BRPI0017148B1 - vetor, célula hospedeira recombinante, e, método para produzir um produto químico fino - Google Patents

vetor, célula hospedeira recombinante, e, método para produzir um produto químico fino Download PDF

Info

Publication number
BRPI0017148B1
BRPI0017148B1 BRPI0017148A BR0017148A BRPI0017148B1 BR PI0017148 B1 BRPI0017148 B1 BR PI0017148B1 BR PI0017148 A BRPI0017148 A BR PI0017148A BR 0017148 A BR0017148 A BR 0017148A BR PI0017148 B1 BRPI0017148 B1 BR PI0017148B1
Authority
BR
Brazil
Prior art keywords
protein
nucleic acid
amino acid
gene
seq
Prior art date
Application number
BRPI0017148A
Other languages
English (en)
Other versions
BR0017148A (pt
Inventor
Burkhard Kröger
Byung-Joon Hwang
Gregor Haberhauer
Hartwig Schröder
Heung-Shick Lee
Jun-Won Kim
Markus Pompejus
Oskar Zelder
Original Assignee
Basf Aktiengesellschfat
Basf Se
Evonik Degussa Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Basf Aktiengesellschfat, Basf Se, Evonik Degussa Gmbh filed Critical Basf Aktiengesellschfat
Publication of BR0017148A publication Critical patent/BR0017148A/pt
Publication of BRPI0017148B1 publication Critical patent/BRPI0017148B1/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/34Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Corynebacterium (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)

Abstract

"molécula de ácido nucleico isolada, vetor, célula hospedeira, método para produzir um polipeptídeo, polipeptídeo de caminho metabólico, polipeptídeo isolado, e, métodos para produzir um produto químico fino e para modular o rendimento de um produto químico fino a partir de uma célula". moléculas de ácido nucleico isoladas, designadas moléculas de ácido nucleico mp, que codificam novas proteínas mp de corynebacterium glutamicum são descritas. a invenção também fornece moléculas de ácido nucleico de anti-sentido, vetores de expressão recombinantes contendo moléculas de ácido nucleico mp e células hospedeiras nas quais os vetores de expressão foram introduzidos. a invenção ainda fornece proteínas mp isoladas, proteínas mp mutadas, proteínas de fusão, peptídeos antigênicos e métodos para a melhoria da produção de um composto desejado a partir do c. glutamicum com base no engendramento genético de genes mp neste organismo.

Description

“VETOR, CÉLULA HOSPEDEIRA RECOMBINANTE, E, MÉTODO PARA PRODUZIR UM PRODUTO QUÍMICO FINO” PEDIDOS RELACIONADOS O presente pedido é uma continuação em parte do Pedido de Patente U.S. 09/606,740, depositado em 23 de Junho de 2000, Este pedido também é uma continuação em parte do Pedido de Patente U.S. 09/603.124, depositado em. 23 de junho de 2000. O presente pedí do reivindica prioridade para o Pedido de Patente Condicional U.S. Séríe N9 60/141031, depositado em 25 de junho de 1999, Pedido de Patente Condicional U.S. Série N9 60/142101, depositado em 2 de julho de 1999, Pedido de Patente Condicional U.S. Série N® 60/148613, depositado em 12 de agosto de 1999, Pedido de Patente Condicional U.S. Série N® 60/187960, depositado em 9 de março de 2000 e também para o Pedido de Patente Alemão N9 19931420.9, depositado em 8 de julho de 1999. Os conteúdos totais de todos os pedidos anteriormente mencionados são por meio deste expressamente aqui incorporados por esta referência.
FUNDAMENTOS DA INVENÇÃO
Certos produtos e subprodutos de processos metabólicos que ocorrem naturalmente em células têm utilidade em uma ampla série de indústrias, incluindo as indústrias de alimentos, de produtos alimentícios, de cosméticos e farmacêuticas. Estas moléculas, coletivamente denominadas de “produtos químicos finos”, incluem ácidos orgânicos, aminoácidos tanto proteinogênícos quanto não proleinogênicos, nucleotídeos e nucleosídeos, lipídeos e ácidos graxos, díóis, carboidratos, compostos aromáticos, vitaminas e co-fatores, e enzimas. A sua produção é mais convenientemente realizada através da cultura em grande escala de bactérias desenvolvidas para produzir e secretar grandes quantidades de uma molécula particular desejada. Um organismo particularmente útil para este propósito é a Corynebacterium glutamicum, uma bactéria gram positiva, não patogênica. Através da seleção de cepa, várias cepas mutantes foram desenvolvidas, as quais produzem uma série de compostos desejáveis. Entretanto, a seleção de cepas melhoradas para a produção de uma molécula particular é um processo que consome tempo e difícil.
SUMÁRIO DA INVENÇÃO A invenção fornece novas moléculas de ácido nucleico bacterianas que têm uma variedade de usos, Estes usos incluem a identificação de microorganismos que podem ser usados para produzir produtos químicos finos, (por exemplo, aminoácidos, tais como, por exemplo, lisina e metionina), a modulação da produção de produto químico fmo em C. glutamicum ou bactérias relacionadas, a tipagem ou identificação de C. glutamicum ou bactérias relacionadas, como pontos de referência para o mapeamento do genoma da C. glutamicum e como marcadores para transformação. Estas novas moléculas de ácido nucleico codificam proteínas, aqui referidas como proteínas do caminho metabólico (MP). A C, glutamicum é uma bactéria gram positiva, aeróbica que é habitualmente usada na indústria para a produção em larga escala de uma variedade de produtos químicos finos e também para a degradação de hidrocarbonetos (tal como em derramamentos de petróleo) e para a oxidação de terpenóides. As moléculas de ácido nucleico MP da invenção, portanto, podem ser usadas para identificar microorganismos que podem ser usados para produzir produtos químicos finos, por exemplo, pelos processos de fermentação. A modulação da expressão dos ácidos nucleicos MP da invenção ou a modificação da seqüência das moléculas de ácido nucleico MP da invenção podem ser usadas para modular a produção de um ou mais produtos químicos finos a partir de um microorganismo (por exemplo, para melhorar o rendimento ou a produção de um ou mais produtos químicos finos a partir de uma espécie de Corynebacterium ou Brevibacterium). Em uma forma de realização preferida, os genes MP da invenção são combinados com um ou mais genes envolvidos no mesmo ou em caminhos metabólicos diferentes para modular a produção de um ou mais produtos químicos finos a partir de um microorganismo.
Os ácidos nucleicos de MP da invenção também podem ser usados para identificar um organismo como sendo a Corynebacterium glutamicum ou um parente próximo desta ou para identificar a presença de C. glutamicum ou um parente desta em uma população mista de microorganismos. A invenção fornece as seqüências de ácido nucleico de vários genes de C. glutamicum; pela sondagem do DNA genômico extraído de uma cultura de uma população única ou mista de microorganismos sob condições severas com uma sonda que atravessa uma região de um gene da C. glutamicum que é único para este organismo, pode-se verificar se este organismo está presente. Embora a Corynebacterium glutamicum por si só seja não patogênica, está relacionada a espécies patogênicas em seres humanos, tais como a Corynebacterium diphtheriae (o agente causativo da difteria); a detecção de tais organismos é de relevância clínica significante.
As moléculas de ácido nucleico MP da invenção também podem servir como pontos de referência para o mapeamento do genoma da C. glutamicum, ou de genomas de organismos relacionados. Similarmente, estas moléculas ou variantes ou porções destas podem servir como marcadores para espécies de Corynebacterium ou Brevibacterium geneticamente engendradas.
As proteínas MP codificadas pelas novas moléculas de ácido nucleico da invenção são capazes de, por exemplo, realizar uma etapa enzimática envolvida no metabolismo de certos produtos químicos finos, incluindo aminoácidos, por exemplo, lisina e metionina, vitaminas, co- fatores, nutracêuticos, nucleotídeos, nucleosídeos e trealose. Dadas a disponibilidade de vetores de clonagem para o uso na Corynebacterium glutamicum, tais como aqueles divulgados em Sinskey et ai, Patente U.S. N2 4.649.119 e técnicas para a manipulação genética de C. glutamicum e a espécie relacionada da Brevibacterium (por exemplo, lactofermentum) (Yoshihama et al, J. Bacteriol. 162: 591 a 597 (1985); Katsumata et ai, J. Bacteriol. 159: 306 a 311 (1984); e Santamaria et ai, J. Gen. Microbiol. 130: 2237 a 2246 (1984)), as moléculas de ácido nucleico da invenção podem ser utilizadas na engenharia genética deste organismo para tomá-lo um produtor melhor ou mais eficiente de um ou mais produtos químicos finos.
Esta produção melhorada ou eficiência de produção de um produto químico fino pode ser devido a um efeito direto da manipulação de um gene da invenção ou pode ser devido a um efeito indireto de tal manipulação. Especificamente, alterações nos caminhos metabólicos da C. glutamicum para aminoácidos, por exemplo, lisina e metionina, vitaminas, co-fatores, nucleotídeos e trealose podem ter um impacto direto na produção global de um ou mais destes compostos desejados a partir deste organismo. Por exemplo, a otimização da atividade de uma proteína do caminho biossintético de uma lisina ou uma metionina ou diminuição da atividade de uma proteína do caminho degradativo de uma lisina ou metionina podem resultar em um aumento no rendimento ou na eficiência de produção de lisina ou metionina a partir de tal organismo engendrado. As alterações nas proteínas envolvidas nestes caminhos metabólicos também podem ter um impacto indireto na produção ou na eficiência de produção de um produto químico fino desejado. Por exemplo, uma reação que esteja em competição com um intermediário necessário para a produção de uma molécula desejada pode ser eliminada ou um caminho necessário para a produção de um intermediário particular para um composto desejado pode ser otimizado. Além disso, modulações na biossíntese ou na degradação de, por exemplo, um aminoácido, por exemplo, lisina ou metionina, uma vitamina ou um nucleotídeo podem aumentar a capacidade global do microorganismo para desenvolver e dividir rapidamente, aumentando assim a quantidade e/ou as capacidades de produção do microorganismo em cultura e aumentando deste modo o rendimento possível do produto químico fino desejado.
As moléculas de ácido nucleico e de proteína da invenção, sozinhas ou em combinação com uma ou mais moléculas de ácido nucleico e proteína do mesmo ou de caminho metabólico diferente, podem ser utilizadas para melhorar diretamente a produção ou a eficiência de produção de um ou mais produtos químicos finos desejados a partir da Corynebacterium glutamicum (por exemplo, metionina ou lisina). Usando-se técnicas genéticas recombinantes bem conhecidas na técnica, uma ou mais das enzimas biossintéticas ou degradativas da invenção para aminoácidos, por exemplo, lisina e metionina, vitaminas, co-fatores, nutracêuticos, nucleotídeos, nucleosídeos ou trealose podem ser manipuladas tal que a sua função seja modulada. Por exemplo, uma enzima biossintética pode ser melhorada na eficiência ou a sua região de controle haloestérico destruída tal que a inibição de regeneração da produção do composto seja impedida. Similarmente, uma enzima degradativa pode ser suprimida ou modificada pela substituição, supressão ou adição tal que a sua atividade degradativa seja reduzida para o composto desejado sem prejudicar a viabilidade da célula. Em cada caso, o rendimento global ou a taxa de produção do produto químico fino desejado podem ser aumentados.
Também é possível que tais alterações nas moléculas de proteína e de nucleotídeo da invenção possam melhorar a produção de outros produtos químicos finos além dos aminoácidos, por exemplo, lisina e metionina, vitaminas, co-fatores, nutracêuticos, nucleotídeos, nucleosídeos e trealose através de mecanismos indiretos. O metabolismo de qualquer composto é necessariamente entrelaçado com outros caminhos biossintéticos e degradativos dentro da célula e co-fatores, intermediários ou substratos necessários em um caminho são provavelmente fornecidos ou limitados por um outro caminho. Portanto, modulando-se a atividade de uma ou mais proteínas da invenção, a produção ou a eficiência de atividade de um outro caminho biossintético ou degradativo de produto químico fino pode ser impactado. Por exemplo, os aminoácidos servem como as unidades estruturais de todas as proteínas, contudo podem estar presentes intracelularmente em níveis que são limitadores para a síntese de proteína; portanto, aumentando-se a eficiência de produção ou os rendimentos de um ou mais aminoácidos dentro da célula, proteínas, tais como as proteínas biossintéticas ou degradativas podem ser mais facilmente sintetizadas. Do mesmo modo, uma alteração em uma enzima do caminho metabólico tal que uma reação colateral particular tome-se mais ou menos favorecida pode resultar na supra ou infra produção de um ou mais compostos que são utilizados como intermediários ou substratos para a produção de um produto químico fino desejado.
Esta invenção fornece novas moléculas de ácido nucleico que codificam proteínas, chamadas aqui de proteínas de caminho metabólico (MP), que são capazes de, por exemplo, realizar uma etapa enzimática envolvida no metabolismo de moléculas importantes para o funcionamento normal das células, tais como aminoácidos, por exemplo, lisina e metionina, vitaminas, co-fatores, nucleotídeos e nucleosideos ou trealose. As moléculas de ácido nucleico que codificam uma proteína MP são aqui chamadas de moléculas de ácido nucleico MP. Em uma forma de realização preferida, a proteína MP, sozinha ou em combinação com um ou mais proteínas do mesmo ou de caminho metabólico diferente, realiza uma etapa enzimática relacionada com o metabolismo de um ou mais dos seguintes: aminoácidos, por exemplo, lisina e metionina, vitaminas, co-fatores, nutracêuticos, nucleotídeos, nucleosideos e trealose. Os exemplos de tais proteínas incluem aquelas codificadas pelos genes apresentados na Tabela 1.
Conseqüentemente, um aspecto da invenção diz respeito a moléculas de ácido nucleico isoladas (por exemplo, cDNAs, DNAs ou RNAs) que compreendem uma seqüência de nucleotídeo que codifica uma proteína MP ou porções biologicamente ativas desta, bem como fragmentos de ácido nucleico adequados como iniciadores ou sondas de hibridização para a detecção ou amplificação de ácido nucleico que codifica o MP (por exemplo, DNA ou mRNA). Em formas de realização particularmente preferidas, a molécula de ácido nucleico isolada compreende uma das seqüências de nucleotídeo apresentadas como as SEQ ID NOs numeradas com números impares na Listagem de Seqüência (por exemplo, SEQ ID NO; 1, SEQ ID NO; 3 ou SEQ ID NO; 5) ou a região codificadora ou um complemento desta de uma destas seqüências de nucleotídeo. Em outras formas de realização particularmente preferidas, a molécula de ácido nucleico isolada da invenção compreende uma seqüência de nucleotídeo que hibridiza com ou é pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59% ou 60%, preferivelmente pelo menos cerca de 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69% ou 70%, mais preferivelmente pelo menos cerca de 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, ou 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89% ou 90%, ou 91%, 92%, 93%, 94% e ainda mais preferivelmente pelo menos cerca de 95%, 96%, 97%, 98%, 99%, 99,7% ou mais homóloga a uma seqüência de nucleotídeo apresentada como uma SEQ ID NO numerada com número impar na Listagem de Seqüência (por exemplo, SEQ ID NO; 1, SEQ ID NO: 3 ou SEQ ID NO: 5) ou uma parte desta. Em outras formas de realização preferidas, a molécula de ácido nucleico isolada codifica uma das seqüências de aminoácido apresentadas como uma SEQ ID NO numerada com número par na Listagem de Seqüência (por exemplo, SEQ ID NO: 2, SEQ ID NO: 4 ou SEQ ID NO: 6). As proteínas MP preferidas da presente invenção também possuem preferivelmente pelo menos uma das atividades do MP aqui descritas.
Em uma outra forma de realização, a molécula de ácido nucleico isolada codifica uma proteína ou parte desta em que a proteína ou parte desta inclui uma seqüência de aminoácido que é suficientemente homóloga a uma seqüência de aminoácido da invenção (por exemplo, uma seqüência tendo uma SEQID NO: numerada com número par na Listagem de Seqüência, tal como SEQ ID NO: 2, SEQ ID NO: 4 ou SEQ ID NO: 6), por exemplo, suficientemente homóloga a uma seqüência de aminoácido da invenção tal que a proteína ou parte desta mantenha uma atividade do MP. Preferivelmente, a proteína ou parte desta codificada pela molécula de ácido nucleico mantém a capacidade para realizar uma reação enzimática em um caminho metabólico de um aminoácido, por exemplo, lisina ou metionina, vitamina, co-fator, nutracêutico, nucleotídeo, nucleosídeo ou trealose. Em uma forma de realização, a proteína codificada pela molécula de ácido nucleico é pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59% ou 60%, preferivelmente pelo menos cerca de 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69% ou 70%, mais preferivelmente pelo menos cerca de 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, ou 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89% ou 90%, ou 91%, 92%, 93%, 94% e ainda mais preferivelmente pelo menos cerca de 95%, 96%, 97%, 98%, 99%, 99,7% ou mais homóloga a uma seqüência de aminoácido da invenção (por exemplo, uma seqüência de aminoácido inteira selecionada daquelas que tenham uma SEQ ID NO: numerada com número par na Listagem de Seqüência, tal como SEQ ID NO: 2, SEQ ID NO: 4 ou SEQ ID NO: 6). Em uma outra forma de realização preferida, a proteína é uma proteína da C. glutamicum de comprimento completo que é substancialmente homóloga a uma seqüência de aminoácido inteira da invenção (codificada por uma matriz de leitura aberta apresentada nas SEQ ID NOs numeradas com números impares correspondentes na Listagem de Seqüência (por exemplo, SEQID NO: 1, SEQID NO: 3 ou SEQID NO: 5).
Em uma outra forma de realização preferida, a molécula de ácido nucleico isolada é derivada da C. glutamicum e codifica uma proteína (por exemplo, uma proteína de fusão MP) que inclui um domínio biologicamente ativo que é pelo menos cerca de 50% ou mais homólogo a um das seqüências de aminoácido da invenção (por exemplo, uma seqüência de uma das SEQ ID NOs numeradas com números pares na Listagem de Seqüência, tal como SEQ ID NO: 2, SEQ ID NO: 4 ou SEQ ID NO: 6), e é capaz de catalisar uma reação em um caminho metabólico para um aminoácido, por exemplo, lisina ou metíonina, vitamina, co-fator, nutracêutico, nucleotídeo, nucleosídeo ou trealose ou uma ou mais das atividades apresentadas na Tabela 1 e que também inclui seqüências de ácido nucleico heterólogas que codificam um polipeptídeo heterólogo ou regiões reguladoras.
Em uma outra forma de realização, a molécula de ácido nucleico isolada é de pelo menos 15 nucleotídeos no comprimento e hibridiza sob condições severas com uma molécula de ácido nucleico que compreende uma seqüência de nucleotídeo da invenção (por exemplo, uma seqüência de uma SEQ ID NO: numerada com número impar na Listagem de Seqüência, tal como SEQ ID NO: 1, SEQ ID NO: 3 ou SEQ ID NO: 5). Preferivelmente, a molécula de ácido nucleico isolada corresponde a uma molécula de ácido nucleico que ocorre naturalmente. Mais preferivelmente, o ácido nucleico isolado codifica uma proteína MP da C. glutamicum que ocorre naturalmente ou uma parte biologicamente ativa desta.
Um outro aspecto da invenção diz respeito a vetores, por exemplo, vetores de expressão recombinantes, contendo as moléculas de ácido nucleico da invenção, sozinhas ou em combinação com uma ou mais moléculas de ácido nucleico envolvidas no mesmo ou em caminho diferente, e às células hospedeiras nas quais tais vetores foram introduzidos. Em uma forma de realização, tal célula hospedeira é usada para produzir uma proteína MP cultivando-se a célula hospedeira em um meio adequado. A proteína MP pode ser depois isolada do meio ou da célula hospedeira. Já um outro aspecto da invenção diz respeito a um microorganismo geneticamente alterado em que um ou mais genes MP, sozinhos ou em combinação com um ou mais genes envolvidos no mesmo ou em caminho metabólico diferente, foram introduzidos ou alterados. Em uma forma de realização, o genoma do microorganismo foi alterado pela introdução de uma molécula de ácido nucleico da invenção que codifica uma ou mais das seqüências do MP do tipo selvagem ou mutadas como transgenes, sozinhas ou em combinação com uma ou mais moléculas de ácido nucleico envolvidas no mesmo ou em caminho metabólico diferente. Em uma outra forma de realização, um ou mais genes MP endógenos dentro do genoma do microorganismo foram alterados, por exemplo, funcionalmente rompidos, pela recombinação homóloga com um ou mais genes MP alterados. Em uma outra forma de realização, um ou mais genes MP endógenos ou introduzidos, sozinhos ou em combinação com um ou mais genes do mesmo ou de caminho metabólico diferente, em um microorganismo foram alterados por uma ou mais mutações, supressões ou inversões de ponto mas ainda codificam proteínas MP funcionais. Ainda em uma outra forma de realização, uma ou mais das regiões reguladoras (por exemplo, um promotor, repressor ou indutor) de um ou mais genes MP em um microorganismo, sozinhos ou em combinação com um ou mais genes MP ou em combinação com um ou mais genes do mesmo ou de caminho metabólico diferente, foram alteradas (por exemplo, pela supressão, truncagem, inversão ou mutação de ponto) tal que a expressão de um ou mais genes MP seja modulada. Em uma forma de realização preferida, o microorganismo pertence ao gênero Corynebacterium ou Brevibacterium, com a Corynebacterium glutamicum sendo particularmente preferida. Em uma forma de realização preferida, o microorganismo também é utilizado para a produção de um composto desejado, tal como um aminoácido, com a lisina e a metionina sendo particularmente preferidas. Em uma forma de realização particularmente preferida, o gene MP é o gene metZ (SEQID NO: 1), o gene metC (SEQ ID NO: 3) ou o gene RXA00657 (SEQ ID NO: 5), sozinhos ou em combinação com um ou mais genes MP da invenção ou em combinação com um ou mais genes envolvidos no metabolismo da metionina e/ou lisina.
Em um outro aspecto, a invenção fornece um método de identificar a presença ou a atividade da Corynebacterium diphtheriae em um paciente. Este método inclui a detecção de uma ou mais das seqüências de ácido nucleico ou de aminoácido da invenção (por exemplo, as seqüências apresentadas na Tabela 1 e na Listagem de Seqüência como as SEQ ID NOs de 1 até 122) em um paciente, detectando-se deste modo a presença ou a atividade da Corynebacterium diphtheriae no paciente.
Ainda um outro aspecto da invenção diz respeito a uma proteína MP isolada ou uma parte desta, por exemplo, uma parte biologicamente ativa. Em uma forma de realização preferida, a proteína MP isolada ou parte desta, sozinha ou em combinação com uma ou mais proteínas MP da invenção ou em combinação com uma ou mais proteínas do mesmo ou de caminho metabólico diferente, pode catalisar uma reação enzimática envolvida em um ou mais dos caminhos para o metabolismo de um aminoácido, por exemplo, lisina ou metionina, uma vitamina, um co-fator, um nutracêutico, um nucleotídeo, um nucleosídeo ou uma trealose. Em uma outra forma de realização preferida, a proteína MP isolada ou parte desta é suficientemente homóloga a uma seqüência de aminoácido da invenção (por exemplo, uma seqüência de uma SEQ ID NO: numerada com número par na Listagem de Seqüência tal como SEQ ID NO: 2, SEQ ID NO: 4 ou SEQ ID NO: 6) tal que a proteína ou parte desta mantenha a capacidade para catalisar uma reação enzimática envolvida em um ou mais dos caminhos para o metabolismo de um aminoácido, uma vitamina, um co-fator, um nutracêutico, um nucleotídeo, um nucleosídeo ou trealose. A invenção também fornece uma preparação isolada de uma proteína MP. Em formas de realização preferidas, a proteína MP compreende uma seqüência de aminoácido da invenção (por exemplo, uma seqüência de uma SEQ ID NO: numerada com número par na Listagem de Seqüência, tal como SEQ ID NO: 2, SEQ ID NO: 4 ou SEQ ID NO: 6). Em uma outra forma de realização preferida, a invenção diz respeito a uma proteína de comprimento completo isolada que é substancialmente homóloga a uma seqüência de aminoácido inteira da invenção (por exemplo, uma seqüência de uma SEQ ID NO: numerada com número par na Listagem de Seqüência, tal como SEQ ID NO: 2, SEQ ID NO: 4 ou SEQ ID NO: 6) (codificada por uma matriz de leitura aberta apresentada em uma SEQ ID NO: numerada com número impar correspondente da Listagem de Seqüência, tal como SEQ ID NO: 1, SEQ ID NO: 3 ou SEQ ID NO: 5). Já em uma outra forma de realização, a proteína é pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59% ou 60%, preferivelmente pelo menos cerca de 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69% ou 70%, mais preferivelmente pelo menos cerca de 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, ou 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89% ou 90%, ou 91%, 92%, 93%, 94% e ainda mais preferivelmente pelo menos cerca de 95%, 96%, 97%, 98%, 99%, 99,7% ou mais homóloga a uma seqüência de aminoácido inteira da invenção (por exemplo, uma seqüência de uma SEQ ID NO: numerada com número par da Listagem de Seqüência, tal como SEQ ID NO: 2, SEQ ID NO: 4 ou SEQ ID NO: 6). Em outras formas de realização, a proteína MP isolada compreende uma seqüência de aminoácido que é pelo menos cerca de 50% ou mais homóloga a uma das seqüências de aminoácido da invenção (por exemplo, uma seqüência de uma SEQ ID NO: numerada com número par da Listagem de Sequência, tal como SEQID NO: 2, SEQ ID NO: 4 ou SEQ ID NO: 6) e é capaz de catalisar uma reação enzimática em um caminho metabólico de aminoácido, vitamina, co-fator, nutracêutico, nucleotídeo, nucleosídeo ou trealose, sozinha ou em combinação com uma ou mais proteínas MP da invenção ou qualquer proteína do mesmo ou de caminho metabólico diferente, ou tem uma ou mais das atividades apresentadas na Tabela 1.
Alternativamente, a proteína MP isolada pode compreender uma seqüência de aminoácido que é codificada por uma seqüência de nucleotídeo que hibridiza, por exemplo, hibridiza sob condições severas, ou é pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59% ou 60%, preferivelmente pelo menos cerca de 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69% ou 70%, mais preferivelmente pelo menos cerca de 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, ou 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89% ou 90%, ou 91%, 92%, 93%, 94% e ainda mais preferivelmente pelo menos cerca de 95%, 96%, 97%, 98%, 99%, 99,7% ou mais homóloga a uma seqüência de nucleotídeo de uma das SEQ ID NOs numeradas com números pares apresentadas na Listagem de Seqüência. Também é preferido que as formas preferidas das proteínas MP também tenham uma ou mais das bioatividades MP aqui descritas. O polipeptídeo MP, ou uma parte biologicamente ativa deste, pode estar operativamente ligado a um polipeptídeo não MP para formar uma proteína de fusão. Nas formas de realização preferidas, esta proteína de fusão tem uma atividade que difere daquela da proteína MP sozinha. Em outras formas de realização preferidas, esta proteína de fusão, quando introduzida em um caminho da C. glutamicum para o metabolismo de um aminoácido, vitamina, co-fator, nutracêutico, resulta em rendimentos e/ou eficiência de produção aumentados de um produto químico fino desejado a partir da C. glutamicum. Em formas de realização particularmente preferidas, a integração desta proteína de fusão em um caminho metabólico de um aminoácido, vitamina, co-fator, nutracêutico, nucleotídeo, nucleosídeo ou trealose de uma célula hospedeira modula a produção de um composto desejado a partir da célula.
Em um outro aspecto, a invenção fornece métodos para avaliar moléculas que modulam a atividade de uma proteína MP, pela interação com a própria proteína ou um substrato ou parceiro de ligação da proteína MP ou pela modulação da transcrição ou tradução de uma molécula de ácido nucleico do MP da invenção, Um outro aspecto da invenção diz respeito a um método para produzir um produto químico fino. Este método envolve o cultivo de uma célula que contenha um ou mais vetores que direcionem a expressão de uma ou mais moléculas de ácido nucleico do MP da sozinha ou em combinação com uma ou mais moléculas de ácido nucleico MP da invenção ou qualquer molécula de ácido nucleico do mesmo ou de caminho metabólico diferente, tal que um produto químico fino seja produzido. Em uma forma de realização preferida, este método ainda inclui a etapa de obter uma célula que contenha tal vetor, em que uma célula é transfectada com um vetor que direcione a expressão de um ácido nucleico do MP. Em uma outra forma de realização preferida, este método ainda inclui a etapa de recuperar o produto químico fino da cultura. Em uma forma de realização particularmente preferida, a célula é do gênero Corynebacterium ou Brevibacíerium ou é selecionada daquelas cepas apresentadas na Tabela 3. Em uma outra forma de realização preferida, os genes MP são o gene metZ (SEQID NO: 1), o gene metC (SEQ ID NO: 3) ou o gene designado como RXA00657 (SEQ ID NO: 5) (ver a Tabela 1), sozinhos ou em combinação com uma ou mais moléculas de ácido nucleico MP da invenção ou com um ou mais genes envolvidos no metabolismo da metionina e/ou lisina. Já em uma outra forma de realização preferida, o produto químico fino é um aminoácido, por exemplo, L-lisina e L-metionina.
Um outro aspecto da invenção diz respeito a métodos para modular a produção de uma molécula a partir de um microorganismo. Tais métodos incluem contatar a célula com um agente que module a atividade da proteína MP ou a expressão do ácido nucleico do MP tal que uma atividade associada com a célula seja alterada em relação a esta mesma atividade na ausência do agente. Em uma forma de realização preferida, a célula é modulada para um ou mais dos caminhos metabólicos de aminoácido, vitamina, co-fator, nutracêutico, nucleotídeo, nucleosídeo ou trealose da C, glutamicum, tal que os rendimentos ou a taxa de produção de um produto químico fino desejada por este microorganismo sejam melhorados. O agente que modula a atividade da proteína MP pode ser um agente que estimule a atividade da proteína MP ou a expressão do ácido nucleico do MP. Os exemplos de agentes que estimulam a atividade da proteína MP ou a expressão do ácido nucleico do MP incluem moléculas pequenas, proteínas MP ativas e ácidos nucleicos que codificam as proteínas MP que foram introduzidas na célula. Os exemplos de agentes que inibem a atividade ou expressão do MP incluem moléculas pequenas e moléculas de ácido nucleico do MP anti-sentido.
Um outro aspecto da invenção diz respeito a métodos para modular rendimentos de um composto desejado a partir de uma célula, envolvendo a introdução de um gene do MP do tipo selvagem ou mutante em uma célula, sozinho ou em combinação com uma ou mais moléculas de ácido nucleico MP da invenção ou qualquer molécula de ácido nucleico do mesmo ou de caminho metabólico diferente, mantido em um plasmídeo separado ou integrado no genoma da célula hospedeira. Se integrado no genoma, tal integração pode ser aleatória ou pode ocorrer pela recombinação homóloga tal que o gene nativo é substituído pela cópia introduzida, causando a produção do composto desejado a partir da célula a ser modulada. Em uma forma de realização preferida, os ditos rendimentos são aumentados. Em uma outra forma de realização preferida, o dito produto químico é um produto químico fino. Em uma forma de realização particularmente preferida, o dito produto químico fino é um aminoácido. Em formas de realização especialmente preferidas, o dito aminoácido é L-Hsina e L-metionina. Em uma outra forma de realização preferida, o dito gene é o gene metZ (SEQ ID NO: 1), o gene metC (SEQ ID NO: 3) ou o gene RXA00657 (SEQ ID NO: 5), sozinhos ou em combinação com uma ou mais moléculas de ácido nucleico MP da invenção ou com um ou mais genes envolvidos no metabolismo da metionina e/ou lisina.
DESCRICÀO DETALHADA DA INVENÇÃO A presente invenção fornece moléculas de ácido nucleico e de proteína do MP que estão envolvidas no metabolismo de certos produtos químicos finos na Corynebacterium glutamicum, incluindo aminoácidos, por exemplo, lisina e metionina, vitaminas, co-fatores, nutracêuticos, nucleotídeos, nucleosídeos e trealose. As moléculas da invenção podem ser utilizadas na modulação da produção de produtos químicos finos a partir de microorganismos, tais como a C. glutamicum, diretamente (por exemplo, quando a modulação da atividade de uma proteína da biossíntese de lisina ou metionina tem um impacto direto na produção ou na eficiência de produção da lisina ou metionina a partir deste organismo) ou pode ter um impacto indireto que não obstante resulta em um aumento do rendimento ou da eficiência de produção do composto desejado (por exemplo, onde a modulação da atividade de uma proteína da biossíntese de nucleotídeo tem um impacto na produção de um ácido orgânico ou de um ácido graxo a partir da bactéria, talvez devido ao desenvolvimento melhorado ou um fornecimento aumentado de co-fatores, compostos de energia ou moléculas precursoras necessárias). As moléculas MP podem ser utilizadas sozinhas ou em combinação com outras moléculas MP da invenção ou em combinação com outras moléculas envolvidas no mesmo ou em caminho metabólico diferente, (por exemplo, metabolismo de lisina ou metionina). Em uma forma de realização preferida, as moléculas MP são as moléculas de ácido nucleico metZ (SEQID NO: 1), metC (SEQID NO: 3) ou RXA00657 (SEQID NO: 5) e as proteínas codificadas por estas moléculas de ácido nucleico (SEQ ID NO: 2, SEQ ID NO: 4 e SEQ ID NO: 6, respectivamente). Os aspectos da invenção são mais explicados abaixo. I. Produtos químicos finos O termo “produto químico fino” é reconhecido na técnica e inclui moléculas produzidas por um organismo que têm aplicações em várias indústrias, tais como, mas não limitadas às indústrias farmacêuticas, agrícolas e cosméticas. Tais compostos incluem ácidos orgânicos, tais como ácido tartárico, ácido itacônico e ácido diaminopimélico, aminoácidos tanto proteinogênicos quanto não proteinogênicos, bases de purina e de pirimidina, nucleosídeos e nucleotídeos (como descrito por exemplo, em Kuninaka, A. (1996) Nucleotides and Related Compounds, p. 561 a 612, na Biotechnology Vol. 6, Rehm et al., eds. VCH: Weinheím e as referências contidas nesta), lipídeos, ácidos graxos tanto saturados quanto não saturados (por exemplo, ácido araquidônico), dióis (por exemplo, propano diol e butano diol), carboidratos (por exemplo, ácido hialurônico e trealose), compostos aromáticos (por exemplo, aminas aromáticas, vanilina e índigo), vitaminas e co-fatores (como descrito na Ullmamfs Encyclopedia of Industrial Chemistry, vol. A27, “Vitamins”, p. 443 a 613 (1996) VCH: Weinheim e as referências contidas nesta; e Ong, A. S., Niki, E. & Packer, L. (1995) “Nutrition, Lipids, Health and Disease” Proceedings of the UNESCO/Confederation of Scientifíc and Technological Associations in Malaysia and the Society for Free Radical Research - Asia, feito em 1 a 3 de setembro de 1994 em Penang, Malaysia, AOCS Press, (1995)), enzimas, policetídeos (Cane et al, (1998) Science 282: 63 a 68) e todos os outros produtos químicos descritos em Gutcho (1983) Chemicals by Fermentation, Noyes Data Corporation, ISBN: 0818805086 e referências nesta. O metabolismo e o uso de certos destes produtos químicos finos são ainda explicados abaixo. A. Metabolismo e usos de aminoácido Os aminoácidos compreendem as unidades estruturais básicas de todas as proteínas e como tais são essenciais para o funcionamento celular normal em todos os organismos. O termo “aminoácido” é reconhecido na técnica. Os aminoácidos proteinogênicos, dos quais existem 20 espécies servem como unidades estruturais para as proteínas, nas quais estão ligados por ligações peptídicas, enquanto os aminoácidos não proteinogênicos (centenas dos quais são conhecidas) não são normalmente encontrados em proteínas (ver a Ullmamfs Encyclopedia of Industrial Chemistry, vol. A2, p. 55 a 97 VCH: Weinheim (1985)). Os aminoácidos podem estar na configuração ótica D ou L, considera-se que os aminoácidos L são, no geral, o único tipo encontrado em proteínas que ocorrem naturalmente. Os caminhos biossintéticos e degradativos de cada um dos 20 aminoácidos proteinogênicos foram bem caracterizados tanto em células procarióticas quanto em eucarióticas (ver, por exemplo, Stryer, L. Biochemistry, 3a edição, páginas 578 a 590 (1988)). Os aminoácidos “essenciais” (histidina, isoleucina, leucina, lisina, metionina, fenilalanina, treonina, triptofano e valina), assim denominados porque são, no geral, uma exigência nutricional devido à complexidade de sua biossínteses, são facilmente convertidas pelos caminhos biossintéticos simples nos 11 aminoácidos “não essenciais” remanescentes (alanina, arginina, asparagina, aspartato, cisteína, glutamato, glutamina, glicina, prolina, serina e tirosina). Os animais superiores retêm a capacidade para sintetizar alguns destes aminoácidos, mas os aminoácidos essenciais devem ser fornecidos da dieta de modo que a síntese normal de proteína ocorra.
Com exceção da sua função na biossíntese da proteína, estes aminoácidos são produtos químicos interessantes por si só e muitos foram verificados ter várias aplicações nas indústrias de alimento, de produtos alimentícios, de produtos químicos, de cosméticos, agrícola e farmacêutica. A lisina é um aminoácido importante na nutrição não apenas de seres humanos, mas também de animais monogástricos tais como aves e suínos. O glutamato é o mais habitualmente usado como um aditivo de sabor (glutamato monossódico, MSG) e é amplamente usado por toda a indústria de alimentos, como o são o aspartato, a fenilalanina, a glicina e a cisteína. A glicina, a L-metionina e o triptofano são todos utilizados na indústria farmacêutica. A glutamina, a valina, a leucina, a isoleucina, a histidina, a arginina, a prolina, a serina e a alanina são de uso tanto na indústria farmacêutica quanto na de cosméticos. A treonina, o triptofano e a D/L-metionina são aditivos comuns de produtos alimentícios. (Leuchtenberger, W. (1996) Amino aids - technical production and use, p. 466 a 502 em Rehm et aL, (eds.) Biotechnology vol. 6, capítulo 14a VCH: Weinheim). Adicionalmente, estes aminoácidos foram verificados ser úteis como precursores para a síntese de aminoácidos e proteínas sintéticas, tais como a N-acetilcisteína, a S-carboximetil-L-cisteína, (S)-5-hidroxitriptofano e outros descritos em Ulmamrís Encyclopedia of Industrial Chemistry, vol. A2, p. 57 a 97, VCH: Weinheim, 1985. A biossíntese destes aminoácidos naturais em organismos capazes de produzi-los, tais como as bactérias, foi bem caracterizada (para revisão de biossíntese de aminoácido bacteriano e seu regulamento, ver Umbarger, Η. E. (1978) Ann. Rev. Biochem. 47: 533 a 606). O glutamato é sintetizado pela aminação redutiva de α-cetoglutarato, um intermediário no ciclo do ácido cítrico. A glutamina, a prolina e a arginina são cada uma subseqüentemente produzidas a partir do glutamato. A biossíntese de serina é um processo de três etapas que começa com 3-fosfoglicerato (um intermediário na glicólise) e que resulta neste aminoácido após as etapas de oxidação, transaminação e hidrólise. Tanto a cisteína quanto a glicina são produzidas a partir da serina; a primeira pela condensação de homocisteína com serina e a última pela transferência do átomo de carbono β da cadeia lateral para tetraidrofoliato, em uma reação catalisada pela transidroximetilase de serina. A fenilalanina e a tirosina são sintetizadas a partir dos precursores do caminho glicolítico e de pentose fosfato de eritrose 4-fosfato e fosfoenolpiruvato em um caminho biossintético de 9 etapas que diferem apenas nas duas etapas finais após a síntese de prefenato. O triptofano também é produzido a partir destas duas moléculas iniciais, mas a sua síntese é um caminho de 11 etapas. A tirosina também pode ser sintetizada a partir da fenilalanina em uma reação catalisada pela fenilalanina hidroxilase. A alanina, a valina e a leucina são todas produtos biossintéticos do piruvato, o produto final da glicólise. O aspartato é formado a partir do oxaloacetato, um intermediário do ciclo de ácido cíclico. A asparagina, a metionina, a treonina e a lisina são cada uma produzida pela conversão de aspartato. A isoleucina é formada a partir da treonina.
Os caminhos biossintéticos que levam à metionina foram estudados em diversos organismos. A primeira etapa, a acilação de homoserina, é comum a todos os organismos, mesmo que a fonte dos grupos acila transferidos seja diferente. A Escherichia coli e as espécies relacionadas usam succinil-CoA (Michaeli, S. e Ron, E. Z. (1981) Mol. Gen. Genet. 182, 349 a 354), enquanto a Saccharomyces cerevisiae (Langin, T., et al., (1986) Gene 49, 283 a 293), Brevibacterium flavum (Miyajima, R. e Shiio, I. (1973) J. Biochem. 73, 1061 a 1068; Ozaki, H. e Shiio, I. (1982) J. Biochem. 91, 1163 a 1171), C. glutamicum Park, S. - D., et al., (1998) Mol. Cells 8,286 a 294) e Leptospira meyeri (Belfaiza, J. et al., (1998) 180, 250 a 255; Bourhy, P., et al., (1997) J. Bacteriol. 179, 4396 a 4398) usam acetil-CoA como o doador de acila. A formação de homocisteína a partir da acilomocerina pode ocorrer de duas maneiras diferentes. A E. coli usa o caminho da trans- sulfuração que é catalisado pela cistationina-y-sintase (o produto de metB) e pela cistationina β-liase (o produto de meíC). A S. cerevisiae (Cherest, H. e Surdin-Ketjan, Y. (1992) Genetics 130, 51 a 58), B. flavum (Ozaki, H. e Shiio, I. (1982) J. Biochem. 91, 1163 a 1171), Pseudomonas aeruginosa (Foglino, M. et al, (1995) Microbiology 141, 431 a 439) e a L. meyeri (Belfaiza, J. et al, (1998) J. Bacteriol. 180,250 a 255) utilizam o caminho da sulfidrilação que é catalisado pela acilomoserina sulfidrilase. Ao contrário da B. flavum intimamente relacionada, que usa apenas o caminho da sulfidrilação direta, as atividades de enzima do caminho da trans-suliuração foi detectado nos extratos das células da C. glutamicum e o caminho foi proposto ser a rota para a biossíntese da metionina no organismo (Hwang, B-J. et al, (1999) Mol. Cells 9, 300 a 308; Kase, H. e Nakayama, K. (1974) Agr. Biol. Chem. 38,2021 a 2030; Park, S.-D., et al, 1998) Mol. Cells 8,286 a 294).
Embora alguns genes envolvidos na biossíntese da metionina na C. glutamicum tenham sido isolados, a informação na biossíntese de metionina na C. glutamicum é ainda muito limitada. Nenhum gene outro que não metA e metB foram isolados a partir do organismo. Para entender os caminhos biossintéticos que levam à metionina na C. glutamicum, isolamos e caracterizamos o gene metC (SEQ ID NO: 3) e o gene metZ (também chamado de metí) (SEQ ID NO: 1) da C. glutamicum (ver a Tabela 1).
Os aminoácidos em excesso da síntese de proteína necessária para a célula não podem ser armazenados e são ao invés disso degradados para fornecer intermediários para os caminhos metabólicos principais da célula (para revisão ver Stryer, L. Biochemistry 3a ed. capítulo 21 “Amino Acid Degradation and the Urea Cycle” p. 495 a 516 (1988)). Embora a célula seja capaz de converter aminoácidos não desejados em intermediários metabólicos úteis, a produção de aminoácido é dispendiosa em termos de energia, de moléculas precursoras e das enzimas necessárias para sintetizá- los. Assim não é surpreendente que a biossíntese de aminoácido seja regulada pela inibição de regeneração, em que a presença de um aminoácido particular serve para diminuir ou interromper totalmente a sua própria produção (para revisão dos mecanismos de regeneração nos caminhos biossintéticos de aminoácido, ver Stryer, L. Biochemistry, 3a ed. capítulo 24: “Biosynthesis of Amino Acids and Heme” p. 575 a 600 (1988)). Assim, a produção de qualquer aminoácido particular é limitada pela quantidade deste aminoácido presente na célula. B. Metabolismo e usos de vitamina, co-fator e nutracêutico As vitaminas, co-fatores e nutracêuticos compreendem um outro grupo de moléculas que os animais superiores perderam a capacidade de sintetizar e deste modo devem ingeri-los embora estes sejam facilmente sintetizados por outros organismos tais como as bactérias. Estas moléculas são por si só substâncias bioativas ou são precursoras de substâncias biologicamente ativas que podem servir como carregadores de elétron ou intermediários em uma variedade de caminhos metabólicos. Com exceção do seu valor nutritivo, estes compostos também tem valor industrial significante como agentes corantes, antioxidantes e catalisadores ou outros auxiliares de processamento (para uma revisão da estrutura, atividade e aplicações industriais destes compostos, ver, por exemplo, UllmamTs Encyclopedia of Industrial Chemistry, “Vitamins”, vol. A27, p. 443 a 613, YCH: Weinheim, 1996). O termo “vitamina” é reconhecido na técnica e inclui nutrientes que são requeridos por um organismo para o funcionamento normal, mais que este organismo não pode sintetizar por si só. O grupo de vitaminas pode abranger co-fatores e compostos nutracêuticos. A linguagem “co-fator” inclui compostos não proteináceos requeridos para que uma atividade enzimática normal ocorra. Tais compostos podem ser orgânicos ou inorgânicos; as moléculas de co-fator da invenção são preferivelmente orgânicas. O termo “nutracêutico” inclui suplementos dietéticos tendo benefícios saudáveis em vegetais e animais, particularmente em seres humanos. Os exemplos de tais moléculas são vitaminas, antioxidantes e também certos lipídeos (por exemplo, ácidos graxos poliinsaturados). A biossíntese destas moléculas em organismos capazes de produzi-los, tais como as bactérias, foi amplamente caracterizada (Ullmamfs Encyclopedia of Industrial Chemistry, “Vitamins”, vol. A27, p. 443 a 613, VCH: Weinheim, 1996; Michal, G. (1999) Biochemical Pathways: An Atlas of Biochemistry and Molecular Biology, John Wiley & Sons; Ong, A. S., Niki, E. & Packer, L. (1995) “Nutrition, Lipids, Health and Disease” Proceedings of the UNESCO/Confederation of Scientific and Technological Associations in Malaysia and the Society for Free Radical Research - Asia, feito de 1 a 3 de setembro de 1994 em Penang, Malaysia, AOCS Press: Champaign IL X, 374 S). A tiamina (vitamina Bj) é produzida pela união química de porções de pirimidina e tiazol. A riboflavina (vitamina B2) é sintetizada a partir de guanosina-5’-trifosfato (GTP) e ribose-5’-fosfato. A riboflavina, por sua vez, é utilizada para a síntese de mononucleotídeo de flavina (FMN) e de dinucleotideo de flavina adenina (FAD). A família de compostos coletivamente denominados “vitamina Bg” (por exemplo, piridoxina, piridoxamina, piridoxa-5’-fosfato e o cloridreto de piridoxina comercialmente usado) são todos derivados da unidade estrutural comum, 5-hidróxi-6-metilpiridina. O pantotenato (ácido pantotênico, (R)-(+)-N-(2,4-diidróxi-3,3-dimetil-l-oxobutil)^-alanina) pode ser produzido por síntese química ou por fermentação. As etapas finais na biossíntese do pantotenato consiste da condensação direcionada pelo ATP de β-alanina e ácido pantóico. As enzimas responsáveis pelas etapas de biossíntese para a conversão ao ácido pantóico, à β-alanina e para a condensação ao ácido pantotênico são conhecidas. A forma metabolicamente ativa de pantotenato é a Co-enzima A, para a qual a biossíntese processa-se em 5 etapas enzimáticas. O pantotenato, o piridoxal-5 ’-fosfato, a cisterna e o ATP são os precursores da Co-enzima A. Estas enzimas não apenas catalisam a formação de pantotenato, mas também a produção de ácido (R)-pantóico, (R)-pantolactona, (R)-pantenol (provitamina B5), panteteína (e seus derivados) e a Co-enzima A. A biossíntese de biotina a partir da molécula precursora de pimeloil-CoA em microorganismos foi estudada em detalhes e diversos dos genes envolvidos foram identificados. Verificou-se que muitas das proteínas correspondentes também estão envolvidas na síntese de cachos de Fe e são membros da classe nifS de proteínas. O ácido lipóico é derivado do ácido octanóico e serve como uma coenzima no metabolismo de energia, onde toma-se parte do complexo de piruvato de desidrogenase e do complexo de α-cetoglutarato desidrogenase. Os foliatos são um grupo de substâncias que são todas derivadas do ácido fólico que por sua vez é derivado do ácido L-glutâmico, do ácido p-amino benzóico e de 6-metilpterina. A biossíntese de ácido fólico e seus derivados, partindo-se dos intermediários de metabolismo guanosina-5’-trifosfato (GTP), ácido L-glutâmico e ácido p-amino-benzóico foi estudada em detalhes em certos microorganismos.
Os corrinóides (tais como as cobalaminas e particularmente a vitamina Bi2) e as porfirinas pertencem a um grupo de produtos químicos caracterizados por um sistema de anel de tetrapirrol. A biossíntese de vitamina B]2 é suficientemente complexa de modo que ainda não foi completamente caracterizada. Mas muitas das enzimas e substratos envolvidos são agora conhecidos. O ácido nicotínico (nicotinato) e a nicotinamida são derivados de piridina que são também denominados “niacina”. A niacina é o precursor das coenzimas importantes NAD (nicotinamida adenina dinucleotídeo) e NADP (nicotinamida adenina dinucleotídeo fosfato) e suas formas reduzidas. A produção em larga escala destes compostos contam amplamente com as sínteses químicas isentas de célula, embora alguns destes produtos químicos também foram produzidos pela cultura em larga escala de microorganismos, tais como a riboflavina, a Vitamina B6, o pantotenato e a biotina. Apenas a Vitamina B)2 é produzida unicamente pela fermentação, devido à complexidade da sua síntese. Metodologias in vitro requerem gastos significantes de materiais e tempo, ffeqüentemente com custos enormes. C, Metabolismo e usos de purina, pirimidina, nucleosídeo e nucleotídeo Os genes de metabolismo de purina e pirimidina e suas proteínas correspondentes são alvos importantes para a terapia de doenças de tumor e infecções virais. A linguagem “purina” ou “pirimidina” inclui as bases nitrogenadas que são constituintes de ácidos nucleicos, co-enzimas e nucleotídeos. O termo “nucleotídeo” inclui as unidades estruturais básicas de moléculas de ácido nucleico que são compreendidos de uma base nitrogenada, um açúcar de pentose (no caso de RNA o açúcar é ribose; no caso de DNA, o açúcar é D-desoxirribose) e ácido fosfórico. A linguagem “nucleosídeo” inclui moléculas que servem como precursores para nucleotídeos, mas que carecem da porção de ácido fosfórico que os nucleotídeos possuem. Inibindo-se a biossíntese destas moléculas ou a sua mobilização para formar moléculas de ácido nucleico é possível inibir a síntese de RNA e de DNA; inibindo-se esta atividade de uma maneira alvejada à células cancerosas, a capacidade das células de tumor para dividir e replicar pode ser inibida. Adicionalmente, existem nucleotídeos que não formam moléculas de ácido nucleico, mas ao invés disto servem como armazéns de energia (isto é, AMP) ou como co-enzimas (isto é, FAD e NAD).
Diversas publicações descreveram o uso destes produtos químicos para estas indicações médicas, influenciando-se o metabolismo da purina e/ou da pirimidina (por exemplo, Christopherson, R. I. e Lyons, S. D. (1990) “Potent inhibitors of de novo pirimidine and purine biosynthesis as chemotherapeutic agents”. Med. Res. Reviews 10: 505 a 548). Os estudos de enzimas envolvidas no metabolismo da purina e da pirimidina foram focalizados no desenvolvimento de novos medicamentos que podem ser usados, por exemplo, como imunossupressores ou anti-proliferantes (Smith, J. L., (1995) “Enzymes in Nucleotide Synthesis” Curr. Opin. Struct. Biol. 5: 752 a 757; (1995 Biochem. Soc. Transact. 23: 877 a 902). Entretanto as bases de purina e de pirimidina, nucleosídeos e nucleotídeos têm outras utilidades: Como intermediários na biossintese de diversos produtos químicos finos (por exemplo, tiamina, S-adenosil-metionina, foliatos ou riboflavina), como carregadores de energia para a célula (por exemplo, ATP ou GTP) e como os próprios produtos químicos habitualmente usados como realçadores de sabor (por exemplo, IMP ou GMP) ou como diversas aplicações medicinais (ver, por exemplo, Kuninaka, A. (1996) Nucleotides and Related Compounds in Biotechnology vol. 6, Rehm et ai, eds. VCH: Weinheim, p. 561 a 612). Da mesma maneira, as enzimas envolvidas no metabolismo da purina, pirimidina, nucleosídeo ou nucleotídeo estão servindo cada vez mais como alvos contra os quais produtos químicos para a proteção de safra, incluindo fungicidas, herbicidas e inseticidas são desenvolvidos. O metabolismo destes compostos nas bactéria foi caracterizado (para revisões ver, por exemplo, Zalkin, H. e Dixon, J. E. (1992) “de novo purine nucleotide biosynthesis”, em: Progress in Nucleic Acid Research and Molecular Biology, vol. 42, Academic Press, p. 259 a 287; e Michal, G. (1999) “Nucleotides e Nucleosides”, capítulo 8 em: Biochemical Pathways: An Atlas of Biochemistry and Molecular Biology, Wiley: New York). O metabolismo de purina foi o assunto de pesquisa intensiva e é essencial para o funcionamento normas da célula. O metabolismo de purina prejudicado em animais superiores podem causar doença grave, tais como a gota. Os nucleotídeos de purina são sintetizados a partir da ribose-5-fosfato, em uma série de etapas através do composto intermediário inosina-5’-fosfato (IMP), resultando na produção de guanosina- 5’-fosfato (GMP ou de adenosina -5’-monofosfato (AMP) a partir dos quais as formas de trifosfato utilizadas como nucleotídeos são facilmente formadas. Estes compostos são utilizados como armazéns de energia, de modo que a sua degradação forneça energia para muitos processos bioquímicos diferentes na célula. A biossíntese de pirimidina processa-se pela formação de uridina-5’-monofosfato (UMP) a partir da ribose-5-fosfato. A UMP, por sua vez, é convertida para citidina -5’-trifosfato (CTP). As formas de desóxi de todos estes nucleotídeos são produzidas em uma reação de redução de uma etapa a partir da forma de difosfato ribose do nucleotídeo para a forma de difosfato desoxirribose do nucleotídeo. Na fosforilaçao, estas moléculas são capazes de participar na síntese de DNA. D. Metabolismo e usos de trealose A trealose consiste de duas moléculas de glicose, ligadas em uma ligação a, a-1,1. É habitualmente usada na indústria de alimentos como um adoçante, um aditivo para alimentos secos ou congelados e em bebidas. Entretanto, também tem aplicações nas indústrias farmacêuticas, cosméticas e de biotecnologia (ver, por exemplo, Nishimoto et al., (1998) Patente U.S. N2 5.759.610; Singer, Μ. A. e Lindquist, S. (1998) Trends Biotech. 16: 460 a 467; Paiva, C. L. A. e Panek, A. D. (1996) Biotech. Ann. Rev. 2: 293 a 314; e Shíosaka, M. (1997) J. Japan 172: 97 a 102). A trealose é produzida pelas enzimas a partir de muitos microorganismos e é naturalmente liberada no meio circundante, do qual pode ser coletada usando-se métodos conhecidos na técnica. II. Elementos e métodos da invenção A presente invenção está fundamentada, pelo menos em parte, na descoberta de novas moléculas, aqui chamadas de moléculas de ácido nucleico e de proteína MP (ver Tabela 1), que desempenham um papel ou funcionam em um ou mais caminhos metabólicos celulares. Em uma forma de realização, as moléculas MP catalisam uma reação enzimática envolvendo um ou mais caminhos metabólicos de aminoácido, por exemplo, lisina ou metionina, vitamina, co-fator, nutracêutico, nucleotídeo, nucleosídeo ou trealose. Em uma forma de realização preferida, a atividade de uma ou mais moléculas MP da presente invenção, sozinhas ou em combinação com moléculas envolvidas no mesmo ou de caminho metabólico diferente (por exemplo, metabolismo de metionina ou lisina), em um ou mais caminhos metabólicos da C. glutamicum, para aminoácidos, vitaminas, co-fatores, nutracêuticos, nucleotídeos, nucleosídeos ou trealose tem um impacto na produção de um produto químico fmo desejado por este organismo. Em uma forma de realização particularmente preferida, as moléculas MP da invenção são moduladas na atividade, tal que os caminhos metabólicos da C. glutamicum, nos quais as proteínas MP da invenção estão envolvidas são modulados em eficiência ou rendimento, que modula direta ou indiretamente a produção ou a eficiência de produção de um produto químico fmo desejado pela C. glutamicum. Em uma forma de realização preferida, o produto químico fmo é um aminoácido, por exemplo, lisina ou metionina. Em uma outra forma de realização preferida, as moléculas MP são metZ, metY e/ou RXA00657 (ver a Tabelai). A linguagem, “proteína MP” ou “polipeptídeo MP” inclui proteínas que desempenham um papel, por exemplo, catalisam uma reação enzimática, em um ou mais dos caminhos metabólicos de aminoácido, vitamina, co-fator, nutracêutico, nucleotídeo, nucleosídeo ou trealose. Os exemplos de proteínas MP incluem aquelas codificadas pelos genes MP apresentados na Tabela 1 e pelas SEQ ID NOs numeradas com números impares. Os termos “gene MP” ou “seqüência de ácido nucleico MP” incluem seqüências de ácido nucleico que codificam uma proteína MP, que consistem de uma região codificadora e também regiões de seqüência 5’ e 3’ não traduzidas correspondentes. Os exemplos de genes MP incluem aqueles apresentados na Tabela 1. Os termos “produção” ou “produtividade” são reconhecidos na técnica e incluem a concentração do produto de fermentação (por exemplo, o produto químico fino desejado) formado dentro de um tempo dado e um volume de fermentação dado (por exemplo, kg de produto por hora por litro). O termo “eficiência de produção” inclui o tempo requerido para um nível particular de produção ser alcançado (por exemplo, quanto tempo leva para a célula atingir uma razão particular de produção de um produto químico fino). Os termos “rendimento” ou “rendimento de produto/carbono” são reconhecidos na técnica e incluem a eficiência da conversão da fonte de carbono no produto (isto é, o produto químico fino). Isto é escrito, no geral, como, por exemplo, kg de produto por kg de fonte de carbono. Aumentando-se o rendimento ou a produção do composto, a quantidade de moléculas recuperadas ou de moléculas recuperadas úteis daquele composto em uma dada quantidade de cultura em uma dada quantidade de tempo é aumentada. Os termos “biossíntese” ou um “caminho biossintético” são reconhecidos na técnica e incluem a síntese de um composto, preferivelmente um composto orgânico, por uma célula a partir de compostos intermediários em que pode ser um processo de etapa múltipla e altamente regulado. Os termos “degradação” ou um “caminho de degradação” são reconhecidos na técnica e incluem a ruptura de um composto, preferivelmente um composto orgânico, por uma célula a produtos de degradação (falando-se no geral, moléculas menores ou menos complexas) em que pode ser um processo de etapa múltipla e altamente regulado. A linguagem “metabolismo” é reconhecida na técnica e inclui a totalidade das reações bioquímicas que ocorrem em um organismo. O metabolismo de um composto particular, (por exemplo, o metabolismo de um aminoácido tal como a glicina) compreende então os caminhos globais biossintéticos, de modificação e de degradação na célula relacionada a este composto.
As moléculas MP da presente invenção podem ser combinadas com uma ou mais moléculas MP da invenção ou uma ou mais moléculas do mesmo ou de caminho metabólico diferente para aumentar o rendimento de um produto químico fino desejado. Em uma outra forma de realização preferida, o produto químico fino é um aminoácido, por exemplo, lisina ou metionina. Altemativamente, ou além disso, um subproduto que não é desejado pode ser reduzido pela combinação ou rompimento de moléculas MP ou outras moléculas metabólicas (por exemplo, moléculas envolvidas no metabolismo de lisina ou metionina). As moléculas MP combinadas com outras moléculas do mesmo ou de um caminho metabólico diferente podem ser alteradas na sua seqüência de nucleotídeo e na seqüência de aminoácido correspondente para alterar a sua atividade sob condições fisiológicas, que leva a um aumento na produtividade e/ou rendimento de um produto químico fino desejado. Em uma outra forma de realização, uma molécula MP na sua forma original ou na sua forma alterada descrita acima pode ser combinada com outras moléculas do mesmo ou de um caminho metabólico diferente que são alterados na sua seqüência de nucleotídeo de tal modo que a sua atividade é alterada sob condições fisiológicas que leva a um aumento na produtividade e/ou rendimento de um produto químico fino desejado, por exemplo, um aminoácido tal como metionina ou lisina.
Em uma outra forma de realização, as moléculas MP da invenção, sozinhas ou em combinação com uma ou mais moléculas do mesmo ou de caminho metabólico diferente são capazes de modular a produção de uma molécula desejada, tal como um produto químico fino, em um microorganismo tal como a C. glutamicum. Usando-se técnicas genéticas recombinantes, uma ou mais das enzimas biossintéticas ou degradativas da invenção para aminoácidos, por exemplo, lisina e metionina, vitaminas, co-fatores, nutracêuticos, nucleotídeos, nucleosídeos ou trealose podem ser manipuladas tal que a sua função seja modulada. Por exemplo, uma enzima biossintética pode ser melhorada em eficiência ou a sua região de controle alostérico destruída tal que a inibição de regeneração da produção do composto seja impedida. Similarmente, uma enzima degradativa pode ser suprimida ou modificada pela substituição, supressão ou adição tal que a sua atividade degradativa seja diminuída para o composto desejado sem prejudicar a viabilidade da célula. Em cada caso, o rendimento global ou a taxa de produção de um destes produtos químicos finos pode ser aumentada.
Também é possível que tais alterações nas moléculas de proteína e de nucleotídeo da invenção possam melhorar a produção de outros produtos químicos finos além dos aminoácidos, vitaminas, co-fatores, nutracêuticos, nucleotídeos, nucleosídeos e trealose. O metabolismo de qualquer composto é necessariamente entrelaçado com outros caminhos biossintéticos e degradativos dentro da célula e necessariamente co-fatores, intermediários ou substratos em um caminho são provavelmente fornecidos ou limitados por um outro de tal caminho. Portanto, modulando-se a atividade de uma ou mais das proteínas da invenção, a produção ou a eficiência de atividade de um outro caminho biossintético ou degradativo de produto químico fino pode ser impactado. Por exemplo, os aminoácidos servem como as unidades estruturais de todas as proteínas, contudo podem estar presentes intracelularmente em níveis que são limitadores para a síntese de proteína; portanto, aumentando-se a eficiência de produção ou os rendimentos de um ou mais aminoácidos dentro da célula, proteínas, tais como as proteínas biossintéticas ou degradativas podem ser mais facilmente sintetizadas. Do mesmo modo, uma alteração em uma enzima do caminho metabólico tal que uma reação colateral particular tome-se mais ou menos favorecida pode resultar na supra ou infra produção de um ou mais compostos que são utilizados como intermediários ou substratos para a produção de um produto químico fmo desejado.
As sequências de ácido nucleico isoladas da invenção estão contidas dentro do genoma de uma cepa de Corynebacterium gluiamicum disponível através da American Type Culture Collection, dada a designação ATCC 13032. A seqüência de nucleotídeo dos DNAs MP da C. glutamicum isolados e as seqüências de aminoácido prognosticadas das proteínas MP da C. glutamicum, estão apresentadas na Listagem de Seqüência como SEQ ID NOs numeradas com números impares e SEQ ID NOs numeradas com números pares, respectivamente. As análises computacionais foram realizadas de modo que classificaram e/ou identificaram estas seqüências de nucleotídeo como seqüências que codificam as proteínas do caminho metabólico, por exemplo, proteínas envolvidas nos caminhos metabólicos da metionina ou lisina. A presente invenção também diz respeito a proteínas que têm uma seqüência de aminoácido que é substancialmente homóloga a uma seqüência de aminoácido da invenção (por exemplo, a seqüência de uma SEQ ID NO: numerada com número par na Listagem de Seqüência). Como aqui usado, uma proteína que tem uma seqüência de aminoácido que é substancialmente homóloga a uma seqüência de aminoácido selecionada é pelo menos cerca de 50% homóloga à seqüência de aminoácido selecionada, por exemplo, a seqüência de aminoácido selecionada inteira. Uma proteína que tem uma seqüência de aminoácido que é substancialmente homóloga a uma seqüência de aminoácido selecionada também pode ser pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59% ou 60%, preferivelmente pelo menos cerca de 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69% ou 70%, mais preferivelmente pelo menos cerca de 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, ou 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89% ou 90%, ou 91%, 92%, 93%, 94% e ainda mais preferivelmente pelo menos cerca de 95%, 96%, 97%, 98%, 99%, 99,7% ou mais homóloga à seqüência de aminoácido selecionada.
Uma proteína MP da invenção ou uma parte ou fragmento biologicamente ativos desta, sozinha ou em combinação com uma ou mais proteínas do mesmo ou de caminho metabólico diferente, podem catalisar uma reação enzimática em um ou mais caminhos metabólicos de aminoácido, vitamina, co-fator, nutracêutico, nucleotídeo, nucleosídeo ou trealose ou têm uma ou mais das atividades apresentadas na Tabela 1 (por exemplo, metabolismo de biossíntese de metionina ou lisina). Vários aspectos da invenção estão descritos em mais detalhes nas subseções seguintes: A, Moléculas de ácido nucleico isoladas Um aspecto da invenção diz respeito a moléculas de ácido nucleico isoladas que codificam polipeptídeos MP ou partes biologicamente ativas destes, bem como fragmentos da ácido nucleico suficientes para o uso como sondas de hibridização ou iniciadores para a identificação ou amplificação de ácido nucleico que codifica o MP (por exemplo, DNA do MP). Como aqui usado, o termo “molécula de ácido nucleico” é intencionado a incluir moléculas de DNA (por exemplo, cDNA ou DNA genômico) e moléculas de RNA (por exemplo, mRNA) e análogos do DNA ou RNA gerados usando-se análogos de nucleotídeo. Este termo também abrange seqüência não traduzida localizada tanto na extremidade 3’ quanto na 5’ da região codificadora do gene: pelo menos cerca de 100 nucleotídeos da seqüência à montante da extremidade 5’ da região codificadora e pelo menos cerca de 20 nucleotídeos da seqüência à jusante da extremidade 3’ da região codificadora de gene. A molécula de ácido nucleico pode ser de filamento único ou de filamento duplo, mas preferivelmente é DNA de filamento duplo. Uma molécula de ácido nucleico “isolada” é uma que é separada das outras moléculas de ácido nucleico que estão presentes na fonte natural do ácido nucleico. Preferivelmente, um ácido nucleico “isolado” é isento de seqüências que naturalmente flanqueiam o ácido nucleico (isto é, seqüências localizadas nas extremidades 5’ e 3’ do ácido nucleico) no DNA genômico do organismo a partir do qual o ácido nucleico é derivado. Por exemplo, em várias formas de realização, a molécula de ácido nucleico MP isolada pode conter menos do que cerca de 5 kb, 4 kb, 3 kb, 2 kb, 1 kb, 0,5 kb ou 0,1 kb de sequências de nucleotídeo que naturalmente flanqueiam a molécula de ácido nucleico no DNA genômico da célula da qual o ácido nucleico é derivado (por exemplo, uma célula da C. glutamicum). Além disso, uma molécula de ácido nucleico “isolada”, tal como uma molécula de DNA, pode ser substancialmente livre de outro material celular ou meio de cultura quando produzida pelas técnicas recombinantes ou precursores químicos ou outros produtos químicos quando quimicamente sintetizada.
Uma molécula de ácido nucleico da presente invenção, por exemplo, uma molécula de ácido nucleico tendo uma seqüência de nucleotídeo de uma SEQ ID NO: numerada com número impar da Listagem de Seqüência ou uma parte desta podem ser isoladas usando-se técnicas de biologia molecular padrão e a informação de seqüência aqui fornecida. Por exemplo, um DNA MP da C. glutamicum pode ser isolado de uma biblioteca de C. glutamicum usando-se toda ou uma parte de uma das seqüências das SEQ ID NOs numeradas com números impares da Listagem de Seqüência como uma sonda de hibridização e técnicas de hibridização padrão (por exemplo, como descrito em Sambrook, J., Fritsh, E. F. e Maniatis, T. Molecular Cloning: A Laboratory Manual 2a, ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989). Além disso, uma molécula de ácido nucleico que abrange toda ou uma parte de uma das seqüências de ácido nucleico da invenção (por exemplo, uma SEQ ID NO: numerada com número impar) pode ser isolada pela reação de cadeia de polimerase usando-se iniciadores de oligonucleotídeo planejados com base nesta seqüência (por exemplo, uma molécula de ácido nucleico que abrange toda ou uma parte de uma das seqüências de ácido nucleico da invenção (por exemplo, uma SEQ ID NO: numerada com número impar na Listagem de Seqüência) pode ser isolada pela reação de cadeia de polimerase usando-se iniciadores de oligonucleotídeo planejados com base nesta mesma seqüência). Por exemplo, o mRNA pode ser isolado de células endoteliais normais (por exemplo, pelo procedimento de extração de guanidínio-tiocianato de Chirgwin et ai, (1979) Biochemistry 18: 5294 a 5299) e o DNA pode ser preparado usando-se a transcriptase reversa (por exemplo, a transcriptase reversa MLV de Moloney, disponível da Gibco/BRL, Bethesda, MD; ou a transcriptase reversa AMV, disponível da Seikagaku America, Inc., St. Petersburg, FL). Os iniciadores de oligonucleotídeo sintéticos para a amplificação de reação de cadeia de polimerase podem ser planejados com base em uma das seqüências de nucleotídeo mostradas na Listagem de Seqüência. Um ácido nucleico da invenção pode ser amplificado usando-se cDNA ou, altemativamente, o DNA genômico, como um padrão e iniciadores de oligonucleotídeo apropriados de acordo com técnicas de amplificação por PCR padrão. O ácido nucleico assim amplificado pode ser clonado em um vetor apropriado e caracterizado pela análise de seqüência de DNA. Além disso, os oligonucleotídeos que correspondem a uma seqüência de nucleotídeo MP podem ser preparados por técnicas sintéticas padrão, por exemplo, usando-se um sintetizador de DNA automatizado.
Em uma forma de realização preferida, uma molécula de ácido nucleico isolada da invenção compreende uma das seqüências de nucleotídeo apresentadas na Listagem de Seqüência. As seqüências de ácido nucleico da invenção, como apresentadas na Listagem de Seqüência, correspondem aos DNAs MP da Corynebacterium glutamicum da invenção. Este DNA compreende seqüências que codificam proteínas MP (isto é, a “região codificadora” indicada em cada seqüência SEQ ID NO: numerada com número impar na Listagem de Seqüência), bem como as seqüências não traduzidas 5’ e as seqüências não traduzidas 3\ também indicadas em cada SEQ ID NO: numerada com número impar na Listagem de Seqüência. Altemativamente, a molécula de ácido nucleico pode compreender apenas a região codificadora de qualquer uma das seqüências de ácido nucleico da Listagem de Seqüência.
Para os propósitos deste pedido, será entendido que algumas das seqüências de ácido nucleico e de aminoácido MP apresentadas na Listagem de Seqüência tem um número de identificação RXA, RXN, RXS ou RXC tendo a designação “RXA”, “RXN”, “RXS” ou “RXC” seguido por 5 dígitos (isto é, RXA, RXN, RXS ou RXC). Cada uma das seqüências de ácido nucleico compreende até três partes: uma região à montante 5’, uma região codificadora e uma região à jusante. Cada uma destas três regiões é identificada pela mesma designação RXA, RXN, RXS ou RXC para eliminar a confusão. A recitação “uma das seqüências numeradas com número impar na Listagem de Seqüência”, então, refere-se a qualquer uma das seqüências de ácido nucleico na Listagem de Seqüência, que também pode ser distinguida pelas suas designações RXA, RXN, RXS ou RXC diferentes. A região codifícadora de cada uma destas seqüências é traduzida em uma seqüência de aminoácido correspondente, que também é apresentada na Listagem de Seqüência, como uma SEQ ID NO: numerada com número par imediatamente seguindo a seqüência de ácido nucleico correspondente, por exemplo, a região codifícadora para RXA00115 é apresentada na SEQ ID NO: 69, enquanto a seqüência de aminoácido que ela codifica é apresentada como SEQ ID NO: 70. As seqüências das moléculas de ácido nucleico da invenção são identificadas pelas mesmas designações RXA, RXN, RXS ou RXC como as moléculas de aminoácido que elas codificam, tal que possam ser facilmente correlacionadas. Por exemplo, as seqüências de aminoácido designadas RXA00115, RXN00403 e RXS03158 são traduções das regiões codifícadoras das seqüências de nucleotídeo das moléculas de ácido nucleico RXA00115, RXN00403 e RXS03158, respectivamente. A correspondência entre as seqüências de nucleotídeo e de aminoácido RXA, RXN, RXS ou RXC da invenção e suas SEQ ID NOs designadas está apresentada na Tabela 1.
Diversos dos genes da invenção são “genes designados com F”. Um gene designados com F inclui aqueles genes apresentados na Tabela 1 que têm um “F” na frente das designações RXA, RXN, RXS ou RXC. Por exemplo, a SEQID NO: 77, designada, como indicado na Tabela 1, como “F RXA00254” é um gene designado com F.
Também listados na Tabela 1 estão os genes metZ (ou metY) e metC (designados como SEQ ID NO: 1 e SEQ ID NO: 3, respectivamente). A seqüência de aminoácido correspondente codificada pelos genes metZ e metC são designadas como SEQ ID NO: 2 e SEQ ID NO: 5, respectivamente.
Em uma forma de realização, as moléculas de ácido nucleico da presente invenção não são intencionadas a incluir aquelas compiladas na Tabela 2.
Em uma outra forma de realização preferida, uma molécula de ácido nucleico isolada da invenção compreende uma molécula de ácido nucleico que é um complemento de uma das sequências de nucleotídeo da invenção (por exemplo, uma seqüência de uma SEQ ID NO: numerada com número impar na Listagem de Seqüência) ou uma parte desta. Uma molécula de ácido nucleico que é complementar a uma das seqüências de nucleotídeo da invenção é uma que é suficientemente complementar a uma das seqüências de nucleotídeo apresentadas na Listagem de Seqüência (por exemplo, a seqüência de uma SEQ ID NO: numerada com número impar) tal que possa hibridizar com uma das seqüências de nucleotídeo da invenção, formando deste modo um duplex estável.
Ainda em uma outra forma de realização preferida, uma molécula de ácido nucleico isolada da invenção compreende uma seqüência de nucleotídeo que é pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59% ou 60%, preferivelmente pelo menos cerca de 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69% ou 70%, mais preferivelmente pelo menos cerca de 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79% ou 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89% ou 90% ou 91%, 92%, 93%, 94%, e ainda mais preferivelmente pelo menos cerca de 95%, 96%, 97%, 98%, 99%, 99,7% ou mais homólogas a uma seqüência de nucleotídeo da invenção (por exemplo, uma seqüência de uma SEQ ID NO: numerada com número impar na Listagem de Seqüência) ou uma parte desta. As faixas e os valores de identidade intermediários às faixas relatadas acima (por exemplo, 70 a 90% idêntica ou 80 a 95% idêntica) também são intencionadas a estarem abrangidas pela presente invenção. Por exemplo, faixas de valores de identidade usando-se uma combinação de qualquer um dos valores acima relacionados como limites superiores e/ou inferiores são intencionados a estarem incluídos. Em uma forma de realização adicional preferida, uma molécula de ácido nucleico isolada da invenção compreende uma seqüência de nucleotídeo que hibridiza, por exemplo, hibridiza sob condições severas, a uma das seqüências de nucleotídeo da invenção ou uma parte destas.
Além disso, a molécula de ácido nucleico da invenção pode compreender apenas uma parte da região codifícadora da seqüência de uma das SEQ ID NOs numeradas com números impares da Listagem de Seqüência, por exemplo, um fragmento que pode ser usado como uma sonda ou iniciador ou um fragmento que codifica uma parte biologicamente ativa e uma proteína MP. As seqüências de nucleotídeo determinadas a partir da clonagem dos genes MP da C. glutamicum, permitem a geração de sondas e iniciadores planejados para o uso na identificação e/ou clonagem de homólogos MP em outros tipos de células e organismos, bem como homólogos MP de outras Corynebaderia ou espécie relacionada. A sonda/iniciador tipicamente compreende oligonucleotídeo substancialmente purificado. O oligonucleotídeo tipicamente compreende uma região de seqüência de nucleotídeo que hibridiza sob condições severas a pelo menos cerca de 12, preferivelmente cerca de 25, mais preferivelmente cerca de 40, 50 ou 75 nucleotídeos consecutivos de um filamento de sentido de uma das seqüências de nucleotídeo da invenção (por exemplo, uma seqüência de uma das SEQ ID NOs numeradas com números impares da Listagem de Seqüência), uma seqüência anti-sentido de uma destas seqüências ou seus mutantes que ocorrem naturalmente. Os iniciadores com base em uma seqüência de nucleotídeo da invenção podem ser usados em reações de PCR para clonar homólogos de MP. As sondas com base nas seqüências de nucleotídeo MP podem ser usadas para detectar transcritos ou seqüências genômicas que codificam as mesmas proteínas ou proteínas homólogas. Em formas de realização preferidas, a sonda ainda compreende um grupo de rótulo ligada a ela, por exemplo, o grupo de rótulo pode ser um rádio isótopo, um composto fluorescente, uma enzima ou um co-fator de enzima. Tais sondas podem ser usadas como uma parte de um conjunto de teste de diagnóstico para identificar células que expressam erroneamente uma proteína MP, tal como medindo-se um nível de um ácido nucleico que codifica o MP em uma amostra de células de um paciente, por exemplo, detectando-se os níveis de mRNA do MP ou determinado-se se um gene MP genômico foi mutado ou suprimido.
Em uma forma de realização, a molécula de ácido nucleico da invenção codifica uma proteína ou parte desta que inclui uma seqüência de aminoácido que é suficientemente homóloga a uma seqüência de aminoácido da invenção (por exemplo, uma seqüência de uma SEQ ID NO: numerada com número par da Listagem de Seqüência) tal que a proteína ou uma parte desta mantenha a capacidade para catalisar uma reação enzimática em um caminho metabólico de aminoácido, vitamina, co-fator, nutracêutico, nucleotídeo, nucleosídeo ou trealose. Como aqui usada, a linguagem “suficientemente homóloga” refere-se a proteínas ou partes destas que tenham seqüências de aminoácido que incluam uma quantidade mínima de resíduos de aminoácido idênticos ou equivalentes (por exemplo, um resíduo de aminoácido que tenha uma cadeia lateral similar como um resíduo de aminoácido em uma seqüência de uma das SEQ ID NOs numeradas com números pares da Listagem de Seqüência) a uma seqüência de aminoácido da invenção tal que a proteína ou parte desta seja capaz de catalisar uma reação enzimática em um caminho metabólico de aminoácido, vitamina, co-fator, nutracêutico, nucleotídeo, nucleosídeo ou trealose da C. glutamicum. Os membros da proteína de tais caminhos metabólicos, como aqui descritos, funcionam para catalisar a biossíntese ou a degradação de um ou mais de: aminoácidos, vitaminas, co-fatores, nutracêuticos, nucleotídeos, nucleosídeos ou trealose. Os exemplos de tais atividades também estão aqui descritos. Assim, “a função de uma proteína MP” contribui para o funcionamento global de um ou mais de tais caminhos metabólicos e contribui, seja direta ou indiretamente, para o rendimento, produção e/ou eficiência de produção de um ou mais produtos químicos finos. Os exemplos de atividades da proteína MP estão apresentados na Tabela 1.
Em uma outra forma de realização, a proteína é pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59% ou 60%, preferivelmente pelo menos cerca de 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69% ou 70%, mais preferivelmente pelo menos cerca de 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, ou 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89% ou 90%, ou 91%, 92%, 93%, 94% e ainda mais preferivelmente pelo menos cerca de 95%, 96%, 97%, 98%, 99%, 99,7% ou mais homóloga a uma seqüência de aminoácido inteira da invenção (por exemplo, uma seqüência de uma SEQ ID NO: numerada com número par da Listagem de Seqüência).
As partes de proteínas codificadas pelas moléculas de ácido nucleico MP da invenção são preferivelmente porções biologicamente ativas de uma das proteínas MP. Como aqui usado, o termo “parte biologicamente ativa de uma proteína MP” é intencionado incluir uma parte, por exemplo, um domínio/motivo, de uma proteína MP que catalisa uma reação enzimática em um ou mais caminhos metabólicos de aminoácido, vitamina, co-fator, nutracêutico, nucleotídeo, nucleosídeo ou trealose da C. glutamicum ou tem uma atividade apresentada na Tabela 1. Para determinar se uma proteína MP ou uma parte biologicamente ativa desta pode catalisar uma reação enzimática em um caminho metabólico de aminoácido, vitamina, co-fator, nutracêutico, nucleotídeo, nucleosídeo ou trealose, um ensaio de atividade enzimática pode ser realizado. Tais métodos de ensaio são bem conhecidos por aqueles de habilidade comum na técnica, como detalhado no Exemplo 8 da Exemplificação.
Os fragmentos de ácido nucleico adicionais que codificam partes biologicamente ativas de uma proteína MP podem ser preparados isolando-se uma parte de uma das seqüências de aminoácido da invenção (por exemplo, uma seqüência de uma SEQID NO: numerada com número par da Listagem de Seqüência), que expressa a parte codificada da proteína ou peptídeo MP (por exemplo, pela expressão recombinante in vitró) e avaliando-se a atividade da parte codificada da proteína ou peptídeo MP. A invenção ainda abrange moléculas de ácido nucleico que diferem de uma das seqüências de nucleotídeo da invenção (por exemplo, uma seqüência de uma SEQ ID NO: numerada com número impar da Listagem de Seqüência) (e partes desta) devido à degeneração do código genético e assim codifica a mesma proteína MP como aquela codificada pelas seqüências de nucleotídeo da invenção. Em uma outra forma de realização, uma molécula de ácido nucleico isolada da invenção tem uma seqüência de nucleotídeo que codifica uma proteína tendo uma seqüência de aminoácido apresentada na Listagem de Seqüência (por exemplo, uma SEQ ID NO: numerada com número par). Ainda em uma outra forma de realização, a molécula de ácido nucleico da invenção codifica uma proteína da C. glutamicum de comprimento completo que é substancialmente homóloga a uma seqüência de aminoácido da invenção (codificada por uma matriz de leitura aberta mostrada em uma SEQID NO: numerada com número impar da Listagem de Seqüência).
Será entendido por uma pessoa de habilidade comum na técnica que em uma forma de realização as seqüências da invenção não são intencionadas a incluir as seqüências da técnica anterior, tais como aquelas seqüências do GenBank apresentadas na Tabela 2 que foram disponibilizadas antes da presente invenção. Em uma forma de realização, a invenção inclui seqüências de nucleotídeo e de aminoácido tendo uma identidade percentual a uma seqüência de nucleotídeo ou de aminoácido da invenção que é maior do que aquela de uma seqüência da técnica anterior (por exemplo, uma seqüência do GenBank (ou a proteína codificada por tal seqüência) apresentada na Tabela 2). Por exemplo, a invenção inclui uma seqüência de nucleotídeo que é maior do que e/ou pelo menos 45% idêntica à seqüência de nucleotídeo designada RXA00657 SEQ ID NO: 5. Uma pessoa de habilidade comum na técnica pode ser capaz de calcular o patamar inferior da identidade percentual para qualquer seqüência dada da invenção examinando-se as pontuações de identidade percentual calculada pelo GAP apresentados na Tabela 4 para cada um dos três principais para a seqüência dada e subtraindo-se a identidade percentual calculada pelo GAP mais alta de 100 por cento. Uma pessoa de habilidade comum na técnica também avaliará que as seqüências de ácido nucleico e de aminoácido tendo identidades percentuais maiores do que o patamar mais baixo assim calculado (por exemplo, pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59% ou 60%, preferivelmente pelo menos cerca de 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69% ou 70%, mais preferivelmente pelo menos cerca de 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79% ou 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89% ou 90% ou 91%, 92%, 93%, 94%, e ainda mais preferivelmente pelo menos cerca de 95%, 96%, 97%, 98%, 99%, 99,7 ou mais idêntico) também estão abrangidas pela invenção.
Além das seqüências de nucleotídeo MP da C. gluíamicum apresentadas na Listagem de Seqüência como SBQ ID NOs numeradas com números impares, será avaliado por uma pessoa de habilidade comum na técnica que os polimorfismos de seqüência de DNA que levam a mudanças nas seqüências de aminoácido de proteínas MP podem existir dentro de uma população (por exemplo, a população de C. gluíamicum). Tal polimorfismo genético no gene MP pode existir entre indivíduos dentro de uma população devido à variação natural. Como aqui usado, os termos “gene” e “gene recombinante” refere-se a moléculas de ácido nucleico que compreendem uma matriz de leitura aberta que codifica uma proteína MP, preferivelmente uma proteína MP da C. gluíamicum. Tais variações naturais podem tipicamente resultar em variação de 1 a 5% na seqüência de nucleotídeo do gene MP. Qualquer uma e todas de tais variações de nucleotídeo e polimorfismos de aminoácido resultantes no MP que são o resultado de variação natural e que não alteram a atividade funcional das proteínas MP são intencionadas a estarem dentro do escopo da invenção.
As moléculas de ácido nucleico que correspondem às variantes naturais e homólogos não da C. gluíamicum do DNA MP da C. gluíamicum da invenção podem ser isoladas com base na sua homologia ao ácido nucleico de MP da C. gluíamicum aqui divulgado usando-se o DNA da C. gluíamicum ou uma parte deste, como uma sonda de hibridização de acordo com técnicas de hibridização padrão sob condições de hibridização severas. Conseqüentemente, em uma outra forma de realização, uma molécula de ácido nucleico isolada da invenção é pelo menos 15 nucleotídeos no comprimento e hibridiza sob condições severas à molécula de ácido nucleico que compreende uma seqüência de nucleotídeo de uma SEQ ID NO: numerada com número impar da Listagem de Seqüência. Em outras formas de realização, o ácido nucleico é pelo menos 30, 50, 100, 250 ou mais nucleotídeos no comprimento. Como aqui usado, o termo “hibridiza sob condições severas” é intencionado a descrever condições par hibridização e lavagem sob as quais as seqüências de nucleotídeo pelo menos 60% homólogas umas às outras tipicamente permanecem hibridizadas uma à outra. Preferivelmente, as condições são tais que as seqüências pelo menos cerca de 65%, mais preferivelmente pelo menos cerca de 70% e ainda mais preferivelmente pelo menos cerca de 75% ou mais homólogas uma à outra tipicamente permanecem hibridizadas uma à outra. Tais condições severas são conhecidas por uma pessoa de habilidade comum na técnica e pode ser encontrada em Current Protocols in Molecular Biology, John Wiley & Sons, N. Y. (1989), 6.3.1 a 6.3.6. Um exemplo não limitante preferido de condições de hibridização severas é a hibridização em 6X de cloreto de sódio/citrato de sódio (SSC) a cerca de 45°C, seguido por uma ou mais lavagens em 0,2 X SSC, 0,1% SDS entre 50 e 65 °C. Preferivelmente, uma molécula de ácido nucleico isolada da invenção que hibridiza sob condições severas a uma seqüência de ácido nucleico da invenção corresponde a uma molécula de ácido nucleico que ocorre naturalmente. Como aqui usado, uma molécula de ácido nucleico “que ocorre naturalmente” refere-se a uma molécula de RNA ou DNA que tenha uma seqüência de nucleotídeo que ocorra na natureza (por exemplo, codifica uma proteína natural). Em uma forma de realização, o ácido nucleico codifica uma proteína MP da C. glutamicum natural.
Além das variantes que ocorrem naturalmente da seqüência MP que pode existir na população, uma pessoa de habilidade comum na técnica avaliará ainda que mudanças podem ser introduzidas pela mutação em uma seqüência de nucleotídeo da invenção, levando deste modo a mudanças na seqüência de aminoácido da proteína MP codificada, sem alterar a capacidade funcional da proteína MP. Por exemplo, as substituições de nucleotídeo que levam a substituições de aminoácido nos resíduos de aminoácido “não essenciais” podem ser feitas em uma seqüência de nucleotídeo da invenção. Um resíduo de aminoácido “não essencial” é um resíduo que pode ser alterado da seqüência do tipo selvagem de uma das proteínas MP (por exemplo, uma SEQID NO: numerada com número par na Listagem de Seqüência) sem alterar a atividade da dita proteína MP, ao passo que um resíduo de aminoácido “essencial” é requerido para a atividade de proteína MP. Outros resíduos de aminoácido, entretanto, (por exemplo, aqueles que não são conservados ou apenas semi-conservados no domínio tendo atividade MP) podem não ser essenciais para a atividade e assim são prováveis de serem suscetíveis a alterações sem alterar a atividade MP.
Conseqüentemente, um outro aspecto da invenção diz respeito a moléculas de ácido nucleico que codificam proteínas MP que contêm mudanças nos resíduos de aminoácido que não são essenciais para a atividade MP. Tais proteínas MP diferem na seqüência de aminoácido de uma seqüência de uma SEQ ID NO: numerada com número par da Listagem de Seqüência retendo ainda pelo menos uma das atividades MP aqui descritas. Em uma forma de realização, a molécula de ácido nucleico isolada compreende uma seqüência de nucleotídeo que codifica uma proteína, em que a proteína compreende uma seqüência de aminoácido pelo menos cerca de 50% homóloga a uma seqüência de aminoácido da invenção e é capaz de catalisar uma reação enzimática em um caminho metabólico de aminoácido, vitamina, co-fator, nutracêutico, nucleotídeo, nucleosídeo ou trealose ou tem uma ou mais das atividades apresentadas na Tabela 1. Preferivelmente, a proteína codificada pela molécula de ácido nucleico é pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59% ou 60%, preferivelmente pelo menos cerca de 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69% ou 70%, mais preferivelmente pelo menos cerca de 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, ou 80%, 81%, 82%, 83%, 84%, 85%, 86%o, 87%, 88%, 89% ou 90%o, ou 91%, 92%, 93%, 94%» e ainda mais preferivelmente pelo menos cerca de 95%, 96%, 97%, 98%, 99%, 99,7%) homóloga à uma das seqüências de aminoácido da invenção.
Para determinar a homologia percentual de duas seqüências de aminoácido (por exemplo, uma das seqüências de aminoácido da invenção e uma forma mutante desta) ou de dois ácidos nucleicos, as seqüências são alinhadas com propósitos de comparação ótimos (por exemplo, os intervalos podem ser introduzidos na seqüência de uma proteína ou ácido nucleico para o alinhamento ótimo com a outra proteína ou ácido nucleico). Os resíduos de aminoácido ou nucleotídeos nas posições de aminoácido ou posições de nucleotídeo correspondentes são depois comparados. Quando uma posição em uma seqüência (por exemplo, uma das seqüências de aminoácido da invenção) é ocupada pelo mesmo resíduo de aminoácido ou nucleotídeo como a posição correspondente na outra seqüência (por exemplo, uma forma mutante da seqüência de aminoácido) então as moléculas são homólogas naquela posição (isto é, como aqui usado a “homologia” de aminoácido ou de ácido nucleico é equivalente à “identidade” de aminoácido ou de ácido nucleico). A homologia percentual entre as duas seqüências é uma função do número de posições idênticas compartilhadas pelas seqüências (isto é,% de homologia = # de posições idênticas/# total de posições x 100). Uma molécula de ácido nucleico isolada que codifica uma proteína MP homóloga a uma seqüência de proteína da invenção (por exemplo, uma seqüência de uma SEQ ID NO: numerada com número par da Listagem de Seqüência) pode ser criada introduzindo-se uma ou mais substituições, adições ou supressões de nucleotídeo em uma seqüência de nucleotídeo da invenção tal que uma ou mais substituições, adições ou supressões de aminoácido sejam introduzidas na proteína codificada. As mutações podem ser introduzidas em uma das seqüências de nucleotídeo da invenção por técnicas padrão, tais como a mutagênese direcionada a sitio e a mutagênese mediada pela PCR. Preferivelmente, substituições de aminoácido conservativas são feitas em um ou mais resíduos de aminoácido prognosticados não essenciais, Uma “substituição de aminoácido conservativa” é uma em que o resíduo de aminoácido é substituído por um resíduo de aminoácido tendo uma cadeia lateral similar. As famílias de resíduos de aminoácido tendo cadeias laterais similares foram definidas na técnica. Estas famílias incluem aminoácidos com cadeias laterais básicas (por exemplo, lisina, arginina, histidina), cadeias laterais ácidas (por exemplo, ácido aspártico, ácido glutâmico), cadeias laterais polares não carregadas (por exemplo, glicina, asparagina, glutamina, serina, treonina, tirosina, cisteína), cadeias alterais não polares (por exemplo, alanina, valina, leucina, isoleucina, prolina, fenilalanina, metionina, triptofano), cadeias laterais ramificadas em beta (por exemplo, treonina, valina, isoleucina) e cadeias laterais aromáticas (por exemplo, tirosina, fenilalanina, triptofano, histidina). Assim, um resíduo de aminoácido não essencial prognosticado em uma proteína MP é preferivelmente substituído por um outro resíduo de aminoácido da mesma família de cadeia lateral. Altematívamente, em uma outra forma de realização, as mutações podem ser aleatoriamente introduzidas ao longo de toda ou de parte de uma seqüência codificadora do MP, tal como pela mutagênese de saturação e os mutantes resultantes podem ser avaliados quanto a uma atividade MP aqui descrita para identificar mutantes que retenham a atividade MP. Seguindo-se a mutagênese da seqüência de nucleotídeo de uma das SEQID NOs numeradas com números impares na Listagem de Seqüência, a proteína codificada pode ser recombinantemente expressada e a atividade da proteína pode ser determinada usando-se, por exemplo, ensaios aqui descritos (ver o Exemplo 8 da Exemplificação).
Além das moléculas de ácido nucleico que codificam proteínas MP acima descritas, um outro aspecto da invenção diz respeito a moléculas de ácido nucleico isoladas que estão em anti-sentido em relação a estas. Um ácido nucleico de “anti-sentido” compreende uma seqüência de nucleotídeo que é complementar a uma seqüência de ácido nucleico de “sentido” que codifica uma proteína, por exemplo, complementar ao filamento codificador de uma molécula de DNA de filamento duplo ou complementar a uma seqüência de mRNA. Conseqüentemente, um ácido nucleico de anti-sentido pode ligar-se pelo hidrogênio a um ácido nucleico de sentido. O ácido nucleico de anti-sentido pode ser complementar a um filamento codificador do MP inteiro ou a apenas uma parte deste. Em uma forma de realização, uma molécula de ácido nucleico de anti-sentido é anti-sentido a uma “região codificadora” do filamento codificador de uma seqüência de nucleotídeo que codifica uma proteína MP. O termo “região codificadora” refere-se à região da seqüência de nucleotídeo que compreende códons que são traduzidos em resíduos de aminoácido (por exemplo, a região codificadora inteira da SEQID NO: 1 (metZ) compreende os nucleotídeos de 363 a 1673). Em uma outra forma de realização, a molécula de ácido nucleico de anti-sentido é anti-sentido a uma “região não codificadora” do filamento codificador de uma seqüência de nucleotídeo que codifica o MP. O termo “região não codificadora” refere-se às seqüências 5’ e 3’ que flanqueiam a região codificadora que não são traduzidas em aminoácidos (isto é, também chamadas de regiões não traduzidas 5’ e 3’).
Dadas as seqüências de filamento codificador que codificam o MP aqui divulgado (por exemplo, as seqüências apresentadas como SEQ ID NOs numeradas com números impares na Listagem de Seqüência), ácidos nucleicos de anti-sentido da invenção podem ser planejados de acordo com as regras de emparelhamento de base de Watson e Crick. A molécula de ácido nucleico de anti-sentido pode ser complementar à região codificadora inteira do mRNA do MP, mas mais preferivelmente é um oligonucleotídeo que é anti-sentido a apenas uma parte da região codificadora ou não codificadora do mRNA do MP. Por exemplo, oligonucleotídeo de anti-sentido pode ser complementar à região que circunda o sítio de início de tradução do mRNA do MP. Um oligonucleotídeo de anti-sentido pode ser por exemplo, de cerca de 5, 10, 15, 20, 25, 30, 35, 40, 45 ou 50 nucleotídeos no comprimento. Um ácido nucleico de anti-sentido da invenção pode ser construído usando-se a síntese química e reações de ligação enzimáticas usando-se procedimentos conhecidos na técnica. Por exemplo, um ácido nucleico de anti-sentido (por exemplo, um oligonucleotídeo de anti-sentido) pode ser quimicamente sintetizado usando-se nucleotídeos que ocorrem naturalmente ou nucleotídeos diferentemente modificados planejados para aumentar a estabilidade biológica das moléculas ou para aumentar a estabilidade física do duplex formado entre os ácidos nucleicos de anti-sentido e de sentido, por exemplo, os nucleotídeos substituídos pelos derivados de fosforotioato e acridina podem ser usados. Os exemplos de nucleotídeos modificados que podem ser usados para gerar o ácido nucleico de anti-sentido incluem 5-fluorouracila, 5-bromouracila, 5-clorouracila, 5-iodouracila, hipoxantina, xantina, 4-acetilcitosina, 5-(carboxiidroxilmetil)uracila, 5-carboximetilaminometil-2-tiouridina, 5-carboximetilaminometiluracila, diidrouracila, beta-D-galactosilqueosina, inosina, N6-isopenteniladenina, 1-metilguanina, 1-metilinosina, 2,2-dimetilguanina, 2-metiladenina, 2-metüguanina, 3-metilcitosina, 5-metilcitosina, N6-adenina, 7-metilguanina, 5 -metilaminometiluracila, 5-metoxiaminometil-2-tiouracila, beta-D-manosilqueosina, 5’-metoxicarboximetiluracila, 5-metoxiuracila, 2-metiltio-N6-isopenteniladenina, ácido uracil-5-oxiacético (v), vibutoxosina, pseudouracila, queosina, 2-tiocitosina, 5 -metil-2-tiouracila, 2-tiouracila, 4-tiouracila, 5-metiluracila, éster metílico do ácido uracil-5-oxiacético, ácido uracil-5-oxiacético (v), 5 -meti 1 - 2-ti ouracil a, 3-(3-amino-3-N-2-carboxipropil) uracila, (acp3)w e 2,6-diaminopurina. Altemativamente, o ácido nucleico de anti-sentido pode ser biologicamente produzido usando-se um vetor de expressão no qual um ácido nucleico foi subclonado em uma orientação anti-sentido (isto é, o RNA transcrito do ácido nucleico inserido será de uma orientação anti-sentido em relação a um ácido nucleico alvo de interesse, descrito ainda na subseção seguinte).
As moléculas de ácido nucleico de anti-sentido da invenção são tipicamente administradas a uma célula ou geradas in situ tal que hibridizem ou se liguem ao mRNA celular e/ou ao DNA genômico que codificam uma proteína MP para deste modo inibir a expressão da proteína, por exemplo, pela inibição da transcrição e/ou tradução. A hibridização pode ser por complementaridade de nucleotídeo convencional para formar um duplex estável ou, por exemplo, no caso de uma molécula de ácido nucleico de anti-sentido que se liga aos duplexes de DNA, Através das interações específicas no sulco principal da hélice dupla. A molécula de anti-sentido pode ser modificada tal que se ligue especificamente a um receptor ou um antígeno expressado em uma superfície celular selecionada, por exemplo, ligando-se a molécula de ácido nucleico de anti-sentido a um peptídeo ou um anticorpo que se ligue a um receptor de superfície celular ou antígeno. A molécula de ácido nucleico de anti-sentido também pode ser liberada para as células usando-se os vetores aqui descritos. Para se obter concentrações intracelulares suficientes destas moléculas de anti-sentido, construções de vetor em que a molécula de ácido nucleico de anti-sentido é colocada sob o controle de um promotor procariótico, viral ou eucariótico forte são preferidas.
Já em uma outra forma de realização, a molécula de ácido nucleico de anti-sentido da invenção é uma molécula de ácido nucleico a-anomérica. Uma molécula de ácido nucleico a-anomérica forma híbridos de filamento duplo específicos com o RNA complementar em que, ao contrário das unidades β usuais, os filamentos correm paralelos uns aos outros (Gaultier et al., (1987) Nucleic Acids Res. 15: 6625 a 6641). A molécula de ácido nucleico de anti-sentido também pode compreender um 2’-o-metilribonucleotídeo (Inoue et ai, (1987) Nucleic Acids Res. 15: 6131 a 6148) ou um análogo de RNA-DNA quimérico (Inoue et al., (1987) FEBS
Lett. 215.327 a 330).
Ainda em uma outra forma de realização, um ácido nucleico de anti-sentido da invenção é uma ribozima. As ribozimas são moléculas de RNA catalíticas com atividade de ribonuclease que são capazes de clivar um ácido nucleico de filamento único, tal como um mRNA, para o qual têm uma região complementar. Assim, as ribozimas (por exemplo, as ribozimas cabeça de martelo (descritas em Haselhoff e Gerlach (1988) Nature 334: 585 a 591)) podem ser usadas para clivar cataliticamente os transcritos de mRNA do MP para deste modo inibir a tradução do mRNA do MP. Uma ribozima tendo especificidade para um ácido nucleico que codifica o MP pode ser planejada com base na seqüência de nucleotídeo de um DNA do MP aqui divulgado (isto é, SEQID NO: 1 {meíZ}). Por exemplo, um derivado de um RNA de L-19 IVS de Teírahymena pode ser construído em que a seqüência de nucleotídeo do sítio ativo é complementar à seqüência de nucleotídeo a ser clivada em um mRNA que codifica MP. Ver, por exemplo, Cech et al., Patente U.S. N2 4.987.071 e Cech et al, Patente U.S. N2 5.116.742. Altemativamente, o mRNA do MP pode ser usado para selecionar um RNA catalítico tendo uma atividade de ribonuclease específica de uma reunião de moléculas de RNA. Ver, por exemplo, Bartel, D. e Szostak, J. W. (1993) Science 261:1411 a 1418.
Altemativamente, a expressão do gene MP pode ser inibida alvejando-se as seqüências de nucleotídeo complementares à região reguladora de uma seqüência de nucleotídeo do MP (por exemplo, um promotor e/ou realçadores do MP) para formar estruturas helicoidais triplas que impedem a transcrição de um gene MP nas células alvo. Ver, no geral, Helene, C. (1991) Anticancer Drug Des. 6(6): 569 a 584; Helene, C. et al., (1992) Ann. N. Y. Acad. Sei. 660: 27 a 36; e Maher, L. J. (1992) Bioassays 14(12): 807 a 815.
Um outro aspecto da invenção diz respeito a combinações de genes envolvidos no metabolismo de metionina e/ou lisina e ao uso das combinações de genes envolvidas no metabolismo de metionina e/ou lisina nos métodos da invenção. As combinações preferidas são as combinações de metZ com metC, metB (que codifica a Cistationina Sintase), metA (que codifica a homoserina-O-acetiltransferase), metE (que codifica a Metionina Sintase), metH (que codifica a Metionina Sintase), hom (que codifica a homoserina desidrogenase), asd (que codifica a aspartato semialdeído desidrogenase), lysC/ask (que codifica a aspartocinase ) e rxa00657 (aqui designado como a SEQ ID NO: 5), dapA (gene que codifica a DIIDRODIPICOLINATO SINTASE), dapB (gene que codifica a DIIDRODIPICOLINATO REDUCTASE), dapC (gene que codifica a 2,3,4,5-tetraidropiridina-2-carboxilato N-succiniltransferase), dapD/argD (gene que codifica a acetilomitina transaminase), dapE (gene que codifica a succinildiaminopimelato dessuccinilase), dapF (gene que codifica a diaminopimelato epimerase), lysA (gene que codifica a diaminopimelato descarboxilase), ddh (gene que codifica a diaminopimelato desidrogenase), lysE (gene que codifica o exportador de lisina), lysG (gene que codifica o regulador do exportador), hsk (gene que codifica a homoserina cinase) bem como os genes envolvidos na reação anaplerótica tal como ppc (gene que codifica a fosfoenolpiruvato carboxilase), ppcK (gene que codifica a fosfoenolpiruvato carboxicinase), pycA (gene que codifica a piruvato carboxilase), accD, accA, accB, accC (genes que codificam as subunidades da acetil-CoA-carboxilase), bem como os genes do caminho de pentose-fosfato, os genes gpdh que codifica a glicose-6-fosfato-desidrogenase, opcA, pgdh gene que codifica a 6-fosfogliconato-desidrogenase), ta (gene que codifica a transaldolase), ik (gene que codifica a transcetolase), pgl (gene que codifica a 6-FOSOFOGLICONOLACTONASE), ripe (gene que codifica a RIBULOSE-FOSFATO-3-EPIMERASE) rpe (gene que codifica a RIBOSE 5-FOSFATO EPIMERASE) ou combinações dos genes mencionados acima dos caminhos de pentose-fosfato ou outros genes MP da invenção.
Os genes podem ser alterados na sua seqüência de nucleotídeo e na seqüência de aminoácido correspondente resultando em derivados de tal modo que a sua atividade seja alterada sob condições fisiológicas que levam a um aumento na produtividade e/ou rendimento de um produto químico fino desejado, por exemplo, um aminoácido tal como metionina ou lisina. Uma classe de tal alterações ou derivados é bem conhecida para seqüência de nucleotídeo do gene ask que codifica a aspartocinase. Estas alterações levam à remoção da inibição da rejeição pelos aminoácidos lisina e treonina e subseqüentemente à supraprodução de lisina. Em uma forma de realização preferida, o gene metZ ou formas alteradas do gene metZ são usados em uma cepa de Corynebacterium em combinação com ask, hom, metA e metH ou derivados destes genes. Em uma outra forma de realização preferida o metZ ou formas alteradas do gene metZ são usados em uma cepa de Corynebacterium em combinação com ask, hom, metA e metE ou derivados destes genes. Em uma forma de realização mais preferida, as combinações do gene metZ ou formas alteradas do gene metZ são combinados com ask, hom, metA e metH ou derivados destes genes ou metZ é combinado com ask, hom, metA e metE ou derivados destes genes em uma cepa de Corynebacterium e fontes de enxofre tais como sulfatos, tiossulfatos, sulfitos e também fontes de enxofre mais reduzidas tais como H2S e sulfetos e derivados são usados no meio de desenvolvimento. Da mesma maneira, fontes de enxofre tais como metil mercaptano, ácido metanossulfônico, tioglicolatos, tiocianatos, tiouréia, enxofre contendo aminoácidos tais como cisteína e outros compostos contendo enxofre podem ser usados. Um outro aspecto da invenção diz respeito ao uso das combinações de gene mencionadas acima em uma cepa de Corynebacterium que é, antes ou depois da introdução do gene, mutagenizada pela radiação ou por produtos químicos mutagênicos bem conhecidos por uma pessoa de habilidade comum na técnica e selecionados quanto a resistência contra altas concentrações do produto químico fino de interesse, por exemplo, lisina ou metionina ou análogos dos produtos químicos finos desejados tais como os análogos de metionina, etionina, metil metionina ou outros. Em uma outra forma de realização, as combinações de gene acima mencionadas podem ser expressadas em uma cepa de Corynebacterium tendo rompimentos de gene particulares. Os preferidos são rompimentos de gene que codificam proteínas que favorecem o fluxo de carbono para metabólitos não desejados. Onde a metionina é o produto químico fino desejado a formação de lisina pode ser desfavorável. Em tal caso, a combinação dos genes mencionados acima devem se processar em uma cepa de Corynebacterium que carrega um rompimento de gene do gene lysA (que codifica a diaminopimelato descarboxilase) ou do gene ddh (que codifica a meso-diaminopimelato desidrogenase que catalisa a conversão de tetraidropicolinato para meso-diaminopimelato). Em uma forma de realização preferida, uma combinação favorável dos genes mencionados acima são todas alteradas de tal modo que os seus produtos de gene não são inibidos pela regeneração pelos produtos finais ou metabólitos do caminho biossintético que leva ao produto químico fino desejado. No caso em que o produto químico fino desejado é metionina, as combinações de gene podem ser expressadas em uma cepa previamente tratada com agentes mutagênicos ou radiação e selecionados quanto à resistência mencionada acima. Adicionalmente, a cepa deve ser cultivada em um meio de cultivo contendo uma ou mais das fontes de enxofre mencionadas acima.
Em uma outra forma de realização da invenção, um gene foi identificado a partir do genoma da Corynebacterium glutamicum como um gene que codifica uma proteína reguladora transcricional hipotética. Este gene é descrito como RXA00657. A seqüência de nucleotídeo de RXA00657 corresponde à SEQ ID NO: 5. A seqüência de aminoácido de RXA00657 corresponde à SEQ ID NO: 6. Foi verificado que quando o gene RXA00657, bem como as regiões reguladoras à montante e à jusante descritas nos exemplos, foram clonados em um vetor capaz de replicar na Corynebacterium glutamicum e transformados e expressados em uma cepa produtora de lisina tal como a ATCC13286, que esta cepa produziu mais lisina comparada com a cepa transformada com o mesmo plasmídeo carecendo do fragmento de nucleotídeo anteriormente mencionado RXA00657. Além da observação de que o título de lisina foi aumentado na cepa mencionada, a seletividade determinada pela quantidade molar de lisina produzida comparada com a quantidade molar de sacarose consumida foi aumentada (ver o Exemplo 14). A supraexpressão de RXA00657 em combinação com a supraexpressão de outros genes cada um diretamente envolvido no caminho específico da lisina tal como lysC, dapA, dapB, dapC, dapD, dapF, ddh, lysE, lysG e lysR resulta em uma aumento na produção de lisina comparado ao RXA00657 sozinho. B, Vetores de expressão recombinantes e células hospedeiras Um outro aspecto da invenção diz respeito a vetores, preferivelmente vetores de expressão, contendo um ácido nucleico que codifica uma proteína MP (ou uma parte desta) ou combinações de genes em que pelo menos um gene codifica uma proteína MP. Como aqui usado, o termo “vetor” refere-se a uma molécula de ácido nucleico capaz de transportar um outro ácido nucleico ao qual foi ligado. Um tipo de vetor é um “plasmídeo”, que refere-se a uma volta de DNA de filamento duplo circular na qual os segmentos de DNA adicionais podem ser ligados. Um outro tipo de vetor é um vetor viral, em que segmentos de DNA adicionais podem ser ligados no genoma viral. Certos vetores são capazes de replicação autônoma em uma célula hospedeira na qual são introduzidos (por exemplo, os vetores bacterianos tendo uma origem bacteriana de replicação e vetores mamíferos epissômicos). Outros vetores (por exemplo, os vetores mamíferos não epissômicos são integrados no genoma de uma célula hospedeira na introdução na célula hospedeira e deste modo são replicados junto com o genoma hospedeiro. Além disso, certos vetores são capazes de direcionar a expressão de genes aos quais estão operativamente ligados. Tais vetores são aqui chamados de “vetores de expressão”. No geral, os vetores de expressão de utilidade em técnicas de DNA recombinantes estão ffeqüentemente na forma de plasmídeos. No presente relatório descritivo, “plasmídeo” e “vetor” podem ser usados intercambiavelmente visto que o plasmídeo é a forma mais habitualmente usada de vetor. Entretanto, a invenção é intencionada a incluir outras tais formas de vetores de expressão, tais como vetores virais (por exemplo, retrovírus defeituosos na replicação, adenovírus e vírus associados a adeno) que servem funções equivalentes.
Os vetores de expressão recombinantes da invenção compreendem um ácido nucleico da invenção em uma forma adequada para a expressão do ácido nucleico em uma célula hospedeira, que significa que os vetores de expressão recombinantes incluem uma ou mais seqüências reguladoras, selecionadas nas base das células hospedeiras a serem usadas para a expressão, que são operativamente ligados à seqüência de ácido nucleico a ser expressada. Dentro de um vetor de expressão recombinante, “operavelmente ligado” é intencionado a significar que a seqüência de nucleotídeo de interesse está ligada à(s) seqüência(s) reguladora(s) de uma maneira que permita a expressão da seqüência de nucleotídeo (por exemplo, em um sistema de transcrição/tradução in vitro ou em uma célula hospedeira quando o vetor é introduzido na célula hospedeira). O termo “seqüência reguladora” é intencionado a incluir promotores, sítios de ligação repressores, sítios de ligação ativadores, realçadores e outros elementos de controle de expressão (por exemplo, terminadores, sinais de poliadenilação ou outros elementos de uma estrutura secundária de mRNA). Tais seqüências reguladoras estão descritas, por exemplo, em Goeddel; Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA (1990). As seqüências reguladoras incluem aquelas que direcionam a expressão constitutiva de uma seqüência de nucleotídeo em muitos tipos de célula hospedeira e aquelas que direcionam a expressão da seqüência de nucleotídeo apenas em certas células hospedeiras. As seqüências reguladoras preferidas são, por exemplo, os promotores tais como cos-, tac-, trp-, tet-, trp-tet-, lpp-, lac-, Ipp-lac-, laclq-, T7-, T5-, T3-, gal-, trc-, ara-, SP6-, amy, SP02, λ-Ρκ- ou λ PL, que são usados preferivelmente em bactérias. As seqüências reguladoras adicionais são, por exemplo, promotores de leveduras e fungos, tais como ADC1, MFa, AC, P-60, CYC1, GAPDH, TEF, rp28, ADH, promotores de vegetais tais como CaMV/35S, SSU, OCS, lib4, usp, STLS1, B33, nos ou promotores de ubiquitina ou faseolina. Também é possível usar promotores artificiais. Será avaliado por uma pessoa de habilidade comum na técnica que o planejamento do vetor de expressão pode depender de fatores tais como a escolha da célula hospedeira a ser transformada, o nível de expressão da proteína desejada, etc. Os vetores de expressão da invenção podem ser introduzidos em células hospedeiras para deste modo produzir proteínas ou peptídeos, incluindo proteínas ou peptídeos de fusão, codificados por ácidos nucleicos como aqui descritos (por exemplo, proteínas MP, formas mutantes de proteínas MP, proteínas de fusão, etc.).
Os vetores de expressão recombinantes da invenção podem ser planejados para a expressão de proteínas MP em células procarióticas ou eucarióticas. Por exemplo, os genes MP podem ser expressados em células bacterianas tais como a C. glutamicum, células de inseto (usando-se vetores de expressão de baculovírus), células de levedura e outros fungos (ver Romanos, Μ. A. et ai, (1992) “Foreign Gene Expression in Yeast: A Review”, Yeast 8: 423 a 488; van den Hondel, C. A. M. J. J. et al, (1991) “Heterologous Gene Expression in Filamentous Fungi” em: More Gene Manipulations in Fungi. J. W, Bennet & L. L. Lasure, eds., p. 396 a 428: Academic Press: San Diego; e van den Hondel, C. A. M. J. J. e Punt, P.J. (1991) “Gene Transfer Systems and Vector Developments for Filamentous Fungi, em: Applied Molecular Genetics of Fungi, Peberdy, J. F., et al., eds., p. 1 a 28, Cambridge University Press: Cambridge). As células de algas e vegetais multicelulares (ver Schmidt, R. e Willmitzer, L. (1998) High Efficiency Agrobacterium tumefaciens - Mediated Transformation of Ârabidopsis thaliana Leaf and Cotyledon Explants” Plant Cell Rep.: 583 a 586) ou células de mamífero. As células hospedeiras adequadas são ainda debatidas em Goeddel, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA (1990). Altemativamente, um vetor de expressão recombinante pode ser transcrito e traduzido in vitro, por exemplo, usando-se seqüências reguladoras do promotor T7 e polimerase T7. A expressão de proteínas em procariotas é mais ffeqüentemente realizada com vetores contendo promotores constitutivos ou indutíveis e direcionam a expressão de proteínas de fusão ou de não fusão. Os vetores de fusão adicionam vários aminoácidos a uma proteína codificada neste, usualmente no término amino da proteína recombinante mas também no término C ou fundidos dentro de regiões adequadas nas proteínas. Tais vetores de fusão tipicamente servem a três propósitos: 1) para aumentar a expressão de proteína recombinante; 2) para aumentar a solubilidade da proteína recombinante; e 3) para auxiliar na purificação da proteína recombinante pela atuação como um ligando na purificação de afinidade. Freqüentemente, em vetores de expressão de fusão, um sítio de divagem proteolítica é introduzido na junção da porção de fusão e a proteína recombinante para permitir a separação da proteína recombinante da porção de fusão subseqüente à purificação da proteína de fusão. Tais enzimas e suas seqüências de reconhecimento cognatas incluem o Fator Xa, trombina e enterocinase.
Os vetores de expressão de fusão típicos incluem pGEX (Pharmacia Biotech Inc., Smith, D. B. e Johnson, K. S. (1988) Gene 67: 31 a 40), pMAL (New England Biolabs, Beverly, MA) e pRIT5 (Pharmacia, Piscataway, NJ) que funde a glutationa S-transferase (GST) a proteína de ligação E da maltose ou a proteína A, respectivamente, à proteína recombinante alvo. Em uma forma de realização, a seqüência codificadora da proteína MP é clonada em um vetor de expressão pGEX para criar um vetor que codifica uma proteína de fusão que compreende, a partir do término N para o término C, GST-sítio de divagem de trombina-proteína X. A proteína de fusão pode ser purificada pela cromatografia de afinidade usando-se resina de glutationa-agarose. A proteína MP recombinante não fundida à GST pode ser recuperada pela divagem da proteína de fusão com trombina.
Os exemplos de vetores de expressão da E. coli de não fusão indutíveis adequados incluem pTrc (Amarm et al., (1988) Gene 69: 301 a 315) pLG338, pACYC184, pBR322, pUC18, pUC19, pKC30, pRep4, pHSl, pHS2, pPLc236, pNBL24, pLG200, pUR290, pIN-IIIl 13-B1, Xgtll, pBdCl e pET lld (Studier et al., Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, Califórnia (1990) 60 a 89; e Pouwels et al., eds. (1985) Cloning Vectors, Elsevier: New York IBSN 0 444 904018). A expressão do gene alvo a partir do vetor pTrc reside na transcrição de polimerase do RNA hospedeiro a partir de um promotor de fusão trp-lac híbrido. A expressão do gene alvo a partir do vetor pET lld reside na transcrição de um promotor de fusão gnlO-lac do T7 mediada por uma polimerase de RNA viral co-expressada (T7 gnl). Esta polimerase viral é fornecida pelas cepas hospedeiras BL21(DE3) ou HMS174(DE3) a partir de um profago λ residente que abriga um gene T7 gnl sob o controle transcricional do promotor lacUV 5. Para a transformação de outras variedades de bactérias, vetores apropriados podem ser selecionados. Por exemplo, os plasmídeos piJ101, pIJ364, pIJ702 e pIJ361 são conhecidos por serem úteis na transformação de Streptomyces, enquanto os plasmídeos pUB 110, pC194 ou pBD214 são adaptados para a transformação da espécie Bacillus. Diversos plasmídeos de uso na transferência de informação genética na Corynebacterium incluem pHMl519, pBLl, pSA77 oupAJ667 (Pouwels et ai, eds. (1985) Cloning Vectors. Elsevier: New York IBSN 0 444 904018).
Uma estratégia para maximizar a expressão de proteína recombinante é expressar a proteína em uma bactéria hospedeira com uma capacidade prejudicada para clivar proteoliticamente a proteína recombinante (Gottesman, S., Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, Califórnia (1990) 119 a 128), Uma outra estratégia é alterar a seqüência de ácido nucleico do ácido nucleico a ser inserido em um vetor de expressão de modo que os códons individuais para cada aminoácido sejam aqueles preferencialmente utilizados na bactéria escolhida para a expressão, tal como a C. glutamicum (Wada et ai, (1992) Nucleic Acids Res. 20: 2111 a 2118). Tal alteração de seqüências de ácido nucleico da invenção pode ser realizada por técnicas de síntese de DNA padrão.
Em uma outra forma de realização, o vetor de expressão da proteína MP é um vetor de expressão de levedura. Os exemplos de vetores para a expressão em levedura S. cerevisiae incluem pYepSecl (Baldari, et ai, (1987) EMBO J. 6: 229 a 234), 2 μ, pAG-1, Yep6, Yepl3, pEMBLYe23, pNFa (Kuijan e Herskowitz, (1982) Cell 30: 933 a 943), pJRY88 (Schultz et ai, (1987) Gene 54: 113 a 123) e pYES2 (Invitrogen Corporation, San Diego, CA). Os vetores e métodos para construção de vetores apropriados para o uso em outros fungos, tais como os fungos filamentosos incluem aqueles detalhados em van den Hondel, C. A. M. J. J. & Punt P. J. (1991) “Gene Transfer Systems and Vector Developments for Filamentous Fungi, em: Applied Molecular Genetics of Fungi, J. F Peberdy., et ai, eds., p. 1 a 28, Cambridge University Press: Cambridge e Pouwels et ai, eds. (1985) Cloning Vectors. Elsevier: New York (IBSN 0 444 904018).
Altemativamente, as proteínas MP da invenção podem ser expressadas era células de inseto usando-se vetores de expressão de baculovírus. Os vetores de baculovírus disponíveis para a expressão de proteínas era células de inseto cultivadas (por exemplo, células Sf9) incluem a série pAc (Smith et al., (1983) Mol. Cell BioL 3: 2156 a 2165) e a série pVL (Lucklow e Summers (1989) Virology 170: 31 a 39).
Em uma outra forma de realização, as proteínas MP da invenção podem ser expressadas em células vegetais unicelulares (tais como algas) ou em células vegetais de plantas superiores (por exemplo, as Spermatophytes, tais como vegetais de safra). Os exemplos de vetores de expressão vegetais incluem aqueles detalhados em Becker, D., Kemper, E., Schell, J. e Masterson, R. (1992) “New Plant Binary Vectors com Selectable Markers Located Proximal to the Left Border”, Plant Mol. Biol. 20: 1195 a 1197; e Bevan, M. W. (1984) “Binary Agrobacterium Vectors for Plant Transformation”, Nucl. Acid. Res. 12: 8711 a 8721 e incluem pLGV23, pGHlac+, pBIN19, pAK2004 e pDH51 (Pouwels et al, eds. (1985) Cloning Vectors. Elsevier: New York IBSN 0 444 904018). Já em uma outra forma de realização, um ácido nucleico da invenção é expressado em células mamíferas usando-se um vetor de expressão mamífero. Os exemplos de vetores de expressão mamíferos incluem pCDM8 (Seed, B. (1987) Nature 329:840) e pMT2PC (Kaufman et al., (1987) EMBO J. 6:187 a 195). Quando usado em células mamíferas, as funções de controle do vetor de expressão são freqüentemente fornecidas por elementos reguladores virais. Por exemplo, os promotores habitualmente usados são derivados de polioma, Adenovírus 2, citomegalovírus e o Vírus Símio 40. Par outros sistemas de expressão adequados tanto para as células procarióticas quanto para as eucarióticas ver os capítulos 16 e 17 de Sambrook, J., Fritsh, E. F. e. Maniatis, T. Molecular Cloning: A Laboratory Manual 2a, ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989.
Em uma outra forma de realização, o vetor de expressão mamífero recombinante é capaz de direcionar a expressão do ácido nucleico preferencialmente em um tipo de célula particular (por exemplo, elementos reguladores específicos de tecido são usados para expressar o ácido nucleico). Os elementos reguladores específicos de tecido são conhecidos na técnica. Os exemplos não limitantes de promotores específicos de tecido incluem o promotor da albumina “específico do fígado; Pinkert et al, (1987) Genes Dev. 1: 268 a 277, promotores específicos de linfóides (Calame e Eaton (1988) Adv. Immunol, 43: 235 a 275), em promotores particulares de receptores de célula T (Winoto e Baltimore (1989) EMBO J. 8: 729 a 733) e imunoglobulinas (Baneiji et al., (1983) Cell 33: 729 a 740, Queen e Baltimore (19830 Cell 33: 741 a 748), promotores específicos de neurônio (por exemplo, o promotor de neurofilamento; Byme e Ruddle (1989) PNAS 86: 5473 a 5477), promotores específicos do pâncreas (Edlund et al., (1985) Science 230: 912 a 916) e promotores específicos de glândula mamária (por exemplo, promotor do soro do leite; Patente U.S. N2 4.873.316 e Publicação do Pedido Europeu N2 264.166). Os promotores regulados de modo desenvolvimental também estão abrangidos, por exemplo, os promotores hox de murino (Kesel e Gruss (1990) Science 249: 374 a 379 e o promotor da a-fetoproteína (Campes e Tilghman (1989) Genes Dev. 3:537 a 546). A invenção ainda fornece um vetor de expressão recombinante que compreende uma molécula de DNA da invenção clonada no vetor de expressão em uma orientação anti-sentido. Isto é a molécula de DNA é operativamente ligada a uma sequência reguladora de uma maneira que permita a expressão (pela transcrição da molécula de DNA) de uma molécula de RNA que é anti-sentido em relação ao mRNA do MP. As seqüências reguladoras operativamente ligadas a um ácido nucleico clonado na orientação anti-sentido podem ser escolhidas de modo que direcionem a expressão contínua da molécula de RNA de anti-sentido em uma variedade de tipos de célula, por exemplo, promotores virais e ou realçadores ou seqüências reguladoras podem ser escolhidas de modo que direcionem a expressão constitutiva, específica de tecido ou específica do tipo de célula de um RNA de anti-sentido. O vetor de expressão de anti-sentido pode estar na forma de um plasmídeo, fagomídeo ou vírus atenuado recombinantes em que os ácidos nucleicos de anti-sentido são produzidos sob o controle de uma região reguladora de alta eficiência, a atividade da qual pode ser determinada pelo tipo de célula no qual o vetor é introduzido. Para um debate da regulagem de expressão de gene usando genes de anti-sentido ver Weintraub, H. et al., Antisense RNA as a molecular tool for genetic analysis, Reviews -Trends in Genetics, vol. 1(1) 1986.
Um outro aspecto da invenção diz respeito a células hospedeiras nas quais um vetor de expressão recombinante da invenção foi introduzido. Os termos “célula hospedeira” e “célula hospedeira recombinante” são aqui usados intercambiavelmente. E entendido que tais termos referem-se não apenas à célula objeto particular mas à descendência ou descendência potencial de tal célula. Porque certas modificações possam ocorrer em gerações sucessivas devido à mutação ou influencias ambientais, tal descendência não pode ser, de fato, idêntica à célula precursora, mas estão ainda incluídas dentro do escopo do termo como aqui usado.
Uma célula hospedeira pode ser qualquer célula procariótica ou eucariótica. Por exemplo, uma proteína MP pode ser expressada em células bacterianas tais como a C. glutamicum, células de inseto, células de levedura o de mamífero (tais como as células do ovário de hamster Chinês (CHO) ou células COS). Outras células hospedeiras adequadas são conhecidas por aqueles de habilidade comum na técnica. Os microorganismos relacionados com a Corynebacterium glutamicum que podem ser convenientemente usados como células hospedeiras para as moléculas de ácido nucleico e de proteína da invenção estão apresentados na Tabela 3. 0 DNA vetorial pode ser introduzido nas células procarióticas ou eucarióticas por intermédio de técnicas de transformação ou transfecção convencionais. Como aqui usado, os termos “transformação” e “transfecção”, “conjugação” e “transdução” são intencionados a referirem-se a uma variedade de técnicas reconhecidas no ramo para a introdução de ácido nucleico estranho (por exemplo, DNA linear ou RNA (por exemplo, um vetor linearizado ou uma construção de gene sozinha sem um vetor) ou ácido nucleico na foram de um vetor (por exemplo, um plasmídeo, fago, fasmídeo, fagomídeo, transposon ou outro DNA) em uma célula hospedeira, incluindo a co-precipitação com fosfato de cálcio ou cloreto de cálcio, a transfecção mediada por DEAE-dextrano, a lipofecção, competência natural, transferência mediada por produto químico ou eletroporação. Os métodos adequados para transformar ou transfectar células hospedeiras podem ser encontrados em Sambrook, et al, (Molecular Cloning: A Laboratory Manual 2a, ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989), e outros manuais de laboratório.
Para a transfecção estável de células mamíferas, é conhecido que, dependendo do vetor de expressão e da técnica de transfecção usada, apenas uma pequena fração de células pode integrar o DNA estranho no seu genoma. De modo a identificar e selecionar estes integrantes, um gene que codifica um marcador selecionável (por exemplo, resistência a antibióticos) é, no geral, introduzido nas células hospedeiras junto com o gene de interesse. Os marcadores selecionáveis preferidos incluem aqueles que conferem resistência a medicamentos, tais como G418, higromicina e metotrexato. O ácido nucleico que codifica um marcador selecionável pode ser introduzido em uma célula hospedeira no mesmo vetor como aquele que codifica uma proteína MP ou pode ser introduzido em um vetor separado. As células estavelmente transfectadas com o ácido nucleico introduzido podem ser identificadas pela seleção de medicamento (por exemplo, células que tenham incorporado o gene marcador selecionável sobreviverá, enquanto as outras células morrerão).
Para criar um microorganismo recombinante homólogo, um vetor é preparado o qual contém pelo menos uma porção de um gene MP na qual uma supressão, adição ou substituição foi introduzida para deste modo alterar por exemplo, romper funcionalmente, o gene MP. Preferivelmente, este gene MP é um gene MP do Corynebacterium glutamicum, mas este pode ser um homólogo de uma bactéria relacionada ou mesmo de uma fonte de mamífero, de levedura ou de inseto. Em uma forma de realização preferida, o vetor é planejado tal que, na recombinação homóloga, o gene MP endógeno é funcionalmente rompido (isto é, não mais codifica uma proteína funcional, também chamado de vetor de inativação). Altemativamente, o vetor pode ser planejado tal que, na recombinação homóloga, o gene MP endógeno seja mutado ou de outro modo alterado mas ainda codifica uma proteína funcional (por exemplo, a região reguladora à montante pode ser alterada para deste modo alterar a expressão da proteína MP endógena). No vetor de recombinação homóloga, a parte alterada do gene MP é flanqueada nas suas extremidades 5’ e 3’ pelo ácido nucleico adicional do gene MP para permitir que a recombinação homóloga ocorra entre o gene MP exógeno carregado pelo vetor e um gene MP endógeno em um microorganismo. O ácido nucleico MP flanqueador adicional é de comprimento suficiente para a recombinação homóloga bem sucedida com o gene endógeno. Tipicamente, diversas quilobases de DNA flanqueador (em ambas as extremidades 5’ e 3’) são incluídas no vetor (ver, por exemplo, Thomas, K. R. e Capecchi, M. R. (1987) Cell 51: 503 para uma descrição de vetores de recombinação homóloga). O vetor é introduzido em um microorganismo (por exemplo, pela eletroporação) e as células nas quais o gene MP introduzido recombinou homologamente com o gene MP endógeno são selecionadas, usando-se técnicas conhecida no ramo.
Em uma outra forma de realização, os microorganismos recombinantes podem ser produzidos de modo que contenham sistemas selecionados que permitam a expressão regulada do gene introduzido. Por exemplo, a inclusão de um gene MP em um vetor colocando-o sob o controle do operon lac permite a expressão do gene MP apenas na presença de IPTG. Tais sistemas reguladores são bem conhecidos na técnica.
Em uma outra forma de realização, um gene MP endógeno em uma célula hospedeira é rompida (por exemplo, pela recombinação homóloga ou outros meios genéticos conhecidos na técnica) tal que a expressão do seu produto de proteína não ocorra. Em uma outra forma de realização, um gene MP endógeno ou introduzido em uma célula hospedeira foi alterado por uma ou mais mutações de ponto, supressões ou inversões, mais ainda codifica uma proteína MP funcional. Ainda em uma outra forma de realização, uma ou mais das regiões reguladoras (por exemplo, um promotor, repressor ou indutor) de um gene MP em um microorganismo foram alteradas (por exemplo, pela supressão, truncagem, inversão ou mutação de ponto) tal que a expressão do gene MP é modulada. Uma pessoa de habilidade comum na técnica avaliará que células hospedeiras contendo mais do que uma das modificações do gene e da proteína do MP descritas podem ser facilmente produzidas usando-se os métodos da invenção e são intencionadas a estarem incluídas na presente invenção.
Uma célula hospedeira da invenção, tal como uma célula hospedeira procariótica ou eucariótica em cultura, pode ser usada para produzir (isto é, expressar) uma proteína MP. Consequentemente, a invenção ainda fornece métodos para produzir proteínas MP usando as células hospedeiras da invenção. Em uma forma de realização, o método compreende cultivar a célula hospedeira da invenção (na qual um vetor de expressão recombinante que codifica uma proteína MP foi introduzido ou em cujo genoma foi introduzido um gene que codifica uma proteína MP do tipo selvagem ou alterada) em um meio adequado até que a proteína MP seja produzida. Em uma outra forma de realização, o método ainda compreende isolar proteínas MP do meio ou da célula hospedeira. C. Proteínas MP isoladas Um outro aspecto da invenção diz respeito a proteínas MP isoladas e partes biologicamente ativas destas. Uma proteína “isolada” ou “purificada” ou parte biologicamente ativa desta é substancialmente livre de material celular quando produzida pelas técnicas de DNA recombinantes ou precursores químicos ou outros produtos químicos quando quimicamente sintetizada. A linguagem “substancialmente livre de material celular” inclui preparações de proteína MP em que a proteína é separada dos componentes celulares das células nas quais é natural ou recombinantemente produzida. Em uma forma de realização, a linguagem “substancialmente livre de material celular” inclui preparações de proteína MP tendo menos do que cerca de 30% (em peso seco) de uma proteína que não do MP (também chamada aqui de “proteína contaminante”), mais preferivelmente menos do que cerca 20% de uma proteína que não a do MP, ainda mais preferivelmente menos do que cerca de 10% de uma proteína que não a do MP e o mais preferivelmente menos do que cerca de 5% de uma proteína que não a do MP. Quando a proteína MP ou parte biologicamente ativa desta é recombinantemente produzida, também é preferível e substancialmente isenta de meio de cultura, isto é, o meio de cultura representa menos do que cerca de 20%, mais preferivelmente menos do que cerca d 10% e o mais preferivelmente menos do que cerca de 5% do volume da preparação de proteína. A linguagem “substancialmente livre de precursores químicos ou outros produtos químicos” inclui preparações de proteína MP em que a proteína é separada dos precursores químicos ou de outros produtos químicos que estão envolvidos nas síntese da proteína. Em uma forma de realização, a linguagem “substancialmente livre de precursores químicos ou outros produtos químicos” inclui preparações de proteína MP tendo menos do que cerca de 30% (em peso seco) de precursores químicos ou produtos químicos que não de MP, mais preferivelmente menos do que cerca 20% de precursores químicos ou produtos químicos que não de MP, ainda mais preferivelmente menos do que cerca 10% de precursores químicos ou produtos químicos que não de MP, e o mais preferivelmente menos do que cerca 5% de precursores químicos ou produtos químicos que não de MP. Em formas de realização preferidas, proteínas isoladas ou partes biologicamente ativas destas carecem de proteínas de contaminação do mesmo organismo do qual a proteína MP é derivada. Tipicamente, tais proteínas são produzidas pela expressão recombinante de, por exemplo, uma proteína MP da C. gluíamicum em um microorganismo tal como a C. glutamicum.
Uma proteína MP isolada ou uma parte desta da invenção pode catalisar uma reação enzimática em um caminho metabólico de aminoácido, vitamina, co-fator, nutracêutico, nucleotídeo, nucleosídeo ou trealose ou tem um ou mais dos aditivos apresentados na Tabela 1. Em formas de realização preferidas, a proteína ou parte desta compreende uma seqüência de aminoácido que é suficientemente homóloga a uma seqüência de aminoácido da invenção (por exemplo, uma seqüência de uma SEQ ID NO: numerada com número par da Listagem de Seqüência) tal que a proteína ou parte desta mantenha a capacidade para catalisar uma reação enzimática em um caminho metabólico de aminoácido, vitamina, co-fator, nutracêutico, nucleotídeo, nucleosídeo ou trealose, A parte da proteína é preferivelmente uma parte biologicamente ativa como aqui descrito. Em uma outra forma de realização preferida, uma proteína MP da invenção tem uma seqüência de aminoácido apresentada como uma SEQ ID NO: numerada com número par da Listagem de Seqüência. Já em uma outra forma de realização preferida, a proteína MP tem uma seqüência de aminoácido que é codificada por uma seqüência de nucleotídeo que hibridiza, por exemplo, hibridiza sob condições severas, a uma seqüência de nucleotídeo da invenção (por exemplo, uma sequência de uma SEQID NO: numerada com número impar da Listagem de Seqüência). Ainda em uma outra forma de realização preferida, a proteína MP tem uma seqüência de aminoácido que é codificada por uma seqüência de nucleotídeo que é pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59% ou 60%, preferivelmente pelo menos cerca de 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69% ou 70%, mais preferivelmente pelo menos cerca de 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79% ou 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89% ou 90% ou 91%, 92%, 93%, 94%, e ainda mais preferivelmente pelo menos cerca de 95%, 96%, 97%, 98%, 99%, 99,7% ou mais homóloga a uma das seqüências de ácido nucleico da invenção ou uma parte destas. Os valores de limites e de identidade intermediários aos valores relacionados acima (por exemplo, 70 a 90% idêntico ou 80 a 95% idêntico) também são intencionados a serem abrangidos pela presente invenção. Por exemplo, os limites de valores de identidade usando uma combinação de qualquer um dos valores acima relacionados como limites superiores e/ou inferiores são intencionados a estarem incluídos. As proteínas MP preferidas da presente invenção também possuem preferivelmente pelo menos uma das atividades MP aqui descritas. Por exemplo, uma proteína MP preferida da presente invenção inclui uma seqüência de aminoácido codificada por uma seqüência de nucleotídeo que hibridiza, por exemplo, hibridiza sob condições severas, a uma seqüência de nucleotídeo da invenção e que pode catalisar uma reação enzimática em um caminho metabólico de aminoácido, vitamina, co-fator, nutracêutico, nucleotídeo, nucleosídeo ou trealose ou que tem uma ou mais das atividades apresentadas na Tabela 1.
Em outras formas de realização, a proteína MP é substancialmente homóloga a uma seqüência de aminoácido da invenção (por exemplo, uma seqüência de uma SEQ ID NO: numerada com número par da Listagem de Seqüência) e retém a atividade funcional da proteína de uma das seqüências de aminoácido da invenção não obstante difira em seqüência de aminoácido devido à variação natural ou mutagênese, como descrito em detalhes na subseção I acima. Conseqüentemente, em uma outra forma de realização, a proteína MP é uma proteína que compreende uma seqüência de aminoácido que é pelo menos cerca de 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59% ou 60%, preferivelmente pelo menos cerca de 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69% ou 70%, mais preferivelmente pelo menos cerca de 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79% ou 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89% ou 90% ou 91%, 92%, 93%, 94%, e ainda mais preferivelmente pelo menos cerca de 95%, 96%, 97%, 98%, 99%, 99,7% ou mais homóloga a uma seqüência de aminoácido inteira da invenção e que tem pelo menos uma das atividades MP aqui descritas. Os valores de limites e de identidade intermediários aos valores relacionados acima (por exemplo, 70 a 90% idêntico ou 80 a 95% idêntico) também são intencionados a serem abrangidos pela presente invenção. Por exemplo, os limites de valores de identidade usando uma combinação de qualquer um dos valores acima relacionados como limites superiores e/ou inferiores são intencionados a estarem incluídos. Em uma outra forma de realização, a invenção diz respeito a uma proteína de C. glutamicum de comprimento completo que é substancialmente homóloga a uma seqüência de aminoácido inteira da invenção.
As partes biologicamente ativas de uma proteína MP incluem peptídeos que compreendem seqüências de aminoácido derivadas da seqüência de aminoácido de uma proteína MP, por exemplo, uma seqüência de aminoácido de uma SEQ ID NO: numerada com número par da Listagem de Seqüência ou a seqüência de aminoácido de uma proteína homóloga a uma proteína MP que inclui menos aminoácidos do que uma proteína MP de comprimento completo ou a proteína de comprimento completo que é homóloga a uma proteína MP e exibe pelo menos uma atividade de uma proteína MP. Tipicamente, as partes biologicamente ativas (peptídeos, por exemplo, peptídeos que tenham, por exemplo, 5, 10, 15, 20, 30, 35, 36, 37, 38, 39,40, 50,100 ou mais aminoácidos no comprimento) compreendem um domínio ou motivo com pelo menos uma atividade de uma proteína MP. Além disso, outras partes biologicamente ativas, em que outras regiões da proteína são suprimidas, pode ser preparadas pelas técnicas recombinantes e avaliadas quanto a uma ou mais das atividades aqui descritas. Preferivelmente, as partes biologicamente ativas de uma proteína MP incluem um ou mais domínios/motivos selecionados ou partes destes que tenham atividade biológica.
As proteínas MP são preferivelmente produzidas pelas técnicas de DNA recombinante. Por exemplo, uma molécula de ácido nucleico que codifica a proteína é clonada em um vetor de expressão (como descrito acima), o vetor de expressão é introduzido em uma célula hospedeira (como descrito acima) e a proteína MP é expressada na célula hospedeira. A proteína MP pode então ser isolada a partir das células por um esquema de purificação apropriado usando-se técnicas padrão de purificação de proteína. Alternativa à expressão recombinante, uma proteína MP, polipeptídeo ou peptídeo podem ser quimicamente sintetizados usando-se técnicas padrão de síntese de peptídeo. Além disso, a proteína MP nativa pode ser isolada a partir de células (por exemplo, células endoteliais), por exemplo, usando-se um anticorpo anti-MP, que pode ser produzido por técnicas padrão utilizando-se uma proteína MP ou um fragmento desta, desta invenção. A invenção também fornece proteínas MP quiméricas ou de fusão. Como aqui usado, uma “proteína quimérica” ou “proteína de fusão” de MP compreendem um polipeptídeo MP operativamente ligado a um polipeptídeo não MP. Um “polipeptídeo MP” refere-se a um polipeptídeo tendo uma seqüência de aminoácido que corresponda ao MP, ao passo que um “polipeptídeo não MP” refere-se a um polipeptídeo tendo uma seqüência de aminoácido que corresponde a uma proteína que não é substancialmente homóloga à proteína MP, por exemplo, uma proteína que é diferente da proteína MP e que é derivada do mesmo organismo ou de um diferente. Dentro da proteína de fusão, o termo “operativamente ligado” é intencionado a indicar que o polipeptídeo MP e o polipeptídeo não MP estão fundidos um ao outro pela matriz. O polipeptídeo não MP pode estar fundido ao término N ou ao término C do polipeptídeo MP. Por exemplo, em uma forma de realização a proteína de fusão é uma proteína de fusão GST-MP em que as seqüências MP estão fundidas ao término C das seqüências GST. Tais proteínas de fusão podem facilitar a purificação de proteínas MP recombinantes. Em uma outra forma de realização, a proteína de fusão é uma proteína MP contendo uma seqüência de sinal heteróloga no seu término N. Em certas células hospedeiras (por exemplo, células hospedeiras de mamífero), a expressão e/ou secreção de uma proteína MP pode ser aumentada pelo uso de uma seqüência de sinal heteróloga.
Preferivelmente, uma proteína MP, quimérica ou de fusão, da invenção é produzida por técnicas padrão de DNA recombinante. Por exemplo, fragmentos de DNA que codificam seqüências de polipeptídeo diferentes são ligados juntos pela matriz de acordo com técnicas convencionais, por exemplo, utilizando-se términos abruptamente terminados ou altemadamente terminados para a ligação, digestão de enzima de restrição par fornecer términos apropriados, preenchimento de extremidades coesivas como apropriado, tratamento com fosfatase alcalina para evitar união não desejável e ligação enzimática. Em uma outra forma de realização, o gene de fusão pode ser sintetizado por técnicas convencionais incluindo sintetizadores de DNA automatizados. Altemativamente, a amplificação pela PCR de fragmentos de gene pode ser realizada usando-se iniciadores de âncora que dão origem a projeções complementares entre dois fragmentos de gene consecutivos que podem ser subseqüentemente recozidos ou reamplificados para gerar uma seqüência de gene quimérica (ver, por exemplo, Current Protocols in Molecular Biology, eds. Ausubel et al, John Wiley & Sons: 1992). Além disso, muitos vetores de expressão são comercialmente disponíveis que já codificam uma porção de fusão (por exemplo, um polipeptídeo GST). Um ácido nucleico que codifica o MP pode ser clonado em tal vetor de expressão tal que a porção de fusão seja ligada pela matriz à proteína MP.
Os homólogos da proteína MP podem ser gerados pela mutagênese, por exemplo, mutação de ponto diferente ou truncagem da proteína MP. Como aqui usado, o termo “homólogo” refere-se a uma forma variante da proteína MP que atua como um agonista ou antagonista da atividade da proteína MP. Um agonista da proteína MP pode reter substancialmente as mesmas, ou um subconjunto, atividades biológicas da proteína MP. Um antagonista da proteína MP pode inibir uma ou mais das atividades da forma que ocorre naturalmente da proteína MP, por exemplo, ligando-se competitivamente a um membro à jusante ou à montante da cascata do MP que inclui a proteína MP. Assim, a proteína MP da C. ghitamicum e seus homólogos da presente invenção podem modular a atividade de um ou mais caminhos metabólicos nos quais as proteína MP desempenham um papel neste microorganismo.
Em uma forma de realização alternativa, os homólogos da proteína MP podem ser identificados avaliando-se bibliotecas combinatórias de mutantes, por exemplo, mutantes de truncagem, da proteína MP quanto à atividade agonista ou antagonista à proteína MP. Em uma forma de realização, uma biblioteca diversificada de variantes MP é gerada pela mutagênese combinatória ao nível de ácido nucleico e é codificada por uma biblioteca de gene diversificada. Uma biblioteca diversificada de variantes MP pode ser produzida, por exemplo, ligando-se enzimaticamente uma mistura de oligonucleotideos sintéticos nas seqüências de gene tal que um conjunto degenerado de seqüências MP potenciais seja expressável como polipeptídeos individuais ou altemativamente, como um conjunto de proteínas de fusão maiores (por exemplo, para a demonstração de fago) contendo o conjunto de seqüências MP neste. Existe uma variedade de métodos que podem ser usados para produzir bibliotecas de homólogos de MP potenciais a partir de uma seqüêncía de oligonucleotídeo degenerada. A síntese química de uma seqüência de gene degenerada pode ser realizada em um sintetizador de DNA automático e o gene sintético depois ligado em um vetor de expressão apropriado. O uso de um conjunto degenerado de genes permite o fornecimento, em uma mistura, de todas seqüências que codificam o conjunto desejado de seqüências MP potenciais. Os métodos para sintetizar oligonucleotideos degenerados são conhecidos na técnica (ver, por exemplo, Narang, S. A. (1983) Tetrahedron 39:3; Itakura et al, (1984) Annu. Rev. Biochem. 53: 323; Itakura et al, (1984) Science 198: 1056; Ike et al, (1983) Nucleic Acid Res. 11:477.
Além disso, bibliotecas de fragmentos da codificadora da proteína MP podem ser usadas para gerar uma população diversificada de fragmentos NP para avaliação e subseqüente seleção de homólogos de uma proteína MP. Em uma forma de realização, uma biblioteca de fragmentos de seqüência codificadora pode ser gerada tratando-se um fragmento de PCR de filamento duplo de uma seqüência codificadora do MP com uma nuclease sob condições em que o corte ocorre apenas em cerca de uma vez por molécula, desnaturizando-se o DNA de filamento duplo, renaturizando o DNA para formar o DNA de filamento duplo que podem incluir pares de sentido/anti-sentido de produtos cortados diferentes, removendo-se as partes de filamento único dos duplexes reformados pelo tratamento com nuclease SI e ligando-se a biblioteca de fragmento resultante em um vetor de expressão. Por este método, uma biblioteca de expressão pode ser derivada de modo que codifique fragmentos de terminal N, terminal C e internos de vários tamanhos da proteína MP.
Diversas técnicas são conhecidas no ramo para avaliar produtos de gene de bibliotecas combinatoriais fabricadas pelas mutações de ponto ou truncagem e para avaliar bibliotecas de cDNA quanto a produtos de gene tendo uma propriedade selecionada. Tais técnicas são adaptáveis para avaliação rápida das bibliotecas de gene geradas pela mutagênese combinatória de homólogos do MP. As técnicas mais amplamente usadas, que são suscetíveis à análise de alto rendimento, para avaliar bibliotecas de gene grandes tipicamente incluem a clonagem da biblioteca de gene em vetores de expressão replicáveis, transformando-se células apropriadas com a biblioteca resultante de vetores e expressando-se os genes combinatórios sob condições em que a detecção de uma atividade desejada facilita a isolação do vetor que codifica o gene cujo produto foi detectado. A mutagênese de conjunto recursiva (REM), uma nova técnica que realça a freqüência de mutantes funcionais nas bibliotecas, pode ser usada em combinação com os ensaios de avaliação para identificar homólogos do MP (Arkín e Yourvan (1992) PNAS 89: 7811 a 7815; Delgrave et aL, (1993) Protein Engineering 6(3): 327 a 331).
Em uma outra forma de realização, os ensaios com base em célula podem ser explorados para analisar uma biblioteca MP diversificada, usando-se métodos bem conhecidos na técnica. D. Usos e métodos da invenção As moléculas de ácido nucleico, proteínas, homólogos de proteína, proteínas de fusão, iniciadores, vetores e células hospedeiras aqui descritos podem ser usados em um ou mais dos seguintes métodos: identificação de C. glutamicum e organismos relacionados; mapeamento de genomas de organismos relacionados ao C. glutamicum; identificação e localização de seqüências da C. glutamicum de interesse; estudos evolucionários; determinação de regiões da proteína MP requeridas para função; modulação de uma atividade da proteína MP; modulação da atividade de um caminho do MP; e modulação da produção celular de um composto desejado, tal como um produto químico fino.
As moléculas de ácido nucleico do MP da invenção têm uma variedade de usos. Primeiro, podem ser usadas para identificar um organismo como sendo Corinebacterium gluíamicum ou um parente próximo desta. Também, podem ser usadas para identificar a presença de C. glutamicum ou um parente desta em uma população mista de microorganismo. A invenção fornece as seqüências de ácido nucleico de vários genes da C. glutamicum', pela sondagem do DNA genômico extraído de uma cultura de uma população única ou mista de microorganismos sob condições severas com uma sonda que abrange uma região de um gene da C. glutamicum que seja única para este organismo, pode-se averiguar se este organismo está presente. Embora a Corinebacterium glutamicum por si só não seja patogênica aos seres humanos, está relacionada a espécies que são patógenos humanos, tais como a Corinebacterium diphtheriae. A Corinebacterium diphtheriae é o agente causativo da difteria, uma infecção que desenvolve rapidamente aguda, febril que envolve patologia tanto local quanto sistêmica. Nesta doença, uma doença local desenvolve-se no trato respiratório superior e envolve dano necrótico às células epiteliais; os bacilos secretam toxina que é disseminada através desta lesão para tecidos suscetíveis distais do corpo. Mudanças degenerativas realizadas pela inibição da síntese de proteína nestes tecidos, que incluem coração, músculo, nervos periféricos, glândulas supra-renais, rins, fígado e baço, resulta na patologia sistêmica da doença. A difteria continua a ter alta incidência em muitas partes do mundo, incluindo a África, Ásia, Europa Oriental e os Estados Independentes da antiga União Soviética. Um avanço epidêmico de difteria nas últimas duas regiões resultou em pelo menos 5.000 mortes desde 1990.
Em uma forma de realização, a invenção fornece um método de identificar a presença ou atividade da Corinebacterium diphtheriae em um paciente. Este método inclui a detecção de uma ou mais das seqüências de ácido nucleico ou de aminoácido da invenção (por exemplo, as seqüências apresentadas como SEQ ID NOs numeradas com números impares ou numeradas com números pares, respectivamente, na Listagem de Seqüência) em um paciente, detectando-se deste modo a presença ou a atividade da Corinebacterium diphtheriae no paciente. A C. glutamicum e a C. diphtheriae são bactérias relacionadas e muitas das moléculas de ácido nucleico e de proteína na C. glutamicum, são homólogas às moléculas de ácido nucleico e de proteína na C. diphtheriae e portanto podem ser usadas para detectar a C. diphtheriae em um paciente.
As moléculas de ácido nucleico e de proteína da invenção também podem servir como marcadores para regiões específicas do genoma. Isto tem utilidade não apenas no mapeamento do genoma, mas também para estudos funcionais das proteínas de C. glutamicum. Por exemplo, para identificar a região do genoma à qual uma proteína de ligação de DNA da C. glutamicum, se liga, o genoma da C. glutamicum, pode ser digerido e os fragmentos incubados com a proteína de ligação de DNA. Aqueles que ligam a proteína podem ser adicionalmente sondados com as moléculas de ácido nucleico da invenção, preferivelmente com rótulos facilmente detectáveis; a ligação de tal molécula de ácido nucleico ao fragmento de genoma permite a localização do fragmento no mapa do genoma da C. glutamicum, e, quando realizado múltiplas vezes com enzimas diferentes, facilita uma rápida determinação da seqüência de ácido nucleico à qual a proteína se liga. Além disso, as moléculas de ácido nucleico da invenção podem ser suficientemente homólogas às seqüências de espécies relacionadas tal que estas moléculas de ácido nucleico podem servir como marcadores para a construção de um mapa genômico nas bactérias relacionadas, tais como a Brevibacterium lactofermentum.
As moléculas de ácido nucleico do MP da invenção também são úteis para estudos evolucionários e estruturais de proteína. Os processos metabólicos nos quais as moléculas da invenção participam são utilizados por uma ampla variedade de células procarióticas e eucarióticas; comparando-se as sequências das moléculas de ácido nucleico da presente invenção àquelas que codificam enzimas similares de outros organismos, a relacionabilidade evolucionária dos organismos pode ser avaliada. Similarmente, tal comparação permite uma avaliação de quais regiões da seqüência são conservadas e quais não o são, o que pode auxiliar na determinação daquelas regiões da proteína que são essenciais para o funcionamento da enzima. Este tipo de determinação é de valor para estudos de engendramento de proteína e pode dar uma indicação do que a proteína pode tolerar em termos de mutagênese sem a perda da função. A manipulação das moléculas de ácido nucleico MP da invenção pode resultar na produção de proteínas MP tendo diferenças funcionais a partir das proteínas MP do tipo selvagem. Esta proteínas podem ser melhoradas na eficiência ou na atividade, podem estar presente em números maiores na célula do que é usual ou podem ser diminuídas na eficiência ou na atividade. A invenção também fornece métodos para avaliar moléculas que modulam a atividade de uma proteína MP, pela interação com a própria proteína ou com um substrato ou parceiro de ligação da proteína MP ou pela modulação da transcrição ou tradução de uma molécula de ácido nucleico MP da invenção. Em tais métodos, um microorganismo que expressa uma ou mais proteínas MP da invenção é contatado com um ou mais compostos de teste e o efeito de cada composto de teste na atividade ou no nível de expressão da proteína MP é avaliado.
Quando o produto químico fino desejado a ser isolado de uma cultura fermentativa de grande escala da C. glutamicum, é um aminoácido, uma vitamina, um co-fator, um nutracêutico, um nucleotídeo, um nucleosídeo ou trealose, a modulação da atividade ou da eficiência da atividade de uma ou mais das proteínas da invenção pelos mecanismos genéticos recombinantes podem impactar diretamente a produção de um destes produtos químicos finos. Por exemplo, no caso de uma enzima em um caminho biossintético para um aminoácido desejado, a melhora na eficiência ou atividade da enzima (incluindo a presença de cópias múltiplas do gene) deve levar a uma produção ou eficiência de produção aumentadas daquele aminoácido desejado. No caso de uma enzima em um caminho biossintético para um aminoácido cuja síntese está em competição com a síntese de um aminoácido desejado, qualquer diminuição na eficiência ou atividade desta enzima (incluindo a supressão do gene) deve resultar em um aumento na produção ou na eficiência de produção do aminoácido desejado, devido à competição diminuída para compostos intermediários e/ou energia. No caso de uma enzima em um caminho de degradação para um aminoácido desejado, qualquer diminuição na eficiência ou na atividade da enzima deve resultar em um rendimento ou eficiência de produção maiores do produto desejado devido a uma diminuição na sua degradação. Por fim, a mutagênese de uma enzima envolvida na biossíntese de um aminoácido desejado tal que esta enzima não mais seja capaz da inibição da retroalimentação deve resultar em rendimentos ou eficiência de produção aumentados do aminoácido desejado. O mesmo se deve aplicar às enzimas biossintéticas e degradativas da invenção envolvidas no metabolismo de vitaminas, co-fatores, nutracêuticos, nucleotídeos, nucleosídeos e trealose.
Similarmente, quando o produto químico fino desejado não é um dos compostos anteriormente mencionados, a modulação da atividade de uma das proteínas da invenção pode ainda impactar o rendimento e/ou a eficiência de produção do composto a partir de uma cultura em grande escala da C. glutamicum. Os caminhos metabólicos de qualquer organismo estão intimamente interconectados; o intermediário usado por um caminho é freqüentemente fornecido por um caminho diferente. A expressão e a função de enzima podem ser reguladas com base nos níveis celulares de um composto de um processo metabólico diferente e os níveis celulares de moléculas necessárias para o desenvolvimento básico, tais como aminoácidos e nucleotídeos, podem afetar criticamente a viabilidade do microorganismo em cultura de grande escala. Assim, a modulação de uma enzima de biossíntese de aminoácido, por exemplo, tal que esta não seja mais responsável pela inibição da retroalimentação ou tal que esta seja melhorada na eficiência ou na quantidade de material metabolizado ou processado pode resultar em níveis celulares aumentados de um ou mais aminoácidos. Por sua vez, este conjunto aumentado de aminoácidos fornece não apenas um fornecimento aumentado de moléculas necessárias para a síntese de proteína mas também de moléculas que são utilizadas como intermediários e precursores em vários outros caminhos biossintéticos. Se um aminoácido particular foi limitado na célula a sua produção aumentada pode aumentar a capacidade da célula para realizar numerosas outras reações metabólicas, bem como permitir que a célula produza mais eficientemente proteínas de todos os tipos, possivelmente aumentado a taxa de desenvolvimento ou a capacidade de sobrevivência globais da célula na cultura em grande escala. A viabilidade aumentada melhora a quantidade de células capazes de produzir o produto químico fino desejado em cultura fermentativa, aumentando deste modo o rendimento deste composto. Processos similares são possíveis pela modulação da atividade de uma enzima degradativa da invenção de modo que a enzima não mais catalise, ou catalise menos eficientemente, a degradação de um composto celular que é importante para a biossíntese de um composto desejado ou que permitirá que a célula desenvolva-se e reproduza mais eficientemente em cultura de grande escala. Dever ser enfatizado que a otimização da atividade degradativa ou o aumento da atividade biossintética de certas moléculas da invenção também podem ter um efeito benéfico na produção de certos produtos químicos finos a partir da C. gluíamicum. Por exemplo, diminuindo-se a eficiência de atividade de uma enzima biossintética em um caminho que compete com o caminho biossintético de um composto desejado para um ou mais intermediários, mais daqueles intermediários devem estar disponíveis para a conversão ao produto desejado. Uma situação similar pode evocar a melhoria da capacidade ou eficiência degradativas de uma ou mais das proteínas da invenção.
Esta lista anteriormente mencionada de estratégias de mutagênese para proteínas MP para resultar em rendimentos aumentados de um composto desejado não deve ser interpretada como limitante; variações nestas estratégias de mutagênese estarão facilmente evidente a uma pessoa de habilidade comum na técnica. Por estes mecanismos, as moléculas de ácido nucleico e de proteína da invenção podem ser utilizadas para gerar a C. glutamicum, ou cepas relacionadas de bactérias que expressam as moléculas de ácido nucleico e de proteína MP mutadas tal que o rendimento, a produção e/ou a eficiência de produção de um composto desejado sejam melhorados. Este composto desejado pode ser qualquer produto natural da C. glutamicum, que inclui os produtos finais de caminhos de biossíntese e intermediários de caminhos metabólicos que ocorrem naturalmente, bem como moléculas que não ocorrem naturalmente no metabolismo da C. glutamicum, mas que são produzidas por uma cepa da C. glutamicum, da invenção. Os compostos preferidos a serem produzidos pelas cepas da Corynebacterium glutamicum são os aminoácidos L-lisina e L-metionina.
Em uma forma de realização, o gene metC que codifica a cistationina β-liase, a terceira enzima no caminho biossintético da metionina foi isolado da Corynebacterium glutamicum. O produto translacional do gene não apresentou nenhuma homologia significante com aquele do gene metC de outros organismos. A introdução do plasmídeo contendo o gene metC na C. glutamicum resultou em um aumento de 5 vezes na atividade da cistationina β-liase. O produto de proteína, agora designado MetC (que corresponde à SEQ ID NO: 4), que codifica um produto de proteína de 35.574 Daltons e consiste de 325 aminoácidos é idêntico ao gene aecD anteriormente relatado (Rossol, I. e Puhler, A. (1992) J. Bacteriology 174, 2968 a 2977) exceto a existência de dois aminoácidos diferentes. Igual ao gene aecD, quando presente em cópias múltiplas, o gene metC confere resistência à S-(p-aminoetil)-cisteína que é um análogo de lisina tóxico. Entretanto, evidências genéticas e bioquímicas sugerem que a atividade natural do produto de gene metC é mediar a biossíntese da metionina no C. glutamicum. As cepas mutantes de metC foram construídas e as cepas apresentaram prototrofia à metionina. As cepas mutantes perderam completamente a sua capacidade para apresentar resistência à S-(y-aminoetil)-cisteína. Estes resultados mostram que, além da trans-sulfuração , que é um outro caminho biossintético, o caminho da sulfidrilação direta é funcional na C. glutamicum como uma rota biossintética paralela para a metionina. Já em uma outra forma de realização, também é mostrado que o caminho de sulfidrilação adicional é catalisado pela O-acetilomoserina sulfidrilase. A presença do caminho é demonstrada pela isolação do gene metZ (ou metí) e da enzima (que corresponde à SEQ ID NO: 1 e SEQ ID NO: 2, respectivamente) correspondentes. Entre as espécies eucariótas, de fungo e de levedura foi relatado ter tanto o caminho de trans-sulfuração e sulfidrilação direta. Até aqui, nenhum organismo procariótico que possua ambos os caminhos foram verificados. Diferente da E. coli que possuí apenas um único caminho biossintético para a lisina, a C. glutamicum possui dois caminhos biossintéticos paralelos para o aminoácido. O caminho biossintético para metionina na C. glutamicum é análogo àquele da lisina neste aspecto. 0 gene metZ está localizado na região à montante de metA, que é o gene que codifica a enzima que catalisa a primeira etapa da biossíntese da metionina (Park, S. - D., et al, (1998) Mol. Cells 8, 286 a 294). As regiões a montante e a jusante de metA foram seqüenciadas para identificar outros genes met. Parece que metZ e metA formam um operon. A expressão dos genes que codificam MetA e MetZ levam à supra produção dos polipeptídeos correspondentes.
Surpreendentemente, os clones metZ podem complementar as cepas mutantes metB da Escherichia coli auxotróficas em metionina. Isto mostra que o produto de proteína de metZ catalisa uma etapa que pode desviar da etapa catalisada pelo produto de proteína de metB. O metZ também foi rompido e a cepa mutante apresentou prototrofia à metionina. Os mutantes duplos metB e metZ da Corynebacterium glutamicum também foram construídos. O mutante duplo é auxotrófico para metionina. Assim, metZ codifica uma proteína que catalisa a reação de O-Acetil-Homoserina para Homocisteína, que é uma etapa no caminho de sulfidrilação da biossíntese de metionina. A Corynebacterium glutamicum contém tanto o caminho de trans-sulfuração quanto o de sulfidrilação da biossíntese de metionina. A introdução de metZ na C. glutamicum resultou na expressão de uma proteína de 47.000 Daltons. A introdução combinada de metZ e metA na C. glutamicum resultou no aparecimento de proteínas metA e metZ como mostrado pela eletroforese em gel. Se a cepa Corynebacterium é uma superprodutora de lisina, a introdução de um plasmídeo contendo metA e metZ resultou em um título de lisina mais baixo mas o acúmulo de homocisteína e metionina é detectado.
Em uma outra forma de realização, metA e metZ foram introduzidos nas cepas de Corynebacterium glutamicum junto com o gene hom, que codifica a homoserina desidrogenase, catalisando a conversão de aspartato, semialdeído para homoserina. Genes hom diferentes de organismos diferentes foram escolhidos para este experimento. O gene hom da Corynebacterium glutamicum pode ser usado, bem como os genes hom de outros procariotas como Escherichia coli ou Bacillus subtilis ou o gene hom de eucariotas tais como Sacchoromyces cerevisiae, Shizosaccharomyces pombe, Ashbya gossypii ou algas, plantas superiores ou animais. Pode ser que o gene hom seja insensível contra a inibição de retroalimentação mediada por quaisquer metabólitos que ocorram nos caminhos biossintéticos dos aminoácidos da família aspartato, como aspartato, lisina, treonina ou metionina. Tais metabólitos são por exemplo, aspartato, lisina, metionina, treonina, aspartil-fosfato, aspartato semi aldeído, homoserina, cistationina, homocisteína ou qualquer outro metabólito que ocorra nestes caminhos biossintéticos. Além dos metabólitos, a homoserina desidrogenase pode ser insensível contra a inibição pelos análogos de todos aqueles metabólitos ou ainda contra outros compostos envolvidos neste metabolismo como são outros aminoácidos como cisteína ou cofatores como a vitamina B12 e todos os seus derivados e S-adenosilmetionina e seus metabólitos e derivados e análogos. A insensibilidade da homoserina desidrogenase contra todos estes, uma parte destes ou apenas um destes compostos pode ser a sua atitude natural ou pode ser o resultado de uma ou mais mutações que resultaram da mutação clássica e seleção usando produtos químicos ou irradiação ou outros mutagenos. As mutações também podem ser introduzidas no gene hom usando a tecnologia de gene, por exemplo, a introdução de mutações de ponto específicas de sítio ou por qualquer método anteriormente mencionado para o MP ou as seqüências de DNA que codificam o MP, Quando um gene hom foi combinado com os genes metZ e metA e introduzidos em uma cepa da Corynebacterium glutamicum que é uma super produtora de lisina, o acúmulo de lisina foi reduzido e o acúmulo de homocisteína e metionina foi realçado. Um outro realce das concentrações de homocisteína e metionina pode ser obtido, se uma cepa da Corynebacterium glutamicum super produtora de lisina é usada e um rompimento do gene ddh ou o gene lysA foi introduzido antes da transformação com DNA contendo um gene hom e metZ e met em combinação, A super produção de homocisteína e metionina foi possível usando fontes de enxofre diferentes. Sulfatos, tiossulfatos, sulfitos e também fontes de enxofre mais reduzidas como H2S e sulfetos e derivados puderam ser usados. Da mesma maneira, fontes de enxofre orgânico como metil mercaptano, tioglicolatos, tiocianatos, tiouréia, aminoácidos contendo enxofre como cisteína e outros compostos contendo enxofre podem ser usados para se obter a super produção de homocisteína e metionina.
Em uma outra forma de realização, o gene metC foi introduzido em uma cepa da Corynebacterium glutamicum usando os métodos anteriormente mencionados. O gene metC pode ser transformado na cepa em combinação com outros genes como metB, metA e metA. O gene hom também pode ser adicionado. Quando o gene hom, os genes metC, metA e metB foram combinados em um vetor e introduzidos em uma cepa da Corynebacterium glutamicum, a super produção de homocisteína e metionina foi alcançada. A super produção de homocisteína e metionina foi possível usando-se fontes de enxofre diferentes. Sulfatos, tiossulfatos, sulfitos e também fontes de enxofre mais reduzidas como H2S e sulfetos e derivados puderam ser usados. Da mesma maneira, fontes de enxofre orgânico como metil mercaptano, tioglicolatos, tiocianatos, tiouréia, aminoácidos contendo enxofre como cisteína e outros compostos contendo enxofre podem ser usados para se obter a super produção de homocisteína e metionina.
Esta invenção é ainda ilustrada pelos seguintes exemplos que não devem ser interpretados como limitantes. Os conteúdos de todas as referências, pedidos de patente, patentes, pedidos de patente publicados, Tabelas e a listagem de seqüência citados em todo este pedido são por meio deste incorporados por referência.
Exemplificação Exemplo 1: Preparação de DNA genômico total de Corynebacterium glutamicum ATCC 13032 Uma cultura de Corynebacterium glutamicum (ATCC 13032) foi cultivada durante a noite a 30°C com agitação vigorosa em meio BHI (Difco). As célula foram colhidas por centrifugação, o sobrenadante foi descartado e as células fora recolocadas em suspensão em 5 ml de tampão I (5% do volume original da cultura - todos os volumes indicados foram calculados para 100 ml de volume de cultura). Composição do tampão I: 140,34 g/litro de sacarose, 2,46 g/litro MgS04 x 7H20,10 ml/litro de solução de KH2PO4 (100 g/litro, ajustado ao pH 6,7 com KOH), 50 ml/litro de concentrado Ml2 (10 g/litro de (NH^SC^, 1 g/litro de NaCl, 2 g/litro de MgS04 x 7H20, 0,2 g/litro de CaCl2, 0,5 g/litro de extrato de levedura (Difco), 10 ml/litro de mistura de elementos traço (200 mg/litro de FeS04 x H20, 10 mg/litro de ZnS04 x 7 H20, 3 mg/litro de MnCl2 x 4 H20, 30 mg/litro de H3BO3, 20 mg/litro de CoCl2 x 6 H20, 1 mg/litro de NiCl2 x 6 H20,3 mg/litro de Na2Mo04 x 2 H20, 500 mg/litro de agente complexador (EDTA ou ácido crítico), 100 ml/litro de mistura de vitaminas (0,2 mg/litro de biotina, 0,2 mg/litro ácido fólico, 20 mg/litro de ácido p-amino benzóico, 20 mg/litro de riboflavina, 40 mg/litro de ca-pantotenato, 140 mg/litro de ácido nicotínico, 40 mg/litro de cloridreto de piridoxol, 200 mg/litro de mio-inositol). Lisozima foi adicionada à suspensão a uma concentração final de 2,5 mg/ml. Após uma incubação de aproximadamente 4 horas a 37°C, a parede celular foi degradada e os protoplastos resultantes são colhidos por centrifugação. A pelota foi lavada uma vez com 5 ml de tampão I e uma vez com 5 ml de tampão TE (10 mM de Tris-HCl,l mM de EDTA, pH 8). A pelota foi recolocada em suspensão em 4 ml de tampão TE e 0,5 ml de solução de SDS (10%) e 0,5 ml de solução de NaCl (5 M) foram adicionados. Depois da adição da proteinase K a uma concentração final de 200 pg/ml, a suspensão é incubada durante ca. 18 horas a 37°C. O DNA foi purificado pela extração com fenol, fenol-clorofórmio-álcool isoamílico e clorofórmio álcool isoamílico usando-se procedimentos padrão. Depois, o DNA foi precipitado pela adição de 1/50 volume de acetato de sódio 3 M e 2 volumes de etanol, seguido por uma incubação de 30 minutos a -20°C e uma centrifugação de 30 minutos a 12.000 rpm em uma centrífuga de alta velocidade usando-se um rotor SS34 (Sorvall). O DNA foi dissolvido em 1 ml de tampão TE contendo 20 pg/ml de RNaseA e dialisado a 4°C contra 1000 ml de tampão TE durante pelo menos 3 horas. Durante este tempo, o tampão foi trocado 3 vezes. Às alíquotas de 0,4 ml da solução de DNA dialisada, 0,4 ml de LiCl 2 M e 0,8 ml de etanol são adicionados. Depois de uma incubação de 30 minutos a -20°C, o DNA foi coletado por centrifugação (13.000 rpm, Biofuge Fresco, Heraeus, Hanau, Alemanha). A pelota de DNA foi dissolvida em tampão TE. O DNA preparado por este procedimento pode ser usado para todos os propósitos, incluindo Southern Blotting ou a construção de bibliotecas genômicas. Exemplo 2: Construção de bibliotecas genômicas em Escherichia coli de Corynebacterium glutamicum ATCC13032.
Usando-se o DNA preparado como descrito no Exemplo 1, bibliotecas de cosmídeo e de plasmídeo foram construídas de acordo com métodos conhecidos e bem estabelecidos (ver, por exemplo, Sambrook, J. et al. (1989) “Molecular Cloning : A Laboratory Manual”, Cold Spring Harbor Laboratory Press, ou Ausubel, F. M. et al. (1994) “Current Protocols in Molecular Biology”, John Wiley & Sons.) Qualquer plasmídeo ou cosmídeo pode ser usado. De uso particular foram os plasmídeos pBR322 (Sutcliffe, J. G. (1979) Proc. Natl. Acad. Sei. USA, 75: 3737 a 3741); pACYC177 (Change & Cohen (1978) J. Bacteriol 134: 1141 a 1156), plasmídeos da série pBS (pBSSK+, pBSSK- e outros; Stratagene, LaJolla, USA), ou cosmídeos como SuperCosl (Stratagene, LaJolla, USA) ou Loristó (Gibson, T. J., Rosenthal A. e Waterson, R. H. (1987) Gene 53: 283 a 286. Bibliotecas de gene especificamente para o uso no C. glutamicum podem ser construídas usando-se o plasmídeo pSL109 (Lee, H. S. e A. J. Sinskey (1994) J. Microbiol. Biotechnol. 4:256 a 263).
Para isolação de clones meíC, células JE6839 da E. coli foram transformadas com o DNA da biblioteca e colocadas em placa em meio mínimo M9 contendo ampiciíina e os suplementos apropriados. As placas foram incubadas a 37°C durante 5 dias. As colônias foram isoladas e avaliadas quanto ao teor de plasmídeo. A seqüência de nucleotídeo completa do gene metC isolado foi determinada pelos métodos bem conhecidos por uma pessoa de habilidade comum na técnica.
Exemplo 3: Seqüenciamento de DNA e Análise Funcional Computacional As bibliotecas genômicas como descritas no Exemplo 2 foram usadas para o seqüenciamento de DNA de acordo com métodos padrão, em particular pelo método de terminação de cadeia usando-se máquinas seqüenciadoras ABI377 (ver, por exemplo, Fleischman, R. D. et al. (1995) “Whole-genome Random Seqüencing and Assembly of Haemophilus Influenzae Rd., Science, 269: 496 a 512). Os iniciadores de seqüenciamento com as seguintes seqüências de nucleotídeo foram usados: 5’-GGAAACAGTATGACCATG-3 ’ (SEQ ID NO: 123) ou 5’-GTAAAACGACGGCCAGT-3’ (SEQ IDNO: 124).
Exemplo 4: Mutagênese in vivo A mutagênese in vivo de Corynebacterium glutamicum pode ser realizada pela passagem de DNA plasmídico (ou outro vetor) através de E. coli ou outros microorganismos (por exemplo, Bacillus spp. ou leveduras tais como a Saccharomyces cerevisiae) que são prejudicados em suas capacidades para manter a integridade da sua informação genética. Cepas mutadoras típicas têm mutações nos genes para o sistema de reparo de DNA (por exemplo, mutHLS, mutD, mutT, etc.; para referência, ver Rupp, W. D. (1996) DNA repair mechanisms, in: Escherichia coli and Salmonella, p. 2277 a 2294, ASM: Washington.) Tais cepas são bem conhecidas por aqueles de habilidade comum na técnica. O uso de tais cepas é ilustrado, por exemplo, em Greener, A. e Callahan, M. (1994) Strategies 7:32 a 3.
Exemplo 5: Transferência de DNA Entre Escherichia coli e Corynebacterium glutamicum Diversas espécies de Corynebacterium e de Brevibacterium contêm plasmídeos endógenos (como por exemplo, pHM1519 ou pBLI) que replicam autonomamente (para revisão ver, por exemplo, Martin, J. F. et al (1987) Biotechnology, 5: 137 a 146). Vetores de transporte para Escherichia coli e Corynebacterium glutamicum podem ser facilmente construídos usando-se vetores padrão para E. coli (Sambrook, J. et al. (1989), “Molecular Cloning: A Laboratory Manual”, Cold Spring Harbor Laboratory Press ou Ausubel, F. M. et al. (1994) “Current Protocols in Molecular Biology”, John Wiley & Sons) aos quais uma origem ou replicação para e um marcador adequado de Corynebacterium glutamicum são adicionados. Tais origens de replicação são preferivelmente tomadas de plasmídeos endógenos isolados de espécies de Corynebacterium e Brevibacterium. De uso particular como marcadores de transformação para estas espécies são genes para a resistência à canamicina (tais como aquelas derivadas dos transposons Tn5 ou Tn903) ou ao cloranfenicol (Winnacker, E. L. (1987) “From Genes to Clones -Introduction to Gene Technology, VCH, Weinheim). Existem numerosos exemplos na literatura da construção de uma ampla variedade de vetores de transporte que replicam tanto na E. coli quanto na C. glutamicum, e que podem ser usados para diversos propósitos, incluindo a supraexpressão de gene (para referência, ver por exemplo, Yoshihama, M. et al. (1985) J. Bacteriol. 162: 591 a 597, Martin J. F. et al. (1987) Biotechnology, 5:137 a 146 e Eikmanns, B. J. et al. (1991) Gene, 102: 93 a 98).
Usando-se métodos padrão, é possível clonar um gene de interesse em um dos vetores de transporte descritos acima e introduzir tais vetores híbridos em cepas de Corynebacterium glutamicum. A transformação de C. glutamicum pode ser obtida pela transformação de protoplasto (Kastsumata, R. et al (1984) J. Bacteriol. 159: 306 a 311), eletroporação (Liebl, E. et al. (1989) FEMS Microbiol. Letters, 53: 399 a 303) e nos casos onde vetores especiais são usados, também pela conjugação (como descrito por exemplo, em Schafer, A et al. (1990) J. Bacteriol. 172: 1663 a 1666). Também é possível transferir os vetores de transporte de C. glutamicum para E. coli preparando-se o DNA plasmídico de C. glutamicum (usando-se métodos padrão bem conhecidos na técnica) e transformando-o na E. coli. Esta etapa de transformação pode ser realizada usando-se métodos padrão, mas é vantajoso usar um cepa da E. coli deficiente em Mcr, tal como a NM522 (Gough & Murray (1983) J. Mol. Biol. 166:1 a 19).
Os genes podem ser supra expressados nas cepas da C. glutamicum usando-se plasmídeos que compreendem pCGI (Patente U.S. N° 4.617.267) ou fragmentos destes e opcionalmente o gene para a resistência à canamicina de TN903 (Grindley, N. D. e Joyce, C. M. (1980) Proc. Natl. Acad Sei. USA 77(12): 7176 a 7180). Além disso, os genes podem ser supra expressados nas cepas da C. glutamicum usando-se o plasmídeo pSL109 (Lee, H. S. e A. J. Sinskey (1994) J. Microbiol. Biotechnol. 4:256 a 263).
Com exceção do uso de plasmídeos replicativos, a supra expressão do gene também pode ser obtida pela integração no genoma. A integração genômica na C. glutamicum ou em outras espécies de Corynebacterium ou Brevibacterium pode ser realizada por métodos bem conhecidos, tais como a recombinação homóloga com região(ões) genômica(s), integração mediada pela endonuclease de restrição (REMI) (ver, por exemplo, Patente DE 19823834), ou através do uso de transposons. Também é possível modular a atividade de um gene de interesse modificando-se as regiões reguladoras (por exemplo, um promotor, um repressor, e/ou um realçador) pela modificação, inserção, ou supressão de seqüência usando-se métodos direcionados a sítio (tais como a recombinação homóloga) ou métodos com base em eventos aleatórios (tais como mutagênese de transposon ou REMÍ). As seqüências de ácido nucleico que funcionam como terminadores transcricionais também podem ser inseridos a 3’ da região codificadora de um ou mais genes da invenção; tais terminadores são bem conhecidos na técnica e estão descritos, por exemplo, em Winnacker, E. L. (1987) From Genes to Clones - Introduction to Gene Technology. VCH: Weinheim.
Exemplo 6: Avaliação da Expressão da Proteína Mutante As observações da atividade de uma proteína mutada em uma célula hospedeira transformada residem no fato de que a proteína mutante é expressada de uma maneira similar e em uma quantidade similar àquela da proteína do tipo selvagem. Um método útil para averiguar o nível de transcrição do gene mutante (um indicador da quantidade de mRNA disponível para a tradução para o produto de gene) é realizar uma Northern Blot (para referência ver, por exemplo, Ausubel et al. (1988) Current Protocols in Molecular Biology, Wiley: New York), em que um iniciador planejado para ligar-se ao gene de interesse é rotulado com um rótulo detectável (usualmente radioativo ou quimioluminescente), tal que quando o RNA total de uma cultura do organismo é extraído, conduzido em gel, transferido para uma matriz estável e incubado com esta sonda, a ligação e a quantidade de ligação da sonda indica presença e também a quantidade de mRNA para este gene, Esta informação é evidência do grau de transcrição do gene mutante. O RNA celular total pode ser preparado a partir da Corynebacterium glutamicum por diversos métodos, todos bem conhecidos na técnica, tais como aquele descrito em Bormann, E. R. et al., (1992) Mol. Microbiol. 6: 317 a 326.
Para avaliar a presença ou quantidade relativa de proteína traduzida deste mRNA, técnicas padrão, tais como eletroforese em gel de SDS-acrilamida, foram utilizadas. A supra produção de metC e metZ em combinação com metA na Corynebacterium glutamicum foi demonstrada por este método. Um Western Blot também pode ser utilizado (ver, por exemplo, Ausubel et al, (1988) Current Protocols in Molecular Biology, Wiley: New York). Neste processo, as proteínas celulares totais são extraídas, separadas pela eletroforese em gel, transferidas para uma matriz tal como nitrocelulose e incubadas com uma sonda, tal como um anticorpo, que se liga especificamente à proteína desejada. Esta sonda é, no geral, alvejada com um rótulo quimioluminescente ou colorimétrico que pode ser facilmente detectado. A presença e a quantidade de rótulo observado indica a presença e a quantidade da proteína mutante desejada presente na célula.
Exemplo 7: Cultivo de Escherichia coli e Corynebacterium glutamicum geneticamente modificadas - meio e condições de cultura Cepas de E, coli são rotineiramente cultivadas em MB e caldo LB, respectivamente (Fullettie, Μ, T., et al., (1993) J. Bacteriol. 175,4096 a 4103). O meio mínimo para E. coli é ο M9 e o MCGC modificado (Yoshihama, M., et al., (1985) J. Bacteriol. 162, 591 a 507). A glicose foi adicionada a uma concentração final de 1%. Antibióticos foram adicionados nas seguintes quantidades (microgramas por mililitro): ampicilina, 50; canamicina, 25; ácido nalidíxico, 25. Aminoácidos, vitaminas e outros suplementos foram adicionados nas seguintes quantidades: metionina, 9,3 mM; arginina, 9,3 mM; histidina, 9,3 mM; tiamina, 0,05 mM. As células de E. coli foram rotineiramente cultivadas a 37°C, respectivamente.
As Corynebacteria geneticamente modificadas são cultivadas em meio de cultivo sintético ou natural. Vários meios de cultivo diferentes para Corynebacteria são tanto bem conhecidos quanto facilmente disponíveis (Lieb et al., (1989) Appl. Microbiol. Biotechnol., 32: 205 a 210; von der Osten et al., (1998) Biotechnology Letters, 11: 11 a 16; Patente DE 4.120.867; Liebl (1992) “The Genus Corynebacterium, in: The Procaryotes, Volume II, Balows, A. et al., eds. Springer-Verlag). Estes meios consistem de uma ou mais fontes de carbono, fontes de nitrogênio, sais inorgânicos, vitaminas e elementos traço. As fontes de carbono preferidas são açúcares, tais como mono, di ou polissacarídeos. Por exemplo, glicose, frutose, manose, galactose, ribose, sorbose, ribulose, lactose, maltose, sacarose, rafmose, amido ou celulose servem como fontes muito boas de carbono. Também é possível fornecer açúcar ao meio por intermédio de compostos complexos tais como melaço ou outros subprodutos do refinamento de açúcar. Também pode ser vantajoso fornecer misturas de diferentes fontes de carbono. Outras fontes de carbono possíveis são álcoois e ácidos orgânicos tais como metanol, etanol, ácido acético ou ácido lático. As fontes de nitrogênio são usualmente compostos de nitrogênio orgânicos ou inorgânicos ou materiais que contenham estes compostos. As fontes de nitrogênio exemplares incluem gás amônia ou sais de amônia, tais como NH4CI ou (NH4)2S04, NH4OH, nitratos, uréia, aminoácidos ou fontes de nitrogênio complexas como líquido da maceração do milho, farinha de feijão de soja, proteína de feijão de soja, extrato de levedura, extrato de carne e outras. A superprodução de enxofre contendo aminoácidos como homocisteína e metionina foi feita possível usando-se diferentes fontes de enxofre. Sulfatos, tiossulfatos, sulfitos e também fontes de enxofre mais reduzidas como H2S e sulfetos e derivados podem ser usados. Da mesma maneira, fontes de enxofre orgânico como metil mercaptano, tioglicolatos, tiocianatos, tiouréia, aminoácidos contendo enxofre como cisteína e outros compostos contendo enxofre podem ser usados para se obter a supra produção de homocisteína e metionina.
Os compostos de sal inorgânico que podem ser incluídos no meio incluem os sais de cloreto, fósforo ou sulfato de cálcio, magnésio, sódio, cobalto, molibdênio, potássio, manganês, zinco, cobre e ferro.
Compostos queladores podem ser adicionados ao meio para manter os íons metálicos em solução. Os compostos queladores podem ser adicionados ao meio para manter os íons metálicos em solução. Os compostos queladores particularmente úteis incluem diidroxifenóis como catecol ou protocatecoato ou ácidos orgânicos tais como ácido cítrico. É típico para o meio conter também outros fatores de desenvolvimento tais como vitaminas ou promotores do crescimento, os exemplos dos quais incluem biotina, riboflavina, tiamina, ácido fólico, ácido nicotínico, pantotenato e piridoxina. Os fatores de desenvolvimento e os sais freqüentemente originam de componentes do meio complexo tais como extrato de levedura, melaço, líquido da maceração do milho e outros. A composição exata dos compostos do meio depende fortemente do experimento imediato e é individualmente decidido para cada caso específico. A informação a cerca da otimização do meio está disponível do livro texto “Applied Microbiol. Physiology, A Practical Approach (eds. P. M. Rhodes, P. F. Stanbury, IRL Press (1997) pp. 53 a 73, ISBN 0 19 963577 3). Também é possível selecionar o meio de cultivo a partir de fornecedores comerciais, como o padrão 1 (Merck) ou BHI (infusão de coração de cereal, DIFCO) ou outros.
Todos os componentes do meio são esterilizados, pelo calor (20 minutos a 1,5 bar e 121°C) ou pela filtração estéril. Os componentes podem ser esterilizados juntos ou, se necessário, separadamente. Todos os componentes do meio podem estar presentes no início do cultivo ou podem ser opcionalmente adicionados de modo contínuo ou por batelada.
As condições de cultura são definidas separadamente para cada experimento. A temperatura deve estar em uma faixa entre 15°C e 45°C. A temperatura pode ser mantida constante ou pode ser alterada durante o experimento. O pH do meio deve estar na faixa de 5 a 8,5, preferivelmente em tomo de 7,0 e pode ser mantido pela adição de tampões ao meio. Um tampão exemplar para este propósito é um tampão de fosfato de potássio. Os tampões sintéticos tais como MOPS, HEPES, ACES e outros podem ser alternativa ou simultaneamente usados. Também é possível manter um pH de cultura constante através da adição de NaOH ou de NH4OH durante 0 cultivo. Se componentes de meio complexos tais como extrato de levedura são utilizados, a necessidade para tampões adicionais pode ser reduzida, devido ao fato de que muitos compostos complexos têm altas capacidades de tampão. Se um fermentador é utilizado para cultivar os microorganismos, 0 pH também pode ser controlado usando-se amônia gasosa. O tempo de incubação está usualmente em uma faixa de várias horas a vários dias. Este tempo é selecionado de modo a permitir que a quantidade máxima de produto acumule no caldo. Os experimentos de cultivo divulgados podem ser realizados em uma variedade de recipiente, tais como placas microtituladoras, tubos de vidro, frascos de vidro ou fermentadores de vidro ou metal de tamanho diferentes. Para avaliar um número grande de clones, os microorganismos devem ser cultivados em placas microtituladoras, tubos de vidro ou frascos de agitação, com ou sem placas defletoras. Preferivelmente, frascos de agitação de 100 ml são usados, enchidos com 10% em volume) do meio de cultivo requerido. Os frascos devem ser agitados em um agitador rotativo (amplitude de 25 mm) usando uma faixa de velocidade de 100 a 300 rpm. As perdas por evaporação podem ser diminuídas mantendo-se uma atmosfera úmida; altemativamente, uma correção matemática para as perdas por evaporação deve ser realizada.
Se clones geneticamente modificados são testados, um clone de controle não modificado ou um clone de controle contendo 0 plasmídeo básico sem qualquer inserto também deve ser testado. O meio é inoculado a uma OD6oo de 0,5 a 1,5 usando-se células desenvolvidas em placas de agar, tais como placas CM (10 g/litro de glicose, 2,5 g/litro de NaCl, 2 g/litro de uréia, 10 g/litro de polipeptona, 5 g/litro de extrato de levedura, 5 g/litro de extrato de carne, 22 g/litro de NaCl, 2 g/litro de uréia, 10 g/litro de polipeptona, 5 g/litro de extrato de levedura, 5 g/litro de extrato de carne, 22 g/litro de agar, pH 6,8 com NaOH 2 M) que foram incubadas a 30°C. A inoculação do meio é realizada pela introdução de uma suspensão salina de células da C. glutamicum das placas CM ou a adição de uma pré cultura líquida desta bactéria.
Exemplo 8. Análise in vitro da função de proteínas mutantes A determinação de atividades e parâmetros cinéticos de enzimas é bem estabelecida na técnica. Os experimentos para determinar a atividade de qualquer enzima alterada dada devem ser feitos de encomenda para a atividade específica da enzima do tipo selvagem, que está bem dentro da capacidade de uma pessoa de habilidade comum na técnica. Revisões a respeito de enzimas, no geral, bem como detalhes específicos que dizem respeito à estrutura, cinéticas, princípios, métodos, aplicações e exemplos para a determinação de muitas atividades de enzima podem ser encontradas, por exemplo, nas seguintes referências: Dixon, M. e Webb, E. C. (1979) Enzymes, Longmans: London; Fersht, (1985) Enzyme Structure and Mechanism, Freeman: New York; Walsh, (1979) Enzymatic Reactions Mechanisms. Freeman: San Francisco; Proce, N. C., Stevens, L. (1982) Fundamentais of Enzymology. Oxford Univ. Press: Oxford; Boyer, P. D. ed. (1983) The Enzymes, 3a ed. Academic Press: New York; Bisswanger, H., (1994) Enzymkínetik, 2a ed. VCH: Weinheim (ISBN 3527300325); Bergmeyer, H. U., Bergmeyer, I, Grapl, M., eds. (1983 a 1986) Methods of Enzymatic Analysis, 3a ed. vol I a XII, Verlag Chemie: Weinheim; e Ullmamfs Encyclopedia of Industrial Chemistry (1987) vol. A9, “Enzymes”. VCH: Weinheim, p. 352 a 363.
Os extratos de célula da Corynebacterium glutamicum foram preparados como anteriormente descrito (Park, S. -D., et al, (1998) Mol. Cells 8,286 a 294). A cistationina β-liase foi ensaiada como segue. A mistura de ensaio conteve 100 mM Tris-HCl (pH 8,5), 0,1 mM de NADH, 1 mM de L-cistationina, 5 unidades de L-lactato desidrogenase e quantidades apropriadas de extrato bruto. As mudanças óticas foram monitoradas a 340 nm. O ensaio para resistência à S-(D-aminoetil)-cisteína (AEC) foi realizado como descrito em Rossol, I. e Pühler, A. (1992) J. Bacteriol. 174, 2968 a 2977. Os resultados dos ensaios de cistationina β-liase dos extratos de cepas da Corynebacterium glutamicum diferentes bem como os resultados dos ensaios de resistência à AEC da mesma cepa estão resumidos na Tabela 5, abaixo. a a enzima foi induzida pelo cultivo até a fase estacionária no meio mínimo contendo 1% de glicose. As células foram colhidas, rompidas e ensaiadas quanto a atividade como descrito no Materiais e Métodos. b o meio mínimo MCGC foi usado. O cultivo foi monitorado nas placas. c as células foram cultivadas em placas contendo 40 mM de S-(P~aminometil)-cisteína (AEC) durante 5 dias. d os mutantes foram gerados neste estudo. e não determinada. A capacidade dos clones metC para expressar a cistationina β-liase foi testada pelo ensaio enzimático. Os extratos brutos preparados a partir das células AS019E12 da C. glutamicum que abriga o plasmídeo pSL173 foram ensaiadas. As células que abrigam o plasmídeo apresentaram um aumento de aproximadamente 5 vezes na atividade da cistationina β-liase comparadas com aquela que abrigam o vetor vazio pMTl (Tabela 5), aparentemente devido ao efeito da dose de gene. A análise de SDS-PAGE dos extratos brutos revelou uma faixa de cistationina β-liase putativa com Mr aproximado de 41.000. A intensidade de cada faixa de cistationina β-liase putativa estava de acordo com os dados dos ensaios de complementação e enzimático (Tabela 5), Como descrito acima, uma região de metC pareceu ser quase idêntica ao aecD anteriormente relatado. Visto que o gene aecD foi isolado com base na sua capacidade para conferir resistência ao S-(p-aminoetil)-cisteína (AEC), um análogo de lisina tóxico, testamos o produto de proteína de metC quanto a presença da atividade. Como mostrado na Tabela 5, as células que super expressam a cistationina β-liase apresentaram resistência aumentada à AEC. A cepa que carrega uma mutação no gene metC (ver abaixo) perde completamente a sua capacidade para apresentar um fenótipo de resistência à AEC. O ensaio para O-acetilomoserina sulfidrilase foi realizado como segue (Belfaiza, J., et al, (1998) J. Bacteril. 180, 250 a 255; Ravanel, S., M. Droux e R. Douce (1995) Arch. Biochem. Biophys. 316, 572 a 584; Foglino, M. (1995) Microbiology 141,431 a 439). A mistura de ensaio de 0,1 ml conteve 20 mM de MOPS-NaOH (pH 7,5), 10 mM de O-acetilomoserina, 2 mM de Na2S em 50 mM de NaOH e uma quantidade apropriada de enzima. Imediatamente depois da adição de Na2S que foi adicionado por último, a mistura de reação foi coberta com 50 ul de óleo mineral. Depois de 30 minutos de incubação a 30°C, a reação foi interrompida pela ebulição da mistura durante 3 minutos. A homocisteína produzida na reação foi quantificada como anteriormente descrito (Yamagata, S. (1987) Method Enzymol. 143, 478 a 483). A mistura de reação de 0,1 ml foi tomada e misturada com 0,1 ml de H20, 0,6 ml de NaCl saturado, 0,1 ml de Na2C03 1,5 M contendo 67 mM de KCN e 0,1 ml de nitroprussida a 2%. Depois de 1 minuto de incubação na temperatura ambiente, a densidade ótica foi medida a 520 nm. As células de Corynebacterium que abrigam cópias adicionais do gene metZ, por exemplo, um plasmídeo contendo o gene metZ, exibiu atividades de enzima metZ significantemente mais altas do que o mesmo tipo de células de Corynebacterium sem cópias adicionais do gene metZ. A atividade de proteínas que ligam ao DNA pode ser medida por vários métodos bem estabelecidos, tais como os ensaios de mudança de faixa de DNA (também chamados ensaios de retardação de gel). O efeito de tais proteínas na expressão de outras moléculas pode ser medido usando-se ensaios de gene repórter (tais como aquele descrito em Kolmar, H. et al., (1995) EMBO J. 14: 3895 a 3904 e as referências citadas neste). Os sistemas de teste de gene repórter são bem conhecidos e estabelecidos para aplicações tanto em células procarióticas quanto eucarióticas usando-se enzimas tais como a beta-galactosidase, a proteína fluorescente verde e várias outras. A determinação de atividade de proteínas de transporte de membrana pode ser realizada de acordo com técnicas tais como aquelas descritas em Gennis, R. B. (1989) “Pores, Channels and Transporters”, em Biomembranes, Molecular Structures and Function, Springer: Heidelberg, p. 85 a 137; 199 a 234; e 270 a 322.
Exemplo 9: Análise de impacto de proteína mutante na produção do produto desejado O efeito da modificação genética na C. glutamicum na produção de um composto desejado (tal como um aminoácido) pode ser avaliado cultivando-se o microorganismo modificado sob condições adequadas (tais como aquelas descritas acima) e analisando-se o meio e/ou o componente celular quanto a produção aumentada do produto desejado (isto é, um aminoácido). Tais técnicas de análise são bem conhecidas por uma pessoa de habilidade comum na técnica e incluem espectroscopia, cromatografia de camada fina, métodos de tingimento de vários tipos, métodos enzimáticos e microbiológicos e cromatografia analítica tal como a cromatografia líquida de alto desempenho (ver, por exemplo, Ullman, Encyclopedia of Industrial Chemistry, Vol. A2, p. 89 a 90 e p. 443 a 613, VCH: Weinheim (1985); Fallon, A. et ai, (1987) “Applications of HPLC in Biochemistry” em: Laboratory Techniques in Biochemistry and Molecular Biology, vol. 17; Rehm et ai, (1993) Biotechnology, vol. 3, capítulo III: “Product recovery and purification”, páginas 469 a 714, VCH: Weinheim;
Belter, P. A. et al., (1988) Bioseparations: downstream processing for biotechnology, John Wiley and Sons; Kennedy, J. F. e Cabral, J. M. S. (1992) Recovery processes for biological materiais, John Wiley and Sons; Shaeiwitz, J. A. e Henry, J. D. (1988) Biochemical separations, em: Ullman’s Encyclopedia of Industrial Chemistry, Vol. B3, capítulo 11 página 1 a 27, VCH: Weinheim; e Dechow, F. J. (1989) Separation and purification techniques in biotechnology, Noyes Publications).
Além das medições do produto final de fermentação, também é possível analisar outros componentes dos caminhos metabólicos utilizados para a produção do composto desejado, tais como intermediários e subprodutos, para determinar a eficiência global de produção do composto. Os métodos de análise incluem medições dos níveis de nutrientes no meio (por exemplo, açúcares, hidrocarbonetos, fontes de nitrogênio, fosfato e outros íons), medições da composição de biomassa e cultivo análise da produção de metabólitos comuns de caminhos biossintéticos e medição de gases produzidos durante a fermentação. Os métodos padrão para estas medições estão resumidos no Applied Microbial Physiology, A Practical Approach, P. M. Rhodes e P. F. Stanbury, eds., IRL Press, p. 103 a 129; 131 a 163; e 165 a 192 (ISBN: 0199635773) e referências citadas neste.
Exemplo 10: Purificação do produto desejado a partir da cultura de C. gíutamicum A recuperação do produto desejado das células da C. gíutamicum, ou do sobrenadante da cultura descrita acima pode ser realizada por vários métodos bem conhecidos na técnica. Se o produto desejado não é secretado das células, as células podem ser colhidas da cultura pela centrifugação de baixa velocidade, as células podem ser lisadas por técnicas padrão, tais como força mecânica ou sonificação. O escombro celular é removido por centrifugação e a fração de sobrenadante contendo as proteínas solúveis é retida para outra purificação do composto desejado. Se o produto é secretado das células de C. gluíamicum, depois as células são removidas da cultura pela centrifugação de baixa velocidade e a fração sobrenadante é retida para outra purificação, A fração sobrenadante de cada método de purificação é submetida à cromatografia com uma resina adequada, em que a molécula desejada é retida em uma resina de cromatografia enquanto muitas das impurezas na amostra não o são ou onde as impurezas são retidas pela resina enquanto a amostra não é. Tais etapas de cromatografia podem ser repetidas como necessário, usando-se as mesmas ou resinas de cromatografia diferentes. Uma pessoa de habilidade comum na técnica pode ser bem versada na seleção de resinas de cromatografia apropriadas e na sua aplicação mais eficaz para uma molécula particular a ser purificada. O produto purificado pode ser concentrado por filtração ou ultrafiltração e armazenado a uma temperatura na qual a estabilidade do produto seja maximizada.
Existe uma ampla série de métodos de purificação conhecidos na técnica e o método precedente de purificação não é intencionado a ser limitante. Tais técnicas de purificação estão descritas, por exemplo, em Bailey, J. E. & Ollis, D. F. Biochemical Engineering Fundamentais, McGraw-Hill: New York (1986). A identidade e a pureza dos compostos isolados podem ser avaliadas por técnicas padrão no ramo. Estas incluem cromatografia líquida de alto desempenho (HPLC), métodos espectroscópicos, métodos de fingimento, cromatografia de camada fina, NIRS, ensaio enzimático ou microbiologicamente. Tais métodos de análise são revistos em: Patek et ai, (1994) Appl. Environ. Microbiol. 60: 133 a 140; Malakhova et al, (1996) Biotekhnologiya 11: 27 a 32; e Schmidt et ai, (1998) Bioprocess Engineer. 19: 67 a 70. Ulmann’s Encyclopedia of Industrial Chemistry, (1996) Vol. A27, VCH: Weinheim, p. 89 a 90, p. 521 a 540, p. 540 a 547, p. 559 a 566, 575 a 581 e p. 581 a 587; Michal, G. (1999) Biochemical Pathways: An Atlas of Biocheraistry and Molecular Biology, John Wiley and Sons; Fallon, A. et ai, (1987) Applications of HPLC in Biochemistry in: Laboratory Techniques in Biochemistry and Molecular Biology, vol. 17.
Exemplo 11; Análise das seqüências de gene da invenção A comparação das seqüências e a determinação da homologia percentual entre duas seqüências são técnicas conhecidas no ramo e pode ser realizada usando-se um algoritmo matemático, tal como o algoritmo de Karlin e Altschul (1990) Proc. Natl. Acad. Sei. USA 87: 2264 a 2268, modificado como em Karlin e Altschul (1993) Proc. Natl. Acad. Sei. USA 90: 5873 a 5877. Tal algoritmo é incorporado nos programas NBLAST e XBLAST (versão 2.0) de Altschul et ai, (1990) J. Mol. Biol. 215:403 a 410. As pesquisas de nucleotídeo em BLAST podem ser realizadas com o programa NBLAST, pontuação = 100, comprimento de palavra = 12 para se obter seqüências de nucleotídeo homólogas às moléculas de ácido nucleico MP da invenção. As pesquisas de proteína em BLAST podem ser realizadas com o programa XBLAST, pontuação = 50, comprimento de palavra = 3 para se obter seqüências de atninoácido homólogas às moléculas de proteína MP da invenção. Para se obter alinhamentos em intervalos para propósitos de comparação o BLAST em intervalos pode ser utilizado como descrito em Altschul et ai, (1997) Nucleic Acids Res. 25(17): 3389 a 3402. Quando da utilização dos programas BLAST e BLAST em intervalos, uma pessoa de habilidade comum na técnica saberá como otimizar os parâmetros do programa (por exemplo, XBLAST e NBLAST) para a seqüência específica que é analisada.
Um outro exemplo de um algoritmo matemático utilizado para a comparação de seqüências é o algoritmo de Meyers e Miller ((1988) Comput. Appl, Biosci. 4: 11 a 17). Tal algoritmo é incorporado no programa ALIGN (versão 2.0) que é parte do pacote de software de alinhamento de seqüência GCG. Quando da utilização do programa ALIGN para comparar seqüências de aminoácido, uma tabela de resíduo em peso PAM120, uma penalidade de comprimento de intervalo de 12 e uma penalidade de intervalo de 4 podem ser usados. Algoritmos adicionais para a análise de seqüência são conhecidos na técnica e incluem ADVANCE e ADAM. descritos em Torelli e Robotti (1994) Comput. Appl. Biosci. 10: 3 a 5; e FASTA, descrito em Pearson e Lipman (1988) P. N. A. S. 85:2444 a 2448. A homologia percentual entre duas seqüências de aminoácido também podem ser realizadas usando-se o programa GAP no pacote de software GCG (disponível em http://www.gcg.com), usando-se uma matriz Blosum 62 ou uma matriz PAM250 e um peso de intervalo de 12,10,8,6 ou 4 e um peso de comprimento de 2,3 ou 4. A homologia percentual entre duas seqüências de ácido nucleico pode ser realizada usando-se o programa GAP no pacote de software GCG, usando-se parâmetros padrão, tais como um peso de intervalo de 50 e um peso de comprimento de 3.
Uma análise comparativa das seqüências de gene da invenção com aquelas presentes no Genbank foi realizada usando-se técnicas conhecidas no ramo (ver, por exemplo, Bexevanis e Ouellette, eds. (1998) Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins. John Wiley and Sons: New York). As seqüências de gene da invenção foram comparadas com os genes presentes no Genbank em um processo de três etapas. Em uma primeira etapa, uma análise de BLASTN (por exemplo, uma análise de alinhamento local) foi realizada para cada uma das seqüências da invenção contra as seqüências de nucleotídeo presentes no Genbank e as 500 melhores foram retidas para outras análises. Uma pesquisa FASTA subseqüente (por exemplo, uma análise de alinhamento local e global combinadas, em que regiões limitadas das seqüências são alinhadas) foi realizada nestas 500 melhores. Cada seqüência de gene da invenção foi subseqüentemente alinhada de modo global a cada uma das três melhores em FASTA, usando-se o programa GAP no pacote de software GCG (usando-se parâmetros padrão). De modo a se obter resultados corretos, o comprimento das seqüências extraídas do Genbank foi ajustado ao comprimento das sequências em dúvida pelos métodos bem conhecidos na técnica. Os resultados desta análise são apresentados na Tabela 4. O dado resultante é idêntico àquele que podería ter sido obtido se uma análise GAP (global) sozinha tivesse sido realizada em cada um dos genes da invenção em comparação com cada uma das referências no Genbank, mas exigiu tempo computacional significantemente reduzido quando comparado a tal análise GAP (global) de banco de dado amplo. As seqüências da invenção para as quais nenhum dos alinhamentos acima os valores de corte foram obtidos são indicadas na Tabela 4 pela ausência de informação de alinhamento. Será ainda entendido por uma pessoa de habilidade comum na técnica que as porcentagens de homologia de alinhamento GAP apresentadas na Tabela 4 sob o título “% de homologia (GAP)” estão listadas no formato numérico europeu, em que uma V representa um ponto decimal. Por exemplo, um valor de “40,345” nesta coluna representa “40.345%”.
Exemplo 12: Construção e operação de micro-séries de DNA
As seqüências da invenção podem ser adicionalmente usadas na construção e aplicação de micro-séries de DNA (o planejamento, a metodologia e os usos de séries de DNA são bem conhecidos na técnica e estão descritos, por exemplo, em Schena, M. et al., (1995) Science 270:467 a 470; Wodicka, L. et al., (1997) Nature Biotechnology 15: 1359 a 1367; DeSaizieu, A. et al., (1998) Nature Biotechnology 16:45 a 48; e DeRisi, J. L. et al., (1997) Science 278:680 a 686).
As micro-séries de DNA são suportes sólidos ou flexíveis que consistem de nitrocelulose, nylon, vidro, silicona ou outros materiais. As moléculas de ácido nucleico podem ser ligadas à superfície de uma maneira ordenada. Após rotulação apropriada, outros ácidos nucleicos ou misturas de ácido nucleico podem ser hibridizados às moléculas de ácido nucleico imobilizadas e o rótulo pode ser usado para monitorar e medir as intensidades de sinal individuais das moléculas hibridizadas nas regiões definidas. Esta metodologia permite a quantificação simultânea da quantidade relativa ou absoluta de todos ou dos ácidos nucleicos selecionados na amostra ou mistura de ácido nucleico aplicadas. As micro-séries de DNA, portanto, permitem uma análise de expressão de ácidos nucleicos múltiplos (tanto quanto 6800 ou mais) em paralelo (ver, por exemplo, Schena, M. (1996) BioEssays 18(5): 427 a 431).
As seqüências da invenção podem ser usadas para planejar iniciadores de oligonucleotídeo que são capazes de amplificar regiões definidas de um ou mais genes da C. glutamicum por uma reação de amplificação de ácido nucleico tal como a reação de cadeia de polimerase. A escolha e o planejamento dos iniciadores de oligonucleotídeo 5’ ou 3’ ou de ligadores apropriados permite a ligação covalente dos produtos de PCR resultantes à superfície de um meio de suporte descrito acima (e também descrito por exemplo, em Schena, M. et al., (1995) Science 270.467 a 470).
As micro-séries de ácido nucleico também podem ser construídas pela síntese de oligonucleotídeo in situ como descrito por Wodicka, L. et al., (1997) Nature Biotechnology 15: 1359 a 1367. Por métodos fotolitográficos, regiões precisamente definidas da matriz são expostas à luz. Os grupos de proteção que são fotoinstáveis são deste modo ativados e sofrem a adição de nucleotídeo, ao passo que as regiões que são protegidas da luz não sofrem qualquer modificação. Ciclos subseqüentes de proteção e ativação pela luz permitem a síntese de oligonucleotídeos diferentes em posições definidas. As regiões definidas, pequenas dos genes da invenção podem ser sintetizadas em micro-séries pela síntese de oligonucleotídeo de fase sólida.
As moléculas de ácido nucleico da invenção presentes em uma amostra ou mistura de nucleotídeos podem ser hibridizadas às micro-séries.
Estas moléculas de ácido nucleico podem ser rotuladas de acordo com métodos padrão. Em resumo, as moléculas de ácido nucleico (por exemplo, moléculas de mRNA ou moléculas de DNA) são rotuladas pela incorporação de nucleotídeos isotópica ou fluorescentemente rotulados, por exemplo, durante a transcrição reversa ou síntese de DNA. A hibridização de ácidos nucleicos rotulados às micro-séries está descrita (por exemplo, em Schena, M, et al., (1995) acima; Wodicka, L. et ai, (1997) acima; e DeSaizieu A. et al., (1998) acima). A detecção e quantificação da molécula hibridizada são feitas de encomenda para o rótulo incorporado específico. Os rótulos radioativos podem ser detectados, por exemplo, como descrito em Schena, M. et al., (1995) acima) e rótulos fluorescentes podem ser detectados, por exemplo, pelo método de Shalon et al., (1996) Genome Research 6: 639 a 645). A aplicação das seqüências da invenção à tecnologia de micro-série de DNA, como descrito acima, permite análises comparativas de cepas diferentes da C. glutamicum, ou outras Corynebacteria. Por exemplo, os estudos de variações inter-cepas com base nos perfis de transcrito individual e a identificação de genes que são importantes para as propriedades de cepa específicas e/ou desejadas tais como patogenicidade, produtividade e tolerância ao estresse são facilitados pelas metodologias de série de ácido nucleico. Da mesma maneira, as comparações do perfil de expressão de genes da invenção durante o curso de uma reação de fermentação são possíveis usando-se a tecnologia de série de ácido nucleico. Exemplo 13: Análise das dinâmicas de populações de proteína celular (proteômicos) Os genes, composições e métodos da invenção podem ser aplicados para estudar as interações e dinâmicas de populações de proteínas denominadas “proteômicos”. As populações de proteína de interesse incluem, mas não são limitadas à população de proteína total da C. glutamicum, (por exemplo, em comparação com as populações de proteína de outros organismos), aquelas proteínas que são ativas sob condições ambientais ou metabólicas específicas (por exemplo, durante a fermentação, em temperatura alta ou baixa ou em pH alto ou baixo) ou aquelas proteínas que são ativas durante fases específicas do cultivo e desenvolvimento.
As populações de proteína podem ser analisadas por várias técnicas bem conhecidas, tais como a eletroforese em gel. As proteínas celulares podem ser obtidas, por exemplo, pela lise ou extração e podem ser separadas uma das outras usando-se uma variedade de técnicas eletroforéticas. A eletroforese em gel de poliacrilamida dodecil sulfato de sódio (SDS-PAGE) separa proteínas largamente com base no seu peso molecular. A eletroforese em gel de poliacrilamida de focalização isoelétrica (IEF-PAGE) separa proteínas pelo seu ponto isoelétrico (que reflete não apenas a sequência de aminoácido mas também modificações pós translacionais da proteína). Um outro método mais preferido de análise de proteína é a combinação consecutiva de ambos, o IEF-PAGE e o SDS-PAGE, conhecida como eletroforese 2-D-gel (descrito, por exemplo, em Hemann et ai, (1998) Electrophoresis 19: 3217 a 3221; Fountoulakis et al., (1998) Electrophoresis 19: 1193 a 1202; Langen et al., (1997) Electrophoresis 18: 1184 a 1192; Antelmann et ai, (1997) Electrophoresis 18: 1451 a 1463). Outras técnicas de separação também podem ser utilizadas para a separação de proteína, tais como a eletroforese em gel capilar; tais técnicas são bem conhecidas no ramo.
As proteínas separadas por estas metodologias podem ser visualizadas por técnicas padrão, tais como o tingimento ou rotulação. Os corantes adequados são conhecidos na técnica e incluem Coomassie Brilliant Blue, corante de prata ou pigmentos fluorescentes tais como Sypro Ruby (Molecular Probes). A inclusão de aminoácidos ou outros precursores de proteínas radioativamente rotulados “por exemplo, 35S-metionina, 35S- cisteína, aminoácidos rotulados com 14C, I5N-aminoácidos, 15N03 ou 15NH4* ou aminoácidos rotulados com 13C) no meio de C. glutamicum, permite a rotulação de proteínas destas células antes da sua separação. Similarmente, rótulos fluorescentes podem ser utilizados. Estas proteínas rotuladas podem ser extraídas, isoladas e separadas de acordo com as técnicas anteriormente descritas.
As proteínas visualizadas por estas técnicas podem ser ainda analisadas medindo-se a quantidade de pigmento ou rótulo usado. A quantidade de uma proteína dada pode ser determinada quantitativamente usando-se por exemplo, métodos óticos e podem ser comparadas com a quantidade de outras proteínas no mesmo gel ou em outros géis. Comparações de proteínas em géis podem ser feitas, por exemplo, pela comparação ótica, pela espectroscopia, pela avaliação e análise de imagem de géis ou através de uso de películas e telas fotográficas. Tais técnicas são bem conhecidas no ramo.
Para determinar a identidade de qualquer proteína dada, o seqüenciamento direto ou outras técnicas padrão podem ser utilizadas. Por exemplo, o seqüenciamento de aminoácido de terminal N e/ou C (tal como a degradação de Edman) pode ser usado, como o pode a espectrometria de massa (em particular as técnicas MALDI ou ESI (ver, por exemplo, Langen et al, (1997) Electrophoresis 18:1184 a 1192)). As sequências de proteína aqui fornecidas podem ser usadas para a identificação de proteínas da C. glutamicum, por estas técnicas. A informação obtida por estes métodos pode ser usada para comparar padrões de presença, atividade ou modificação de proteína entre amostras diferentes de várias condições biológicas (por exemplo, organismos diferentes, pontos de tempo de fermentação, condições de meio ou biótipos diferentes, entre outros). Os dados obtidos a partir de tais experimentos sozinhos ou em combinação com outras técnicas podem ser usados para várias aplicações tais como para comparar o comportamento de vários organismos em uma dada situação (por exemplo, metabólica), para aumentar a produtividade de cepas que produzem produtos químicos finos ou para aumentar a eficiência da produção de produtos químicos finos.
Exemplo 14: Clonagem de genes pela aplicação da reação de cadeia de polimerase (PCR) Os genes podem ser amplificados usando oligonucleotídeos que compreendem seqüências de nucleotídeo homólogas às seqüências de Corynebacterium glutamicum ou outras cepas bem como sítios de reconhecimento de enzimas de restrição bem conhecidos na técnica (por exemplo, como descrito em Sambrook J., Fritsh, E. F. e Maniatis, T. Molecular Cloning: A Laboratory Manual, 2a ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989). Estes oligonucleotídeos podem ser usados para amplificar fragmentos de DNA específicos contendo partes do cromossoma de cepas mencionadas usando DNA-polimerases tal como T. aquaíicus DNA-polimerase, P. furiosus DNA-polimerase ou P. woesei DNA-polimerase e nucleotídeos dNTPs em uma solução tampão apropriada como descrito pelo fabricante.
Os fragmentos de gene tais como seqüências codifícadoras de RXA00657incluindo as regiões à montante e à jusante apropriadas não contidas na região codificadora do gene mencionado podem ser amplificados usando-se as tecnologias anteriormente mencionadas. Além disso, estes fragmentos podem ser purificados a partir de oligonucleotídeos e nucleotídeos não incorporados. As enzimas de restrição de DNA podem ser usadas para produzir extremidades protuberantes que podem ser usadas para ligar fragmentos de DNA a vetores digeridos com enzimas complementares ou enzimas compatíveis que produzam extremidades que possam ser usadas para ligar o DNA nos vetores mencionados em Sinskey et ai, Patente U.S. N2 4.649.119 e técnicas para a manipulação genética de C. glutamicum e as espécies Brevibacterium relacionadas (por exemplo, lactofementum) (Yoshihama et al., J. Bacteriol. 162: 591 a 597 (1985); Katsumata et al., J. Bacteriol. 159: 306 a 311 (1984); e Santamaria et al., J. Gen. Microbiol. 130: 2237 a 2246 (1984). Os oligonucleotídeos usados como iniciadores para a amplificação da seqüência de DNA à montante, a seqüência da região codificadora e a região à jusante de RXA00657 foram como segue: TCGGGTATCCGCGCTACACTTAGA (SEQID NO: 121); GGAAACCGGGGCATCGAAACTTA (SEQ ID NO: 122). 0 DNA cromossômico de Corynebacterium glutamicum com uma quantidade de 200 ng foi usado como um padrão em um volume de reação de 100 μΐ contendo 2,5 U Pfu de Turbo-Polymerase® (Stratagene®) e 200 μΜ de dNTP-nucleotídeos. A PCR foi realizada em um PCR-Cycler® (Perkin Elmer 2400®) usando o seguinte protocolo de temperatura/tempo: 1 ciclo: 94°C: 2 min.; 20 ciclos: 94°C: 1 min.; 52°C: 1 min., 72°C: 1,5 min, 1 ciclo: 72°C: 5 min.
Os iniciadores foram removidos do fragmento de DNA amplificado resultante e o fragmento resultante foi clonado no sítio EcoRV abrupto de pBS KS (Stratagene®). O fragmento foi excisado pela digestão com as enzimas de restrição BamHI/Xhol e ligado em um vetor pB digerido por BamHI Sall (SEQ ID NO: 125). O vetor resultante é chamado de pB RXA00657.
Os vetores recombinantes resultantes podem ser analisados usando-se técnicas padrão descritas em por exemplo, Sambrook J, Fritsh, E. F. e Maniatis, T. Molecular Cloning: A Laboratory Manual, 2a ed, Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989), e pode ser transferido na C. glutamicum. usando as técnicas anteriormente mencionadas.
Uma cepa da Corynebacterium (ATCC 13286) foi tratada para uma transformação como descrito. A transformação da C. glutamicum pode ser obtida pela transformação de protoplasto (Kastsumata, R. et al, (1984) J. Bacteriol. 159 306 a 311), eletroporação (Liebl, E. et al, (1989) FEMS Microbiol. Letters, 53: 399 a 303) e nos casos onde vetores especiais são usados, também pela conjugação (como descrito, por exemplo, em Schãfer, A. et al, (1990) J. Bacteriol. 172:1663 a 1666). Também é possível transferir os vetores de transporte da C. glutamicum para a E. coli pela preparação de DNA plasmídico da C. glutamicum (usando métodos padrão bem conhecidos na técnica) e transformando-os na E. coli. Esta etapa de transformação pode ser realizada usando-se métodos padrão, mas é vantajoso usar uma cepa E. coli deficiente em Mcr, tal como NM522 (Gough & Murray (1983) J. Mol. Biol. 166:1 a 19). A transformação de uma cepa bacteriana tal como a cepa de Corynebacterium glutamicum (ATCC 13286) foi realizada com um pB plasmídico contendo as regiões de DNA anteriormente mencionadas de RXA00657 (SEQ ID NO: 6) e em um outro caso com o vetor pB (SEQ ID NO:) que não carrega nenhuma inserção de ácidos nucleicos.
As cepas resultantes foram colocadas em placa e isoladas do meio CM (10 g/litro de Glicose, 2,5 g/litro de NaCl, 2,0 g/litro de Uréia, 10 g/litro de Bacto Peptona (Difco/Becton Dicinson/Sparks USA®), 5 g/litro de extrato de levedura (Difco/Becton Dicinson/Sparks USA®), 5 g/litro de extrato de carne (Difco/Becton Dicinson/Sparks USA®), 22 g/litro de agar (Difco/Becton Dickinson/Sparks USA®) e 15 pg/ml de sulfato de canamicina (Serva, Alemanha) com um ajustado com NaOH até o pH de 6,8.
As cepas isoladas do meio de agar anteriormente mencionado foram inoculadas em 10 ml em um frasco de agitação de 100 ml não contendo nenhuma placa defletora em meio líquido contendo 100 g/litro de sacarose, 500 g/litro de (NFLi^SO^ 2,5 g/litro de NaCl, 2,0 g/litro de Uréia, 10 g/litro de Bacto Peptona (Difco/Becton Dickinson/Sparks USA®), 5 g/litro de extrato de levedura (Difco/Becton Dickinson/Sparks USA®), 5 g/litro de extrato de carne (Difco/Becton Dickinson/Sparks USA®) e 25 g/litro de CaC03 (Riedel de Haen, Alemanha). O meio foi um ajustado com NaOH até o pH 6.8.
As cepas foram incubadas a 30°C durante 48 horas. Os sobrenadantes das incubações foram preparados pela centrifiigação 20’ a 12.000 rpm em uma microcentrífuga Eppendorf®. Os sobrenadantes líquidos foram diluídos e submetidos a uma análise de aminoácido (os métodos padrão para estas medições estão resumidos em Applied Microbial Physiology, A Practical Approach, P. M. Rhodes e P. F. Stanbury, eds., IRL Pres, p. 103 a 129; 131 a 163 e 165 a 192 (ISBN: 0199635773) e as referências citadas neste).
Os resultados estão apresentados na Tabela 6, abaixo. EQUIVALENTES
Aqueles de habilidade comum na técnica reconhecerão ou serão capazes de averiguar usando não mais do que experimentação de rotina, muitos equivalentes às formas de realização específicas da invenção aqui descrita. Tais equivalentes são intencionados estarem abrangidos pelas reivindicações seguintes.

Claims (15)

1. Vetor, caracterizado pelo fato de compreender uma molécula de ácido nucleico isolada de Corynebacte rí um glutamkum codificando uma proteína do caminho metabólico selecionada do grupo que consiste em uma molécula de ácido nucleico compreendo a sequência de nucleotídeo apresentada na SEQ ID NO: 3 ou SEQ ID NO: 5.
2. Vetor de acordo com a reivindicação 1, caracterizado pelo fato de ser um vetor de expressão.
3. Célula hospedeira recombinante, caracterizada pelo fato de que é transfectada com o vetor de expressão como definido na reivindicação 1 ou 2, em que dita célula hospedeira é um microorganismo.
4. Célula hospedeira recombinante de acordo com a reivindicação 3, caracterizada pelo fato de que a dita célula pertence ao gênero Coiynebacunium ou Brcvibacteríum,
5. Célula hospedeira recombinante de acordo com a reivindicação 3, caracterizada pelo fato de que a expressão das ditas moléculas de ácido nucleico resulta na modulação na produção de um produto químico fino a partir da dita célula e em que dito produto químico fino é um aminoácido.
6. Célula hospedeira de acordo com a reivindicação 5, caracterizada pelo fato de que o dito aminoácido é metionina ou lisina.
7. Método para produzir um produto químico fino, caracterizado pelo fato de que compreende cultivar uma célula contendo um vetor conto definido na reivindicação 1 ou 2, tal que o produto químico fino seja produzido, cm que dito produto químico fino é um aminoácido e em que dita célula pertence ao gênero Corynebactenum ou Brevihacferiitm.
8. Método de acordo com a reivindicação 7, caracterizado pelo fato de que a dita célula é cultivada na presença de uma fonte de enxofre.
9. Método de acordo com a reivindicação 7, caracterizado pelo fato de que o dito método ainda compreende a etapa de recuperar o produto químico fino da dita cultura.
10. Método de acordo com a reivindicação 7, caracterizado pelo fato de que o dito aminoácido é metionina ou lisina.
11. Método de acordo com a reivindicação 7, caracterizado pelo fato de que o dito método ainda compreende a etapa de transfectar a dita célula com o vetor como definido na reivindicação 1 ou 2, para resultar em uma célula contendo o dito vetor.
12. Método de acordo com a reivindicação 7, caracterizado pelo fato de que a dita célula é Corynebacterium glutamicum.
13. Método para produzir um produto químico fino, caracterizado pelo fato de que compreende cultivar uma célula cujo DNA genômico foi alterado pela inclusão de uma molécula de ácido nucleico isolada de Corynebacterium glutamicum codificando uma proteína do caminho metabólico selecionada do grupo que consiste em uma molécula de ácido nucleico compreendendo a sequência de nucleotídeo apresentada na SEQ ID NO: 3 ou SEQ ID NO: 5, em que dito produto químico fino é um aminoácido e em que a dita célula pertence ao gênero Corynebacterium ou Brevibacterium.
14. Método para produzir um produto químico fino, caracterizado pelo fato de que compreende cultivar uma célula cujo DNA genômico foi alterado pela inclusão de uma molécula de ácido nucleico isolada de Corynebacterium glutamicum codificando uma proteína do caminho metabólico selecionada do grupo que consiste em uma molécula de ácido nucleico compreendendo a sequência de nucleotídeo apresentada na SEQ ID NO: 3 ou SEQ ID NO: 5, sozinha ou em combinação com um ou mais moléculas de ácidos nucleicos do caminho metabólico, em que dito produto químico fino é um aminoácido e em que dita célula pertence ao gênero Corynebacterium ou Brevibacterium, e em que a molécula de ácido nucleico de caminho metabólico é selecionada do grupo que consiste de metB, metA, metE, metH, hom, asd, lysC, lysC/ask, dapA, dapB, dapC, dapD/argD, dapE, dapF, lysA, ddh, lysE, lysG, lysR, hsk, ppc, pycA, accD, accA, accB, accC, os genes gpdh que codificam a glicose-6-fosfato-desidrogenase, opcA, pgdh, ta, tk, pgl, ripe, rpe ou qualquer combinação dos genes mencionados acima.
15. Método de acordo com a reivindicação 7 ou 13, caracterizado pelo fato de que o dito caminho metabólico é o metabolismo de metionina ou lisina.
BRPI0017148A 2000-03-09 2000-12-22 vetor, célula hospedeira recombinante, e, método para produzir um produto químico fino BRPI0017148B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US18797000P 2000-03-09 2000-03-09
US60674000A 2000-06-23 2000-06-23
PCT/IB2000/002035 WO2001066573A2 (en) 2000-03-09 2000-12-22 Corynebacterium glutamicum genes encoding metabolic pathway proteins

Publications (2)

Publication Number Publication Date
BR0017148A BR0017148A (pt) 2003-03-11
BRPI0017148B1 true BRPI0017148B1 (pt) 2016-03-01

Family

ID=26883605

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0017148A BRPI0017148B1 (pt) 2000-03-09 2000-12-22 vetor, célula hospedeira recombinante, e, método para produzir um produto químico fino

Country Status (14)

Country Link
EP (1) EP1261718B1 (pt)
JP (1) JP4786107B2 (pt)
KR (1) KR101012231B1 (pt)
CN (2) CN101255431B (pt)
AT (1) ATE486941T1 (pt)
AU (2) AU2390301A (pt)
BR (1) BRPI0017148B1 (pt)
CA (1) CA2402186C (pt)
DE (1) DE60045191D1 (pt)
DK (1) DK1261718T3 (pt)
ES (1) ES2354867T3 (pt)
MX (1) MXPA02008710A (pt)
WO (1) WO2001066573A2 (pt)
ZA (1) ZA200208060B (pt)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10109685A1 (de) * 2000-09-09 2002-04-11 Degussa Neue für das sahH-Gen kodierende Nukleotidsequenzen
US6759224B2 (en) 2000-09-09 2004-07-06 Degussa Ag Nucleotide sequences which code for the sahH gene
AU2001279755A1 (en) * 2000-09-09 2002-03-22 Degussa A.G. Nucleotide sequences which code for the sahh gene
DE10154292A1 (de) * 2001-11-05 2003-05-15 Basf Ag Gene die für Stoffwechselweg-Proteine codieren
DE10162729A1 (de) 2001-12-20 2003-07-03 Degussa Allele des sigA-Gens aus coryneformen Bakterien
DE10222858A1 (de) * 2002-05-23 2003-12-04 Basf Ag Verfahren zur fermentativen Herstellung schwefelhaltiger Feinchemikalien
EP2064321B1 (en) * 2006-08-30 2016-03-09 Cargill, Incorporated Beta-alanine/alpha-ketoglutarate aminotransferase for 3-hydroxypropionic acid production
KR100830289B1 (ko) * 2007-01-18 2008-05-16 씨제이제일제당 (주) L-아르기닌 생산 변이주 및 이의 제조방법
KR100987281B1 (ko) * 2008-01-31 2010-10-12 씨제이제일제당 (주) 개량된 프로모터 및 이를 이용한 l-라이신의 생산 방법
US8404465B2 (en) 2009-03-11 2013-03-26 Celexion, Llc Biological synthesis of 6-aminocaproic acid from carbohydrate feedstocks
WO2014028026A1 (en) 2012-08-17 2014-02-20 Celexion, Llc Biological synthesis of difunctional hexanes and pentanes from carbohydrate feedstocks
CN104561194A (zh) * 2013-10-16 2015-04-29 南京工业大学 一种n-乙酰神经氨酸醛缩酶在催化合成n-乙酰神经氨酸中的应用
CN103805552B (zh) * 2014-02-19 2016-03-23 中国科学院天津工业生物技术研究所 一株生物合成稀少糖的谷氨酸棒杆菌工程菌株及其构建方法和应用
CN104535511A (zh) * 2014-07-04 2015-04-22 陶淑芳 基于单酶反应的l-谷氨酰胺的比色测定方法以及测定试剂盒
WO2018079687A1 (en) * 2016-10-26 2018-05-03 Ajinomoto Co., Inc. Method for producing objective substance
JP2019536449A (ja) * 2016-10-26 2019-12-19 味の素株式会社 目的物質の製造方法
EP3456833A1 (en) * 2017-09-18 2019-03-20 Evonik Degussa GmbH Method for the fermentative production of l-amino acids
CN112251457B (zh) * 2019-07-22 2022-04-15 江南大学 一种4-羟基异亮氨酸生产菌的适应性进化方法及其应用
CN111607601B (zh) * 2020-04-24 2022-10-18 天津大学 谷氨酸棒杆菌转录调控因子IpsA突变体及应用
CN112812985B (zh) * 2020-11-11 2023-01-10 新疆阜丰生物科技有限公司 一种提高谷氨酰胺发酵产酸的方法
KR102303747B1 (ko) * 2021-04-12 2021-09-16 씨제이제일제당 (주) 신규한 주요 촉진제 수퍼패밀리 퍼미에이즈 변이체 및 이를 이용한 l-라이신 생산 방법
CN114410614A (zh) * 2021-12-30 2022-04-29 宁夏伊品生物科技股份有限公司 Yh66_05415蛋白或其突变体在制备l-精氨酸中的应用

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5540240B1 (pt) * 1970-02-06 1980-10-16
JP4075087B2 (ja) * 1996-12-05 2008-04-16 味の素株式会社 L−リジンの製造法
KR100878334B1 (ko) * 1999-06-25 2009-01-14 백광산업 주식회사 대사 경로 단백질을 코딩하는 코리네박테리움 글루타미쿰유전자
JP4623825B2 (ja) * 1999-12-16 2011-02-02 協和発酵バイオ株式会社 新規ポリヌクレオチド

Also Published As

Publication number Publication date
EP1261718B1 (en) 2010-11-03
ZA200208060B (en) 2003-11-10
DK1261718T3 (da) 2011-02-14
CN1452659A (zh) 2003-10-29
KR20020086616A (ko) 2002-11-18
WO2001066573A2 (en) 2001-09-13
DE60045191D1 (de) 2010-12-16
BR0017148A (pt) 2003-03-11
CA2402186C (en) 2011-04-05
CN101255431A (zh) 2008-09-03
CA2402186A1 (en) 2001-09-13
MXPA02008710A (es) 2003-02-24
WO2001066573A3 (en) 2002-05-10
AU2390301A (en) 2001-09-17
ATE486941T1 (de) 2010-11-15
JP4786107B2 (ja) 2011-10-05
AU2001223903B2 (en) 2006-11-02
ES2354867T3 (es) 2011-03-18
KR101012231B1 (ko) 2011-02-09
CN101255431B (zh) 2012-05-16
JP2003525623A (ja) 2003-09-02
EP1261718A2 (en) 2002-12-04

Similar Documents

Publication Publication Date Title
EP1257649B1 (en) Corynebacterium glutamicum genes encoding metabolic pathway proteins
BRPI0017148B1 (pt) vetor, célula hospedeira recombinante, e, método para produzir um produto químico fino
JP2007252388A (ja) 炭素代謝およびエネルギー生産に関連するタンパク質をコードするコリネバクテリウム−グルタミカム遺伝子
KR100878333B1 (ko) 항상성 및 적응과 관련된 단백질을 코딩하는코리네박테리움 글루타미쿰 유전자
JP2007244392A (ja) コリネバクテリウム−グルタミカム遺伝子をコードするストレス、耐性および寛容性タンパク質
JP2006271389A (ja) 膜合成および膜輸送に関与するタンパク質をコードするコリネバクテリウム−グルタミカム遺伝子
JP2007236393A (ja) ホスホエノールピルビン酸:糖ホスホトランスフェラーゼ系タンパク質をコードするコリネバクテリウム−グルタミカム遺伝子
US7393675B2 (en) Corynebacterium glutamicum genes encoding proteins involved in carbon metabolism and energy production
US20040043953A1 (en) Genes of corynebacterium
AU2001223903A1 (en) Corynebacterium glutamicum genes encoding metabolic pathway proteins
RU2321634C2 (ru) Гены corynebacterium glutamicum, кодирующие белки, участвующие в метаболизме углерода и продуцировании энергии
KR20050044854A (ko) 글루코스-6-포스페이트-탈수소효소 단백질을 코딩하는유전자
KR100868694B1 (ko) Dna 복제 단백질 및 병인 관련 단백질을 코딩하는유전자
RU2304616C2 (ru) Гены corynebacterium glutamicum, кодирующие белки, участвующие в гомеостазе и адаптации
RU2312145C2 (ru) Гены corynebacterium glutamicum, кодирующие белки, участвующие в синтезе мембран и мембранном транспорте
RU2303635C2 (ru) Гены corynebacterium glutamicum, кодирующие белки резистентности и толерантности к стрессам
KR20050042459A (ko) 포스포에놀피루베이트-당-포스포트랜스퍼라제 단백질을코딩하는 유전자
EP1661987A1 (en) Corynebacterium glutamicum gene encoding phosphoenolpyruvate carboxykinase

Legal Events

Date Code Title Description
B25D Requested change of name of applicant approved

Owner name: BASF SE (DE)

Free format text: ALTERADO DE: BASF AKTIENGESELLSCHAFT

B25A Requested transfer of rights approved

Owner name: EVONIK DEGUSSA GMBH (DE)

Free format text: TRANSFERIDO DE: BASF SE

B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 01/03/2016, OBSERVADAS AS CONDICOES LEGAIS.

B21F Lapse acc. art. 78, item iv - on non-payment of the annual fees in time

Free format text: REFERENTE A 18A ANUIDADE.

B24J Lapse because of non-payment of annual fees (definitively: art 78 iv lpi, resolution 113/2013 art. 12)

Free format text: EM VIRTUDE DA EXTINCAO PUBLICADA NA RPI 2495 DE 30-10-2018 E CONSIDERANDO AUSENCIA DE MANIFESTACAO DENTRO DOS PRAZOS LEGAIS, INFORMO QUE CABE SER MANTIDA A EXTINCAO DA PATENTE E SEUS CERTIFICADOS, CONFORME O DISPOSTO NO ARTIGO 12, DA RESOLUCAO 113/2013.