PT1919514E - Polinucleótidos que codificam enzimas de modificação de isoprenóides e métodos de utilização destes - Google Patents

Polinucleótidos que codificam enzimas de modificação de isoprenóides e métodos de utilização destes Download PDF

Info

Publication number
PT1919514E
PT1919514E PT06785959T PT06785959T PT1919514E PT 1919514 E PT1919514 E PT 1919514E PT 06785959 T PT06785959 T PT 06785959T PT 06785959 T PT06785959 T PT 06785959T PT 1919514 E PT1919514 E PT 1919514E
Authority
PT
Portugal
Prior art keywords
nucleotide sequence
isoprenoid
nucleic acid
quot
host cell
Prior art date
Application number
PT06785959T
Other languages
English (en)
Inventor
Dae-Kyun Ro
Karyn Newman
Eric M Paradise
Jay D Keasling
Mario Ouellet
Rachel Eachus
Kimberly Ho
Timothy Ham
Original Assignee
Univ California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Univ California filed Critical Univ California
Publication of PT1919514E publication Critical patent/PT1919514E/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0036Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
    • C12N9/0038Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
    • C12N9/0042NADPH-cytochrome P450 reductase (1.6.2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/181Heterocyclic compounds containing oxygen atoms as the only ring heteroatoms in the condensed system, e.g. Salinomycin, Septamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y106/00Oxidoreductases acting on NADH or NADPH (1.6)
    • C12Y106/02Oxidoreductases acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
    • C12Y106/02004NADPH-hemoprotein reductase (1.6.2.4), i.e. NADP-cytochrome P450-reductase

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Nutrition Science (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Description

ΕΡ 1 919 514/PT
DESCRIÇÃO "Polinucleótidos que codificam enzimas de modificação de isoprenóides e métodos de utilização destes"
REFERÊNCIA CRUZADA
Este pedido reclama o benefício do pedido provisório de patente U.S. n.° 60/697,067, apresentado em 5 de Julho de 2005.
CAMPO DO INVENTO O presente invento pertence ao campo da produção de compostos isoprenóides e, em particular, das enzimas que modificam os compostos isoprenóides.
ANTECEDENTES DO INVENTO
Os isoprenóides constituem um grupo extremamente grande e diverso de produtos naturais que possuem uma origem biossintética comum, isto é, um precursor metabólico único, o difosfato de isopentenilo (IPP). Até agora foram descritos pelo menos 20.000 isoprenóides. Por definição, os isoprenóides são constituídos pelas chamadas unidades isoprénicas (C5) . O número de átomos de C presente nos isoprenóides é tipicamente divisível por cinco (C5, CIO, C15, C20, C25, C30 e C40), embora tenham sido referidos isoprenóides e politerpenos irregulares. Os compostos isoprenóides também são designados por "terpenos" ou "terpenóides". Os membros importantes dos isoprenóides incluem os carotenóides, os sesquiterpenóides, os diterpenóides e os hemiterpenos. Os carotenóides incluem, por exemplo, o licopeno, o β-caroteno e compostos similares, muitos dos quais funcionam como antioxidantes. Os sesquiterpenóides incluem, por exemplo, a artemisinina, um composto que possui actividade antimalárica. Os diterpenóides incluem, por exemplo, o taxol, um agente quimioterapêutico para o cancro.
Os isoprenóides constituem a família mais numerosa e estruturalmente diferente de produtos naturais. Nesta 2
ΕΡ 1 919 514/PT família, os terpenóides isolados de plantas e de outras fontes naturais são utilizados como compostos aromatizantes e fragrantes comerciais, bem como compostos farmacêuticos, por exemplo, como fármacos antimaláricos, antivirais e anticancerosos. A maioria dos compostos terpenóides actualmente utilizados são produtos naturais ou seus derivados. Os organismos de origem (por exemplo, árvores, invertebrados marinhos) de muitos destes produtos naturais não são receptivos nem à cultura em larga escala necessária para produzir quantidades comercialmente viáveis nem à manipulação genética para maior produção ou derivatização destes compostos. Por conseguinte, os produtos naturais têm de ser produzidos semi-sinteticamente a partir de análogos ou sinteticamente utilizando sínteses químicas convencionais. Além disso, muitos produtos naturais possuem estruturas complexas e, em resultado disso, são actualmente antieconómicos ou impossíveis de sintetizar. Estes produtos naturais precisam de ser extraídos das suas fontes nativas, como sejam as árvores, as esponjas, os corais e os microrganismos marinhos, ou produzidos sintética ou semi-sinteticamente a partir de precursores mais abundantes. A extracção de um produto natural a partir de uma fonte nativa está limitada pela disponibilidade da fonte nativa, e a produção sintética ou semi-sintética de produtos naturais pode sofrer de rendimentos baixos e/ou custos elevados. Tais problemas de produção e de disponibilidade limitada da fonte natural podem restringir o desenvolvimento comercial e clínico destes produtos.
Um exemplo de um composto sesquiterpénico importante é a artemisinina. A artemisinina é um fármaco antimalárico extremamente eficaz, que actualmente é extraído de plantas (Artemísia annua) e utilizado na preparação de medicamentos para terapia de combinação. A artemisinina derivada de plantas é cara, e a sua disponibilidade está sujeita às condições atmosféricas e políticas dos países que cultivam as plantas. 0 ácido artemisínico é um intermediário fundamental na biossíntese da artemisinina. A conversão de amorfa-4,11-dieno em álcool artemisínico, uma etapa importante na produção da artemisinina, é um processo difícil e caro pela química tradicional. 3
ΕΡ 1 919 514/PT
Existe a necessidade na técnica de dispor de métodos de produção de compostos isoprenóides que evitem algumas das desvantagens referidas acima. 0 presente invento contempla esta necessidade ao disponibilizar polinucleótidos que codificam enzimas que modificam os compostos isoprenóides e células hospedeiras que estão geneticamente modificadas para produzir estas enzimas.
Referências bibliográficas
Bertea et al. (2005) Planta Med. 71:40-47; deKraker et al. (2003) Tetradedron 59:409-418; Martin et al. (2003) Nat. Biotechnol. 21:796-802; WO 03/025193; Publicação de Patente U.S. n.° 20050019882; Publicação de Patente U.S. n.° 20030148479; Publicação de Patente U.S. n.° 20040005678; Publicação de Patente U.S. n.° 20030166255.
SUMÁRIO DO INVENTO O presente invento disponibiliza ácidos nucleicos isolados compreendendo sequências nucleotidicas que codificam enzimas de modificação de isoprenóides, as quais apresentam uma actividade de amorfa-4,11-dieno-oxidase, conforme definidos nas reivindicações anexas, assim como vectores recombinantes compreendendo os ácidos nucleicos, conforme definidos nas reivindicações anexas. O presente invento proporciona adicionalmente células hospedeiras geneticamente modificadas com um ácido nucleico ou um vector recombinante do invento, conforme definidas nas reivindicações anexas. O presente invento fornece ainda uma planta transgénica geneticamente modificada com um ácido nucleico do invento, conforme definida nas reivindicações anexas. O presente invento disponibiliza adicionalmente métodos de produção de um composto isoprenóide, em que o método geralmente envolve a cultura de uma célula hospedeira geneticamente modificada do invento, em condições que permitem a síntese de uma enzima que apresenta uma actividade de amorfa-4,11-dieno-oxidase por parte de um ácido nucleico do invento, em que a enzima modifica um composto isoprenóide, conforme definidos nas reivindicações anexas. 4 ΕΡ 1 919 514/ΡΤ
BREVE DESCRIÇÃO DAS FIGURAS A Figura 1 representa a sequência nucleotidica da sequência codificante de um ADNc de CYP71D-A4 (SEQ ID N0:1). A Figura 2 representa a sequência de aminoácidos de uma amorfadieno-12-oxidase (SEQ ID N0:2). A Figura 3 representa a sequência nucleotidica da região codificante de um ADNc da redutase do citocromo P450 de Artemísia annua (SEQ ID N0:3). A Figura 4 representa uma sequência de aminoácidos da redutase do citocromo P450 de Artemísia annua (SEQ ID NO:4).
As Figuras 5A-C representam os resultados de uma experiência de alimentação de substrato in vivo.
As Figuras 6A e 6B ilustram a confirmação do produto por GC-MS.
As Figuras 7A-C representam a produção de novo de ácido artemisinico em levedura.
As Figuras 8A-C ilustram ensaios da enzima amorfadieno- oxidase in vitro. A Figura 9 representa a sequência nucleotidica de um ADNc (clone 71D-B1) que codifica uma enzima de modificação de isoprenóides (SEQ ID N0:5). A Figura 10 representa uma sequência de aminoácidos de uma enzima de modificação de isoprenóides (71D-B1; SEQ ID NO:6).
As Figuras 11A-C representam a actividade de hidroxilação da enzima 71D-B1. A Figura 12 representa a sequência nucleotidica de um ADN genómico que codifica uma enzima de modificação de isoprenóides (SEQ ID NO:7). ΕΡ 1 919 514/ΡΤ A Figura 13 é uma representação esquemática das vias metabólicas dos isoprenóides que resultam na produção dos intermediários difosfato de poliprenilo das vias biossintéticas dos isoprenóides - difosfato de geranilo (GPP), difosfato de farnesilo (FPP) e difosfato de geranilgeranilo (GGPP) - a partir de difosfato de isopentenilo (IPP) e de difosfato de dimetilalilo (DMAPP). A Figura 14 é uma representação esquemática da via do mevalonato (MEV) para a produção de IPP. A Figura 15 é uma representação esquemática da via da DXP para a produção de IPP e de pirofosfato de dimetilalilo (DMAPP).
DEFINIÇÕES
Os termos "isoprenóide", "composto isoprenóide", "terpeno", "composto terpénico", "terpenóide" e "composto terpenóide" são aqui utilizados como sinónimos. Os compostos isoprenóides são constituídos por um número variável das chamadas unidades isoprénicas (C5) . 0 número de átomos de C presente nos isoprenóides é tipicamente divisível por cinco (por exemplo, C5, CIO, C15, C20, C25, C30 e C40) . Foram referidos isoprenóides e politerpenos irregulares e estes estão também incluídos na definição de "isoprenóide". Os compostos isoprenóides incluem, embora não estejam limitados a estes exemplos, os monoterpenos, os sesquiterpenos, os triterpenos, os politerpenos e os diterpenos. assim como os difosfatos de ou mais grupos prenilo. Os incluem o pirofosfato de seu isómero pirofosfato de
Tal como aqui utilizado, o termo "difosfato de prenilo" é usado como sinónimo de "pirofosfato de prenilo" e inclui os difosfatos de monoprenilo que possuem um único grupo prenilo (por exemplo, IPP e DMAPP) , poliprenilo que incluem 2 difosfatos de monoprenilo isopentenilo (IPP) e o dimetilalilo (DMAPP).
Tal como aqui utilizado, o termo "terpeno-sintase" refere-se a qualquer enzima que modifica enzimaticamente o IPP, o DMAPP ou um pirofosfato de poliprenilo, de modo a 6 ΕΡ 1 919 514/ΡΤ produzir um composto terpenóide. 0 termo "terpeno-sintase" inclui as enzimas que catalisam a conversão de um difosfato de prenilo num isoprenóide. 0 termo "pirofosfato" é aqui utilizado como sinónimo de "difosfato". Assim, por exemplo, os termos "difosfato de prenilo" e "pirofosfato de prenilo" são permutáveis; os termos "pirofosfato de isopentenilo" e "difosfato de isopentenilo" são permutáveis; os termos "difosfato de farnesilo" e "pirofosfato de farnesilo" são permutáveis; etc. 0 termo "via do mevalonato" ou "via do MEV" é aqui utilizado para designar a via biossintética que converte a acetil-CoA em IPP. A via do mevalonato compreende enzimas que catalisam as seguintes etapas: (a) condensação de duas moléculas de acetil-CoA em acetoacetil-CoA; (b) condensação de acetoacetil-CoA com acetil-CoA para formar HMG-CoA; (c) conversão de HMG-CoA em mevalonato; (d) fosforilação de mevalonato em mevalonato-5-fosfato; (e) conversão de mevalonato-5-fosfato em mevalonato-5-pirofosfato; e (f) conversão de mevalonato-5-pirofosfato em pirofosfato de isopentenilo. A via do mevalonato está ilustrada esquematicamente na Figura 14. A "metade superior" da via do mevalonato refere-se às enzimas responsáveis pela conversão da acetil-CoA em mevalonato através de um intermediário da via do MEV. 0 termo "via da l-desoxi-D-xilulose-5-difosfato" ou "via da DXP" é aqui utilizado para designar a via que converte o gliceraldeido-3-f osf ato e o piruvato em IPP e em DMAPP através de um intermediário da via da DXP, em que a via da DXP compreende as enzimas que catalisam as reacções representadas esquematicamente na Figura 15.
Tal como aqui utilizado, o termo "preniltransferase" é usado como sinónimo dos termos "difosfato de isoprenilo-sintase" e "poliprenilo-sintase" (por exemplo, "GPP-sintase", "FPP-sintase", "OPP-sintase", etc.) para designar uma enzima que catalisa a condensação consecutiva 1' — 4 de difosfato de isopentenilo com substratos iniciadores alílicos, resultando na formação de difosfatos de prenilo com diferentes comprimentos de cadeia. 7 ΕΡ 1 919 514/ΡΤ
Os termos "polinucleótido" e "ácido nucleico", aqui utilizados como sinónimos, referem-se a uma forma polimérica de nucleótidos de qualquer comprimento, sejam eles ribonucleótidos ou desoxinucleótidos. Assim, este termo inclui, embora não esteja limitado a estes exemplos, ADN ou ARN de cadeia simples, dupla ou múltipla, ADN qenómico, ADNc, hibridos de ADN-ARN ou um polímero compreendendo bases púricas ou pirimidínicas, ou outras bases nucleotídicas naturais, química ou bioquimicamente modificadas, não naturais ou derivatizadas.
Os termos "péptido", "polipéptido" e "proteína" são aqui utilizados como sinónimos e referem-se a uma forma polimérica de aminoácidos de qualquer comprimento, que pode incluir aminoácidos codificados e não codificados, aminoácidos química ou bioquimicamente modificados ou derivatizados e polipéptidos que possuem esqueletos peptídicos modificados. 0 termo "ocorrência natural", tal como aqui utilizado aplicado a um ácido nucleico, uma célula ou um organismo, refere-se a um ácido nucleico, célula ou organismo que é encontrado na natureza. Por exemplo, uma sequência polipeptídica ou polinucleotídica que está presente num organismo (incluindo os vírus), que pode ser isolada a partir de uma fonte existente na natureza e que não foi intencionalmente modificada por um ser humano no laboratório tem uma ocorrência natural.
Tal como aqui utilizado, o termo "isolado" pretende descrever um polinucleótido, um polipéptido ou uma célula que está num ambiente diferente daquele em que o polinucleótido, o polipéptido ou a célula existe naturalmente. Uma célula hospedeira geneticamente modificada isolada poderá estar presente numa população mista de células hospedeiras geneticamente modificadas.
Tal como aqui utilizado, o termo "ácido nucleico exógeno" refere-se a um ácido nucleico que não é normal ou naturalmente encontrado em e/ou produzido por uma dada bactéria, organismo ou célula na natureza. Tal como aqui utilizado, o termo "ácido nucleico endógeno" refere-se a um ácido nucleico que é normalmente encontrado em e/ou produzido 8 ΕΡ 1 919 514/PT por uma dada bactéria, organismo ou célula na natureza. Um "ácido nucleico endógeno" é também designado por "ácido nucleico nativo" ou um ácido nucleico que é "nativo" de uma dada bactéria, organismo ou célula. Por exemplo, os ácidos nucleicos que codificam a HMGS, a mevalonato-cinase e a fosfomevalonato-cinase representam ácidos nucleicos exógenos de E. coli. Estes ácidos nucleicos da via do mevalonato podem ser clonados a partir de Sacchromyces cerevisiae. Em S. cerevisiae, as sequências génicas que codificam HMGS, MK e PMK no cromossoma seriam ácidos nucleicos "endógenos". 0 termo "ácido nucleico heterólogo", como aqui utilizado, refere-se a um ácido nucleico em que pelo menos uma das seguintes condições é verdadeira: (a) o ácido nucleico é estranho a ("exógeno") (isto é, não é encontrado naturalmente em) um dado microrganismo hospedeiro ou célula hospedeira; (b) o ácido nucleico compreende uma sequência nucleotidica que é encontrada naturalmente em (por exemplo, é "endógena de") um dado microrganismo hospedeiro ou célula hospedeira (por exemplo, o ácido nucleico compreende uma sequência nucleotidica que é endógena do microrganismo hospedeiro ou da célula hospedeira), mas que é produzida numa quantidade não natural (por exemplo, maior que a esperada ou maior que a encontrada naturalmente) na célula, ou difere em termos de sequência da sequência nucleotidica endógena, de modo que a mesma proteína codificada (possuindo a mesma, ou substancialmente a mesma, sequência de aminoácidos), que é encontrada endogenamente, é produzida numa quantidade não natural (por exemplo, maior que a esperada ou maior que a encontrada naturalmente) na célula; (c) o ácido nucleico compreende duas ou mais sequências ou segmentos nucleotídicos que não são encontrados na mesma relação na natureza, por exemplo, o ácido nucleico é recombinante. "Recombinante", tal como o termo é aqui utilizado, significa que um ácido nucleico particular (ADN ou ARN) é o produto de várias combinações de passos de clonagem, restrição e/ou ligação, resultando numa construção que possui uma sequência estrutural codificante ou não codificante diferente dos ácidos nucleicos endógenos encontrados em sistemas naturais. Geralmente, as sequências de ADN que codificam a sequência estrutural codificante podem ser 9 ΕΡ 1 919 514/ΡΤ reunidas a partir de fragmentos de ADNc e de elementos de ligação oligonucleotidicos curtos, ou a partir de uma série de oligonucleótidos sintéticos, para fornecer um ácido nucleico sintético que pode ser expresso a partir de uma unidade transcricional recombinante contida numa célula ou num sistema de transcrição e de tradução desprovido de células. Estas sequências podem ser disponibilizadas sob a forma de uma grelha de leitura aberta não interrompida por sequências não traduzidas internas, ou intrões, que estão habitualmente presentes nos genes eucarióticos. Também é possivel utilizar ADN genómico compreendendo as sequências relevantes para a formação de um gene ou unidade transcricional recombinante. Poderão estar presentes sequências de ADN não traduzidas na posição 5' ou 3' da grelha de leitura aberta, em que estas sequências não interferem com a manipulação nem a expressão das regiões codificantes e poderão mesmo actuar de forma a modular a produção de um produto desejado por vários mecanismos (ver "sequências reguladoras de ADN", abaixo).
Assim, por exemplo, o termo polinucleótido ou ácido nucleico "recombinante" refere-se a uma entidade que não tem uma ocorrência natural, por exemplo, é preparada pela combinação artificial de dois segmentos de sequência, que de outro modo estão separados, através de intervenção humana. Esta combinação artificial é frequentemente obtida quer por meio de sintese quimica quer pela manipulação artificial de segmentos isolados de ácidos nucleicos, por exemplo, através de técnicas de engenharia genética. Tal é geralmente efectuado para substituir um determinado codão por um codão redundante que codifica o mesmo aminoácido ou um aminoácido conservativo, normalmente introduzindo ou removendo em simultâneo um local de reconhecimento da sequência. Em alternativa, o procedimento é realizado para reunir segmentos de ácidos nucleicos que possuem funções desejadas, de modo a produzir uma combinação de funções desejada. Esta combinação artificial é muitas vezes obtida quer por meio de sintese quimica quer pela manipulação artificial de segmentos isolados de ácidos nucleicos, por exemplo, através de técnicas de engenharia genética. 10 ΕΡ 1 919 514/ΡΤ
Por "construção" pretende designar-se um ácido nucleico recombinante, geralmente ADN recombinante, que foi produzido com o objectivo de expressar uma(s) sequência(s) nucleotidica(s) especifica(s) ou que se destina a ser utilizado na construção de outras sequências nucleotidicas recombinantes.
Tal como aqui utilizados, os termos "operão" e "unidade de transcrição simples" são usados como sinónimos para designar duas ou mais regiões codificantes contíguas (sequências nucleotidicas que codificam um produto génico, tal como um ARN ou uma proteina) que são reguladas de forma coordenada por um ou mais elementos de controlo (por exemplo, um promotor). Tal como aqui utilizado, o termo "produto génico" refere-se a um ARN codificado por ADN (ou vice-versa) ou uma proteina que é codificada por um ARN ou ADN, em que um gene compreenderá normalmente uma ou mais sequências nucleotidicas que codificam uma proteina e poderá também incluir intrões e outras sequências nucleotidicas não codificantes.
Os termos "sequências reguladoras de ADN", "elementos de controlo" e "elementos reguladores", aqui utilizados como sinónimos, referem-se a sequências de controlo transcricional e traducional, tais como promotores, amplificadores, sinais de poliadenilação, sequências de terminação, sinais de degradação de proteínas e elementos similares, que permitem e/ou regulam a expressão de uma sequência codificante e/ou a produção de um polipéptido codificado numa célula hospedeira. O termo "transformação" é aqui utilizado como sinónimo de "modificação genética" e refere-se a uma alteração genética permanente ou temporária induzida numa célula após a introdução de um ácido nucleico novo (isto é, ADN exógeno à célula). A alteração genética ("modificação") pode ser obtida quer por incorporação do novo ADN no genoma da célula hospedeira quer por manutenção temporária ou estável do novo ADN como um elemento epissómico. Quando a célula é uma célula eucariótica, uma alteração genética permanente é geralmente obtida por introdução do ADN no genoma da célula. Nas células procarióticas, as alterações permanentes podem ser introduzidas no cromossoma ou via elementos 11 ΕΡ 1 919 514/ΡΤ extracromossómicos como plasmídeos e vectores de expressão, que poderão conter uma ou mais marcas de selecção para ajudar à sua manutenção na célula hospedeira recombinante. Os métodos adequados de modificação genética incluem a infecção virai, a transfecção, a conjugação, a fusão de protoplastos, a electroporação, a tecnologia de bombardeamento de partículas, a precipitação com fosfato de cálcio, a microinjecção directa e métodos idênticos. A escolha do método está geralmente dependente do tipo de célula que está a ser transformada e das circunstâncias em que a transformação está a ter lugar (isto é, in vitro, ex vivo ou in vivo). Uma discussão geral destes métodos pode ser encontrada em Ausubel et al., Short Protocols in Molecular Biology, 3rd ed., Wiley & Sons, 1995. "Ligado de forma funcional" refere-se a uma justaposição em que os componentes assim descritos se encontram numa relação que lhe permite actuarem da maneira pretendida. Por exemplo, um promotor está ligado de forma funcional a uma sequência codificante se o promotor influenciar a sua transcrição ou expressão. Tal como aqui utilizados, os termos "promotor heterólogo" e "regiões de controlo heterólogas" referem-se a promotores e outras regiões de controlo que não estão normalmente associados a um ácido nucleico particular na natureza. Por exemplo, uma "região de controlo transcricional heteróloga de uma região codificante" é uma região de controlo transcricional que não está normalmente associada à região codificante na natureza.
Uma "célula hospedeira", tal como o termo é aqui utilizado, designa uma célula eucariótica, uma célula procariótica ou uma célula de um organismo multicelular (por exemplo, uma linha celular) crescida como uma entidade unicelular, in vivo ou in vitro, em que as células eucarióticas ou procarióticas podem ser, ou foram, utilizadas como receptores de um ácido nucleico (por exemplo, um vector de expressão compreendendo uma sequência nucleotídica que codifica um ou mais produtos génicos de vias biossintéticas, tais como produtos génicos da via do mevalonato) e incluem a descendência da célula original que foi geneticamente modificada pelo ácido nucleico. Entende-se que a descendência de uma única célula poderá não ser necessária e totalmente 12
ΕΡ 1 919 514/PT idêntica em termos de morfologia ou de ADN genómico ou ADNc total ao progenitor original devido a mutação natural, acidental ou deliberada. Uma "célula hospedeira recombinante" (também designada por uma "célula hospedeira geneticamente modificada") é uma célula hospedeira na qual foi introduzido um ácido nucleico heterólogo, por exemplo, um vector de expressão. Por exemplo, uma célula hospedeira procariótica do invento é uma célula hospedeira procariótica geneticamente modificada (por exemplo, uma bactéria) em virtude da introdução, numa célula hospedeira procariótica adequada, de um ácido nucleico heterólogo, por exemplo, um ácido nucleico exógeno que é estranho à (não é normalmente encontrado na natureza na) célula hospedeira procariótica, ou um ácido nucleico recombinante que não é encontrado normalmente na célula hospedeira procariótica; e uma célula hospedeira eucariótica do invento é uma célula hospedeira eucariótica geneticamente modificada em virtude da introdução, numa célula hospedeira eucariótica adequada, de um ácido nucleico heterólogo, por exemplo, um ácido nucleico exógeno que é estranho à célula hospedeira eucariótica, ou um ácido nucleico recombinante que não é encontrado normalmente na célula hospedeira eucariótica.
Um ácido nucleico é "hibridizável" com outro ácido nucleico, como seja um ADNc, um ADN genómico ou um ARN, quando uma forma de cadeia simples do ácido nucleico pode hibridar com o outro ácido nucleico nas condições apropriadas de temperatura e de força iónica da solução. As condições de hibridação e de lavagem são bem conhecidas e estão exemplificadas em Sambrook, J., Fritsch, E. F. & Maniatis, T. Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor (1989), particularmente no Capitulo 11 e na Tabela 11.1; e Sambrook, J. & Russell, W., Molecular Cloning: A Laboratory Manual, Third Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor (2001). As condições de temperatura e de força iónica determinam a "estringência" da hibridação. As condições de estringência podem ser ajustadas para pesquisar fragmentos moderadamente similares, por exemplo, sequências homólogas de organismos fracamente aparentados, até fragmentos extremamente similares, tais como genes que duplicam enzimas funcionais de organismos fortemente 13 ΕΡ 1 919 514/ΡΤ aparentados. As condições de hibridação e as lavagens pós-hibridação são úteis para determinar as condições de estringência desejadas da hibridação. Um conjunto de lavagens pós-hibridação ilustrativas consiste numa série de lavagens que começam com SSC 6x (em que SSC é NaCl 0,15 M e tampão citrato 15 mM), SDS a 0,5% à temperatura ambiente durante 15 minutes, depois são repetidas com SSC 2x, SDS a 0,5% a 45°C durante 30 minutos e, em seguida, são repetidas duas vezes com SSC 0,2x; SDS a 0,5% a 50°C durante 30 minutos. Outras condições estringentes são obtidas mediante a utilização de temperaturas mais elevadas, em que as lavagens são idênticas às descritas acima, com excepção da temperatura das duas lavagens finais de 30 minutos em SSC 0,2x; SDS a 0,5%, que é aumentada para 60°C. Outro conjunto de condições extremamente estringentes utiliza duas lavagens finais em SSC 0,lx; SDS a 0,1% a 65°C. Outro exemplo de condições estringentes de hibridação é a hibridação a 50 °C ou temperatura superior e SSC 0,lx (cloreto de sódio 15 mM/citrato de sódio 1,5 mM) . Outro exemplo de condições estringentes de hibridação é a incubação durante a noite a 42°C numa solução de formamida a 50%, SSC 5x (NaCl 150 mM, citrato trissódico 15 mM), fosfato de sódio 50 mM (pH 7,6), solução de Denhardt 5x, sulfato de dextrano a 10% e 20 yg/ml de ADN de esperma de salmão cisalhado e desnaturado, seguida de lavagem dos filtros em SSC 0,lx a cerca de 65°C. As condições de hibridação e as condições de lavagem pós-hibridação estringentes são condições de hibridação e condições de lavagem pós-hibridação que são pelo menos tão estringentes como as condições representativas indicadas acima. A hibridação requer que os dois ácidos nucleicos contenham sequências complementares, embora dependendo da estringência da hibridação sejam possíveis correspondências incorrectas entre as bases. A estringência apropriada para hibridar os ácidos nucleicos depende do comprimento dos ácidos nucleicos e do grau de complementação, variáveis bem conhecidas na técnica. Quanto maior o grau de similaridade ou de homologia entre duas sequências nucleotídicas, maior o valor da temperatura de fusão (Tf) para os híbridos de ácidos nucleicos que possuem essas sequências. A estabilidade relativa (correspondente a uma Tf mais elevada) das hibridações de ácidos nucleicos diminui na seguinte ordem: 14
ΕΡ 1 919 514/PT ARN:ARN, ADN:ARN, ADN:ADN. No caso de híbridos com mais de 100 nucleótidos de comprimento, foram derivadas equações para calcular Tf (ver Sambrook et al., acima, 9.50-9.51). No caso de hibridações com ácidos nucleicos mais curtos, isto é, oligonucleótidos, a posição das correspondências incorrectas torna-se mais importante e o comprimento do oligonucleótido determina a sua especificidade (ver Sambrook et al., acima, 11.7-11.8). Tipicamente, o comprimento para um ácido nucleico hibridizável é de pelo menos cerca de 10 nucleótidos. Os comprimentos mínimos ilustrativos para um ácido nucleico hibridizável são: pelo menos cerca de 15 nucleótidos, pelo menos cerca de 20 nucleótidos e pelo menos cerca de 30 nucleótidos. Além disso, um perito reconhecerá que a temperatura e a concentração de sal da solução de lavagem poderão ser ajustadas consoante necessário de acordo com factores como o comprimento da sonda. 0 termo "substituição conservativa de aminoácidos" refere-se à permutabilidade nas proteínas de resíduos de aminoácidos que possuem cadeias laterais similares. Por exemplo, um grupo de aminoácidos com cadeias laterais alifáticas consiste em glicina, alanina, valina, leucina e isoleucina; um grupo de aminoácidos com cadeias laterais hidroxi-alifáticas consiste em serina e treonina; um grupo de aminoácidos com cadeias laterais contendo amida consiste em asparagina e glutamina; um grupo de aminoácidos com cadeias laterais aromáticas consiste em fenilalanina, tirosina e triptofano; um grupo de aminoácidos com cadeias laterais básicas consiste em lisina, arginina e histidina; e um grupo de aminoácidos com cadeias laterais contendo enxofre consiste em cisterna e metionina. Os grupos exemplificativos de substituições conservativas de aminoácidos são: valina-leucina-isoleucina, fenilalanina-tirosina, lisina-arginina, alanina-valina e asparagina-glutamina.
Os "ácidos nucleicos sintéticos" podem ser reunidos a partir de blocos de construção oligonucleotídicos que são sintetizados quimicamente utilizando procedimentos conhecidos pelos peritos. Estes blocos de construção são ligados e hibridados para formar segmentos do gene, que são depois reunidos enzimaticamente para construir o gene completo. O termo "quimicamente sintetizada", em relação a uma sequência 15 ΕΡ 1 919 514/ΡΤ
de ADN, significa que os seus nucleótidos constituintes foram reunidos in vitro. A sintese química manual do ADN pode ser obtida utilizando procedimentos bem estabelecidos, e a síntese química automatizada pode ser efectuada utilizando um de vários equipamentos disponíveis comercialmente. A sequência nucleotídica dos ácidos nucleicos pode ser modificada no sentido de uma expressão óptima, com base numa optimização da sequência nucleotídica para reflectir a preferência de codões da célula hospedeira. Um perito apreciará a probabilidade de uma expressão bem-sucedida se a utilização de codões for influenciada no sentido dos codões favorecidos pelo hospedeiro. A determinação dos codões preferidos pode basear-se numa pesquisa de genes derivados da célula hospedeira para os quais estão disponíveis informações sobre a respectiva sequência.
Um polinucleótido ou polipéptido possui uma certa percentagem de "identidade de sequência" com outro polinucleótido ou polipéptido, o que significa que, quando estão alinhados, essa percentagem de bases ou de aminoácidos é a mesma, e estes encontram-se na mesma posição relativa, ao comparar as duas sequências. A similaridade de sequência pode ser determinada de várias maneiras diferentes. Para determinar a identidade de sequência, as sequências podem ser alinhadas utilizando os métodos e programas computacionais, incluindo o BLAST, disponíveis através da internet em ncbi.nlm.nih.gov/BLAST. Ver, por exemplo, Altschul et al. (1990), J. Mol. Biol. 215:403-10. Outro algoritmo de alinhamento é o FASTA, disponível no pacote do Grupo de Genética Computacional (GCG de "Genetics Computing Group") de Madison, Wisconsin, EUA, uma filial totalmente detida de
Oxford Molecular Group, Inc. Outras técnicas para o alinhamento estão descritas em Methods in Enzymology, vol. 266: Computer Methods for Macromolecular Sequence Analysis (1996), ed. Doolittle, Academic Press, Inc., uma divisão de Harcourt Brace & Co., San Diego, Califórnia, EUA. Os programas de alinhamento que permitem lacunas na sequência são de particular interesse. 0 algoritmo de Smith-Waterman é um tipo de algoritmo que permite lacunas nos alinhamentos de sequências. Ver Meth. Mol. Biol. 70: 173-187 (1997).
Adicionalmente, o programa GAP que utiliza o método de 16 ΕΡ 1 919 514/ΡΤ alinhamento de Needleman e Wunsch pode ser utilizado para alinhar as sequências. Ver J. Mol. Biol. 48: 443-453 (1970).
Antes de descrever adicionalmente o presente invento, deve entender-se que este invento não está limitado a concretizações particulares descritas, e como tal pode naturalmente variar. Deve também entender-se que a terminologia aqui utilizada tem o objectivo apenas de descrever concretizações particulares e não se destina a ser limitante, uma vez que o âmbito do presente invento será limitado somente pelas reivindicações anexas.
Quando é fornecido um intervalo de valores, entende-se que cada valor intermediário, ao décimo da unidade do limite inferior excepto se o contexto ditar claramente o contrário, entre o limite superior e inferior desse intervalo e qualquer outro valor estabelecido ou intermediário nesse intervalo estabelecido, está englobado no invento. Os limites superior e inferior destes intervalos mais pequenos poderão ser incluídos, de modo independente, nos intervalos mais pequenos e também estão englobados no invento, sujeitos a qualquer limite especificamente excluído no intervalo estabelecido. Quando o intervalo estabelecido inclui um ou ambos os limites, os intervalos que excluem um ou ambos aqueles limites incluídos também estão incluídos no invento.
Excepto definição em contrário, todos os termos técnicos e científicos aqui utilizados têm o significado normalmente atribuído por um perito na técnica a que este invento pertence. Embora quaisquer métodos e materiais similares ou equivalentes aqueles aqui descritos também possam ser utilizados na prática ou teste do presente invento, os métodos e materiais preferidos são agora descritos. Todas as publicações aqui mencionadas referem e descrevem os métodos e/ou os materiais em relação aos quais as publicações são citadas. É necessário salientar que, tal como utilizadas aqui e nas reivindicações anexas, as formas singulares "um", "uma", "e", "o" e "a" incluem referências no plural excepto se o contexto ditar claramente o contrário. Assim, por exemplo, a referência a "uma enzima de modificação de isoprenóides" 17 ΕΡ 1 919 514/ΡΤ inclui uma pluralidade destas enzimas e a referência à "redutase do citocromo P450" inclui a referência a uma ou mais redutases do citocromo P450 e seus equivalentes conhecidos pelos peritos na técnica, etc. Salienta-se adicionalmente que as reivindicações poderão ser redigidas para excluir qualquer elemento opcional. Como tal, esta afirmação destina-se a servir de base antecedente para o uso de tal terminologia exclusiva como "unicamente", "apenas" e termos similares, em conexão com a citação dos elementos das reivindicações, ou o uso de uma limitação "negativa".
As publicações aqui discutidas são fornecidas unicamente pela sua divulgação antes da data de apresentação do presente pedido. Nada aqui deve ser interpretado como uma admissão de que o presente invento não tem o direito de anteceder tal publicação em virtude de invento prévio. Adicionalmente, as datas de publicação fornecidas poderão ser diferentes das datas de publicação efectivas, que poderão ter de ser confirmadas de modo independente.
DESCRIÇÃO DETALHADA DO INVENTO 0 presente invento proporciona ácidos nucleicos isolados compreendendo sequências nucleotidicas que codificam enzimas de modificação de isoprenóides, assim como vectores recombinantes compreendendo os ácidos nucleicos. 0 presente invento disponibiliza adicionalmente células hospedeiras geneticamente modificadas compreendendo um ácido nucleico ou um vector recombinante do invento. 0 presente invento fornece ainda uma planta transgénica compreendendo um ácido nucleico do invento. 0 presente invento disponibiliza adicionalmente métodos de produção de um composto isoprenóide, em que o método geralmente envolve a cultura de uma célula hospedeira geneticamente modificada do invento, em condições que permitem a síntese de uma enzima de modificação de compostos isoprenóides codificada por um ácido nucleico do invento
ÁCIDOS NUCLEICOS, VECTORES E CÉLULAS HOSPEDEIRAS 0 presente invento disponibiliza um ácido nucleico isolado compreendendo uma sequência nucleotídica que codifica uma enzima que modifica um composto isoprenóide, em que uma 18 ΕΡ 1 919 514/PT enzima que modifica um composto isoprenóide é aqui desiqnada por "uma enzima de modificação de isoprenóides". Um ácido nucleico do invento compreendendo uma sequência nucleotidica que codifica uma enzima de modificação de isoprenóides é designado por "um ácido nucleico de uma enzima de modificação de isoprenóides". Em concretizações particulares, um ácido nucleico isolado de uma enzima de modificação de isoprenóides do invento compreende uma sequência nucleotidica que codifica uma monooxigenase do citocromo P450. Em concretizações particulares, um ácido nucleico isolado de uma enzima de modificação de isoprenóides do invento compreende uma sequência nucleotidica que codifica uma isoprenóide-oxidase. Em algumas concretizações, um ácido nucleico isolado de uma enzima de modificação de isoprenóides do invento compreende uma sequência nucleotidica que codifica uma terpeno-hidroxilase. Em algumas concretizações, um ácido nucleico isolado de uma enzima de modificação de isoprenóides do invento compreende uma sequência nucleotidica que codifica uma terpeno-oxidase. Em algumas concretizações, um ácido nucleico isolado de uma enzima de modificação de isoprenóides do invento compreende uma sequência nucleotidica que codifica uma sesquiterpeno-oxidase. Em algumas concretizações, um ácido nucleico isolado de uma enzima de modificação de isoprenóides do invento compreende uma sequência nucleotidica que codifica uma sesquiterpeno-hidroxilase. A NADPH-oxidorredutase do citocromo P450 (CPR, EC 1.6.2.4) é o parceiro redox de muitas monooxigenases de P450. 0 presente invento disponibiliza ainda um ácido nucleico isolado compreendendo uma sequência nucleotidica que codifica uma redutase do citocromo P450 (CPR). Um ácido nucleico do invento compreendendo uma sequência nucleotidica que codifica uma CPR é designado por "um ácido nucleico de CPR". Uma CPR codificada por um ácido nucleico de CPR do invento transfere electrões do NADPH para o citocromo P450. Em geral, uma CPR codificada por um ácido nucleico de CPR do invento transfere electrões do NADPH para uma enzima de modificação de isoprenóides, por exemplo, uma sesquiterpeno-oxidase, codificada por um ácido nucleico que codifica uma enzima de modificação de isoprenóides do invento. 19
ΕΡ 1 919 514/PT Ácidos nucleicos que codificam enzimas de modificação de isoprenóides
Em algumas concretizações, um ácido nucleico isolado do invento compreende uma sequência nucleotidica que codifica um polipéptido que apresenta uma actividade de isoprenóide-hidroxilase e/ou isoprenóide-oxidase. Em algumas concretizações, um ácido nucleico isolado do invento compreende uma sequência nucleotidica que codifica uma monooxigenase do citocromo P450. Em algumas concretizações, um ácido nucleico isolado do invento compreende uma sequência nucleotidica que codifica uma isoprenóide-hidroxilase. Em algumas concretizações, um ácido nucleico isolado do invento compreende uma sequência nucleotidica que codifica uma isoprenóide-oxidase. Em algumas concretizações, um ácido nucleico isolado do invento compreende uma sequência nucleotidica que codifica um polipéptido que efectua reacções de hidroxilação e de oxidação sucessivas, por exemplo, o polipéptido hidroxila um composto terpénico para gerar um álcool terpénico, oxida o álcool terpénico para gerar um aldeído terpénico e oxida o aldeído terpénico para gerar um ácido carboxílico terpénico. Em algumas concretizações, um ácido nucleico isolado do invento compreende uma sequência nucleotidica que codifica um polipéptido que catalisa a hidroxilação e/ou a oxidação de um grupo isopropenilo de um terpeno, por exemplo, catalisa a hidroxilação de um grupo isopropenilo de um monoterpeno, um diterpeno, um triterpeno, um sesquiterpeno ou um politerpeno. Em algumas concretizações, um ácido nucleico isolado do invento compreende uma sequência nucleotidica que codifica uma monoterpeno-oxidase. Em algumas concretizações, um ácido nucleico isolado do invento compreende uma sequência nucleotidica que codifica uma monoterpeno-hidroxilase. Em algumas concretizações, um ácido nucleico isolado do invento compreende uma sequência nucleotidica que codifica uma politerpeno-hidroxilase. Em algumas concretizações, um ácido nucleico isolado do invento compreende uma sequência nucleotidica que codifica uma politerpeno-oxidase. Em algumas concretizações, um ácido nucleico isolado do invento compreende uma sequência nucleotidica que codifica uma diterpeno-hidroxilase. Em algumas concretizações, um ácido nucleico isolado do invento compreende uma sequência 20 ΕΡ 1 919 514/ΡΤ nucleotídica que codifica uma diterpeno-oxidase. Em algumas concretizações, um ácido nucleico isolado do invento compreende uma sequência nucleotídica que codifica uma triterpeno-hidroxilase. Em algumas concretizações, um ácido nucleico isolado do invento compreende uma sequência nucleotídica que codifica uma triterpeno-oxidase. Em algumas concretizações, um ácido nucleico isolado do invento compreende uma sequência nucleotídica que codifica uma sesquiterpeno-hidroxilase. Em algumas concretizações, um ácido nucleico isolado do invento compreende uma sequência nucleotídica que codifica uma sesquiterpeno-oxidase. Em algumas concretizações, um ácido nucleico isolado do invento compreende uma sequência nucleotídica que codifica uma sesquiterpeno-C12-hidroxilase. Em algumas concretizações, um ácido nucleico isolado do invento compreende uma sequência nucleotídica que codifica um polipéptido que efectua a oxidação em C12 de um sesquiterpeno. Em algumas concretizações, um ácido nucleico isolado do invento compreende uma sequência nucleotídica que codifica uma amorfadieno-12-oxidase. 0 produto de acção da reacção de uma terpeno-ciclase (também designada por "terpeno-sintase") é o chamado "esqueleto terpénico". Em algumas concretizações, um ácido nucleico isolado do invento compreende uma sequência nucleotídica que codifica uma enzima de modificação de isoprenóides que catalisa a hidroxilação e/ou a oxidação de um esqueleto terpénico ou de um seu produto a jusante. Em geral, um substrato de uma enzima de modificação de isoprenóides, codificada por um ácido nucleico do invento, compreende um esqueleto terpénico ou um esqueleto terpénico modificado. Em muitas concretizações, um substrato de uma enzima de modificação de isoprenóides, codificada por um ácido nucleico do invento, compreende um grupo isopropenilo.
Os substratos monoterpénicos de uma enzima de modificação de isoprenóides, codificada por um ácido nucleico do invento, incluem, embora não estejam limitados a estes, qualquer substrato monoterpénico que produz um produto de oxidação que é um composto monoterpénico ou é um intermediário numa via biossintética que origina um composto monoterpénico. Os substratos monoterpénicos exemplificativos 21 ΕΡ 1 919 514/ΡΤ incluem, embora não estejam limitados a estes, os substratos monoterpénicos que estão abrangidos por qualquer uma das seguintes famílias: monoterpenos acíclicos, dimetiloctanos, mentanos, monoterpenóides irregulares, cineóis, canfanos, isocanfanos, monoterpenos monocíclicos, pinanos, fenchanos, tujanos, caranos, iononas, iridanos e canabanóides. Os substratos, intermediários e produtos monoterpénicos exemplificativos incluem, embora não estejam limitados a estes, limoneno, citranelol, geraniol, mentol, álcool perílico, linalol e tujona.
Os substratos diterpénicos de uma enzima de modificação de isoprenóides, codificada por um ácido nucleico do invento, incluem, embora não estejam limitados a estes, qualquer substrato diterpénico que produz um produto de oxidação que é um composto diterpénico ou é um intermediário numa via biossintética que origina um composto diterpénico. Os substratos diterpénicos exemplificativos incluem, embora não estejam limitados a estes, os substratos diterpénicos que estão abrangidos por qualquer uma das seguintes famílias: diterpenóides acíclicos, diterpenóides bicíclicos, diterpenóides monocíclicos, labdanos, clerodanos, taxanos, diterpenóides tricíclicos, diterpenóides tetracíclicos, caurenos, beierenos, atiserenos, afidicolinas, graianotoxinas, giberelinas, diterpenos macrocíclicos e elizabetatrianos. Os substratos, intermediários e produtos diterpénicos exemplificativos incluem, embora não estejam limitados a estes, casbeno, eleuterobina, paclitaxel, prostratina e pseudopterosina.
Os substratos triterpénicos de uma enzima de modificação de isoprenóides, codificada por um ácido nucleico do invento, incluem, embora não estejam limitados a estes, qualquer substrato triterpénico que produz um produto de oxidação que é um composto triterpénico ou é um intermediário numa via biossintética que origina um composto triterpénico. Os substratos, intermediários e produtos triterpénicos exemplificativos incluem, embora não estejam limitados a estes, arbruside E, bruceantina, testosterona, progesterona, cortisona e digitoxina. 22 ΕΡ 1 919 514/ΡΤ
Os substratos sesquiterpénicos de uma enzima de modificação de isoprenóides, codificada por um ácido nucleico do invento, incluem, embora não estejam limitados a estes, qualquer substrato sesquiterpénico que produz um produto de oxidação que é um composto sesquiterpénico ou é um intermediário numa via biossintética que origina um composto sesquiterpénico. Os substratos sesquiterpénicos exemplificativos incluem, embora não estejam limitados a estes, os substratos sesquiterpénicos que estão abrangidos por qualquer uma das seguintes famílias: farnesanos, monociclofarnesanos, sesquiterpenos monocíclicos, sesquiterpenos bicíclicos, biciclofarnesanos, bisabolanos, santalanos, cupranos, herbertanos, gimnomitranos, tricotecanos, chamigranos, carotanos, acoranos, antisatinas, cadinanos, oplopananos, copaanos, picrotoxanos, himachalanos, longipinanos, longiciclanos, cariofilanos, modefanos, sifiperfolanos, humulanos, intergrifolianos, lippifolianos, protoilludanos, illudanos, hirsutanos, lactaranos, esterpuranos, fomanosanos, marasmanos, germacranos, elemanos, eudesmanos, bacanos, quilosifanos, guaianos, pseudoguaianos, sesquiterpenos tricíclicos, patchoulanos, trixanos, aromadendranos, gorgonanos, nardosinanos, brasilanos, pinguisanos, sesquipinanos, sesquicanfanos, tujopsanos, bicilcohumulanos, alliacanos, esterpuranos, lactaranos, africanos, integrifolianos, protoilludanos, aristolanos e neolemnanos. Os substratos sesquiterpénicos exemplificativos incluem, embora não estejam limitados a estes, amorfadieno, aloisolongifoleno, (-)-a-trans-bergamoteno, (-)-β-elemeno, (+)-germacreno A, germacreno B, (+)-γ-gurjuneno, (+)-ledeno, neointermedeol, (+)-β-selineno e (+)-valenceno. A possibilidade de um ácido nucleico do invento codificar uma terpeno-oxidase, ou uma terpeno-hidroxilase, pode ser prontamente determinada recorrendo a ensaios padrão para estas actividades enzimáticas, utilizando o substrato apropriado. Os produtos da modificação enzimática são geralmente analisados por cromatografia gasosa-espectrometria de massa. A possibilidade de um ácido nucleico do invento codificar uma sesquiterpeno-oxidase, ou uma sesquiterpeno-hidroxilase, pode ser prontamente determinada utilizando ensaios padrão para estas actividades enzimáticas. Ver, por exemplo, a Publicação de Patente U.S. n.° 20050019882. 23 ΕΡ 1 919 514/ΡΤ
Em algumas concretizações, um ácido nucleico do invento compreende a sequência nucleotidica representada na Figura 1 e apresentada na SEQ ID N0:1. Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotidica que possui uma identidade de sequência nucleotidica de pelo menos cerca de 45%, pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 57%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 98% ou pelo menos cerca de 99% com a sequência nucleotidica apresentada na SEQ ID NO:1. Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotidica que possui uma, duas, três, quatro, cinco, seis, sete, oito, nove, dez, entre cerca de 10 e cerca de 15, entre cerca de 15 e cerca de 20, entre cerca de 20 e cerca de 25, ou entre cerca de 25 e cerca de 50 substituições nucleotidicas em comparação com a sequência nucleotidica apresentada na SEQ ID NO:l.
Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotidica que possui uma identidade de sequência nucleotidica de pelo menos cerca de 45%, pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 57%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 98% ou pelo menos cerca de 99% com a sequência nucleotidica apresentada na SEQ ID NO:l, em que o ácido nucleico codifica um polipéptido que apresenta uma actividade de terpeno-hidroxilase e/ou terpeno-oxidase (por exemplo, uma actividade de sesquiterpeno-oxidase, uma actividade de sesquiterpeno-hidroxilase, etc.).
Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotidica que possui uma identidade de sequência nucleotidica de pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 57%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos 24 ΕΡ 1 919 514/PT cerca de 95%, pelo menos cerca de 98% ou pelo menos cerca de 99% com um trecho de pelo menos cerca de 500, pelo menos cerca de 600, pelo menos cerca de 700, pelo menos cerca de 800, pelo menos cerca de 900, pelo menos cerca de 1.000, pelo menos cerca de 1.100, pelo menos cerca de 1.200, pelo menos cerca de 1.300, pelo menos cerca de 1.400 ou pelo menos cerca de 1.450 nucleótidos contíguos da sequência nucleotídica apresentada na SEQ ID NO:l.
Em algumas concretizações, um ácido nucleico do invento compreende pelo menos cerca de 500, pelo menos cerca de 600, pelo menos cerca de 700, pelo menos cerca de 800, pelo menos cerca de 900, pelo menos cerca de 1.000, pelo menos cerca de 1.100, pelo menos cerca de 1.200, pelo menos cerca de 1.300, pelo menos cerca de 1.400 ou pelo menos cerca de 1.450 nucleótidos contíguos da sequência nucleotídica apresentada na SEQ ID NO:l. Em algumas concretizações, um ácido nucleico do invento compreende pelo menos cerca de 500, pelo menos cerca de 600, pelo menos cerca de 700, pelo menos cerca de 800, pelo menos cerca de 900, pelo menos cerca de 1.000, pelo menos cerca de 1.100, pelo menos cerca de 1.200, pelo menos cerca de 1.300, pelo menos cerca de 1.400 ou pelo menos cerca de 1.450 nucleótidos contíguos da sequência nucleotídica apresentada na SEQ ID NO:l e codifica um polipéptido que apresenta uma actividade de terpeno-hidroxilase e/ou terpeno-oxidase, por exemplo, uma actividade de sesquiterpeno-hidroxilase e/ou oxidase.
Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotídica que híbrida, em condições estringentes de hibridação, com um ácido nucleico compreendendo a sequência nucleotídica apresentada na SEQ ID NO:l, ou um seu complemento.
Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotídica que codifica um polipéptido compreendendo uma sequência de aminoácidos conforme representada na Figura 2 e apresentada na SEQ ID NO:2. Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotídica que codifica um polipéptido compreendendo uma sequência de aminoácidos que possui uma identidade de sequência de aminoácidos de pelo 25 ΕΡ 1 919 514/ΡΤ menos cerca de 45%, pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 98% ou pelo menos cerca de 99% com a sequência de aminoácidos apresentada na SEQ ID NO:2. Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotídica que codifica um polipéptido compreendendo uma sequência de aminoácidos que possui uma identidade de sequência de aminoácidos de pelo menos cerca de 45%, pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 98% ou pelo menos cerca de 99% com um trecho de pelo menos cerca de 50, pelo menos cerca de 75, pelo menos cerca de 100, pelo menos cerca de 150, pelo menos cerca de 200, pelo menos cerca de 250, pelo menos cerca de 300, pelo menos cerca de 350, pelo menos cerca de 400, pelo menos cerca de 450 ou pelo menos cerca de 490 aminoácidos contíguos da sequência de aminoácidos apresentada na SEQ ID NO:2. Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotídica que codifica um polipéptido compreendendo uma sequência de aminoácidos que possui uma, duas, três, quatro, cinco, seis, sete, oito, nove, dez, entre cerca de 10 e cerca de 15, entre cerca de 15 e cerca de 20 ou entre cerca de 20 e cerca de 25 substituições de aminoácidos conservativas em comparação com a sequência de aminoácidos apresentada na SEQ ID NO:2. Em algumas concretizações, o polipéptido codificado apresenta uma actividade de terpeno-hidroxilase e/ou terpeno-oxidase. Em algumas concretizações, o polipéptido codificado apresenta uma actividade de sesquiterpeno-oxidase. Em algumas concretizações, o polipéptido codificado catalisa a oxidação em C12 de um substrato sesquiterpénico. Em outras concretizações, o polipéptido codificado apresenta uma actividade de sesquiterpeno-hidroxilase.
Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotídica que codifica um polipéptido compreendendo pelo menos cerca de 50, pelo menos 26 ΕΡ 1 919 514/ΡΤ cerca de 75, pelo menos cerca de 100, pelo menos cerca de 150, pelo menos cerca de 200, pelo menos cerca de 250, pelo menos cerca de 300, pelo menos cerca de 350, pelo menos cerca de 400, pelo menos cerca de 450 ou pelo menos cerca de 490 aminoácidos contíguos de uma sequência de aminoácidos que possui uma identidade de sequência de aminoácidos de pelo menos cerca de 45%, pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 98%, pelo menos cerca de 99% ou de 100% com a sequência de aminoácidos apresentada na SEQ ID NO:2. Em algumas concretizações, o polipéptido codificado apresenta uma actividade de terpeno-hidroxilase e/ou terpeno-oxidase. Em algumas concretizações, o polipéptido codificado apresenta uma actividade de sesquiterpeno-oxidase. Em algumas concretizações, o polipéptido codificado catalisa a oxidação em C12 de um substrato sesquiterpénico. Em outras concretizações, o polipéptido codificado apresenta uma actividade de sesquiterpeno-hidroxilase.
Em algumas concretizações, um ácido nucleico do invento compreende a sequência nucleotídica representada na Figura 9 e apresentada na SEQ ID NO:5. Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotídica que possui uma identidade de sequência nucleotídica de pelo menos cerca de 45%, pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 57%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 98% ou pelo menos cerca de 99% com a sequência nucleotídica apresentada na SEQ ID NO:5. Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotídica que possui uma, duas, três, quatro, cinco, seis, sete, oito, nove, dez, entre cerca de 10 e cerca de 15, entre cerca de 15 e cerca de 20, entre cerca de 20 e cerca de 25, ou entre cerca de 25 e cerca de 50 substituições nucleotídicas em comparação com a sequência nucleotídica apresentada na SEQ ID NO:5. 27
ΕΡ 1 919 514/PT
Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotidica que possui uma identidade de sequência nucleotidica de pelo menos cerca de 45%, pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 57%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 98% ou pelo menos cerca de 99% com a sequência nucleotidica apresentada na SEQ ID NO:5, em que o ácido nucleico codifica um polipéptido que apresenta uma actividade de terpeno-hidroxilase e/ou terpeno-oxidase (por exemplo, uma actividade de sesquiterpeno-oxidase, uma actividade de sesquiterpeno-hidroxilase, etc.).
Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotidica que possui uma identidade de sequência nucleotidica de pelo menos cerca de 45%, pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 57%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 98% ou pelo menos cerca de 99% com um trecho de pelo menos cerca de 500, pelo menos cerca de 600, pelo menos cerca de 700, pelo menos cerca de 800, pelo menos cerca de 900, pelo menos cerca de 1.000, pelo menos cerca de 1.100, pelo menos cerca de 1.200, pelo menos cerca de 1.300, pelo menos cerca de 1.400 ou pelo menos cerca de 1.450 nucleótidos contíguos da sequência nucleotidica apresentada na SEQ ID NO: 5.
Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotidica que codifica um polipéptido compreendendo pelo menos cerca de 50, pelo menos cerca de 75, pelo menos cerca de 100, pelo menos cerca de 150, pelo menos cerca de 200, pelo menos cerca de 250, pelo menos cerca de 300, pelo menos cerca de 350, pelo menos cerca de 400, pelo menos cerca de 450 ou pelo menos cerca de 480 aminoácidos contíguos de uma sequência de aminoácidos que possui uma identidade de sequência de aminoácidos de pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, 28 ΕΡ 1 919 514/ΡΤ pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 98%, pelo menos cerca de 99% ou de 100% com a sequência de aminoácidos apresentada na SEQ ID NO: 6. Em muitas concretizações, o polipéptido codificado apresenta uma actividade de terpeno-hidroxilase e/ou terpeno-oxidase. Em muitas concretizações, o polipéptido codificado apresenta uma actividade de sesquiterpeno-oxidase ou de sesquiterpeno-hidroxilase. Em muitas concretizações, o polipéptido codificado catalisa a hidroxilação de um substrato sesquiterpénico.
Em algumas concretizações, um ácido nucleico do invento compreende pelo menos cerca de 500, pelo menos cerca de 600, pelo menos cerca de 700, pelo menos cerca de 800, pelo menos cerca de 900, pelo menos cerca de 1.000, pelo menos cerca de 1.100, pelo menos cerca de 1.200, pelo menos cerca de 1.300, pelo menos cerca de 1.400 ou pelo menos cerca de 1.450 nucleótidos contíguos da sequência nucleotídica apresentada na SEQ ID NO:5. Em algumas concretizações, um ácido nucleico do invento compreende pelo menos cerca de 500, pelo menos cerca de 600, pelo menos cerca de 700, pelo menos cerca de 800, pelo menos cerca de 900, pelo menos cerca de 1.000, pelo menos cerca de 1.100, pelo menos cerca de 1.200, pelo menos cerca de 1.300, pelo menos cerca de 1.400 ou pelo menos cerca de 1.450 nucleótidos contíguos da sequência nucleotídica apresentada na SEQ ID NO:5 e codifica um polipéptido que apresenta uma actividade de terpeno-hidroxilase e/ou terpeno-oxidase, por exemplo, uma actividade de sesquiterpeno-oxidase, uma actividade de sesquiterpeno-hidroxilase, etc.
Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotídica que híbrida, em condições estringentes de hibridação, com um ácido nucleico compreendendo a sequência nucleotídica apresentada na SEQ ID NO:5, ou um seu complemento.
Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotídica que codifica um polipéptido compreendendo uma sequência de aminoácidos conforme representada na Figura 9 e apresentada na SEQ ID NO: 6. Em algumas concretizações, um ácido nucleico do invento 29
ΕΡ 1 919 514/PT compreende uma sequência nucleotídica que codifica um polipéptido compreendendo uma sequência de aminoácidos que possui uma identidade de sequência de aminoácidos de pelo menos cerca de 45%, pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 98% ou pelo menos cerca de 99% com a sequência de aminoácidos apresentada na SEQ ID NO:6. Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotidica que codifica um polipéptido compreendendo uma sequência de aminoácidos que possui uma identidade de sequência de aminoácidos de pelo menos cerca de 45%, pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 98% ou pelo menos cerca de 99% com um trecho de pelo menos cerca de 50, pelo menos cerca de 75, pelo menos cerca de 100, pelo menos cerca de 150, pelo menos cerca de 200, pelo menos cerca de 250, pelo menos cerca de 300, pelo menos cerca de 350, pelo menos cerca de 400, pelo menos cerca de 450 ou pelo menos cerca de 480 aminoácidos contíguos da sequência de aminoácidos apresentada na SEQ ID NO:6. Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotídica que codifica um polipéptido compreendendo uma sequência de aminoácidos que possui uma, duas, três, quatro, cinco, seis, sete, oito, nove, dez, entre cerca de 10 e cerca de 15, entre cerca de 15 e cerca de 20 ou entre cerca de 20 e cerca de 25 substituições de aminoácidos conservativas em comparação com a sequência de aminoácidos apresentada na SEQ ID NO:6. Em algumas concretizações, o polipéptido codificado apresenta uma actividade de terpeno-hidroxilase e/ou terpeno-oxidase. Em algumas concretizações, o polipéptido codificado apresenta uma actividade sesquiterpeno-oxidase. Em algumas concretizações, polipéptido codificado catalisa a hidroxilação de substrato sesquiterpénico. Em outras concretizações, polipéptido codificado apresenta uma actividade sesquiterpeno-hidroxilase. uma de o um o de 30 ΕΡ 1 919 514/ΡΤ
Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotídica que codifica um polipéptido compreendendo pelo menos cerca de 50, pelo menos cerca de 75, pelo menos cerca de 100, pelo menos cerca de 150, pelo menos cerca de 200, pelo menos cerca de 250, pelo menos cerca de 300, pelo menos cerca de 350, pelo menos cerca de 400, pelo menos cerca de 450 ou pelo menos cerca de 480 aminoácidos contíguos de uma sequência de aminoácidos que possui uma identidade de sequência de aminoácidos de pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 98%, pelo menos cerca de 99% ou de 100% com a sequência de aminoácidos apresentada na SEQ ID NO:6. Em algumas concretizações, o polipéptido codificado apresenta uma actividade de terpeno-hidroxilase e/ou terpeno-oxidase. Em algumas concretizações, o polipéptido codificado apresenta uma actividade de sesquiterpeno-oxidase. Em algumas concretizações, o polipéptido codificado catalisa a hidroxilação de um substrato sesquiterpénico. Em outras concretizações, o polipéptido codificado apresenta uma actividade de sesquiterpeno-hidroxilase.
Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotídica que codifica uma variante de um polipéptido compreendendo uma sequência de aminoácidos apresentada na SEQ ID NO:2 ou SEQ. ID NO: 6. Por exemplo, em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotídica que codifica uma enzima que apresenta uma ou mais das propriedades que se seguem em comparação com uma enzima que compreende uma sequência de aminoácidos apresentada na SEQ ID NO:2 ou SEQ ID NO: 6: 1) maior actividade enzimática; 2) maior estabilidade in vitro e/ou in vivo; 3) maior rendimento de produto; 4) taxa de renovação proteica alterada; 5) especificidade de substrato alterada (por exemplo, de modo que a enzima variante modifique um substrato(s) seleccionado(s)); 6) maior eficiência da enzima (por exemplo, maior eficiência de conversão de substrato para gerar produto); e 7) maior solubilidade (por exemplo, solubilidade dentro do citoplasma ou citosol). 31
ΕΡ 1 919 514/PT Ácidos nucleicos que codificam redutases do citocromo P450 0 presente invento disponibiliza um ácido nucleico isolado compreendendo uma sequência nucleotidica que codifica uma redutase do citocromo P450 (CPR). Em algumas concretizações, um ácido nucleico de CPR do invento compreende uma sequência nucleotidica que codifica uma CPR que transfere electrões do NADPH para uma oxidase do citocromo P450, codificada por um ácido nucleico de uma enzima de modificação de isoprenóides do invento.
Em algumas concretizações, um ácido nucleico do invento compreende a sequência nucleotidica representada na Figura 3 e apresentada na SEQ ID NO:3. Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotidica que possui uma identidade de sequência nucleotidica de pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 98% ou pelo menos cerca de 99% com a sequência nucleotidica apresentada na SEQ ID NO:3.
Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotidica que híbrida, em condições estringentes de hibridação, com um ácido nucleico compreendendo a sequência nucleotidica apresentada na SEQ ID NO:3, ou um seu complemento.
Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotidica que codifica um polipéptido compreendendo uma sequência de aminoácidos conforme representada na Figura 4 e apresentada na SEQ ID NO:4. Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotidica que codifica um polipéptido compreendendo uma sequência de aminoácidos que possui uma identidade de sequência de aminoácidos de pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 98% ou pelo menos cerca de 99% com a sequência de aminoácidos apresentada na SEQ ID NO:4. Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotidica que codifica um polipéptido compreendendo uma 32
ΕΡ 1 919 514/PT sequência de aminoácidos que possui uma, duas, três, quatro, cinco, seis, sete, oito, nove, dez, entre cerca de 10 e cerca de 15, entre cerca de 15 e cerca de 20 ou entre cerca de 20 e cerca de 25 substituições de aminoácidos conservativas em comparação com a sequência de aminoácidos apresentada na SEQ ID NO:4.
Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotidica que codifica um polipéptido compreendendo pelo menos cerca de 50, pelo menos cerca de 75, pelo menos cerca de 100, pelo menos cerca de 150, pelo menos cerca de 200, pelo menos cerca de 250, pelo menos cerca de 300, pelo menos cerca de 350, pelo menos cerca de 400, pelo menos cerca de 450, pelo menos cerca de 500, pelo menos cerca de 550, pelo menos cerca de 600, pelo menos cerca de 650 ou pelo menos cerca de 700 aminoácidos contíguos de uma sequência de aminoácidos que possui uma identidade de sequência de aminoácidos de pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 98%, pelo menos cerca de 99% ou de 100% com a sequência de aminoácidos apresentada na SEQ ID NO: 4. Em algumas concretizações, o polipéptido codificado transfere electrões do NADPH para um polipéptido (por exemplo, uma enzima de modificação de isoprenóides) codificado por um ácido nucleico de uma enzima de modificação de isoprenóides do invento.
Em algumas concretizações, um ácido nucleico do invento compreende pelo menos cerca de 500, pelo menos cerca de 600, pelo menos cerca de 700, pelo menos cerca de 800, pelo menos cerca de 900, pelo menos cerca de 1.000, pelo menos cerca de 1.100, pelo menos cerca de 1.200, pelo menos cerca de 1.300, pelo menos cerca de 1.400, pelo menos cerca de 1.500, pelo menos cerca de 1.600, pelo menos cerca de 1.700, pelo menos cerca de 1.800, pelo menos cerca de 1.900, pelo menos cerca de 2.000 ou pelo menos cerca de 2.100 nucleótidos contíguos da sequência nucleotidica apresentada na SEQ ID NO:3. Em algumas concretizações, um ácido nucleico do invento compreende pelo menos cerca de 500, pelo menos cerca de 600, pelo menos cerca de 700, pelo menos cerca de 800, pelo menos cerca de 900, pelo menos cerca de 1.000, pelo menos cerca de 1.100, pelo menos cerca de 1.200, pelo menos cerca de 1.300, 33 ΕΡ 1 919 514/PT pelo menos cerca de 1.400, pelo menos cerca de 1.500, pelo menos cerca de 1.600, pelo menos cerca de 1.700, pelo menos cerca de 1.800, pelo menos cerca de 1.900, pelo menos cerca de 2.000 ou pelo menos cerca de 2.100 nucleótidos contíguos da sequência nucleotídica apresentada na SEQ ID NO:3 e codifica um polipéptido que transfere electrões do NADPH para uma oxidase do citocromo P450 codificada por um ácido nucleico de uma enzima de modificação de isoprenóides do invento, por exemplo, o polipéptido codificado transfere electrões do NADPH para um polipéptido (por exemplo, uma enzima de modificação de isoprenóides) codificado por um ácido nucleico de uma enzima de modificação de isoprenóides do invento.
Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotídica que codifica uma variante de um polipéptido compreendendo uma sequência de aminoácidos apresentada na SEQ ID NO:4. Por exemplo, em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotídica que codifica uma enzima que apresenta uma ou mais das propriedades que se seguem em comparação com uma enzima que compreende uma sequência de aminoácidos apresentada na SEQ ID NO:4: 1) maior actividade enzimática; 2) maior estabilidade in vitro e/ou in vivo; 3) maior rendimento de produto; 4) taxa de renovação proteica alterada; 5) especificidade de substrato alterada (por exemplo, de modo que a enzima variante modifique um substrato (s) seleccionado (s)); 6) maior eficiência da enzima (por exemplo, maior eficiência de conversão de substrato para gerar produto); e 7) maior solubilidade (por exemplo, solubilidade dentro do citoplasma ou citosol).
Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotídica que codifica uma proteína de fusão compreendendo uma sequência de aminoácidos de uma enzima de modificação de isoprenóides que apresenta uma actividade de terpeno-hidroxilase e/ou terpeno-oxidase, como descrita acima, fundida com um polipéptido heterólogo (um "parceiro de fusão"), por exemplo, um polipéptido que não é uma enzima de modificação de isoprenóides como descrita acima. Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotídica que codifica 34 ΕΡ 1 919 514/PT uma proteína de fusão compreendendo uma sequência de aminoácidos de uma CPR, como descrita acima, e um polipéptido heterólogo, por exemplo, um polipéptido que não é uma CPR. Os parceiros de fusão adequados incluem, embora não estejam limitados a estes, polipéptidos que melhoram a solubilidade da enzima de modificação de isoprenóides ou da CPR; polipéptidos que proporcionam um sinal detectável (por exemplo, uma proteína fluorescente; uma enzima que origina um produto detectável, por exemplo, β-galactosidase, luciferase, peroxidase de rábano e similares) ; polipéptidos que permitem a inclusão da enzima de modificação de isoprenóides ou da CPR num compartimento celular particular (por exemplo, citosol, citoplasma, etc.) e similares.
Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotídica que codifica ambas uma enzima de modificação de isoprenóides (por exemplo, um polipéptido que apresenta uma actividade de terpeno-hidroxilase e/ou terpeno-oxidase) e uma CPR. Em algumas concretizações, um ácido nucleico do invento compreende uma sequência nucleotídica que codifica uma proteína de fusão compreendendo uma sequência de aminoácidos de uma enzima de modificação de isoprenóides que apresenta uma actividade de terpeno-hidroxilase e/ou terpeno-oxidase, como descrita acima, fundida com um polipéptido CPR. Em algumas concretizações, a proteína de fusão codificada possui a fórmula NH2-A-X-B-COOH, em que A é a enzima de modificação de isoprenóides que apresenta uma actividade de terpeno-hidroxilase e/ou terpeno-oxidase, X é um elemento de ligação opcional e B é o polipéptido CPR. Em algumas concretizações, a proteína de fusão codificada possui a fórmula NH2-A-X-B-COOH, em que A é o polipéptido CPR, X é um elemento de ligação opcional e B é o polipéptido de modificação de isoprenóides que apresenta uma actividade de terpeno-hidroxilase e/ou terpeno-oxidase. 0 péptido de ligação poderá ter uma variedade de sequências de aminoácidos. As proteínas podem ser unidas por um péptido espaçador, geralmente de natureza flexível, embora não estejam excluídas outras ligações químicas. 0 elemento de ligação poderá ser um elemento de ligação clivável. As sequências de ligação adequadas serão geralmente péptidos com 35 ΕΡ 1 919 514/PT um comprimento entre cerca de 5 e cerca de 50 aminoácidos ou um comprimento entre cerca de 6 e cerca de 25 aminoácidos. Utilizar-se-ão geralmente elementos de ligação peptidicos com um certo grau de flexibilidade. Os péptidos de ligação podem ter praticamente qualquer sequência de aminoácidos, tendo presente que os elementos de ligação preferidos terão uma sequência que resulta num péptido geralmente flexivel. A utilização de aminoácidos pequenos, como a glicina e a alanina, é útil para a criação de um péptido flexivel. A criação de sequências deste tipo é um processo de rotina para os peritos na técnica. Uma variedade de elementos de ligação diferentes está disponível comercialmente e é considerada adequada para utilização de acordo com o presente invento.
Os péptidos de ligação adequados incluem frequentemente sequências de aminoácidos ricas em residuos de alanina e de prolina, que é sabido conferirem flexibilidade a uma estrutura proteica. Os elementos de ligação exemplificativos possuem uma combinação de residuos de glicina, alanina, prolina e metionina, como AAAGGM (SEQ ID NO:8), AAAGGMP PAAAGGM (SEQ ID NO:9); AAAGGM (SEQ ID NO:10); e PPAAAGGM (SEQ ID NO:ll). Outros péptidos de ligação exemplificativos incluem IEGR (SEQ ID NO:12) e GGKGGK (SEQ ID NO:13). Contudo, qualquer elemento de ligação flexivel com um comprimento geralmente entre cerca de 5 e cerca de 50 aminoácidos poderá ser utilizado. Os elementos de ligação poderão ter praticamente qualquer sequência que resulte num péptido geralmente flexivel, incluindo sequências ricas em alanina-prolina do tipo exemplificado acima.
Construções O presente invento disponibiliza adicionalmente vectores recombinantes ("construções") compreendendo um ácido nucleico do invento. Em algumas concretizações, um vector recombinante do invento permite a amplificação de um ácido nucleico do invento. Em algumas concretizações, um vector recombinante do invento permite a produção de uma enzima de modificação de isoprenóides codificada ou de uma CPR codificada, numa célula eucariótica, numa célula procariótica ou num sistema de transcrição/tradução desprovido de células. Os vectores de expressão adequados incluem, embora não estejam limitados a 36 ΕΡ 1 919 514/ΡΤ estes, vectores baseados em baculovírus, vectores baseados em bacteriófagos, plasmídeos, fagemídeos, cosmídeos, fosmídeos, cromossomas artificiais bacterianos, vectores virais (por exemplo, vectores virais baseados no virus da vacina, poliovírus, adenovírus, virus adeno-associado, SV40, virus Herpes simplex e similares), cromossomas artificiais baseados em Pl, plasmideos de levedura, cromossomas artificiais de levedura e quaisquer outros vectores específicos para hospedeiros particulares de interesse (como E. coli, levedura e células de planta).
Em algumas concretizações, um vector recombinante do invento compreende um ácido nucleico que codifica uma enzima de modificação de isoprenóides do invento e um ácido nucleico que codifica uma CPR do invento. Em algumas destas concretizações, um vector recombinante do invento é um vector de expressão que permite a produção de ambas a enzima de modificação de isoprenóides codificada e a CPR codificada numa célula eucariótica, numa célula procariótica ou num sistema de transcrição/tradução desprovido de células.
Determinados tipos de vectores permitem a amplificação das cassetes de expressão do presente invento. Outros tipos de vectores são necessários para uma introdução eficiente do ácido nucleico do invento nas células e para a sua expressão estável uma vez introduzidos. Qualquer vector capaz de aceitar um ácido nucleico do invento está contemplado como sendo um vector recombinante adequado para os objectivos do invento. 0 vector poderá consistir em qualquer comprimento circular ou linear de ADN que se integra no genoma do hospedeiro ou é mantido sob a forma epissómica. Os vectores poderão requerer uma manipulação adicional ou condições particulares para serem incorporados eficazmente numa célula hospedeira (por exemplo, muitos plasmídeos de expressão); ou podem fazer parte de um sistema específico da célula que sofre auto-integração (por exemplo, um vírus recombinante). Em algumas concretizações, o vector é funcional numa célula procariótica, onde estes vectores actuam para propagar o vector recombinante e/ou permitir a expressão de um ácido nucleico do invento. Em algumas concretizações, o vector é funcional numa célula eucariótica, onde o vector será, em muitas concretizações, um vector de expressão. 37
ΕΡ 1 919 514/PT
Os peritos na técnica conhecem numerosos vectores de expressão adequados e muitos estão disponiveis comercialmente. Os vectores seguintes são disponibilizados a titulo exemplificativo; para células hospedeiras bacterianas: pBluescript (Stratagene, San Diego, Califórnia), os vectores pQE (Qiagen), os plasmideos pBluescript, os vectores pNH, os vectores lambda-ZAP (Stratagene); pTrc (Amann et al., Gene, 69:301-315 (1988)); pTrc99a, pKK223-3, pDR540 e pRIT2T (Pharmacia); para células hospedeiras eucarióticas: pXTl, pSG5 (Stratagene), pSVK3, pBPV, pMSG e pSVLSV40 (Pharmacia). É, contudo, possivel utilizar qualquer outro plasmideo ou qualquer outro vector desde que ele seja compatível com a célula hospedeira.
Em muitas concretizações, um vector recombinante do invento compreenderá um ou mais genes de marcas de selecção para proporcionar uma característica fenotípica para a selecção das células hospedeiras transformadas. As marcas de selecção adequadas incluem, embora não estejam limitadas a estas, a di-hidrofolato-redutase e a resistência à neomicina para uma cultura de células eucarióticas; e a resistência à tetraciclina ou à ampicilina em células hospedeiras procarióticas, como E. coli.
Em muitas concretizações, um ácido nucleico do invento compreende uma sequência nucleotídica que codifica uma enzima de modificação de isoprenóides, em que a sequência nucleotídica que codifica a enzima de modificação de isoprenóides está ligada de forma funcional a um ou mais elementos de controlo transcricional e/ou traducional. Em muitas concretizações, um ácido nucleico do invento compreende uma sequência nucleotídica que codifica uma CPR, em que a sequência nucleotídica que codifica a CPR está ligada de forma funcional a um ou mais elementos de controlo transcricional e/ou traducional.
Em algumas concretizações, como referido acima, um vector recombinante do invento compreende um ácido nucleico que codifica uma enzima de modificação de isoprenóides do invento e um ácido nucleico que codifica uma CPR do invento. Em algumas destas concretizações, a sequência nucleotídica que codifica uma enzima de modificação de isoprenóides e a 38 ΕΡ 1 919 514/PT sequência nucleotídica que codifica uma CPR estão liqadas de forma funcional a diferentes elementos de controlo transcricional. Em outras concretizações, a sequência nucleotidica que codifica uma enzima de modificação de isoprenóides e a sequência nucleotidica que codifica uma CPR estão liqadas de forma funcional ao(s) mesmo(s) elemento(s) de controlo transcricional. Em alqumas concretizações, a sequência nucleotidica que codifica uma enzima de modificação de isoprenóides e a sequência nucleotidica que codifica uma CPR estão ambas liqadas de forma funcional ao mesmo promotor indutível. Em algumas concretizações, a sequência nucleotidica que codifica uma enzima de modificação de isoprenóides e a sequência nucleotidica que codifica uma CPR estão ambas ligadas de forma funcional ao mesmo promotor constitutivo.
Os promotores adequados para uso em células hospedeiras procarióticas incluem, embora não estejam limitados a estes, um promotor da ARN-polimerase do bacteriófago T7; um promotor trp; um promotor do operão lac; um promotor híbrido, por exemplo, um promotor híbrido lac/tac, um promotor híbrido tac/trc, um promotor trp/lac, um promotor T7/lac; um promotor trc; um promotor tac e similares; um promotor araBAD; promotores regulados in vivo, como um promotor de ssaG ou um promotor relacionado (ver, por exemplo, Publicação de Patente U.S. n.° 20040131637), um promotor de pagC (Pulkkinen & Miller, J. Bacteriol., 1991; 173 (1) : 86-93; Alpuche-Aranda et al., PNAS, 1992; 89(21):10079-83), um promotor de nirB (Harborne et al. (1992) Mol. Micro. 6:2805-2813) e similares (ver, por exemplo, Dunstan et al. (1999) Infect. Immun. 67:5133-5141; McKelvie et al. (2004) Vaccine 22:3243-3255; e Chatfield et al. (1992) Biotechnol. 10:888-892); um promotor sigma70, por exemplo, um promotor sigma70 consenso (ver, por exemplo, os n.os de acesso do GenBank AX798980, AX798961 e AX798183); um promotor de fase estacionária, por exemplo, um promotor de dps, um promotor de spv e similares; um promotor derivado da ilha de patogenicidade SPI-2 (ver, por exemplo, W096/17951); um promotor actA (ver, por exemplo, Shetron-Rama et al. (2002) Infect. Immun. 70:1087-1096); um promotor rpsM (ver, por exemplo, Valdivia & Falkow (1996). Mol. Microbiol. 22:367-378); um promotor tet (ver, por exemplo, Hillen, W. & Wissmann, A. (1989) In Saenger, W. & Heinemann, U. (eds), 39 ΕΡ 1 919 514/ΡΤ
Topics in Molecular and Structural Biology, Protein-Nucleic Acid Interaction. Macmillan, London, UK, Vol. 10, pp. 143-162); um promotor SP6 (ver, por exemplo, Melton et al. (1984) Nucl. Acids Res. 12:7035-7056); e similares.
Exemplos não limitantes de promotores eucarióticos adequados incluem o promotor precoce imediato de CMV, o promotor da timidina-cinase de HSV, os promotores precoce e tardio de SV40, as LTR de retrovirus e o promotor da metalotioneina-I de ratinho. Em algumas concretizações, por exemplo para expressão numa célula de levedura, um promotor adequado é um promotor constitutivo, tal como um promotor ADH1, um promotor PGK1, um promotor ENO, um promotor PYK1 e similares; ou um promotor regulável, tal como um promotor GAL1, um promotor GAL10, um promotor ADH2, um promotor PH05, um promotor CUP1, um promotor GAL7, um promotor MET25, um promotor MET3 e similares. A selecção do vector e do promotor apropriados encontra-se no âmbito da perícia na técnica. O vector de expressão também poderá conter um local de ligação de ribossomas para iniciação da tradução e uma sequência de terminação da transcrição. O vector de expressão também poderá incluir sequências apropriadas para amplificar a expressão.
Em muitas concretizações, uma sequência nucleotídica que codifica uma enzima de modificação de isoprenóides está ligada de forma funcional a um promotor indutível. Em muitas concretizações, uma sequência nucleotídica que codifica uma CPR está ligada de forma funcional a um promotor indutível. Os promotores indutíveis são bem conhecidos na técnica. Os promotores indutíveis adequados incluem, embora não estejam limitados a estes exemplos, o promotor pL do bacteriófago À; Plac; Ptrp; Ptac (promotor híbrido Ptrp-lac); um promotor indutível por isopropil-beta-D-tiogalactopiranósido (IPTG), por exemplo, um promotor de lacZ; um promotor indutível por tetraciclina; um promotor indutível por arabinose, por exemplo, PBad (ver, por exemplo, Guzman et al. (1995) J. Bacteriol. 177:4121-4130); um promotor indutível por xilose, por exemplo, Pxyl (ver, por exemplo, Kim et al. (1996) Gene 181:71-76); um promotor GAL1; um promotor do triptofano; um promotor lac; um produtor indutível por álcoois, por exemplo, um promotor indutível por metanol, um promotor indutível por 40 ΕΡ 1 919 514/ΡΤ etanol; um promotor indutível por rafinose; um promotor indutível pelo calor, por exemplo, o promotor PL de lambda indutível pelo calor, um promotor controlado por um repressor sensível ao calor (por exemplo, vectores de expressão baseados em lambda reprimidos por CI857; ver, por exemplo, Hoffmann et al. (1999) FEMS Microbiol Lett. 177 (2) : 327-34); e similares.
Em levedura, é possível utilizar um certo número de vectores que contêm promotores constitutivos ou indutíveis. Para obter artigos de revisão, ver Current Protocols in Molecular Biology, Vol. 2, 1988, Ed. Ausubel, et al., Greene
Publish. Assoe. & Wiley Interscience, Ch. 13; Grant et al., 1987, Expression and Secretion Vectors for Yeast, in Methods in Enzymology, Eds. Wu & Grossman, 31987, Acad. Press, N.Y.,
Vol. 153, pp.516-544; Glover, 1986, DNA Cloning, Vol. II, IRL
Press, Wash., D.C., Ch. 3; e Bitter, 1987, Heterologous Gene Expression in Yeast, Methods in Enzymology, Eds. Berger & Kimmel, Acad. Press, N.Y., Vol. 152, pp. 673-684; e The
Molecular Biology of the Yeast Saccharomyces, 1982, Eds. Strathern et al., Cold Spring Harbor Press, Vols. I & II. É possível utilizar um promotor constitutivo de levedura, como ADH ou LEU2, ou um promotor indutível, como GAL (Cloning in Yeast, Ch. 3, R. Rothstein In: DNA Cloning Vol. 11, A
Practical Approach, Ed. DM Glover, 1986, IRL Press, Wash., D.C.). Em alternativa, é possível utilizar vectores que promovem a integração de sequências de ADN estranho no cromossoma da levedura.
Em algumas concretizações, um ácido nucleico do invento ou um vector do invento compreende um promotor ou outro (s) elemento(s) regulador(es) para expressão numa célula de planta. Exemplos não limitantes de promotores constitutivos adequados que são funcionais numa célula de planta são o promotor 35S do vírus do mosaico da couve-flor, um promotor 35S em tandem (Kay et al., Science 236:1299 (1987)), um promotor 19S do vírus do mosaico da couve-flor, um promotor do gene da nopalina-sintase (Singer et al., Plant Mol. Biol. 14:433 (1990); An, Plant Physiol. 81:86 (1986)), um promotor do gene da octopina-sintase e um promotor da ubiquitina. Os promotores indutíveis adequados que são funcionais numa célula de planta incluem, embora não estejam limitados a 41 ΕΡ 1 919 514/ΡΤ estes, um promotor do gene da fenilalanina amoníaco-liase, um promotor do gene da chalcona-sintase, um promotor do gene de uma proteína relacionada com a patogénese, um elemento regulador indutível pelo cobre (Mett et al., Proc. Natl. Acad. Sei. USA 90:4567-4571 (1993); Furst et al., Cell 55:705-717 (1988)); elementos reguladores indutíveis por tetraciclina e por clortetraciclina (Gatz et al., Plant J. 2:397-404 (1992); Rõder et al., Mol. Gen. Genet. 243:32-38 (1994) ; Gatz, Meth. Cell Biol. 50:411-424 (1995)); elementos reguladores indutíveis por eedisona (Christopherson et al., Proc. Natl. Acad Sei. USA 89:6314-6318 (1992); Kreutzweiser et al., Ecotoxicol. Environ. Safety 28:14-24 (1994)); elementos reguladores indutíveis por choque térmico (Takahashi et al., Plant Physiol. 99:383-390 (1992); Yabe et al., Plant Cell Physiol. 35:1207-1219 (1994); Ueda et al., Mol. Gen. Genet. 250:533-539 (1996)); e elementos do operão lac, que são utilizados em combinação com um repressor lac expresso constitutivamente para conferir, por exemplo, uma expressão indutível por IPTG (Wilde et al., EMBO J. 11:1251-1259 (1992); um promotor indutível por nitrato derivado do gene da nitrito-redutase de espinafre (Back et al., Plant Mol. Biol. 17:9 (1991)); um promotor indutível pela luz, como aquele associado às famílias do gene da pequena subunidade da RuBP-carboxilase ou do gene LHCP (Feinbaum et al., Mol. Gen. Genet. 226:449 (1991); Lam & Chua, Science 248:471 (1990)); um elemento regulador receptivo à luz como descrito na Publicação de Patente U.S. n.° 20040038400; elementos reguladores indutíveis por ácido salicílico (Uknes et al., Plant Cell 5:159-169 (1993); Bi et al., Plant J. 8:235-245 (1995) ); elementos reguladores indutíveis por hormonas de plantas (Yamaguchi-Shinozaki et al., Plant Mol. Biol. 15:905 (1990); Kares et al., Plant Mol. Biol. 15:225 (1990)); e elementos reguladores indutíveis por hormonas humanas, como o elemento de resposta aos glucocorticóides humanos (Schena et al., Proc. Natl. Acad. Sei. USA 88:10421 (1991)).
Também é possível incluir elementos reguladores selectivos para tecidos de planta num ácido nucleico do invento ou num vector do invento. Os elementos reguladores selectivos para tecidos adequados, que podem ser utilizados para expressar ectopicamente um ácido nucleico num único tecido ou num número limitado de tecidos, incluem, embora não 42
ΕΡ 1 919 514/PT estejam limitados a estes, um elemento regulador selectivo para o xilema, um elemento regulador selectivo para os traqueides, um elemento regulador selectivo para as fibras, um elemento regulador selectivo para os tricomas (ver, por exemplo, Wang et al. (2002) J. Exp. Botany 53:1891-1897), um elemento regulador selectivo para os tricomas glandulares e similares.
Os vectores que são adequados para utilização em células de planta são conhecidos na técnica, e qualquer um destes vectores pode ser utilizado para introduzir um ácido nucleico do invento numa célula hospedeira de planta. Os vectores adequados incluem, por exemplo, um plasmideo Ti de
Agrobacterium tumefaciens ou um plasmideo Rii de A. rhizogenes. 0 plasmideo Ti ou Rii é transmitido às células de planta aquando da infecção por Agrobacterium e é integrado de forma estável no genoma da planta. J. Schell, Science, 237:1176-83 (1987). Um cromossoma artificial de planta conforme descrito, por exemplo, na Patente U.S. n.° 6,900,012, também é adequado para utilização.
Composições O presente invento disponibiliza adicionalmente composições que compreendem um ácido nucleico do invento. O presente invento proporciona ainda composições que compreendem um vector recombinante do invento. As composições que compreendem um ácido nucleico do invento ou um vector de expressão do invento incluirão, em muitas concretizações, um ou mais dos seguintes elementos: um sal, por exemplo, NaCl, MgCl, KC1, MgS04, etc.; um agente tampão, por exemplo, um tampão Tris, ácido N-(2-hidroxietil)piperazina-N'-2-etanossulfónico (HEPES), ácido 2-(N-morfolino)etanossulfónico (MES), sal de sódio do ácido 2-(N-morfolino)etanossulfónico (MES), ácido 3-(N-morfolino)propanossulfónico (MOPS), ácido N-tris[hidroximetil]metil-3-aminopropanossulfónico (TAPS), etc.; um agente de solubilização; um detergente, por exemplo, um detergente não iónico como Tween-20, etc.; um inibidor de nucleases e similares. Em algumas concretizações, um ácido nucleico do invento ou um vector recombinante do invento está liofilizado. 43
ΕΡ 1 919 514/PT Células hospedeiras O presente invento disponibiliza células hospedeiras geneticamente modificadas, por exemplo, células hospedeiras que foram geneticamente modificadas com um ácido nucleico do invento ou um vector recombinante do invento. Em muitas concretizações, uma célula hospedeira geneticamente modificada do invento é uma célula hospedeira in vitro. Em outras concretizações, uma célula hospedeira geneticamente modificada do invento é uma célula hospedeira in vivo. Em outras concretizações, uma célula hospedeira geneticamente modificada do invento faz parte de um organismo multicelular.
Em muitas concretizações, as células hospedeiras são organismos unicelulares ou são crescidas em cultura como células individuais. Em algumas concretizações, a célula hospedeira é uma célula eucariótica. As células hospedeiras eucarióticas adequadas incluem, embora não estejam limitadas a estas, células de levedura, células de insecto, células de planta, células fúngicas e células algais. As células hospedeiras eucarióticas adequadas incluem, embora não estejam limitadas a estes exemplos, Pichia pastoris, Pichia finlandica, Pichia trehalophila, Pichia koclamae, Pichia membranaefaciens, Pichia opuntiae, Pichia thermotolerans, Pichia salictaria, Pichia guercuum, Pichia pijperi, Pichia stiptis, Pichia methanolica, Pichia sp., Saccharomyces cerevisiae, Saccharomyces sp., Hansenula polymorpha, Kluyveromyces sp., Kluyveromyces lactis, Candida albicans, Aspergillus nidulans, Aspergillus niger, Aspergillus oryzae, Trichoderma reesei, Chrysosporium lucknowense, Fusarium sp., Fusarium gramineum, Fusarium venenatum, Neurospora crassa, Chlamydomonas reinhardtii e similares. Em algumas concretizações, a célula hospedeira é uma célula eucariótica distinta de uma célula de planta.
Em outras concretizações, a célula hospedeira é uma célula de planta. As células de planta incluem células de monocotiledóneas e de dicotiledóneas.
Em outras concretizações, a célula hospedeira é uma célula procariótica. As células procarióticas adequadas incluem, embora não estejam limitadas a estas, qualquer uma 44 ΕΡ 1 919 514/PT de uma variedade de estirpes laboratoriais de Escherichia coli, Lactobacillus sp., Salmonella sp., Shigella sp. e similares. Ver, por exemplo, Carrier et al. (1992) J. Immunol. 148:1176-1181; Patente U.S. n.° 6,447,784; e Sizemore et al. (1995) Science 270:299-302. Os exemplos de estirpes de Salmonella que podem ser empregues no presente invento incluem, embora não estejam limitadas a estas, Salmonella typhi e S. typhimurium. As estirpes de Shigella apropriadas incluem, embora não estejam limitadas a estas, Shigella flexneri, Shigella sonnei e Shigella disenteriae. Tipicamente, a estirpe laboratorial é uma estirpe que é não patogénica. Exemplos não limitativos de outras bactérias adequadas incluem, embora não estejam limitados a estes, Bacillus subtilis, Pseudomonas pudita, Pseudomonas aeruginosa, Pseudomonas mevalonii, Rhodobacter sphaeroides, Rhodobacter capsulatus, Rhodospirillum rubrum, Rhodococcus sp. e similares. Em algumas concretizações, a célula hospedeira é Escherichia coli.
Para produzir uma célula hospedeira geneticamente modificada do invento, um ácido nucleico do invento compreendendo sequências nucleotidicas que codificam uma enzima de modificação de isoprenóides é introduzido, de forma estável ou temporária, numa célula hospedeira parental, utilizando técnicas estabelecidas que incluem, mas não estão limitadas a, electroporação, precipitação com fosfato de cálcio, transfecção mediada por DEAE-dextrano, transfecção mediada por lipossomas e técnicas similares. Para uma transformação estável, o ácido nucleico incluirá ainda geralmente uma marca de selecção, por exemplo, qualquer uma de várias marcas de selecção bem conhecidas, tais como a resistência à neomicina, a resistência à ampicilina, a resistência à tetraciclina, a resistência ao cloranfenicol, a resistência à canamicina e similares.
Em algumas concretizações, uma célula hospedeira geneticamente modificada do invento é uma célula de planta. Uma célula de planta geneticamente modificada do invento é útil para produzir um composto isoprenóide seleccionado, em cultura in vitro de células de planta. Uma orientação no que diz respeito a cultura de tecidos vegetais poderá ser encontrada em, por exemplo, Plant Cell and Tissue Culture, 45 ΕΡ 1 919 514/ΡΤ 1994, Vasil and Thorpe Eds., Kluwer Academic Publishers; e em: Plant Cell Culture Protocols (Methods in Molecular
Biology 111), 1999, Hall Eds, Humana Press. Células hospedeiras geneticamente modificadas
Em algumas concretizações, uma célula hospedeira geneticamente modificada do invento compreende um vector de expressão do invento, em que o vector de expressão do invento compreende uma sequência nucleotidica que codifica uma enzima de modificação de isoprenóides. Em algumas concretizações, uma célula hospedeira geneticamente modificada do invento compreende um vector de expressão do invento, em que o vector de expressão do invento compreende uma sequência nucleotidica que codifica um polipéptido que apresenta uma actividade de terpeno-hidroxilase e/ou terpeno-oxidase.
Em algumas concretizações, uma célula hospedeira geneticamente modificada do invento compreende um primeiro vector de expressão do invento, em que o primeiro vector de expressão do invento compreende um ácido nucleico do invento compreendendo uma sequência nucleotidica que codifica um polipéptido que apresenta uma actividade de terpeno-hidroxilase e/ou terpeno-oxidase; e compreende ainda um segundo vector de expressão do invento, em que o segundo vector de expressão do invento compreende um ácido nucleico do invento compreendendo uma sequência nucleotidica que codifica uma CPR. Em outras concretizações, uma célula hospedeira geneticamente modificada do invento compreende um vector de expressão do invento, em que o vector de expressão do invento compreende um ácido nucleico do invento compreendendo uma sequência nucleotidica que codifica uma enzima de modificação de isoprenóides e um ácido nucleico do invento compreendendo uma sequência nucleotidica que codifica uma CPR. Em outras concretizações, uma célula hospedeira geneticamente modificada do invento compreende um vector de expressão do invento, em que o vector de expressão do invento compreende um ácido nucleico do invento compreendendo uma sequência nucleotidica que codifica um polipéptido de fusão (por exemplo, um polipéptido que inclui uma enzima de modificação de isoprenóides e uma CPR). 46 ΕΡ 1 919 514/ΡΤ
Os ácidos nucleicos que codificam uma CPR adequados incluem os ácidos nucleicos que codificam uma CPR encontrados em plantas. Os ácidos nucleicos que codificam uma CPR adequados incluem os ácidos nucleicos que codificam uma CPR encontrados em fungos. Exemplos de ácidos nucleicos que codificam uma CPR adequados incluem: n.° acesso do GenBank AJ303373 (CPR de Triticum aestivum); n.° acesso do GenBank AY959320 (CPR de Taxus chinensis); n.° acesso do GenBank AY532374 (CPR de Arnni majus); n.° acesso do GenBank AG211221 (CPR de Oryza sativa); e n.° acesso do GenBank AF024635 (CPR de Petroselinum crispum) .
Em algumas concretizações, uma célula hospedeira geneticamente modificada do invento é uma célula hospedeira que normalmente não sintetiza pirofosfato de isopentenilo (IPP) nem mevalonato por meio de uma via do mevalonato. A via do mevalonato compreende: (a) condensação de duas moléculas de acetil-CoA em acetoacetil-CoA; (b) condensação de acetoacetil-CoA com acetil-CoA para formar HMG-CoA; (c) conversão de HMG-CoA em mevalonato; (d) fosforilação de mevalonato em mevalonato-5-fosfato; (e) conversão de mevalonato-5-fosfato em mevalonato-5-pirofosfato; e (f) conversão de mevalonato-5-pirofosfato em pirofosfato de isopentenilo. As enzimas da via do mevalonato necessárias para a produção de IPP variam consoante as condições de cultura.
Como referido acima, em algumas concretizações, uma célula hospedeira geneticamente modificada do invento é uma célula hospedeira que normalmente não sintetiza pirofosfato de isopentenilo (IPP) nem mevalonato por meio de uma via do mevalonato. Em algumas destas concretizações, a célula hospedeira está geneticamente modificada com um vector de expressão do invento compreendendo um ácido nucleico do invento que codifica uma enzima de modificação de isoprenóides; e a célula hospedeira está geneticamente modificada com um ou mais ácidos nucleicos heterólogos compreendendo sequências nucleotidicas que codificam acetoacetil-CoA-tiolase, hidroximetilglutaril-CoA-sintase (HMGS), hidroximetilglutaril-CoA-redutase (HMGR), mevalonato-cinase (MK), fosfomevalonato-cinase (PMK) e pirofosfato de mevalonato-descarboxilase (MPD) (e opcionalmente também IPP- 47 ΕΡ 1 919 514/ΡΤ isomerase). Em muitas destas concretizações, a célula hospedeira está geneticamente modificada com um vector de expressão compreendendo uma sequência nucleotidica que codifica uma CPR. Em algumas destas concretizações, a célula hospedeira está geneticamente modificada com um vector de expressão do invento compreendendo um ácido nucleico do invento que codifica uma enzima de modificação de isoprenóides; e a célula hospedeira está geneticamente modificada com um ou mais ácidos nucleicos heterólogos compreendendo sequências nucleotídicas que codificam MK, PMK, MPD (e opcionalmente também IPP-isomerase). Em muitas destas concretizações, a célula hospedeira está geneticamente modificada com um vector de expressão compreendendo uma sequência nucleotidica que codifica uma CPR.
Em algumas concretizações, uma célula hospedeira geneticamente modificada do invento é uma célula hospedeira que normalmente não sintetiza IPP nem mevalonato por meio de uma via do mevalonato; a célula hospedeira está geneticamente modificada com um vector de expressão do invento compreendendo um ácido nucleico do invento que codifica uma enzima de modificação de isoprenóides; e a célula hospedeira está geneticamente modificada com um ou mais ácidos nucleicos heterólogos compreendendo sequências nucleotídicas que codificam acetoacetil-CoA-tiolase, HMGS, HMGR, MK, PMK, MPD, IPP-isomerase e uma preniltransferase. Em muitas destas concretizações, a célula hospedeira está geneticamente modificada com um vector de expressão compreendendo uma sequência nucleotidica que codifica uma CPR. Em algumas concretizações, uma célula hospedeira geneticamente modificada do invento é uma célula hospedeira que normalmente não sintetiza IPP nem mevalonato por meio de uma via do mevalonato; a célula hospedeira está geneticamente modificada com um vector de expressão do invento compreendendo um ácido nucleico do invento que codifica uma enzima de modificação de isoprenóides; e a célula hospedeira está geneticamente modificada com um ou mais ácidos nucleicos heterólogos compreendendo sequências nucleotídicas que codificam MK, PMK, MPD, IPP-isomerase e uma preniltransferase. Em muitas destas concretizações, a célula hospedeira está geneticamente modificada com um vector de expressão compreendendo uma sequência nucleotidica que codifica uma CPR. 48 ΕΡ 1 919 514/ΡΤ
Em algumas concretizações, uma célula hospedeira geneticamente modificada do invento é uma célula que normalmente sintetiza IPP ou mevalonato por meio de uma via do mevalonato, por exemplo, a célula hospedeira é uma célula que compreende uma via do mevalonato endógena. Em algumas destas concretizações, a célula hospedeira é uma célula de levedura. Em algumas destas concretizações, a célula hospedeira é Saccharomyces cerevisiae.
Em algumas concretizações, uma célula hospedeira geneticamente modificada do invento está adicionalmente modificada geneticamente com um ou mais ácidos nucleicos compreendendo sequências nucleotidicas que codificam uma desidrogenase ou desidrogenases, em que a desidrogenase modifica adicionalmente um composto isoprenóide. A desidrogenase codificada poderá ser uma desidrogenase encontrada naturalmente numa célula procariótica ou numa célula eucariótica ou poderá ser uma variante de tal desidrogenase. Em algumas concretizações, o presente invento proporciona ácidos nucleicos isolados compreendendo sequências nucleotidicas que codificam estas desidrogenases. Ácidos nucleicos da via do mevalonato
As sequências nucleotidicas que codificam produtos génicos da via do MEV são conhecidas na técnica e qualquer sequência nucleotidica conhecida que codifica um produto génico da via do MEV pode ser utilizada para produzir uma célula hospedeira geneticamente modificada do invento. Por exemplo, as sequências nucleotidicas que codificam acetoacetil-CoA-tiolase, HMGS, HMGR, MK, PMK, MPD e IDI são conhecidas na técnica. As sequências seguintes são exemplos não limitantes de sequências nucleotidicas conhecidas que codificam produtos génicos da via do MEV, com os números de acesso do GenBank e o respectivo organismo entre parêntesis após cada enzima da via do MEV: acetoacetil-CoA-tiolase: (NC_000913 REGIÃO: 2324131..2325315; E. coli), (D49362;
Paracoccus denitrificans) e (L20428; Saccharomyces cerevisiae) ; HMGS: (NC_001145; complemento 19061..20536;
Saccharomyces cerevisiae) , (X96617; Saccharomyces cerevisiae) , (X83882; Arabidopsis thalíana), (AB037907;
Kitasatospora griseola) e (BT007302; Homo sapiens); HMGR: 49
ΕΡ 1 919 514/PT (ΝΜ_206548; Drosophila melanogaster) , (NM_204485; Gallus gallus), (AB015627; Streptomyces sp. KO-3988) , (AF542543;
Nicotiana attenuata) , (AB037907; Kitasatospora griseola) , (AX128213, fornecendo a sequência que codifica uma HMGR truncada; Saccharomyces cerevisiae) e (NC_001145: complemento (115734..118898; Saccharomyces cerevisiae)); MK: (L77688; Arabidopsis thaliana) e (X55875; Saccharomyces cerevisiae); PMK: (AF429385; Hevea brasiliensis), (NM_006556; Homo sapiens), (NC_001145. complemento 712315..713670;
Saccharomyces cerevisiae); MPD: (X97557; Saccharomyces cerevisiae) , (AF290095; Enterococcus faecium) e (U49260; Homo sapiens); e IDI: (NC_000913, 3031087..3031635; E. coli) e (AF082326; Haematococcus pluvialis).
Em algumas concretizações, a região codificante de HMGR codifica uma forma truncada de HMGR ("tHMGR") que não possui o domínio transmembranar de HMGR de tipo selvagem. O domínio transmembranar de HMGR contém as porções reguladoras da enzima e não possui qualquer actividade catalítica. A sequência codificante de qualquer enzima conhecida da via do MEV poderá ser alterada de várias formas conhecidas na técnica, para produzir modificações orientadas na sequência de aminoácidos da enzima codificada. A sequência de aminoácidos de uma enzima variante da via do MEV será, em geral, substancialmente similar à sequência de aminoácidos de qualquer enzima conhecida da via do MEV, isto é, diferirá em pelo menos um aminoácido e poderá diferir em pelo menos dois, pelo menos 5, pelo menos 10 ou pelo menos 20 aminoácidos, mas tipicamente em não mais de cerca de cinquenta aminoácidos. As modificações de sequência poderão ser substituições, inserções ou deleções. Por exemplo, como descrito abaixo, a sequência nucleotídica pode ser alterada para as preferências de codões de uma célula hospedeira particular. Além disso, é possível introduzir uma ou mais diferenças na sequência nucleotídica que resultam em modificações conservativas de aminoácidos na proteína codificada.
Preniltransferases
Em algumas concretizações, uma célula hospedeira geneticamente modificada do invento está geneticamente 50
ΕΡ 1 919 514/PT modificada para incluir um ácido nucleico compreendendo uma sequência nucleotidica que codifica uma enzima de modificação de isoprenóides; e em algumas concretizações está também geneticamente modificada para incluir um ou mais ácidos nucleicos compreendendo sequência (s) nucleotidica(s) que codifica (m) uma ou mais enzimas da via do mevalonato, como descrito acima; e um ácido nucleico compreendendo uma sequência nucleotidica que codifica uma preniltransferase.
As preniltransferases constituem um grupo amplo de enzimas que catalisam a condensação consecutiva de IPP, resultando na formação de difosfatos de prenilo com vários comprimentos de cadeia. As preniltransferases adequadas incluem enzimas que catalisam a condensação de IPP com substratos iniciadores alilicos para formar compostos isoprenóides com cerca de 2 unidades isoprénicas até cerca de 6.000 unidades isoprénicas ou mais, por exemplo, 2 unidades isoprénicas (pirofosfato de geranilo-sintase) , 3 unidades isoprénicas (pirofosfato de farnesilo-sintase), 4 unidades isoprénicas (pirofosfato de geranilgeranilo-sintase), 5 unidades isoprénicas, 6 unidades isoprénicas (pirofosfato de hexadecilo-sintase), 7 unidades isoprénicas, 8 unidades isoprénicas (fitoeno-sintase, pirofosfato de octaprenilo-sintase), 9 unidades isoprénicas (pirofosfato de nonaprenilo-sintase), 10 unidades isoprénicas (pirofosfato de decaprenilo-sintase), entre cerca de 10 unidades isoprénicas e cerca de 15 unidades isoprénicas, entre cerca de 15 unidades isoprénicas e cerca de 20 unidades isoprénicas, entre cerca de 20 unidades isoprénicas e cerca de 25 unidades isoprénicas, entre cerca de 25 unidades isoprénicas e cerca de 30 unidades isoprénicas, entre cerca de 30 unidades isoprénicas e cerca de 40 unidades isoprénicas, entre cerca de 40 unidades isoprénicas e cerca de 50 unidades isoprénicas, entre cerca de 50 unidades isoprénicas e cerca de 100 unidades isoprénicas, entre cerca de 100 unidades isoprénicas e cerca de 250 unidades isoprénicas, entre cerca de 250 unidades isoprénicas e cerca de 500 unidades isoprénicas, entre cerca de 500 unidades isoprénicas e cerca de 1.000 unidades isoprénicas, entre cerca de 1.000 unidades isoprénicas e cerca de 2.000 unidades isoprénicas, entre cerca de 2.000 unidades isoprénicas e cerca de 3.000 unidades isoprénicas, entre cerca de 3.000 unidades isoprénicas e 51 ΕΡ 1 919 514/PT cerca de 4.000 unidades isoprénicas, entre cerca de 4.000 unidades isoprénicas e cerca de 5.000 unidades isoprénicas ou entre cerca de 5.000 unidades isoprénicas e cerca de 6.000 unidades isoprénicas ou mais.
As preniltransferases adequadas incluem, embora não estejam limitadas a estes exemplos, uma difosfato de E-isoprenilo-sintase, incluindo, embora não limitada a, difosfato de geranilo (GPP)-sintase, difosfato de farnesilo (FPP)-sintase, difosfato de geranilgeranilo (GGPP)-sintase, difosfato de hexaprenilo (HexPP)-sintase, difosfato de heptaprenilo (HepPP)-sintase, difosfato de octaprenilo (OPP)-sintase, difosfato de solanesilo (SPP)-sintase, difosfato de decaprenilo (DPP)-sintase, chicle-sintase e guta-percha-sintase; e uma difosfato de Z-isoprenilo-sintase, incluindo, embora não limitada a, difosfato de nonaprenilo (NPP)-sintase, difosfato de undecaprenilo (UPP)-sintase, difosfato de desidrodoliquilo-sintase, difosfato de eicosaprenilo-sintase, sintase da borracha natural e outras difosfato de Z-isoprenilo-sintases.
As sequências nucleotídicas de numerosas preniltransferases de uma variedade de espécies são conhecidas e podem ser utilizadas ou modificadas para utilização na produção de uma célula hospedeira geneticamente modificada do invento. As sequências nucleotidicas que codificam preniltransferases são conhecidas na técnica. Ver, por exemplo, o ARNm de pirofosfato de farnesilo-sintetase humana (N.° de acesso do GenBank J05262; Homo sapiens); o gene de difosfato de farnesilo-sintetase (FPP) (N.° de acesso do GenBank J05091; Saccharomyces cerevisiae); o gene de difosfato de isopentenilo:difosfato de dimetilalilo-isomerase (J05090; Saccharomyces cerevisiae); Wang & Ohnuma (2000) Biochim. Biophys. Acta 1529:33-48; Patente U.S. n.° 6,645,747; o ARNm de pirofosfato de farnesilo-sintetase 2 (FPS2) / FPP-sintetase 2 / difosfato de farnesilo-sintase 2 de Arabidopsis thaliana (At4gl7190) (N.° de acesso do GenBank NM_202836); o ARNm de difosfato de geranilgeranilo-sintase (ggpps) de Ginkgo biloba (N.° de acesso do GenBank AY371321); o ARNm de pirofosfato de geranilgeranilo-sintase (GGPS1) / GGPP-sintetase / farnesiltranstransferase de Arabidopsis thaliana (At4g36810) (N.° de acesso do GenBank NM 119845); o 52 ΕΡ 1 919 514/PT gene de Synechococcus elongatus para difosfato de farnesilo-, difosfato de geranilgeranilo-, difosfato de geranilfarnesilo, difosfato de hexaprenilo- e difosfato de heptaprenilo-sintase (SelF-HepPS) (N.° de acesso do GenBank AB016095); etc.
Terpeno-sintases
Em algumas concretizações, uma célula hospedeira geneticamente modificada do invento está geneticamente modificada para incluir um ácido nucleico compreendendo uma sequência nucleotídica que codifica uma terpeno-sintase. Em algumas concretizações, a terpeno-sintase é uma enzima que modifica FPP para gerar um sesquiterpeno. Em outras concretizações, a terpeno-sintase é uma enzima que modifica GPP para gerar um monoterpeno. Em outras concretizações, a terpeno-sintase é uma enzima que modifica GGPP para gerar um diterpeno.
As sequências nucleotidicas que codificam terpeno-sintases são conhecidas na técnica e é possível utilizar qualquer sequência nucleotídica que codifica uma terpeno-sintase conhecida para modificar geneticamente uma célula hospedeira. Por exemplo, as seguintes sequências nucleotidicas que codificam terpeno-sintases, seguidas dos respectivos números de acesso do GenBank e dos organismos em que foram identificadas, são conhecidas e podem ser utilizadas: o ARNm de (-)-germacreno D-sintase (AY438099; Populus balsamifera subsp. trichocarpa x Populus deltoids); o ARNm de E,E-alfa-farneseno-sintase (AY640154; Cucumis sativus); o ARNm de 1,8-cineol-sintase (AY691947; Arabidopsis thaliana); o ARNm de terpeno-sintase 5 (TPS5) (AY518314; Zea mays); o ARNm de terpeno-sintase 4 (TPS4) (AY518312; Zea mays); o ARNm de mirceno/ocimeno-sintase (TPS10) (At2g24210) (NM_127982; Arabidopsis thaliana); o ARNm de geraniol-sintase (GES) (AY362553; Ocimum basilicum); o ARNm de pineno-sintase (AY237645; Picea sitchensis); o ARNm de mirceno-sintase le20 (AY195609; Antirrhinum majus); o ARNm de (E)-β-ocimeno-sintase (0e23) (AY195607; Antirrhinum majus); o ARNm de Ε-β-ocimeno-sintase (AY151086; Antirrhinum majus); o ARNm de terpeno-sintase (AF497492; Arabidopsis thaliana); o ARNm de (-)-canfeno-sintase (AG6.5) (U87910; Abies grandis); o gene de (-)-4S-limoneno-sintase (por exemplo, sequência genómica) 53
ΕΡ 1 919 514/PT (AF326518; Abies grandis); o gene de delta-selineno-sintase (AF326513; Abies grandis); o ARNm de amorfa-4,11-dieno-sintase (AJ251751; Artemísia annua); o ARNm de E-a-bisaboleno-sintase (AF006195; Abies grandis); o ARNm de gama-humuleno-sintase (U92267; Abies grandis); o ARNm de õ-selineno-sintase (U92266; Abies grandis); o ARNm de pineno-sintase (AG3.18) (U87909; Abies grandis); o ARNm de mirceno- sintase (AG2.2) (U87908; Abies grandis); etc.
Utilização de codões
Em algumas concretizações, uma sequência nucleotidica utilizada para produzir uma célula hospedeira geneticamente modificada do invento é modificada de modo que a sequência nucleotidica reflicta a preferência de codões da célula hospedeira particular. Por exemplo, em algumas concretizações, a sequência nucleotidica será modificada para as preferências de codões de levedura. Ver, por exemplo, Bennetzen and Hall (1982) J. Biol. Chem. 257(6): 3026-3031.
Como outro exemplo não limitante, em outras concretizações, a sequência nucleotidica será modificada para as preferências de codões de E. coli. Ver, por exemplo, Gouy & Gautier (1982) Nucleic Acids Res. 10(22):7055-7074,- Eyre-Walker (1996) Mol. Biol. Evol. 13(6):864-872. Ver também Nakamura et al. (2000)
Nucleic Acids Res. 28(1):292.
Modificações genéticas adicionais
Em algumas concretizações, uma célula hospedeira geneticamente modificada do invento é uma célula que está geneticamente modificada para incluir um ou mais ácidos nucleicos compreendendo sequência(s) nucleotidica(s) que codifica(m) uma enzima de modificação de isoprenóides; e que está adicionalmente modificada geneticamente para permitir uma maior produção de um intermediário da via biossintética de terpenos e/ou que está adicionalmente modificada geneticamente de modo que um gene da via biossintética endógena de terpenos esteja funcionalmente desactivado. O termo "funcionalmente desactivado", tal como aqui utilizado no contexto de um gene da via biossintética endógena de terpenos, refere-se a uma modificação genética de um gene da via biossintética de terpenos, em que a modificação resulta 54 ΕΡ 1 919 514/PT na produção de um produto génico codificado pelo gene que é produzido em quantidades abaixo do normal e/ou é não funcional.
As modificações genéticas que melhoram a produção de um intermediário da via biossintética endógena de terpenos incluem, embora não estejam limitadas a estas, modificações genéticas que resultam numa quantidade e/ou actividade reduzidas de uma fosfotransacetilase na célula hospedeira. A concentração intracelular de um intermediário da via biossintética de terpenos é reforçada mediante o aumento da concentração intracelular de acetil-CoA. E. coli segrega uma fracção significativa de acetil-CoA intracelular para o meio sob a forma de acetato. A eliminação do gene que codifica a fosfotransacetilase, pta, a primeira enzima responsável por transformar a acetil-CoA em acetato, reduz a secreção de acetato. As modificações genéticas que reduzem a quantidade e/ou a actividade de fosfotransacetilase numa célula hospedeira procariótica são particularmente úteis quando a célula hospedeira geneticamente modificada é uma célula que está geneticamente modificada com um ácido nucleico que compreende sequências nucleotidicas que codificam um ou mais produtos génicos da via do MEV.
Em algumas concretizações, uma modificação genética que resulta numa quantidade reduzida de fosfotransacetilase numa célula hospedeira procariótica é uma mutação genética que desactiva funcionalmente o gene pta endógeno da célula hospedeira procariótica, que codifica a fosfotransacetilase. 0 gene pta pode ser funcionalmente desactivado de uma variedade de formas, que incluem a inserção de um elemento genético móvel (por exemplo, um transposão, etc.); a eliminação da totalidade ou de parte do gene, de modo que o produto génico não seja produzido ou esteja truncado e seja não funcional na conversão de acetil-CoA em acetato; a mutação do gene de modo que o produto génico não seja produzido ou esteja truncado e seja não funcional na conversão de acetil-CoA em acetato; a eliminação ou mutação de um ou mais elementos de controlo que controlam a expressão do gene pta, de modo que o produto génico não seja produzido; e similares. 55 ΕΡ 1 919 514/ΡΤ
Em algumas concretizações, o gene pta endógeno de uma célula hospedeira geneticamente modificada é eliminado. Qualquer método de eliminação de genes pode ser utilizado. Um exemplo não limitante de um método de eliminação de um gene pta consiste em utilizar o sistema de recombinação XRed. Datsenko & Wanner (2000) Proc Natl Acad Sei USA 97(12): p. 6640-5. Em algumas concretizações, o gene pta será eliminado de uma célula hospedeira (por exemplo, E. coli) que está geneticamente modificada com um ácido nucleico compreendendo sequências nucleotidicas que codificam MK, PMK, MPD e IDI. Em algumas concretizações, o gene pta será eliminado de uma célula hospedeira (por exemplo, E. coli) que está geneticamente modificada com um ácido nucleico compreendendo sequências nucleotidicas que codificam MK, PMK, MPD e IPP. Em algumas concretizações, o gene pta será eliminado de uma célula hospedeira (por exemplo, E. coli) que está geneticamente modificada com um ácido nucleico compreendendo sequências nucleotidicas que codificam MK, PMK, MPD, IPP e uma preniltransferase.
Em algumas concretizações, uma célula hospedeira geneticamente modificada do invento é uma célula que está geneticamente modificada para incluir um ou mais ácidos nucleicos compreendendo sequência(s) nucleotidica(s) que codifica(m) produto(s) génico(s) da via biossintética do MEV; e que está adicionalmente modificada geneticamente de forma que um gene da via biossintética endógena da DXP esteja funcionalmente desactivado. Em outras concretizações, uma célula hospedeira geneticamente modificada do invento é uma célula que está geneticamente modificada para incluir um ou mais ácidos nucleicos compreendendo sequência(s) nucleotidica(s) que codifica(m) produto(s) génico(s) da via biossintética da DXP; e que está adicionalmente modificada geneticamente de forma que um gene da via biossintética endógena do MEV esteja funcionalmente desactivado.
Em algumas concretizações, quando a célula hospedeira geneticamente modificada do invento é uma célula hospedeira procariótica que está geneticamente modificada com ácido(s) nucleico (s) compreendendo sequências nucleotidicas que codificam um ou mais produtos génicos da via do MEV, a célula hospedeira estará adicionalmente modificada geneticamente de 56 ΕΡ 1 919 514/ΡΤ forma que um ou mais genes da via endógena da DXP estejam funcionalmente desactivados. Os genes da via da DXP que podem ser funcionalmente desactivados incluem um ou mais dos genes que codificam qualquer um dos seguintes produtos génicos de DXP: l-desoxi-D-xilulose-5-fosfato-sintase, 1-desoxi-D-xilulose-5-fosfato-redutoisomerase, 4-difosfocitidil-2-C-metil-D-eritritol-sintase, 4-difosfocitidil-2-C-metil-D-eritritol-cinase, 2C-metil-D-eritritol-2,4-ciclodifosfato-sintase e l-hidroxi-2-metil-2-(E)-butenil-4-difosfato-sintase.
Um gene da via endógena da DXP pode ser funcionalmente desactivado de uma variedade de formas, que incluem a inserção de um elemento genético móvel (por exemplo, um transposão, etc.); a eliminação da totalidade ou de parte do gene, de modo que o produto génico não seja produzido ou esteja truncado e seja enzimaticamente inactivo; a mutação do gene de modo que o produto génico não seja produzido ou esteja truncado e seja enzimaticamente não funcional; a eliminação ou mutação de um ou mais elementos de controlo que controlam a expressão do gene, de modo que o produto génico não seja produzido; e similares.
Em outras concretizações, quando a célula hospedeira geneticamente modificada do invento é uma célula hospedeira procariótica que está geneticamente modificada com ácido(s) nucleico(s) compreendendo sequências nucleotídicas que codificam um ou mais produtos génicos da via da DXP, a célula hospedeira estará adicionalmente modificada geneticamente de forma que um ou mais genes da via endógena do MEV estejam funcionalmente desactivados. Os genes da via endógena do MEV que podem ser funcionalmente desactivados incluem um ou mais dos genes que codificam qualquer um dos seguintes produtos génicos de MEV: HMGS, HMGR, MK, PMK, MPD e IDI. Um gene da via endógena do MEV pode ser funcionalmente desactivado de uma variedade de formas, que incluem a inserção de um elemento genético móvel (por exemplo, um transposão, etc.); a eliminação da totalidade ou de parte do gene, de modo que o produto génico não seja produzido ou esteja truncado e seja enzimaticamente inactivo; a mutação do gene de modo que o produto génico não seja produzido ou esteja truncado e seja enzimaticamente não funcional; a eliminação ou mutação de um 57 ΕΡ 1 919 514/ΡΤ ou mais elementos de controlo que controlam a expressão do gene, de modo que o produto génico não seja produzido; e similares.
Composições compreendendo uma célula hospedeira geneticamente modificada do invento 0 presente invento proporciona adicionalmente composições que compreendem uma célula hospedeira geneticamente modificada do invento. Uma composição do invento compreende uma célula hospedeira geneticamente modificada do invento e, em algumas concretizações, compreenderá um ou mais componentes adicionais, em que estes componentes são seleccionados com base, em parte, na utilização prevista da célula hospedeira geneticamente modificada. Os componentes adequados incluem, embora não estejam limitados a estes, sais, tampões, estabilizadores, agentes de inibição de proteases, agentes de inibição de nucleases, compostos conservantes da membrana celular e/ou da parede celular, por exemplo, glicerol, dimetilsulfóxido, etc.; meios nutritivos apropriados para a célula e similares. Em algumas concretizações, as células estão liofilizadas.
Plantas transgénicas
Em algumas concretizações, um ácido nucleico do invento ou um vector de expressão do invento (por exemplo, um ácido nucleico de uma enzima de modificação de isoprenóides do invento ou um vector de expressão do invento compreendendo um ácido nucleico de uma enzima de modificação de isoprenóides) é utilizado como um transgene para gerar uma planta transgénica que produz a enzima de modificação de isoprenóides codificada. Assim, o presente invento disponibiliza adicionalmente uma planta transgénica, em que a planta inclui um transgene compreendendo um ácido nucleico do invento que compreende uma sequência nucleotidica que codifica uma enzima que apresenta uma actividade de terpeno-hidroxilase e/ou terpeno-oxidase, como descrito acima. Em algumas concretizações, o genoma da planta transgénica compreende um ácido nucleico do invento. Em algumas concretizações, a planta transgénica é homozigota quanto à 58
ΕΡ 1 919 514/PT modificação genética. Em algumas concretizações, a planta transgénica é heterozigota quanto à modificação genética.
Em algumas concretizações, uma planta transgénica do invento produz um polipéptido codificado pelo transgene que apresenta uma actividade de terpeno-hidroxilase e/ou terpeno-oxidase, numa quantidade que é pelo menos cerca de 50%, pelo menos cerca de 2x, pelo menos cerca de 5x, pelo menos cerca de lOx, pelo menos cerca de 25x, pelo menos cerca de 50x, pelo menos cerca de lOOx, ou mais, a quantidade do polipéptido produzida por uma planta de controlo, por exemplo, uma planta não transgénica (uma planta que não inclui o transgene que codifica o polipéptido) da mesma espécie.
Em algumas concretizações, uma planta transgénica do invento é uma versão transgénica de uma planta não transgénica de controlo que normalmente produz um composto isoprenóide que é gerado por, ou é um produto a jusante de, um polipéptido codificado pelo transgene que apresenta uma actividade de terpeno-hidroxilase e/ou terpeno-oxidase; em que a planta transgénica produz o composto isoprenóide numa quantidade que é pelo menos cerca de 50%, pelo menos cerca de 2x, pelo menos cerca de 5x, pelo menos cerca de lOx, pelo menos cerca de 25x, pelo menos cerca de 50x, pelo menos cerca de lOOx, ou mais, a quantidade do composto isoprenóide produzida pela planta de controlo, por exemplo, uma planta não transgénica (uma planta que não inclui o transgene que codifica o polipéptido) da mesma espécie.
Os métodos de introdução de ácidos nucleicos exógenos em células de planta são bem conhecidos na técnica. Estas células de planta são consideradas "transformadas", como definido acima. Os métodos adequados incluem a infecção virai (por exemplo, virus de ADN de cadeia dupla), a transfecção, a conjugação, a fusão de protoplastos, a electroporação, a tecnologia de bombardeamento com partículas, a precipitação com fosfato de cálcio, a microinjecção directa, a tecnologia de "whiskers" (fibras curtas) de carboneto de silício, a transformação mediada por Agrobacterium e métodos idênticos. A escolha do método está geralmente dependente do tipo de célula que está a ser transformada e das circunstâncias em 59 ΕΡ 1 919 514/ΡΤ que a transformação está a ter lugar (isto é, in vitro, ex vivo ou in vivo) .
Os métodos de transformação baseados na bactéria do solo Agrobacterium tumefaciens são particularmente úteis para introduzir uma molécula de ácido nucleico exógeno numa planta vascular. A forma de tipo selvagem de Agrobacterium contém um plasmideo Ti (indutor de tumor) que dirige a produção do crescimento de tumores ("crown galls") em plantas hospedeiras. A transferência da região de T-ADN indutora de tumores do plasmideo Ti para o genoma de uma planta necessita dos genes de virulência codificados pelo plasmideo Ti, assim como das fronteiras de T-ADN, que são um conjunto de repetições de ADN directo que delineiam a região que será transferida. Um vector à base de Agrobacterium é uma forma modificada de um plasmideo Ti, em que as funções indutoras de tumores são substituídas pela sequência de ácido nucleico de interesse que será introduzida na planta hospedeira. A transformação mediada por Agrobacterium utiliza geralmente vectores co-integrados ou, preferencialmente, sistemas de vectores binários, em que os componentes do plasmideo Ti são divididos entre um vector auxiliar, que reside permanentemente no hospedeiro Agrobacterium e transporta os genes de virulência, e um vector vaivém, que contém o gene de interesse ligado por sequências de T-ADN. Uma variedade de vectores binários é bem conhecida na técnica e está disponível comercialmente, por exemplo, através de Clontech (Paio Alto, Califórnia). Os métodos de co-cultura de Agrobacterium com células de planta em cultura ou tecidos danificados como tecido de folhas, explantes de raiz, hipocotilédones, porções do caule ou tubérculos, por exemplo, também são bem conhecidos na técnica. Ver, por exemplo, Glick & Thompson, (eds.), Methods in Plant Molecular Biology and Biotechnology, Boca Raton, Fia.: CRC Press (1993). A transformação mediada por Agrobacterium é útil para produzir uma variedade de plantas vasculares transgénicas (Wang et al., acima, 1995), incluindo pelo menos uma espécie de Eucalyptus e legumes de forragem como a alfafa (luzerna); comichão, trevo branco, Stylosanthes, Lotononis bainessii e sanfeno. 60
ΕΡ 1 919 514/PT A transformação mediada por microprojécteis também pode ser utilizada para produzir uma planta transgénica do invento. Este método, inicialmente descrito por Klein et al. (Nature 327:70-73 (1987)), assenta em microprojécteis, como ouro ou tungsténio, que são revestidos com a molécula de ácido nucleico desejada por precipitação com cloreto de cálcio, espermidina ou polietilenoglicol. As partículas de microprojécteis são aceleradas a alta velocidade para um tecido de angiospérmica, utilizando um dispositivo como o BIOLISTIC PD-1000 (Biorad; Hercules, Califórnia).
Um ácido nucleico do invento poderá ser introduzido numa planta de uma maneira que o ácido nucleico seja capaz de entrar na(s) célula(s) da planta, por exemplo, via um protocolo in vivo ou ex vivo. Pelo termo "in vivo", pretende dizer-se que o ácido nucleico é administrado a um corpo vivo de uma planta, por exemplo, infiltração. Pelo termo "ex vivo", pretende dizer-se que as células ou os explantes são modificados fora da planta e depois estas células ou órgãos são regenerados para uma planta. Alguns vectores adequados para a transformação estável de células de planta ou para o estabelecimento de plantas transgénicas já foi descrito, incluindo aqueles descritos em Weissbach & Weissbach, (1989) Methods for Plant Molecular Biology Academic Press; e Gelvin et al., (1990) Plant Molecular Biology Manual, Kluwer Academic Publishers. Os exemplos específicos incluem aqueles derivados de um plasmídeo Ti de Agrobacterium tumefaciens, assim como aqueles descritos por Herrera-Estrella et al. (1983) Nature 303: 209; Bevan (1984) Nucl Acid Res. 12: 8711-8721; Klee (1985) Bio/Technolo 3: 637-642. Em alternativa, é possível utilizar vectores distintos de Ti para transferir o ADN para plantas e células mediante a utilização de técnicas de entrega de ADN livre. Utilizando estes métodos, plantas transgénicas como trigo, arroz (Christou (1991) Bio/Technology 9:957-962) e milho (Gordon-Kamm (1990) Plant Cell 2: 603-618) podem ser produzidas. Um embrião imaturo também pode ser um bom tecido-alvo das monocotiledóneas para as técnicas de entrega directa de ADN utilizando a pistola de partículas (Weeks et al. (1993) Plant Physiol 102: 1077-1084; Vasil (1993) Bio/Technolo 10: 667-674; Wan & Lemeaux (1994) Plant Physiol 104: 37-48) e para a transferência de ADN mediada por Agrobacterium (Ishida et al. (1996) Nature 61
ΕΡ 1 919 514/PT
Biotech 14: 745-750). Os métodos exemplificativos de introdução de ADN em cloroplastos são o bombardeamento biolístico, a transformação de protoplastos com polietilenoglicol e a microinjecção (Danieli et al., Nat. Biotechnol 16:345-348, 1998; Staub et al., Nat. Biotechnol 18: 333-338, 2000; 0'Neill et al., Plant J. 3:729-738, 1993; Knoblauch et al., Nat. Biotechnol 17: 906-909; Patente U.S. n.° 5,451,513; 5,545,817; 5,545,818 e 5,576,198; no Pedido Internacional n.° WO 95/16783; e em Boynton et al., Methods in Enzymology 217: 510-536 (1993); Svab et al., Proc. Natl. Acad. Sei. USA 90: 913-917 (1993); e McBride et al., Proc. Nati. Acad. Sei. USA 91: 7301-7305 (1994)). Qualquer vector adequado para os métodos de bombardeamento biolístico, transformação de protoplastos com polietilenoglicol e microinjecção será apropriado como vector de direccionamento para a transformação de cloroplastos. Qualquer vector de ADN de cadeia dupla poderá ser utilizado como vector de transformação, especialmente quando o método de introdução não utiliza Agrobacterium.
As plantas que podem ser geneticamente modificadas incluem cereais, culturas de forragem, frutos, vegetais, culturas oleaginosas, palmas, silviculturas e vinhas. Seguem-se exemplos específicos de plantas que podem ser modificadas: maís, banana, amendoim, ervilhas-forrageiras, girassol, tomate, colza, tabaco, trigo, cevada, aveia, batata, rebentos de soja, algodão, craveiro, sorgo, tremoço e arroz. Outros exemplos incluem Artemísia annua ou outras plantas conhecidas por produzirem compostos isoprenóides de interesse. O presente invento também disponibiliza células de planta transformadas e tecidos, plantas e produtos que contêm as células de planta transformadas. Uma característica das células transformadas do invento e dos tecidos e produtos que as incluem é a presença de um ácido nucleico do invento integrado no genoma e a produção pelas células de planta de um polipéptido que apresenta uma actividade de terpeno-hidroxilase e/ou terpeno-oxidase, por exemplo, uma sesquiterpeno-oxidase. As células de planta recombinantes do presente invento são úteis como populações de células recombinantes, ou como um tecido, semente, planta completa, 62 ΕΡ 1 919 514/PT caule, fruto, folha, raiz, flor, pecíolo, tubérculo, grão, ração para animais, um campo de plantas e similares. 0 presente invento também disponibiliza material reprodutivo de uma planta transgénica do invento, em que o material reprodutivo inclui sementes, plantas da descendência e material clonal.
MÉTODOS DE PRODUÇÃO DE COMPOSTOS ISOPRENÓIDES 0 presente invento disponibiliza um método de produção de um composto isoprenóide. Em algumas concretizações, os métodos geralmente envolvem a cultura de uma célula hospedeira geneticamente modificada num meio adequado, em que a referida célula hospedeira está geneticamente modificada com um ácido nucleico do invento compreendendo uma sequência nucleotidica que codifica uma enzima de modificação de isoprenóides. Em outras concretizações, os métodos geralmente envolvem a manutenção de uma planta transgénica do invento em condições que favorecem a produção da enzima de modificação de isoprenóides codificada. A produção da enzima de modificação de isoprenóides resulta na produção do composto isoprenóide. Por exemplo, em algumas concretizações, os métodos geralmente envolvem a cultura de uma célula hospedeira geneticamente modificada num meio adequado, em que a referida célula hospedeira está geneticamente modificada com um ácido nucleico do invento compreendendo uma sequência nucleotidica que codifica uma terpeno-oxidase. A produção da terpeno-oxidase resulta na produção do composto isoprenóide. Tipicamente, o método é realizado in vitro, embora a produção in vivo de um composto isoprenóide também esteja contemplada. Em algumas destas concretizações, a célula hospedeira é uma célula eucariótica, por exemplo, uma célula de levedura. Em outras concretizações, a célula hospedeira é uma célula procariótica. Em algumas destas concretizações, a célula hospedeira é uma célula de planta. Em algumas concretizações, o método é realizado numa planta transgénica do invento.
As células utilizam normalmente uma de duas vias para gerar isoprenóides ou precursores de isoprenóides (por exemplo, IPP, difosfatos de poliprenilo, etc.). As Figuras 13-15 ilustram as vias utilizadas pelas células para gerar 63 ΕΡ 1 919 514/PT compostos isoprenóides ou precursores como os difosfatos de poliprenilo. A Figura 13 representa as vias de isoprenóides que envolvem a modificação de difosfato de isopentenilo (IPP) e/ou do seu isómero difosfato de dimetilalilo (DMAPP) por preniltransferases para gerar os difosfatos de poliprenilo: difosfato de geranilo (GPP), difosfato de farnesilo (FPP) e difosfato de geranilgeranilo (GGPP) . 0 GPP e o FPP são adicionalmente modificados por terpeno-sintases para gerar monoterpenos e sesquiterpenos, respectivamente; e o GGPP é adicionalmente modificado por terpeno-sintases para gerar diterpenos e carotenóides. 0 IPP e o DMAPP são gerados por uma de duas vias: a via do mevalonato (MEV) e a via da 1-desoxi-D-xilulose-5-fosfato (DXP). A Figura 14 representa esquematicamente a via do MEV, em que a acetil-CoA é convertida em IPP através de uma série de reacções. A Figura 15 representa esquematicamente a via da DXP, em que o piruvato e o D-gliceraldeido-3-fosfato são convertidos em IPP e DMAPP por meio de uma série de reacções. As células eucarióticas que não são células de planta utilizam exclusivamente a via de isoprenóides do MEV para converter a acetil-coenzima A (acetil-CoA) em IPP, que é subsequentemente isomerizado em DMAPP. As plantas utilizam tanto a via do MEV como a via independente do mevalonato, ou via da DXP, para a sintese de isoprenóides. Os procariotas, com algumas excepções, utilizam a via da DXP para produzir IPP e DMAPP separadamente através de um ponto ramificado.
Em algumas concretizações, uma célula hospedeira está geneticamente modificada com um ácido nucleico do invento compreendendo uma sequência nucleotídica que codifica uma sesquiterpeno-oxidase, e a célula hospedeira é crescida num meio que inclui o sesquiterpeno. 0 sesquiterpeno entra na célula, onde é modificado pela sesquiterpeno-oxidase. Em muitas concretizações, o sesquiterpeno é seleccionado entre amorfadieno, aloisolongifoleno, (-)-a-trans-bergamoteno, (-)-β-elemeno, (+)-germacreno A, germacreno B, (+)-γ-gurjuneno, (+)-ledeno, neointermedeol, (+)-β-selineno e (+)-valenceno. 64
ΕΡ 1 919 514/PT
Em algumas concretizações, a sesquiterpeno-oxidase é uma amorfadieno-oxidase, e a célula hospedeira é crescida num meio que inclui a enzima amorfa-4,11-dieno-oxidase.
Em outras concretizações, a célula hospedeira está adicionalmente modificada geneticamente com um ácido nucleico compreendendo uma sequência nucleotidica que codifica uma terpeno-sintase. Assim, por exemplo, a célula hospedeira está geneticamente modificada com um ou mais ácidos nucleicos compreendendo sequências nucleotidicas que codificam uma terpeno-sintase e uma enzima de modificação de isoprenóides (por exemplo, uma sesquiterpeno-oxidase). 0 crescimento desta célula hospedeira num meio de cultura adequado permite a produção da terpeno-sintase e da enzima de modificação de isoprenóides (por exemplo, uma sesquiterpeno-oxidase). Por exemplo, a terpeno-sintase modifica um pirofosfato de farnesilo para gerar um substrato sesquiterpénico para a referida sesquiterpeno-oxidase.
Dependendo do meio de cultura em que a célula hospedeira é cultivada e dependendo de a célula hospedeira sintetizar ou não IPP por meio de uma via da DXP ou por meio de uma via do mevalonato, em algumas concretizações, a célula hospedeira incluirá modificações genéticas adicionais. Por exemplo, em algumas concretizações, a célula hospedeira é uma célula que não possui uma via endógena do mevalonato, por exemplo, a célula hospedeira é uma célula que normalmente não sintetiza IPP nem mevalonato por meio de uma via do mevalonato. Por exemplo, em algumas concretizações, a célula hospedeira é uma célula que normalmente não sintetiza IPP por meio de uma via do mevalonato, e a célula hospedeira está geneticamente modificada com um ou mais ácidos nucleicos compreendendo sequências nucleotidicas que codificam duas ou mais enzimas da via do mevalonato, uma IPP-isomerase, uma preniltransferase, uma terpeno-sintase e uma enzima de modificação de isoprenóides (por exemplo, uma enzima de modificação de isoprenóides codificada por um ácido nucleico do invento). A cultura desta célula hospedeira permite a produção das enzimas da via do mevalonato, da IPP-isomerase, da preniltransferase, da terpeno-sintase e da enzima de modificação de isoprenóides (por exemplo, uma sesquiterpeno-oxidase) . A produção das enzimas da via do mevalonato, da 65
ΕΡ 1 919 514/PT IPP-isomerase, da preniltransferase, da terpeno-sintase e da enzima de modificação de isoprenóides (por exemplo, uma sesquiterpeno-oxidase) resulta na produção de um composto isoprenóide. Em muitas concretizações, a preniltransferase é uma FPP-sintase, que gera um substrato sesquiterpénico para uma sesquiterpeno-oxidase codificada por um ácido nucleico do invento; e a produção da sesquiterpeno-oxidase resulta na oxidação do substrato sesquiterpénico na célula hospedeira. Quaisquer ácidos nucleicos que codificam as enzimas da via do mevalonato, a IPP-isomerase, a preniltransferase e a terpeno-sintase são apropriados para utilização. Por exemplo, ácidos nucleicos adequados estão descritos em, por exemplo, Martin et al. (2003) acima.
Em algumas das concretizações descritas acima, quando a célula hospedeira está geneticamente modificada com um ou mais ácidos nucleicos compreendendo sequências nucleotidicas que codificam duas ou mais enzimas da via do mevalonato, as duas ou mais enzimas da via do mevalonato incluem MK, PMK e MPD, e a célula hospedeira é crescida em meio que inclui mevalonato. Em outras concretizações, as duas ou mais enzimas da via do mevalonato incluem acetoacetil-CoA-tiolase, HMGS, HMGR, MK, PMK e MPD.
Em algumas concretizações, a célula hospedeira é uma célula que normalmente não sintetiza IPP por meio da via do mevalonato, a célula hospedeira está geneticamente modificada da forma descrita acima e a célula hospedeira compreende adicionalmente uma via da DXP funcionalmente desactivada.
Em algumas concretizações, a célula hospedeira está geneticamente modificada com um ácido nucleico compreendendo uma sequência nucleotidica que codifica uma redutase do citocromo P450 (CPR). Conhece-se uma grande variedade de sequências nucleotidicas de CPR e qualquer ácido nucleico que codifica uma CPR conhecida pode ser utilizado, desde que a CPR codificada apresente actividade na transferência de electrões a partir do NADPH. Em algumas concretizações, o ácido nucleico que codifica CPR codifica uma CPR que transfere electrões do NADPH para uma enzima de modificação de isoprenóides, por exemplo, uma sesquiterpeno-oxidase, codificada por um ácido nucleico que codifica uma enzima de 66
ΕΡ 1 919 514/PT modificação de isoprenóides do invento. Em algumas concretizações, o ácido nucleico que codifica uma CPR é um ácido nucleico de CPR do invento.
Um método do invento é útil para produzir uma variedade de compostos isoprenóides, incluindo, embora não estando limitados a, ácido artemisinico (por exemplo, em que o substrato sesquiterpénico é amorfa-4,11-dieno), álcool de aloisolongifoleno (por exemplo, em que o substrato é aloisolongifoleno), (E)-trans-bergamota-2,12-dien-14-ol (por exemplo, em que o substrato é (-)-α-trans-bergamoteno), (-)- elema-1,3,11(13)-trien-12-ol (por exemplo, em que o substrato é (-)-β-elemeno), germacra-1(10),4,11(13)-trien-12-ol (por exemplo, em que o substrato é (+)-germacreno A), álcool de germacreno B (por exemplo, em que o substrato é germacreno B) , 5,11(13)-guaiadieno-12-ol (por exemplo, em que o substrato é (+)-γ-gurjuneno), álcool de ledeno (por exemplo, em que o substrato é (+)-ledeno), 4p-H-eudesm-ll(13)-eno-4,12-diol (por exemplo, em que o substrato é neointermedeol), (+)—β—costol (por exemplo, em que o substrato é (+)-β-selineno) e similares; e derivados adicionais de qualquer um dos compostos anteriores.
Em algumas concretizações, uma célula hospedeira geneticamente modificada do invento é crescida num meio adequado [por exemplo, meio de Luria-Bertani, opcionalmente suplementado com um ou mais agentes adicionais como seja um indutor (por exemplo, quando a sequência nucleotidica que codifica uma enzima de modificação de isoprenóides está sob o controlo de um promotor indutivel), etc.]; e o meio de cultura é coberto com um solvente orgânico, por exemplo, dodecano, formando uma camada orgânica. 0 composto isoprenóide produzido pela célula hospedeira geneticamente modificada sofre partição para o interior da camada orgânica, a partir da qual pode ser purificado. Em algumas concretizações, quando a sequência nucleotidica que codifica uma enzima de modificação de isoprenóides está ligada de forma funcional a um promotor indutivel, adiciona-se um indutor ao meio de cultura e, após um período de tempo adequado, o composto isoprenóide é isolado a partir da camada orgânica que cobre o meio de cultura. 67
ΕΡ 1 919 514/PT
Em algumas concretizações, o composto isoprenóide será separado de outros produtos que poderão estar presentes na camada orgânica. A separação do composto isoprenóide de outros produtos que poderão estar presentes na camada orgânica é facilmente obtida utilizando, por exemplo, técnicas cromatográficas padrão.
Em algumas concretizações, um composto isoprenóide sintetizado por meio de um método do invento é adicionalmente modificado de forma química numa reacção desprovida de células. Por exemplo, em algumas concretizações, o ácido artemisínico é isolado a partir do meio de cultura e/ou de um lisado celular e é adicionalmente modificado de forma química, numa reacção desprovida de células, para gerar artemisinina.
Em algumas concretizações, o composto isoprenóide é puro, por exemplo, pelo menos cerca de 40% puro, pelo menos cerca de 50% puro, pelo menos cerca de 60% puro, pelo menos cerca de 70% puro, pelo menos cerca de 80% puro, pelo menos cerca de 90% puro, pelo menos cerca de 95% puro, pelo menos cerca de 98% puro ou mais de 98% puro, em que "puro", no contexto de um composto isoprenóide, refere-se a um composto isoprenóide que está isento de outros compostos isoprenóides, macromoléculas, contaminantes, etc.
EXEMPLOS
Os exemplos que se seguem são fornecidos para proporcionar aos peritos na técnica uma descrição completa de como fazer e utilizar o presente invento, e não se destinam a limitar o âmbito do que os inventores consideram o seu invento nem pretendem representar que as experiências apresentadas abaixo consistem em todas ou nas únicas experiências efectuadas. Foram feitos esforços no sentido de assegurar o rigor dos números utilizados (por exemplo, quantidades, temperatura, etc.), mas a existência de alguns erros experimentais e desvios deve ser considerada. Excepto indicação em contrário, partes são partes em peso, peso molecular é o peso molecular médio em peso, a temperatura é em graus Celsius e a pressão é a pressão atmosférica ou próximo desta. Poderão utilizar-se abreviaturas padrão, por 68
ΕΡ 1 919 514/PT exemplo, bp, par(es) de bases; kb, quilobases(s) ; pl, picolitro(s); s, segundo(s); min, minuto(s); h, hora(s); aa, aminoácido(s) ; kb, quilobases(s) ; bp, par(es) de bases; nt, nucleótido(s); i.m., intramuscular(mente); i.p., intraperitoneal(mente); s.c., subcutânea(mente); e similares.
Exemplo 1: Clonagem e sequenciação de enzimas de modificação de isoprenóides A maioria das enzimas que hidroxilam um terpeno são enzimas do citocromo P450. Todas as sequências de aminoácidos disponíveis de terpeno-hidroxilases foram alinhadas com as sequências de aminoácidos de enzimas do citocromo P450 de girassol e de alface. Estas duas espécies de plantas pertencem à família das Asteráceas, a que Artemisia annua também pertence. As enzimas de modificação de isoprenóides, por exemplo, a família CYP71D, agruparam-se, sugerindo um antepassado comum. Conceberam-se iniciadores degenerados para reacção em cadeia da polimerase (PCR), em que estes iniciadores amplificam genes da família CYP71D das
Asteráceas.
Clonagem do ADNc de CYP71AV1 (também designada por CYP71D-A4 ou AMO) e de CPR. Preparou-se uma "pool" de ADNc por meio do kit Super SMART PCR cDNA Synthesis (BD
Bioscience), utilizando 50 ng de ARN total purificado a partir de células de A. annua enriquecidas em tricomas. Os iniciadores degenerados P450 foram concebidos a partir de um motivo de aminoácidos conservado da subfamília CYP71 de alface e de girassol; o iniciador 1 a partir de [Y/Q]G[E/D][H/Y]WR (directo) e o iniciador 2 a partir de FIPERF (inverso) (a Tabela I fornece informações de sequência para os iniciadores). 69 ΕΡ 1 919 514/ΡΤ
Tabela I. Iniciadores utilizados para a construção de plasmideos N.° do Sequência (5' para 3') iniciador 1 TCCGACCA(C/T)ANGGNGAN(C/T)A(C/T)TGGAG; SEQ ID NO:14 2 TCCGACCAAANC(G/T)(C/T)TCNGG(A/G/T)AT(A/G)AA; SEQ ID NO:15 3 CCAGCACA(A/G)TA(C/T)GA(A/G)CA(C/T)TT(C/T)AA(C/T)AA (A/G)AT; SEQ ID NO:16 4 CCAGCAGCCATNCC(C/T)TTNGC(A/G)TCNCC(A/G)CA; SEQ ID NO:17 5 ACGTCTAGAATGAAGAGTATACTAAAAGCAATG; SEQ ID NO:18 6 ACGTCTAGAGCGAAACTTGGAACGAGTAACAACT; SEQ ID NO:19 7 ATGGATCCTATGCAATCAACAACTTCCGTTAAGTTAT; SEQ ID NO:20 8 TATGTCGACCCATACATCACGGAGATATCTTCCT ; SEQ ID NO:21 9 GGACTAGTAAAACAATGGCCCTGACCGAAGAG; SEQ ID NO:22 10 CCAAGCTTTCAGATGGACATCGGGTAAAC; SEQ ID NO:23 11 CTGCCGCGGGGCCGCAAATTAAAGCCTTC; SEQ ID NO:24 12 CTGCCGCGGTAGTACGGATTAGAAGCCGC; SEQ ID NO:25 13 CGGGATCCAAAACAATGGCTGCAGACCAATTGGTG; SEQ ID NO:26 14 GCGTCGACTTAGGATTTAATGCAGGTGACG; SEQ ID NO:27 15 CGGGATCCAAAACAATGAGCGAAGTCGGTATACAG; SEQ ID NO:28 16 GCGTCGACTCATAAC GAAAAAT CAGAGAAAT T T G; SEQ ID NO:29 17 GGACTAGTAAAACAATGGCTTCAGAAAAAGAAATTAG; SEQ ID NO:30 18 TCCCCCGGGCTATTTGCTTCTCTTGTAAAC; SEQ ID NO:31 70 ΕΡ 1 919 514/ΡΤ A reacção em cadeia da polimerase (PCR) utilizando estes iniciadores e os ADNc de A. annua originou um fragmento de ADN de 1 kb. O programa de PCR utilizado consistiu em 7 ciclos com uma temperatura de hibridação de 48°C e 27 ciclos adicionais com uma temperatura de hibridação de 55°C. Os aminoácidos deduzidos a partir do fragmento génico amplificado revelaram uma identidade de aminoácidos de 85% e de 88% com as "contigs" de girassol (QH_CA_Contigl442) e de alface (QG_CA_Contig7108) , respectivamente. A base de dados Compositae EST pode ser encontrada em cgpdb.ucdavis.edu. Isolou-se um fragmento CPR de A. annua utilizando um iniciador directo (iniciador 3) e um iniciador inverso (iniciador 4), concebidos a partir dos motivos conservados QYEHFNKI (SEQ ID NO:32) e CGDAKGMA (SEQ ID NO:33), respectivamente. O programa de PCR utilizado consistiu em 30 ciclos com uma temperatura de hibridação de 50°C. Ambas as sequências terminais em 5' e 3' para CYP71AV1 ("CYP71D-A4") e para CPR foram determinadas utilizando um kit RLM-RACE (Ambion), seguida de recuperação do ADNc completo a partir dos ADNc de folha de A. annua. As grelhas de leitura aberta de CYP71AV1 e de CPR foram amplificadas por PCR e ligadas nos locais SpeI e BamHI/Sall de pESC-URA (Stratagene) com marcas FLAG e cMyc, respectivamente. Para a amplificação por PCR de CYP71AV1, utilizaram-se os iniciadores 5 e 6; para a amplificação por PCR de CPR, utilizaram-se os iniciadores 7 e 8. O programa de PCR utilizado consistiu em 35 ciclos com uma temperatura de hibridação de 55°C. Todos os clones foram sequenciados para confirmar as sequências.
Análise do extracto da planta. A folha de A. annua (100 a 200 mg de peso fresco) foi agitada vigorosamente em 1 ml de hexano contendo vestígios de octadecano 5,8 μΜ como padrão interno, durante 2 horas. Os extractos hexanólicos foram concentrados para 200 μΐ e utilizou-se uma amostra de 1 μΐ para a análise de GC-MS, usando uma coluna DB-XLB (d.i. 0,25 mm x 0,25 μιη x 30 m, J & W Scientific) , para determinar o teor de artemisinina a partir de 14 amostras da planta, como descrito. Woerdenbag et al. (1991) Phytochem. Anal., 2, 215-219. O programa utilizado para o forno do cromatógrafo gasoso consistiu em 100°C até 250°C em incrementos de 5°C min”1. Os extractos hexanólicos da planta foram derivatizados por TMS-diazometano para determinar o teor de ácido artemisínico pelo 71 ΕΡ 1 919 514/ΡΤ GC-FID equipado com a coluna DB5 (n = 8). 0 programa utilizado para o forno do cromatógrafo gasoso consistiu em 80°C (mantidos durante 2 min), rampa de 20°C min-1 até 140°C, separação do produto por meio de incrementos de 5°C min-1 até 220 °C. Os padrões de artemisinina autêntica foram adquiridos de Sigma-Aldrich (St. Louis, Missouri). Síntese de álcool artemisínico. Dissolveu-se ácido artemisínico (100,0 mg; 0,43 mmoles) em THF (10,0 ml) e adicionou-se LiAlH4 (17,0 mg; 0,45 mmoles). A mistura heterogénea foi mantida em refluxo (70°C) durante 15 h. Após arrefecimento, a reacção foi parada com água (3,0 ml) e NaOH aquoso a 15% (3,0 ml), agitada durante 10 minutos e filtrada através de celite. A fase orgânica foi separada, seca com MgS04 e concentrada utilizando um evaporador rotativo. O produto foi purificado por cromatografia em coluna (2:1 hexanos/EtOAc) para fornecer 61,0 mg (rendimento de 65%) do álcool como um óleo incolor. Uma quantidade mínima de ácido artemisínico contaminante foi subsequentemente removida por cromatografia em coluna em alumina neutra (actividade Brockman 1). Os dados de caracterização foram consistentes com os valores da literatura. Síntese de aldeído artemisínico. O álcool artemisínico foi oxidado a aldeído artemisínico de acordo com um procedimento referido na literatura. Sharpless et al. Tetrahedron Letters 17, 2503-2506 (1976). Num balão de 10 ml seco à chama contendo RuCl2(PPh3)3 (17,0 mg; 0,018 mmoles) e N-óxido de N-metilmorfolina (60,0 mg; 0,51 mmoles), sob uma atmosfera de árgon, adicionou-se acetona (4,0 ml). Adicionou-se depois álcool artemisínico (55,0 mg; 0,25 mmoles) dissolvido em acetona (1,0 ml) à solução via uma seringa. A mistura foi agitada a 23°C durante 2 h e concentrada sob vácuo. O produto bruto foi purificado por cromatografia em coluna (4:1 hexanos/EtOAc) para fornecer 32,0 mg (rendimento de 59%) de aldeído artemisínico como um óleo incolor. Os dados de caracterização foram consistentes com as informações da literatura. 72
ΕΡ 1 919 514/PT
Produção e caracterização da estirpe EPY
Reagentes. 0 dodecano e o cariofileno foram adquiridos de Sigma-Aldrich (St. Louis, Missouri). 0 ácido 5-fluorótico (5-FOA) foi adquirido de Zymo Research (Orange, Califórnia). As misturas completas de suplementos ("Complete Supplement Mixtures") para formulação dos meios sintéticos definidos (SD de "Synthetic Defined") foram adquiridas de Qbiogene (Irvine, Califórnia). Todos os outros componentes dos meios foram adquiridos de Sigma-Aldrich ou de Becton, Dickinson (Franklin Lakes, Nova Jérsia).
Estirpes e meios. As estirpes de Escherichia coli DH10B e DH5a foram utilizadas para transformação bacteriana e amplificação de plasmídeos na construção dos plasmideos de expressão utilizados neste estudo. As estirpes foram crescidas a 37°C em meio Luria-Bertani contendo ampicilina numa concentração de 100 mg l-1, com excepção dos plasmideos baseados em ρδ-UB que foram crescidos com ampicilina numa concentração de 50 mg l”1 utilizando DH5oí. A estirpe de Saccharomyces cerevisiae BY4742 (Brachmann et al., Yeast 14, 115-132 (1998)), um derivado de S288C, foi utilizada como estirpe parental para todas as estirpes de levedura. Esta estirpe foi crescida em meio rico YPD. Burke et al., Methods in yeast genetics: a Cold Spring Harbor laboratory course manual (Cold Spring Harbor Laboratory Press, Plainview, NY, 2000). As estirpes de levedura manipuladas foram crescidas em meio SD (Burke et al., acima) com omissão de leucina, uracilo, histidina e/ou metionina nos casos apropriados. Para indução dos genes expressos a partir do promotor de GALl, as estirpes de S. cerevisiae foram crescidas em galactose a 2% como única fonte de carbono.
Construção de plasmideos. Para criar o plasmideo pRS425ADS para a expressão de ADS com o promotor de GALl, ADS foi amplificado por PCR a partir de pADS (Martin et al., Nat. Biotechnol. 21, 796-802 (2003)) utilizando o par de iniciadores 9 e 10 (Tabela I) . Utilizando estes iniciadores, a sequência nucleotidica 5'-AAAACA-3' foi clonada imediatamente a montante do codão de iniciação de ADS. Esta sequência consenso foi utilizada para a tradução eficiente de 73 ΕΡ 1 919 514/ΡΤ ADS e dos outros genes indutíveis pela galactose utilizados neste estudo. 0 produto amplificado foi cortado com SpeI e HindiII e clonado em pRS425GALl digerido com SpeI e HindiII (Mumberg et ai., Nucleic Acids Research 22, 5767-5768 (1994)).
Para a integração de uma cassete de expressão para tHMGR, construiu-se o plasmideo ρδ-HMGR. Primeiro, introduziram-se locais de restrição SacII no plasmideo pRS426GALl (Mumberg et ai., acima) ao nivel da extremidade 5' do promotor de GALl e da extremidade 3' da sequência de terminação de CYC1. Para obter isto, a cassete promotor-local múltiplo de clonagem-sequência de terminação de pRS426GALl foi amplificada por PCR utilizando o par de iniciadores 11 e 12. 0 produto amplificado foi clonado directamente em pRS426GALl digerido com PvuII para construir o vector pRS426-SacII. 0 dominio catalítico de HMG1 foi amplificado por PCR a partir do plasmideo pRH127-3 (Donald et al., Appl. Environ. Microbiol. 63, 3341-3344 (1997)) com o par de iniciadores 13 e 14. 0 produto amplificado foi cortado com BamRI e Sall e clonado em pRS426-SacII digerido com BamRI e Xhol. 0 plasmideo pRS-HMGR foi cortado com SacII, e o fragmento da cassete de expressão foi extraído a partir de gel e clonado em ρδ-UB digerido com SacII (Lee et al., Biotechnol. Prog. 13, 368-373 (1997)). 0 alelo upc2-l de UPC2 foi amplificado por PCR a partir do plasmideo pBD33, utilizando o par de iniciadores 15 e 16. 0 produto amplificado foi cortado com BamRI e SalI e clonado no plasmideo pRS426-SacII digerido com BamRI e Xhol para criar o plasmideo pRS-UPC2. Para a integração de upc2-l, o plasmideo pô-UPC2 foi criado de uma maneira idêntica, por digestão de pRS-UPC2 com SacII e transferência do fragmento apropriado para ρδ-UB.
Para substituir o promotor de ERG9 pelo promotor de MET3, construiu-se o plasmideo pRS-ERG9. 0 plasmideo pRH973 (Gardner et al., J. Biol. Chem. 274, 31671-31678 (1999)) continha um segmento de ERG9 truncado em 5' colocado após o promotor de MET3. 0 plasmideo pRH973 foi cortado com Apal e Ciai e clonado no plasmideo pRS403 digerido com Apal e Ciai, 74 ΕΡ 1 919 514/ΡΤ que contém uma marca de selecção HIS3 (Sikorski et al.,
Genetics 122, 19-27 (1989)).
Para a expressão de ERG20, construiu-se o plasmídeo ρδ-ERG20. 0 plasmideo pRS-SacII foi primeiro digerido com SalI e Xhol, o que criou extremidades coesivas compatíveis. 0 plasmideo foi depois autoligado, eliminando os locais SalI e Xhol, para criar o plasmideo pRS-SacII-DX. ERG20 foi amplificado por PCR a partir do ADN genómico de BY4742, utilizando o par de iniciadores 17 e 18. 0 produto amplificado foi cortado com Spel e SmaI e clonado em pRS-
SacII-DX digerido com Spel e SmaI. 0 plasmideo pRS-ERG20 foi depois cortado com SacII, e o fragmento da cassete de expressão foi extraido a partir de gel e clonado em põ-UB digerido com SacII.
Transformação da levedura e construção das estirpes. A estirpe de S. cerevisiae BY4742 (Brachmann et al., acima), um derivado de S288C, foi utilizada como estirpe parental para todas as estirpes de S. cerevisiae. A transformação de todas as estirpes de S. cerevisiae foi efectuada pelo método padrão do acetato de litio. Gietz, R D. & Woods, R A. in Guide to Yeast Genetics and Molecular and Cell Biology, Part B, 87-96 (Academic Press Inc, San Diego, 2002) . Três a dez colónias de cada transformação foram rastreadas para selecção do transformante com a produção mais elevada de amorfadieno. A estirpe EPY201 foi construída através da transformação da estirpe BY4742 com o plasmideo pRS425ADS e selecção em placas de SD-LEU. O plasmideo ρδ-HMGR foi digerido com Xhol antes da transformação do ADN na estirpe EPY201. Após a selecção inicial em placas de SD-LEU-URA, os transformantes foram crescidos e plaqueados em placas de SD-LEU contendo 5-FOA numa concentração de 1 g 1_1 como selecção para a perda do marcador URA3. O auxotrofo para uracilo resultante, EPY208, foi depois transformado com o ADN plasmídico pô-UPC2 digerido com Xhol. Após a selecção inicial em placas de SD-LEU-URA, os transformantes foram crescidos e plaqueados em placas de SD-LEU contendo 5-FOA numa concentração de 1 g 1_1 para a construção de EPY210. O plasmideo pRS-ERG9 foi cortado com Hindll para integração da fusão P Met3~ERG9 nos loci ERG9 de EPY208 e EPY210, para a construção de EPY213 e EPY225, respectivamente. A selecção destas estirpes foi efectuada em 75 ΕΡ 1 919 514/PT placas de SD-LEU-HIS-MET. A estirpe EPY213 foi depois transformada com o ADN plasmidico ρδ-HMGR digerido com Xhol. Após a selecção inicial em placas de SD-LEU-URA-HIS-MET, os transformantes foram crescidos e plaqueados em placas de SD-LEU-HIS-MET contendo 5-FOA numa concentração de 1 g l”1 para a construção de EPY219. A estirpe EPY219 foi transformada com o ADN plasmidico põ-ERG20 digerido com Xhol. Após a selecção inicial em placas de SD-LEU-URA-HIS-MET, os transformantes foram crescidos e plaqueados em placas de SD-LEU-HIS-MET contendo 5-FOA numa concentração de 1 g 1_1 para a construção de EPY224. A integração de pRS-ERG9 foi verificada por análise de PCR utilizando dois conjuntos de iniciadores. Cada conjunto continha um oligonucleótido para ligação ao ADN inserido e um oligonucleótido para ligação ao ADN genómico que rodeia a inserção. Todas as outras integrações foram verificadas em termos da inserção completa, utilizando um iniciador que se liga à extremidade 5' do promotor de GALl e à extremidade 3' do gene fundido.
Crescimento da levedura. Todas as medições da densidade óptica a 600 nm (DOôoo) foram recolhidas utilizando um espectrofotómetro DU-640 de Beckman. Para medir a produção de amorfadieno, tubos de cultura contendo 5 ml de meio SD (galactose a 2%) (com as omissões apropriadas de aminoácidos como descrito acima) foram inoculados com as estirpes de interesse. Estes inóculos foram crescidos a 30°C até uma DC^oo entre 1 e 2. Frascos de cultura sem anteparas (250 ml) contendo 50 ml de meio SD foram inoculados com estas culturas para uma D06oo = 0,05. A produção de amorfadieno foi medida após 6 dias de crescimento. Estava presente metionina 1 mM em cada cultura para repressão da fusão Pmet3-ERG9 nos loci ERG9. Todos os frascos continham também 5 ml de dodecano. Retiraram-se amostras desta camada de dodecano e diluiram-se em acetato de etilo para determinação da produção de amorfadieno por GC-MS. 76 ΕΡ 1 919 514/ΡΤ
RESULTADOS A artemisinina é produzida nos tricomas glandulares, que são células especializadas da planta. As células dos tricomas glandulares foram isoladas de A. annua, e o ARN foi extraído das células. Utilizando os iniciadores degenerados, isolou-se um ADNc parcial de um novo gene que foi designado por CYP71D-A4. 0 gene completo foi recuperado efectuando uma amplificação rápida das extremidades do ADNc (RACE de "rapid amplification of cDNA ends"). A sequência nucleotídica da região codificante do ADNc está apresentada na Figura 1 (SEQ ID N0:1); a sequência de aminoácidos traduzida é fornecida na Figura 2 (SEQ ID NO:2). 0 ADNc de CYP71D-A4 completo foi expresso em células de levedura. Para analisar a actividade de amorfadieno-oxidase, CYP71D-A4 foi colocado sob o controlo transcricional de um promotor GallO num plasmídeo de estrutura pESC-URA (Sratagene), no qual o gene CPR de A. annua (AACPR; Figura 3; sequência de aminoácidos da proteína codificada fornecida na Figura 4) foi expresso a partir de um promotor Gall. 0 gene AACPR foi obtido a partir do ARNm de tricomas glandulares de A. annua, utilizando uma reacção de PCR com iniciadores degenerados e o método RACE como descrito acima.
Para efectuar um ensaio in vivo referente à actividade de amorfa-4,11-dieno-oxidase, este plasmídeo (p71D-A4/CPR::pESC-URA) e um plasmídeo de controlo, que não possuía o gene CYP71D-A4, foram transformados em células de S. cerevisiae manipuladas para produzir amorfa-4,11-dieno. Resumidamente, estas células são a estirpe BY4742 que transporta um gene integrado que codifica uma HMG-CoA-redutase truncada, que é solúvel em levedura. Estas células transportam o plasmídeo pRS425ADS que possui um gene ADS optimizado em termos de codões sob o controlo do promotor GAL1. As células transformadas foram crescidas em meio sintético sem leucina e uracilo, induzidas por galactose a 2% durante 29 horas e o meio foi extraído com éter. Os extractos foram concentrados e analisou-se 1 μΐ por cromatografia gasosa-espectroscopia de massa (GC-MS) equipada com uma coluna EXL, utilizando um programa de temperatura com incrementos de 5°C por minuto desde 50°C até 250°C. Utilizou- 77 ΕΡ 1 919 514/ΡΤ se ácido artemisínico autêntico para sintetizar álcool artemisinico e aldeido artemisínico, que foram utilizados como padrões. Por meio deste método, detectaram-se dois picos a partir das células que expressam CPR e CYP71D-A4, mas não a partir das células de controlo que expressam apenas CPR. Através da comparação do tempo de retenção e dos espectros de massa com os padrões autênticos, determinou-se que estes picos correspondiam ao álcool artemisínico e ao aldeído artemisínico. 0 ácido artemisínico não foi detectado; não era de esperar que surgisse num GC sem ser derivatizado devido à sua baixa volatilidade.
Efectuou-se um ensaio de alimentação in vivo referente à actividade de amorfa-4,11-dieno-oxidase, em que os mesmos dois plasmídeos foram transformados individualmente numa estirpe de S. cerevisiae de tipo selvagem, YPH499. As células de levedura foram crescidas em 50 ml de meio sem uracilo e dextrose a 2% e foram induzidas por galactose a 2% durante 24 horas. Recolheram-se cinco ml das células induzidas de levedura por centrifugação e utilizou-se meio fresco contendo amorfa-4,11-dieno, álcool artemisínico ou aldeído artemisínico 150 μΜ para ressuspender as células de levedura. As células de levedura foram depois crescidas a 30°C durante 5 horas. O meio foi extraído com éter, seguido de derivatização utilizando N-(ter-butildimetilsilil)-N-metiltrifluoroacetamida para permitir a detecção de qualquer ácido artemisínico utilizando GC-MS. Os padrões de álcool artemisínico e de ácido artemisínico autênticos também foram derivatizados de modo idêntico. Um μΐ de cada um dos controlos e amostras derivatizados foi analisado por GC-MS. O programa de temperatura utilizado consistiu em incrementos de 5°C por minuto entre 50°C e 250°C.
Quando as células receberam amorfa-4,11-dieno, detectou-se uma acumulação significativa de ácido artemisínico, juntamente com uma pequena quantidade dos compostos aldeído e álcool artemisínico, apenas nas células de levedura que expressam ambos os genes CPR e CYP71D-A4 (Figura 5A) . Quando as células receberam álcool artemisínico ou aldeído artemisínico, a acumulação relativa de ácido artemisínico foi mais elevada no meio de cultura das células de levedura 78 ΕΡ 1 919 514/ΡΤ transformadas com CPR/CYP71D-A4 do que do meio da estirpe de controlo transformada apenas com CPR (Figura 5B e 5C).
Figuras 5A-C. 0 composto amorfadieno (Figura 5Ά) e dois outros intermediários da artemisinina - álcool artemisinico (Figura 5B) e aldeido artemisinico (Figura 5C) - foram
adicionados, numa concentração de 150 μΜ, ao meio em que as células de levedura transformadas apenas com CPR (cromatograma superior) ou com ambos os genes CPR e CYP71D-A4 (cromatograma inferior) foram crescidas e induzidas por galactose a 2%. O amorfadieno (1), o álcool artemisinico (2), o aldeido artemisinico (3) e o ácido artemisinico (4) estão indicados por setas. O álcool artemisinico (2) e o ácido artemisinico (4) foram detectados após derivatização por N-(ter-butildimetilsilil)-N-metiltrifluoroacetamida. Asterisco indica os substratos adicionados ao meio. A autenticidade do ácido artemisinico derivatizado nas amostras foi confirmada pelo padrão de ácido artemisinico autêntico (Figuras 6A e 6B) . Estes dados indicam que a primeira hidroxilação é catalisada pela enzima do citocromo P450 codificada no clone CYP71D-A4, e a subsequente conversão oxidativa do álcool artemisinico em aldeido artemisinico e do aldeido artemisinico em ácido artemisinico são muito provavelmente catalisadas pela enzima recombinante CYP71D-A4, juntamente com actividades de oxidação endógena da levedura.
Figuras 6A e 6B. O espectro de massa e o tempo de retenção do novo composto produzido após a alimentação de amorfadieno a células de levedura transformadas com CPR/71D-A4 estão apresentados na Figura 6A, e aqueles do padrão de ácido artemisinico autêntico estão apresentados na Figura 6B. Tanto o produto como o padrão foram detectados por GC-MS após derivatização, que adicionou 114 unidades de massa ao peso molecular de base. A sintese de novo de ácido artemisinico em levedura manipulada a partir de um açúcar simples, como a galactose, foi demonstrada através da modificação genética de EPY224 com pESC-URA albergando tanto CPR ("AACPR") como AMO ("CYP17D-A4") (pESC-URA::AACPR/AMO). Uma construção que codifica a HMGCoA-redutase truncada de levedura foi integrada duas vezes 79 ΕΡ 1 919 514/ΡΤ na estirpe de levedura BY4742. 0 factor de transcrição upc2-l foi sobreexpresso para elevar o nivel de transcrição de vários genes na via biossintética do ergosterol. 0 gene da esqualeno-sintase (ERG9) foi regulado negativamente pelo promotor repressível da metionina MET3. A FPP-sintase foi sobreexpressa pelo promotor Gall, e a ADS também foi sobreexpressa pelo promotor Gall no plasmídeo de estrutura pRS425. A estirpe de levedura EPY224 transportando pESC-URA::AACPR/AMO foi crescida em meio sintético contendo galactose a 1,8% e glucose a 0,2% durante 5 dias a 30°C. As células de levedura foram depositadas, e o depósito foi lavado com tampão alcalino (tampão Tris, pH 9). O tampão foi acidificado para pH 2 por adição de HC1, e o tampão acidificado foi extraído com acetato de etilo. Adicionou-se TMS-diazometano e metanol à fracção de acetato de etilo para derivatizar o ácido artemisínico. A forma de éster metílico do ácido artemisínico foi detectada por GC-MS.
As Figuras 7A-7C representam a produção de novo de ácido artemisínico em levedura quando AACPR e AMO são expressos. Em contraste, não foi detectado qualquer ácido artemisínico numa estirpe de levedura de controlo que expressa apenas AACPR. O pico novo a 13,62 min (Figura 7A, pico 1) mostrou os mesmos padrões de fragmentação de massa que o ácido artemisínico autêntico da planta, Artemísia annua (Figura 7B e C).
As Figuras 8A-8C representam ensaios in vitro da enzima AMO. Isolaram-se microssomas de S. cerevisiae YPH499 expressando AACPR ou CPR/AMO. Os picos cromatográficos para os substratos utilizados estão indicados por asteriscos. Para cada ensaio enzimático, utilizou-se amorfadieno 10 μΜ (a), álcool artemisínico 25 μΜ (b) ou aldeído artemisínico 25 μΜ (c) . As fracções extraíveis com éter foram derivatizadas e analisadas por GC-MS em modo de ião selectivo (m/z: 121,189, 204, 218, 220 e 248) . Os produtos enzimáticos são tal como indicado: 1, álcool artemisínico [tempo de retenção (tR)=13,20]; 2, aldeído artemisínico (tR=ll,79); 3, ácido artemisínico (tR=13,58, detectado como éster metílico). A Figura 9 representa a sequência nucleotídica de um clone de ADNc, designado por 71D-B1 (também designado por 80 ΕΡ 1 919 514/ΡΤ "ΑΜΗ" de amorfadieno-hidroxilase) , que codifica uma terpeno-hidroxilase. A Figura 10 representa a sequência de aminoácidos da proteína codificada por 71D-B1 (AMH).
As Figuras 11A-C representam a actividade de hidroxilação da enzima recombinante codificada no clone AMH (71D-B1) . O pico a 16,82 min em A é o ácido artemisínico quando AMO foi expressa em levedura que sobreexpressa HMGCoA, e o pico a 18,50 min em B é amorfadieno hidroxilado quando AMH e AACPR foram sobreexpressas em levedura que sobreexpressa HMGCoA. Os padrões de fragmentação de massa do amorfadieno hidroxilado estão apresentados na Figura 11C. O pico para o ião parental (220) de amorfadieno hidroxilado é apresentado e outros padrões de fragmentação de iões típicos para os sesquiterpenos e os terpenos são também apresentados (por exemplo, 93, 119, 132, 145, 159 e 177). A Figura 12 representa a sequência nucleotídica de um ADN genómico que codifica uma terpeno-hidroxilase/oxidase. 81 ΕΡ 1 919 514/ΡΤ
LISTAGEM DE SEQUÊNCIAS <110> RO, DAE-KYUN NEWMAN, KARYN PARADISE, ERIC M. KEASLING, JAY D.
OUELLET, MARIO EACHUS, RACHEL HO, KIMBERLY HAM, TIMOTHY
<120> POLINUCLEÓTIDOS QUE CODIFICAM ENZIMAS DE MODIFICAÇÃO DE ISOPRENÓIDES E MÉTODOS DE UTILIZAÇÃO DESTES
<130> BERK-049WO <150> 60/697,067 <151> 2005-07-05 <160> 33 <170> FastSEQ para Windows, Versão 4.0
<210> 1 <211> 1488 <212> ADN <213> Artemísia annua <400> 1 atgaagagta tactaaaagc aatggcactc tcactgacca cttccattgc tcttgcaacg 60 atccttttgt tcgtttacaa gttcgctact cgttccaaat ccaccaaaaa aagcefctcct 120 gagccatggc ggettcccat tattggtcac atgcatcact tg^ttggtac aacgccacat 180 cgtggggtta gggatttagc cagaaagtat ggatctttga tgcatttaca gcttggtgâa 240 gttccaacaa tcgtggtgtc atctccgaaa tgggctaaag agattttgac aacgtacgac 300 attacctttg otaacaggcc cgagacttta actggtgaga ttgttttata tcacaatacg 360 gatgttgttc ttgcacctta tggtgaatac tggaggcaat tacgtaaaat ttgcacattg 420 gagcttttga gtgttaagaa agtaaagtca tttcagtcac ttcgtgaaga ggagtgttgg 480 aatttggttc aagagattaa agcttcaggt tcagggagac cggttaacct ttcagagaat 540 gttttcaagt tgattgcaac gatacttagt agagccgcat ttgggaaagg gatcaaggac 600 cagaaagagt taacggagat tgtgaaagag atactgaggc aaactggtgg ttttgatgtg 660 gcagatatct ttccttcaaa gaaatttctt catcatcttt cgggcaagag agctcggtta 720 actagccttc gcaaaaagat cgataattta atcgataacc ttgtaçctga gcatactgtt 780 aacacctcca gtaaaactaa cgagacactc ctcgatgttc ttttaaggct caaagacagt 840 gctgaattcc cattaacatc tgataacatt aaagccatca ttttggatat gtttggagca 900 ggoacagaca cttcctcatc cacaatcgaa tgggcgattt cggaactcat aaagtgtccg 960 aaagcaatgg agaaagtaca agcggaattg aggaaagcat tgaacggaaa agaaaagatc 1020 catgaggaag acattcaaga actaagctac ttgaacatgg taatcaaaga aacattgagg 1080 ttgcaccctc cactaccctt ggttotgcca agagagtgcc gccaaccagt caatttggct 1140 ggatacaaca tacccaataa gaccaaactt attgtcaacg tctttgcgat aaatagggac 1200 cctgaatatt ggaaagacgc tgaagctttc atccctgaac gatttgaaaa tagttctgca 1260 actgtcatgg gtgcagaata cgagtatctt ccgtttggag ctgggagaag gatgtgtcct 1320 ggagccgcac ttggtttagc taacgtgcag ctcccgctcg ctaatataet atatcatttc 1380 aactggaaac tccccaatgg tgtgagctat gaccagatcg acatgaccga gagctctgga 1440 gccacgatgc aaagaaagac tgagttgtta ctcgttccaa gtttctag 1488 82 ΕΡ 1 919 514/ΡΤ
<210> 2 <211> 495 <212> PRT <213> Artemísia annua <400> 2
Met 1 Lys Ser Ile Leu 5 Ala Leu Ala Thr 20 Ile Lys Ser Thr 35 Lys Lys Gly His 50 Met His Hls Asp 65 Leu Ala Arg Lys Vai Pro Thr Ile Vai 85 Thr Thr Tyr Asp 100 Ile Glu Ile Vai 115 Leu Tyr Glu Tyr 130 Trp Arg Gin Vai 145 Lys Lys Vai Lys Asn Leu Vai Gin Glu 165 Leu Ser Glu Asn 180 val Ala Phe Gly 195 Lys Gly Lys Glu 210 Ile Leu Arg Pro 225 Ser Lys Lys Phe Thr Ser Leu “-S T.yg 245 Glu Hls Thr Vai 260 Asn Vai Leu Leu 275 Arg Leu Asn Ile 290 Lys Alã Ile Ser 305 Ser Ser Thr Ile Lys Ala Met Glu Lys 325 Lys Glu Lys Ile 340 His Met Vai Ile 355 Lys Glu Leu Pro 370 Arg Glu Cys Pro 385 Asn Lys Thr Lys Pro Glu Tyr Trp Lys 405 Asn Ser Ser Ala 420 Thr Gly Ala Gly 435 Arg Arg Vai Gin 450 Leu Pro Leu Pro 465 Asn Gly Vai Ser Ala Thr Met Gin Arg
Lys Ala Met Ala Leu 10 Leu Leu Phe Val 25 Tyr Ser Leu Pro 40 Glu Pro Leu Ile 55 Gly Thr Thr Tyr Gly 70 Ser Leu Met Val· Ser Ser Pro Lys 90 Thr Phe Ala Asn 105 Arg His Asn Thr 120 Asp Val Leu Arg 135 Lys Ile Cys Ser 150 Phe Gin Ser Leu Ile Lys Ala Ser Gly 170 Phe Lys Leu Ile 185 Ala Ile Lys Asp 200 Gin Lys Gin Thr 215 Gly Gly Phe Leu 230 His His Leu Ser Lys Ile Aap Asn Leu 250 Thr Ser Ser Lys 265 Thr Lys Asp Ser 280 Ala Glu Ile Leu 295 Asp Met Phe Glu 310 Trp Ala Ile Ser Val Gin Ala Glu Leu 330 Glu Glu Asp Ile 345 Gin Thr Leu Arg 360 Leu His Arg Gin 375 Pro Val Asn Leu 390 Ile Val Asn Val Asp Ala Glu Ala Phe 410 Val Met Gly Ala 425 Glu Met Cys Pro 440 Gly Ala Ala Asn 455 Ile Leu Tyr Tyr Asp 470 Gin Ile Asp Lys Thr Glu Leu Leu 490
Ser Leu Thr Thr Ser Ile Lys Phe Ala Thr 15 Arg Ser Trp Arg Leu 30 Pro Ile Ile Pro His 45 Arg Gly Val Arg His 60 Leu Gin Leu Gly Glu 75 Trp Ala Lys Glu Ile. 80 Leu Pro Glu Thr Leu 95 Thr Gly Val Leu Ala 110 Pro Tyr Gly Thr Leu 125 Glu Leu Leu Ser Arg 140 Glu Glu Glu Cys Trp 155 Ser Gly Arg Pro Val 160 Asn Thr Ile Leu Ser 175 Arg Ala Glu Leu Thr 190 Glu Ile Val Asp Val 205 Ala Asp Ile Phe Gly 220 Lys Arg Ala Arg Leu 235 Ile IVep Asn Leu Val 240 Ala Asn. Glu Thr Leu 255 Leu Asp Phe Pro Leu 270 Thr Ser Asp Gly Ala 285 Gly Thr Asp Thr Glu 300 Leu Ile Lys Cys Pro 315 Arg Lys Ala Leu Asn 320 Gly Glu Leu Ser Tyr 335 Leu Asn Pro Pro Leu 350 Pro Leu Val Leu Ala 365 Gly Tyr Asn Ile Phe 380 Ala Ile Asn Arg Asp 395 Ile Pro Glu Arg Phe 400 Glu Tyr Glu Tyr Leu 415 Pro Phe Ala Leu Gly 430 Leu Ala Asn His Phe 445 Asn Trp Lys Leu Met 460 Thr Glu Ser Ser Gly 475 Leu Val Pro Ser Phe 480 495 83
ΕΡ 1 919 514/PT
<210> 3 <211> 2157 <212> ADN <213> Artemísia annua <400> 3 atgcaatcaa caacttccgt taagttatct cccttcgatc taatgacggc gttacttaac 60 ggcaaggtat cgttcgacac atcaaacaca tcggatacga atattccgtt agcggtgttt 120 atggagaatc gtgagctttt gatgatttta actacttcgg .ttgcggtgtt gatcggatgc.180 gttgtggtgc ttgtgtggag acggtcgtcg tcggcggcga agaaagcggc ggagtcgccg 240 gtgattgttg tgccgaagaa agtgacggag gatgaggttg atgacggacg gaagaaagtt 300 actgtgtttt ttggaactca gactggtact gctgaaggtt ttgotaaggc gcttgttgaa 360 gaagctaaag cgcgatatga aaaggcggtg tttaaagtga ttgatttgga tgattatgct 420 gctgaagatg atgagtatga ggagaagtta aagaaagaat ctcttgcttt tttcttttta 480 gctacgtatg gagatggtga gccgacagat aatgctgcta gattctataa atggtttacc 540 gagggtgaag agaaaggtga atggcttgac aagcttcaat acgcaçrtgtt tggacttggt 600 aacagacagt atgagcattt caacaagatt gcgaaggtgg tcgatgaaaa acttgtggag 660 cagggtgcaa agcgccttgt tcctgttggc atgggagacg atgatcaatg tatcgaagac 720 gacttcactg catggaaaga gttggtgtgg cctgagttgg atcaattact tcgtgatgag 780 gatgatacat ctgttgccac tccatacaca gctgctgttg gagaataccg tgttgtgttc 840 catgacaaac cagagacata tgateaggat caactgacaa atggccatgc tgttcatgat 900 gctcaacatc catgcagatc caatgtcgct gtcaaaaagg agctccattc ccctctatct 960 gaccggtctt gcactcattt ggaatttgat atctctaata ctggattatc gtatgaaact 1020 ggggaccatg ttggagtcta cgttgagaat ctaagtgaag ttgtggacga agctgaaaaa 1080 ttaataggtt taccgccgca cacttatttc tcagtacata ctgataacga agacgggaca 1140 ccacttggtg gagcctcttt gccacctcct ttccctccat gcactttaag aaaagcattg 1200 gettcctatg ccgatgtttt gagetetcct aaaaagtcag ctttgcttgc tttagctgct 1260 catgctactg attctactga agctgataga ctgaaatttt ttgcgtctcc tgctggaaag 1320 gatgaatatg ctcagtggat agttgcaagc cacagaagtc tccttgaggt catggaggcc 1380 ttcccatcag ctaagcctcc gcttggtgtt ttttttgcat ctgtcgcccc acgtttgàag 1440 ccgagatact attccattto ttcttcccaa aagtttgcgc caaataggat tcatgtaact 1500 tgtgcattag tgtatgagca aacaccatca ggccgcgttc acaagggagt ctgttcaaca 1560 tggatgaaga atgccgtgcc tatgacagaa agccaggatt gcagttgggc cccaatttat 1620 gttagaacat ccaatttcag acttccttct gatcctaagg tcccagttat catgattggc 1680 ccaggcactg gattggctcc atttagaggt ttccttcagg aaaggttagc tcagaaggaa 1740 gctgggactg agctcggaac agccatctta ttcttcggat gcaggaatcg caaagtggat 1800 ttcatatatg aggacgagct taataatttc gtggagácgg gggctctttc cgagcttgtt 1B60 acggccttct ctcgtgaagg tgccactaag gagtacgtgc aacacaagat gactcagaag 1920 gcttcggata tctggaattt actctctgag ggagcatatt tgtatgtttg cggtgatgcc 1980 aaaggcatgg ccaaagatgt acatcggact ctgcacacta ttgtgcaaga acagggatct 2040 ctagactcct caaaggcgga gctctacgtg aagaatctac aaatggcagg aagatatctc 2100 cgtgatgtat gggtcgacat ggaacagaag ttgatttccg aagaagacct cgagtaa 2157
<210> 4 <211> 718 <212> PRT <213> Artemísia annua <400> 4
Met Gin Ser Thr Thr Ser Vai Lys Leu Ser Pro Phe Asp Leu Met Thr 1 5 10 15 Ala Leu Leu Asn Gly Lys Vai Ser Phe Asp Thr Ser Asn Thr Ser Asp 20 25 30 Thr Asn Ile Pro Leu Ala Vai Phe Met Glu Asn Arg Glu Leu Leu Met 35 40 45 Ile Leu Thr Thr. Ser Vai Ala Vai Leu Ile Gly Cys Vai val Val Leu 50 55 60 Vai Trp Arg Arg Ser Ser Ser Ala Ala Lys Lys Ala Ala Glu Ser Pro 65 70 75 80 84 ΕΡ 1 919 514/ΡΤ νβαυ α» >νω raro «sys aatye nxcaj. Thr Glu Asp Glu Val Asp Asp Gly 85 90 95 Arg Lys Lys Vai Thr Vai Phe Phe Gly Thr Gin Thr Gly Thr Ala Glu 100 105 110 Gly Phe Ala Lys Ala Leu Vai Glu Glu Ala Lys Ala Arg Tyr Glu Lys 115 120 125 Ala Vai Phe Lys Vai Ile Asp Leu Asp Asp Tyr Ala Ala Glu Asp Asp 130 135 140 Glu Tyr Glu Glu Lys Leu Lys Lys Glu Ser Leu Ala Phe Phe Phe Leu 145 150 155 160 Ala Thr Tyr Gly Asp Gly Glu Pro Thr Asp Asn Ala Ala Arg Phe Tyr 165 170 175 Lys Trp Phe Thr Glu Gly Glu Glu Lys Gly Glu Trp Leu Asp Lys Leu 180 185 190 Gin Tyr Ala Vai Phe Gly Leu Gly Asn Arg Gin Tyr Glu His Phe Asn 195 200 205 Lys Ile Ala Lys Vai Vai Asp Glu Lys Leu Val Glu Gin Gly Ala Lys 210 215 220 Arg Leu Vai Pro Vai Gly Met Gly Asp Asp Asp Gin Cys Ile Glu Asp 225 230 235 240 Asp Phe Thr Ala Trp Lys Glu Leu Vai Trp Pro Glu Leu Asp Gin Leu 245 250 255 Leu Arg Asp Glu Asp Asp Thr Ser Vai Ala Thr Pro Tyr Thr Ala Ala 260 265 270 Vai Gly Glu Tyr Arg Vai Vai Phe His Asp Lys Pro Glu Thr Tyr Asp 275 280 285 Gin Asp Gin Leu Thr Asn Gly His Ala Vai His Asp Ala Gin His Pro 290 295 300 Cys Arg Ser Asn Vai Ala Vai Lys Lys Glu Leu His Ser Pro Leu Ser 305 310 315 320 Asp Arg Ser Cys Thr His Leu Glu Phe Asp Ile Ser Asn Thr Gly Leu 325 330 335 Ser Tyr Glu Thr Gly Asp His Vai Gly Val Tyr 1'Val Glu Asn Leu Sei! 340 345 350 ,Glu Vai Vai Asp Glu Ala Glu Lys Leu Ile Gly Leu Pro Pro HiS Thr 355 360 365 Tyr Phe Ser Vai His Thr Asp Asn Glu Asp Gly Thr Pro Leu Gly Gly 370 375 380 Ala Ser Leu Pro Pro Pro Phe Pro Pro Cys Thr Leu Arg Lys Ala Leu 385 390 395 400 Ala Ser Tyr Ala Asp Vai Leu Ser Ser Pro Lys Lys Ser Ala Leu Leu 405 410 415 Ala Leu Ala Ala His Ala Thr Asp ser Thr Glu Ala Asp Arg Leu Lys 420 425 430 Phe Phe Ala Ser Pro Ala Gly Lys Asp Glu Tyr. Ala Gin Trp Ile Val 435 440 445 Ala Ser His Arg Ser Leu Leu Glu Vai Met Glu Ala Phe Pro Ser Ala 450 455 460 Lys Pro Pro Leu Gly Vai Phe Phe Ala Ser Val Ala Pro Arg Leu Gin 4 65 470 475 480 Pro Arg Tyr Tyr Ser Ile Ser Ser Ser Pro Lys Phe Ala Pro Asn Arg 485 490 495 Ile His Vai Thr Cys Ala Leu Vai Tyr Glu Gin Thr Pro Ser Gly Arg 500 505 510 Vai His Lys Gly Vai Cys Ser Thr Trp Met Lys Asn Ala Val Pro Met 515 520 525 Thr Glu Ser Gin Asp Cys Ser Trp Ala Pro Ile Tyr Val Arg Thr Ser 530 535 540 Asn Phe Arg Leu Pro Ser Asp Pro Lys Val Pro Val Ile Met lie Gly 545 550 555 560 Pro Gly Thr Gly Leu Ala Pro Phe Arg Gly Phe Leu Gin Glu Arg Leu 565 570 575 85 ΕΡ 1 919 514/ΡΤ miteain'' “45iu Leu Gly Thr Ala Ile Leu Phe Phe 580 585 590 Sly Cys Arg Asn Arg Lys Vai Asp Phe Ile Tyr Glu Asp Glu Leu Asn 595 600 605 Asn Phe Vai Glu Thr Gly Ala Leu Ser Glu Leu Vai Thr Ala Phe Ser 610 615 620 Arg Glu Gly Ala Thr Lys Glu Tyr Vai Gin His Lys Met Thr Gin Lys 625 630 635 640 Ala Ser Asp Ile Trp Asn Leu Leu Ser Glu Gly Ala Tyr Leu Tyr Vai 645 650 655 Cys Gly Asp Ala Lys Gly Met Ala Lys Asp Vai His Arg Thr Leu His 660 665 670 Thr Ile Vai Gin Glu Gin Gly Ser Leu Asp Ser Ser Lys Ala Glu Leu 675 680 685 Tyr Vai Lys Asn Leu Gin Met Ala Gly Arg Tyr Leu Arg Asp Vai Trp 690 695 700 Vai Asp Met Glu Gin Lys Leu Ile Ser Glu Glu Asp Leu Glu 705 710 715
<210> 5 <211> 1467 <212> ADN <213> Artemísia annua <4Ο0> 5 atggcacttt cactgaccac ctocattgct cttgccacga tccttttctt cgtaatttac 60 aagttcgcta ctcgttccaa atccacaaaa aacagccttc ctgagccatg gcgacttccc 120 attattggtc acatgcatca cttgattggt acaataccac atcgtgggct tatggattta 180 gccagaaagt atggatcttt aatgcattta cagcttggtg aagtttcaac aatcgtggtg 240 tcatctccga aatgggctaa agagattttg acaacgtacg acattgcctt tgctaacagg 300 ccctggactt tggctggtga gattgttgta tatcgcaata caaatattgc tgctgcacct 360 tatggtgaat actggaggcg attacgtaaa ctttgcacat cggagcttat gagtgttaag 420 aaagtaaagt catatcagtc gcttcgtgaa gaggagtgtt .ggaatttggt tcaagagatt 480 aaagcttcag gttcagggat accggttaac ctttcagaga acattttcaa gttgattgca 540 acgatacttt gtagagccgc gtttggaaaa ggagtcaagg accagaagga gtgtacggag 600 attatgaaag agatgttgag ggaagttggt ggttttgatg tggcagatat ctttccttcg 660 aagaaatttc ttcatcatct ttcaggcaag agagccaggt taaotagcat tcataagaag 720 ctcgataatt ttatcaataa ccttgttgct gagcatactt tcaaaacttc aagtaaaact 780 gaggagacac ttcttgatgt tcttctaagg ctcaaagata gcgctgaatt cccattaaca B40 gctgacaatg ttaaagccat cattttggat atatttgcag cagggacaga cacttcatca 900 accacaatcg aatgggcgat ttcggaactc ataaagtgtc cgagagcgat ggagaaagta 960 caagcagaac tgaggaaagc acttaacgga aaagaaaaga tccatgagga agatattcaa 1020 ggactaagct acttaaactt ggtaatcaaa gaaacattaa ggttgcaccc tccactaccc 1080 ttgttgccaa gagagtgccg tgaaccagtc aatttggctg gatacgacat acccaataag 1140 acaagactta ttgtcaacgt ctttgcgata aatagggacc cagaatactg gaaagacgct 1200 gaaattttca tccccgaacg atttgaaaat agttctacaa ctctcatggg tgcagaatat 1260 gagtatcttc cgtttggagc tgggagaagg atgtgtcctg gagccgcact tggtttagcc 1320 aacgtgcagc taccgctcgc taatatacta tatcatttca actggaaaot ccccaacggt 1380 gcgagctatg atcagatcga catgaccgag aggtttggaa tctcggttga aagaaagact 1440 cagttgttac tcgtaccaag tttctag 1467
<210> 6 <211> 488 <212> PRT <213> Artemísia annua 86
ΕΡ 1 919 514/PT < 4 Ο Ο > 6
Met Ala Leu Ser Leu Thr Thr Ser Ile Ala Leu Ala Thr Ile Leu Phe 1 5 10 15 Phe Vai Ile Tyr Lys Phe Ala Thr Arg Ser Lys Ser Thr Lys Asn Ser 20 25 30 ΐΜί-Ρΐ!ο· lie Ile Gly His Met His His Leu 35 40 45 Ile Gly Thr Ile Pro His Arg Gly Leu Met Asp Leu Ala Arg Lys Tyr 50 55 60 Gly Ser Leu Met His Leu Gin Leu Gly Glu Val Ser Thr Ile Val Val 65 70 75 80 Ser Ser Pro Lys Trp Ala Lys Glu Ile Leu Thr Thr Tyr Asp Ile Ala 85 90 95 Phe Ala Asn Arg Pro Trp Thr Leu Ala Gly Glu Ile Val Val Tyr Arg 100 105 110 Asn Thr Asn Ile Ala Ala Ala Pro Tyr Gly Glu Tyr Trp Arg Arg Leu 115 120 125 Arg Lys Leu Cys Thr Ser Glu Leu Met Ser Val Lys Lys Val Lys Ser 130 135 140 Tyr Gin Ser Leu Arg Glu Glu Glu Cys Trp Asn Leu Val Gin Glu Ile 145 150 155 160 Lys Ala Ser Gly Ser Gly Ile Pro Val Asn Leu Ser Glu Asn Ile Phe 165 170 175 Lys Leu Ile Ala Thr Ile Leu Cys Arg Ala Ala Phe Gly Lys Gly Val 180 185 190 Lys Asp Gin Lys Glu Cys Thr Glu Ile Met Lys Glu Met Leu Arg Glu 195 200 205 Vai Gly Gly Phe Asp Val Ala Asp Ile Phe Pro Ser Lys Lys Phe Leu 210 215 220 His His Leu Ser Gly Lys Arg Ala Arg Leu Thr Ser Ile His Lys Lys 225 230 235 240 Leu Asp Asn Phe Ile Asn Asn Leu Val Ala Glu His Thr Phe Lys Thr 245 250 255 Ser Ser Lys Thr Glu Glu Thr Leu Leu Asp Val Leu Leu Arg Leu Lys 260 265 270 Asp Ser Ala Glu Phe Pro Leu Thr Ala Asp Asn Val Lys Ala lie Ile 275 280 28S Leu Asp Ile Phe Ala Ala Gly Thr Asp Thr Ser Ser Thr Thr Ile Glu 230 295 ·, 300 Trp Ala Ile Ser Glu Leu Ile Lys Cys Pro Arg: Ala Met Glu Lys Val 305 310 315 320 Gin Ala Glu Leu Arg Lys Ala Leu Asn Gly Lys Glu Lys Ile His Glu 325 330 335 Glu Asp Ile Gin Gly Leu Ser Tyr Leu Asn Leu Val Ile Lys Glu Thr 340 345 350 Leu Arg Leu His Pro Pro Leu Pro Leu Leu Pro Arg Glu Cys Arg Glu 355 360 '365 Pro Vai Asn Leu Ala Gly Tyr Asp Ile Pro Asn Lys Thr Arg Leu Ile 370 375 380 Vai Asn Vai Phe Ala Ile Asn Arg Asp Pro Glu Tyr Trp Lys Asp Ala 385 390 395 400 Glu Ile Phe Ile Pro Glu Arg Phe Glu Asn Ser Ser Thr Thr Leu Met 405 410 415 Gly Ala Glu Tyr Glu Tyr Leu Pro Phe Gly Ala Gly Arg Arg Met Cys 420 425 430 Pro Gly Ala Ala Leu Gly Leu Ala Asn Val Gin Leu Pro Leu Ala Asn 435 440 445 Ile Leu Tyr His Phe Asn Trp Lys Leu Pro Asn Gly Ala Ser Tyr Asp 450 455 460 Gin Ile Asp Met Thr Glu Arg Phe Gly Ile Ser Val Glu Arg Lys Thr 465 470 475 480 Gin Leu Leu Leu Vai Pro Ser Phe 485 87 ΕΡ 1 919 514/ΡΤ
<210> 7 <211> 1038 <212> ADN <213> Artemísia annua <400> 7 gcccttcgag ccgtatgggg attactggcg gcaattacgt aaactttgca cattggagct 60 tttgagtgct aagaaagtag agtcatatca gtcgcttcgt gaagaggagt gttggaattt 120 agttcaagag attaaagctt caggttcagg gataccggtt aacctttcag agaatattta 180 caagttggtt gcaatgatac ttagtagagc tgcgtttggg aaaagaatca aggaccataa 240 ggagtttacg gagcttgtgg aacagatgtt gagggaactt ggtggttttg atgtggcaga 300 tatctttcct tcgcagaaat ttctacatca tatttogggc aagagatcta ggttaactag 360 cattcacaaa aagctcgata atttaatcaa taaccttgtt gctgagcata ttgttgaagc 420 ctcaagtaaa actaaggaga cgctccttga tgttcttcta aggcacaaag., atagccttga 480 attcccattg acagctgata acgttaaagc catcattttg gtatgaatta atccaatata 540 tttttttttt caaaaggcca taatagtgtt aaacaagctt gaaatttttt ataactaagt 600 acatgcacta actttagtac tcgtgaaaat ataatgagtc atcatagggg ttccatgaaa 660 tatacaggac atgtttacag caggcacaga cacttcgtca accacaatcg aatgggtgat 720 ttcggaactc ataaagtgtc cgagagctat ggagaaaata caagcggaac tgaggaaagc 780 acttaacgga aaagaaaaga tccacgagga agacatccaa gaactaagct acttaaactt 840 ggtaatcaaa gaaacattaa ggttgcaccc tccactacee ttggttttgc cacgagagtg 900 ccgtcaacca gtcaatttgg ctggatatga catacccaat aagaccaaac ttattgtcaa 960 cgtctttgcg ataaataggg accctgaata ctggaaagac gctgaatctt tcatcccaga 1020 gcgcttctta actctggt 1038 <210> 8 <211> 6 <212> PRT <213> Sequência artificial <220> <223> péptido de ligação <400> 8 Ala Ala Ala Gly Gly Met 1 5 <210> 9 <211> 14 <212> PRT <213> Sequência artificial <220> <223> péptido de ligação <400> 9
Ala Ala Ala Gly Gly Met Pro Pro Ala Ala Ala Gly Gly Met 1 5 10
<210> 10 <211> 6 <212> PRT <213> Sequência artificial 88 ΕΡ 1 919 514/ΡΤ <220> <223> péptido de ligação <4 0 0> 10
Ala Ala Ala Gly Gly Met 1 5
<210> 11 <211> 8 <212> PRT <213> Sequência artificial <220> <223> péptido de ligação <400> 11
Pro Pro Ala Ala Ala Gly Gly Met 1 5
<210> 12 <211> 4 <212> PRT <213> Sequência artificial <220> <223> péptido de ligação <400> 12 Ile Glu Gly Arg 1
<210> 13 <211> 6 <212> PRT <213> Sequência artificial <220> <223> péptido de ligação <400> 13
Gly Gly Lys Gly Gly Lys 1 5 <210> 14 <211> 25
<212> ADN <213> Sequência artificial 89 ΕΡ 1 919 514/ΡΤ <220> <223> iniciador sintético <220> <221> misc_feature <222> 9, 18, 20 <223> Ν = C ou Τ <220>
<221> misc_feature <222> 11, 14, 17 <223> η = Α,Τ,C ou G <4 0 0> 14 tccgaccana nggngannan tggag 25
<210> 15 <211> 25 <212> ADN <213> Sequência artificial <220> <223> iniciador sintético <220> <221> misc feature <222> (13) ... (13) <223> Ν = G ou Τ <220> <221> misc_feature <222> (14)...(14) <223> Ν = C ou Τ <220> <221> misc_feature <222> (20) ... (20) <223> Ν = A, G ou Τ <220> <221> misc_feature <222> (23) ... (23)
<223> Ν = A ou G 90 ΕΡ 1 919 514/ΡΤ <220> <221> misc_feature <222> 11,17
<223> η = A,Τ,C ou G <4 0 0> 15 tccgaccaaa ncnntcnggn atnaa 25
<210> 16 <211> 29 <212> ADN <213> Sequência artificial <220> <223> iniciador sintético <220> <221> misc_feature <222> (9)...(9)
<223> Ν = A ou G <220> <221> misc_feature <222> (12)...(12) <223> Ν = C ou Τ <220> <221> misc_feature <222> (15)...(15)
<223> Ν = A ou G <220> <221> misc_feature <222> (18) ... (18) <223> Ν = C ou Τ <220> <221> misc_feature <222> (21) ... (21) <223> Ν = C ou Τ <220> <221> misc_feature <222> (24) ... (24) <223> Ν = C ou Τ 91 ΕΡ 1 919 514/ΡΤ <220> <221> misc feature <222> (27)...(27)
<223> Ν = A ou G <400> 16 ccagcacant angancantt naanaanat 2 9
<210> 17 <211> 29 <212> ADN <213> Sequência artificial <220> <223> iniciador sintético <220> <221> misc feature <222> (15)...(15) <223> Ν = C ou Τ <220> <221> misc feature <222> (21)...(21)
<223> Ν = A ou G <220> <221> misc feature <222> (27)...(27)
<223> Ν = A ou G <220>
<221> misc_feature <222> 12, 18, 24 <223> η = Α,Τ,C ou G <4 0 0> 17 ccagcagcca tnccnttngc ntcnccnca 29
<210> 18 <211> 33 <212> ADN <213> Sequência artificial 92 ΕΡ 1 919 514/ΡΤ <220> <223> iniciador sintético <400> 18 acgtctagaa tgaagagtat actaaaagca atg 33 <210> 19 <211> 34 <212> ADN <213> Sequência artificial <220> <223> iniciador sintético <400> 19 acgtctagag cgaaacttgg aacgagtaac aact 34 <210> 20 <211> 37 <212> ADN <213> Sequência artificial <220> <223> iniciador sintético <400> 20 atggatccta tgcaatcaac aacttccgtt aagttat 37 <210> 21 <211> 34 <212> ADN <213> Sequência artificial <220> <223> iniciador sintético <400> 21 tatgtcgacc catacatcac ggagatatct tcct 34 <210> 22 <211> 32 <212> ADN <213> Sequência artificial 93 ΕΡ 1 919 514/ΡΤ <220> <223> iniciador sintético <400> 22 ggactagtaa aacaatggcc ctgaccgaag ag 32 <210> 23 <211> 29 <212> ADN <213> Sequência artificial <220> <223> iniciador sintético <400> 23 ccaagctttc agatggacat cgggtaaac 29 <210> 24 <211> 29 <212> ADN <213> Sequência artificial <220> <223> iniciador sintético <400> 24 ctgccgcggg gccgcaaatt aaagccttc 29 <210> 25 <211> 29 <212> ADN <213> Sequência artificial <220> <223> iniciador sintético <400> 25 ctgccgcggt agtacggatt agaagccgc 29 <210> 26 <211> 35 <212> ADN <213> Sequência artificial 94 ΕΡ 1 919 514/ΡΤ <220> <223> iniciador sintético <400> 26 cgggatccaa aacaatggct gcagaccaat tggtg 35 <210> 27 <211> 30 <212> ADN <213> Sequência artificial <220> <223> iniciador sintético <400> 27 gcgtcgactt aggatttaat gcaggtgacg 30 <210> 28 <211> 35 <212> ADN <213> Sequência artificial <220> <223> iniciador sintético <400> 28 cgggatccaa aacaatgagc gaagtcggta tacag 35 <210> 29 <211> 34 <212> ADN <213> Sequência artificial <220> <223> iniciador sintético <400> 29 gcgtcgactc ataacgaaaa atcagagaaa tttg 34 <210> 30 <211> 37 <212> ADN <213> Sequência artificial 95 ΕΡ 1 919 514/ΡΤ <220> <223> iniciador sintético <400> 30 ggactagtaa aacaatggct tcagaaaaag aaattag 37 <210> 31 <211> 30 <212> ADN <213> Sequência artificial <220> <223> iniciador sintético <400> 31 tcccccgggc tatttgcttc tcttgtaaac 30 <210> 32 <211> 8 <212> PRT <213> Sequência artificial <220> <223> motivo <400> 32
Gin Tyr Glu His Phe Asn Lys Ile 1 5 <210> 33 <211> 8 <212> PRT <213> Sequência artificial <220> <223> motivo <400> 33
Cys Gly Asp Ala Lys Gly Met Ala 1 5
Lisboa, 2012-08-08

Claims (24)

  1. ΕΡ 1 919 514/ΡΤ 1/4 REIVINDICAÇÕES 1. Polinucleótido isolado compreendendo uma sequência nucleotidica que codifica uma enzima que modifica um composto isoprenóide, em que a sequência nucleotidica codifica um polipéptido possuindo uma identidade de sequência de aminoácidos de pelo menos 85% com a sequência de aminoácidos apresentada na SEQ ID N0:2, em que o polipéptido apresenta uma actividade de amorfa-4,11-dieno-oxidase.
  2. 2. Polinucleótido de acordo com a reivindicação 1, em que a sequência nucleotidica possui uma identidade de sequência nucleotidica de pelo menos 90% com a sequência nucleotidica apresentada na SEQ ID NO:l.
  3. 3. Polinucleótido de acordo com a reivindicação 1, em que o polinucleótido compreende uma sequência nucleotidica que codifica um polipéptido possuindo uma identidade de sequência de aminoácidos de pelo menos 90% com a sequência de aminoácidos apresentada na SEQ ID NO:2.
  4. 4. Polinucleótido de acordo com a reivindicação 3, em que a sequência nucleotidica codifica um polipéptido possuindo uma identidade de sequência de aminoácidos de pelo menos 95% com a sequência de aminoácidos apresentada na SEQ ID NO:2.
  5. 5. Vector recombinante compreendendo o polinucleótido de acordo com qualquer uma das reivindicações 1 a 4, em que o referido polinucleótido está opcionalmente ligado de forma funcional a um promotor.
  6. 6. Célula hospedeira geneticamente modificada com o polinucleótido de acordo com qualquer uma das reivindicações 1 a 4 ou o vector de acordo com a reivindicação 5.
  7. 7. Célula hospedeira de acordo com a reivindicação 6, que é seleccionada entre o grupo que consiste em uma célula procariótica, uma célula de levedura e uma célula de planta.
  8. 8. Método de produção de um composto isoprenóide numa célula hospedeira, em que o método compreende: ΕΡ 1 919 514/ΡΤ 2/4 crescer uma célula hospedeira geneticamente modificada de acordo com a reivindicação 6 ou 7 num meio adequado, para produzir uma enzima de modificação de isoprenóides, em que, na presença de um substrato terpénico, a referida produção da referida enzima de modificação de isoprenóides resulta numa modificação enzimática do substrato terpénico e na produção do composto isoprenóide; e em que a referida enzima de modificação de isoprenóides é uma amorfadieno-oxidase e em que o substrato terpénico é amorfa-4,11-dieno.
  9. 9. Método de acordo com a reivindicação 8, em que a referida célula hospedeira está ainda geneticamente modificada com um ácido nucleico compreendendo uma sequência nucleotidica que codifica uma terpeno-sintase, em que a referida cultura permite a produção da referida terpeno-sintase, em que a referida terpeno-sintase é seleccionada entre uma terpeno-sintase que modifica um pirofosfato de farnesilo para produzir um substrato sesquiterpénico para a referida enzima de modificação de isoprenóides.
  10. 10. Método de acordo com a reivindicação 8, em que a referida célula hospedeira é uma célula que normalmente não sintetiza pirofosfato de isopentenilo (IPP) por meio de uma via do mevalonato, e em que a célula hospedeira está geneticamente modificada com ou um mais ácidos nucleicos compreendendo sequências nucleotidicas que codificam duas ou mais enzimas da via do mevalonato, uma IPP-isomerase, uma preniltransferase e uma terpeno-sintase, em que a referida cultura permite a produção das enzimas da via do mevalonato, em que a referida produção das referidas duas ou mais enzimas da via do mevalonato, da referida IPP-isomerase, da referida preniltransferase, da referida terpeno-sintase e da referida enzima de modificação de isoprenóides resulta na produção de um composto isoprenóide.
  11. 11. Método de acordo com a reivindicação 10, em que as referidas duas ou mais enzimas da via do mevalonato compreendem a mevalonato-cinase, a fosfomevalonato-cinase e a pirofosfato de mevalonato-descarboxilase, e em que a célula hospedeira é crescida na presença de mevalonato. ΕΡ 1 919 514/PT 3/4
  12. 12. Método de acordo com a reivindicação 10, em que as referidas duas ou mais enzimas da via do mevalonato compreendem acetoacetil-CoA-tiolase, hidroximetilglutaril-CoA-sintase, hidroximetilglutaril-CoA-redutase, mevalonato-cinase, fosfomevalonato-cinase e pirofosfato de mevalonato-descarboxilase.
  13. 13. Método de acordo com a reivindicação 10, em que a referida preniltransferase é uma pirofosfato de farnesilo-sintase.
  14. 14. Método de acordo com qualquer uma das reivindicações 8 a 13, em que a referida célula hospedeira está geneticamente modificada com um ácido nucleico compreendendo uma sequência nucleotídica que codifica uma redutase do citocromo P450, em que a redutase transfere electrões do NADPH para uma enzima de modificação de isoprenóides.
  15. 15. Método de acordo com a reivindicação 14, em que o referido ácido nucleico possui uma identidade de sequência nucleotídica de pelo menos 90% com a sequência nucleotídica apresentada na SEQ ID NO:3.
  16. 16. Método de acordo com a reivindicação 8, em que a célula hospedeira é uma procariótica, em que a referida célula é uma célula que normalmente sintetiza difosfato de isopentilo por meio da via da l-desoxi-D-xilulose-5-fosfato.
  17. 17. Método de acordo com a reivindicação 16, em que a via da l-desoxi-D-xilulose-5-fosfato está inactivada.
  18. 18. Método de acordo com qualquer uma das reivindicações 7 a 17, que compreende adicionalmente o isolamento do composto isoprenóide.
  19. 19. Método de acordo com a reivindicação 9, em que o composto isoprenóide é o ácido artemisínico e o referido método compreende ainda a modificação do ácido artemisínico para produzir a artemisinina e o isolamento da referida artemisinina. ΕΡ 1 919 514/ΡΤ 4/4
  20. 20. Planta transgénica geneticamente modificada com um ácido nucleico compreendendo uma sequência nucleotidica que codifica uma enzima de modificação de isoprenóides, em que a sequência nucleotidica codifica um polipéptido possuindo uma identidade de sequência de aminoácidos de pelo menos 85% com a sequência de aminoácidos apresentada na SEQ ID N0:2, em que o polipéptido apresenta uma actividade de amorfa-4,11-dieno-oxidase e em que o ácido nucleico é expresso numa célula da planta para produzir a enzima de modificação de isoprenóides na célula.
  21. 21. Planta transgénica de acordo com a reivindicação 20, em que a planta é o tabaco ou Artemísia annua.
  22. 22. Planta transgénica de acordo com a reivindicação 20 ou 21, em que a sequência nucleotidica que codifica a enzima de modificação de isoprenóides está ligada de forma funcional a um promotor constitutivo, um promotor indutivel ou um promotor especifico de um determinado tecido.
  23. 23. Planta transgénica de acordo com a reivindicação 22, em que o promotor especifico de um determinado tecido é um promotor especifico dos tricomas.
  24. 24. Método de produção de um composto isoprenóide, em que o método compreende a manutenção da planta transgénica de acordo com qualquer uma das reivindicações 20 a 23, em que a enzima de modificação de isoprenóides é produzida na referida planta transgénica e em que a produção da enzima de modificação de isoprenóides resulta na modificação de um substrato terpénico e na produção de um composto isoprenóide. Lisboa, 2012-08-08
PT06785959T 2005-07-05 2006-06-29 Polinucleótidos que codificam enzimas de modificação de isoprenóides e métodos de utilização destes PT1919514E (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US69706705P 2005-07-05 2005-07-05

Publications (1)

Publication Number Publication Date
PT1919514E true PT1919514E (pt) 2012-08-16

Family

ID=37605033

Family Applications (1)

Application Number Title Priority Date Filing Date
PT06785959T PT1919514E (pt) 2005-07-05 2006-06-29 Polinucleótidos que codificam enzimas de modificação de isoprenóides e métodos de utilização destes

Country Status (19)

Country Link
US (2) US8163980B2 (pt)
EP (2) EP2489672B1 (pt)
JP (1) JP2009504138A (pt)
KR (2) KR101444090B1 (pt)
CN (4) CN105950667A (pt)
AP (1) AP3827A (pt)
BR (1) BRPI0612411B8 (pt)
CA (1) CA2613469C (pt)
DK (1) DK1919514T3 (pt)
ES (2) ES2386554T3 (pt)
HK (1) HK1134495A1 (pt)
IL (1) IL188376A (pt)
MX (1) MX2008000200A (pt)
PL (1) PL1919514T3 (pt)
PT (1) PT1919514E (pt)
SG (1) SG176459A1 (pt)
SI (1) SI1919514T1 (pt)
WO (1) WO2007005604A2 (pt)
ZA (1) ZA200800889B (pt)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ZA200700753B (en) * 2004-07-27 2008-05-28 Univ California Genetically modified host cells use of same for producing isoprenoid compounds
WO2007005604A2 (en) * 2005-07-05 2007-01-11 The Regents Of The University Of California Polynucleotides encoding isoprenoid modifying enzymes and methods of use thereof
SG172646A1 (en) 2006-05-26 2011-07-28 Amyris Biotechnologies Inc Production of isoprenoids
EP2066778B1 (en) * 2006-09-26 2016-01-27 The Regents of The University of California Production of isoprenoids and isoprenoid precursors
DK2162537T3 (da) 2007-06-01 2012-04-23 Sapphire Energy Inc Anvendelse af genetisk modificerede organismer til at frembringe biomasse-nedbrydende enzymer.
NZ583620A (en) 2007-09-11 2012-08-31 Sapphire Energy Inc Methods of producing organic fuel products with photosynthetic organisms
EP2444415A1 (en) * 2010-10-20 2012-04-25 Genoplante-Valor 1-Deoxy-D-xylulose 5-phosphate synthase alleles responsible for enhanced terpene biosynthesis
RU2625224C2 (ru) * 2011-11-01 2017-07-12 Фирмениш Са Цитохром p450 и его применение для энзиматического окисления терпенов
JP5827601B2 (ja) 2012-07-04 2015-12-02 住友ゴム工業株式会社 特定の蛋白質の発現を光応答転写因子により調整する方法、光応答転写因子をコードする遺伝子が導入されたイソプレノイド産生植物、及び該イソプレノイド産生植物を用いたポリイソプレノイドの製造方法
SG11201500682WA (en) * 2012-09-07 2015-02-27 Sanofi Sa Fusion proteins for treating a metabolic syndrome
PL224377B1 (pl) * 2012-11-02 2016-12-30 Inst Biochemii I Biofizyki Polskiej Akademii Nauk Szczep Trichoderma atroviride, sposób otrzymywania i zastosowanie szczepu Trichoderma atroviride jako środka biobójczego
CA2924541A1 (en) * 2013-09-19 2015-03-26 Firmenich Sa Method for producing fragrant alcohols
WO2016027943A1 (ko) * 2014-08-21 2016-02-25 중앙대학교 산학협력단 rDNA NTS 기반 유전자 다중 삽입 카세트 세트 및 이를 이용한 GRAS 등급의 재조합 효모 균주
WO2016168681A1 (en) * 2015-04-15 2016-10-20 William Marsh Rice University Iterative platform for the synthesis of alpha functionalized products
US11697830B2 (en) * 2015-04-15 2023-07-11 Ramon Gonzalez Iterative platform for the synthesis of alpha functionalized products
CN105177007B (zh) * 2015-10-30 2017-11-10 上海交通大学 一种调控基因在非分泌型腺毛中表达的启动子及其应用
CN105274109B (zh) * 2015-10-30 2017-12-29 上海交通大学 一种调控基因在非分泌型腺毛中表达的启动子及其应用
CN105483236A (zh) * 2015-12-26 2016-04-13 吉林省农业科学院 转基因植物中cry1C基因的LAMP检测引物组、试剂盒及检测方法
CN105567685B (zh) * 2016-01-18 2018-07-13 上海交通大学 AaPDR3基因启动子及其应用
WO2018057385A2 (en) 2016-09-20 2018-03-29 22Nd Century Limited, Llc Trichome specific promoters for the manipulation of cannabinoids and other compounds in glandular trichomes
WO2018111194A1 (en) * 2016-12-16 2018-06-21 Temasek Life Sciences Laboratory Limited Targets for improving terpene production in rhodosporidium toruloides
BR112019019966A2 (pt) 2017-03-24 2020-04-28 Trait Biosciences Inc biossíntese in vivo de alto nível e isolamento de canabinoides solúveis em água em sistemas de plantas
EP3679153A4 (en) 2017-07-11 2021-01-06 Trait Biosciences, Inc. GENERATION OF WATER-SOLUBLE CANNABINOID COMPOUNDS IN YEAST AND PLANT CELL SUSPENSION CULTURES AND COMPOSITIONS
US11946059B2 (en) 2017-07-11 2024-04-02 Trait Biosciences, Inc. In vivo generation of water-soluble cannabinoids in plant cell suspension cultures
US11905543B2 (en) 2017-07-11 2024-02-20 Trait Biosceinces, Inc. In vivo generation of water-soluble acetylated cannabinoid glycoside compounds in plant cell suspension cultures
BR112022013523A2 (pt) * 2020-01-23 2022-09-13 Amyris Inc Polipeptídeo da amorfa-4,11-dieno 12-mono-oxigenase variante, ácido nucleico, célula hospedeira e método para gerar uma variante
CN111621508B (zh) * 2020-06-11 2022-07-01 云南中烟工业有限责任公司 烟草萜类合成酶NtTPS7基因及其载体与应用

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5451513A (en) 1990-05-01 1995-09-19 The State University of New Jersey Rutgers Method for stably transforming plastids of multicellular plants
EP0640136B1 (en) * 1992-03-27 2003-05-07 INTERNATIONAL FLOWER DEVELOPMENTS Pty. Ltd. Genetic sequences encoding flavonoid pathway enzymes with flavonoid 3'-hydroxylase activity and uses thereof
FR2689905B1 (fr) * 1992-04-13 1995-07-13 Orsan Procede de clonage d'une sequence d'adn codant pour une nadph cytochrome p450 reductase et sequences d'adn codant pour une nadph-cytochrome p450 reductase, notamment de plantes.
US5576198A (en) 1993-12-14 1996-11-19 Calgene, Inc. Controlled expression of transgenic constructs in plant plastids
US5545817A (en) 1994-03-11 1996-08-13 Calgene, Inc. Enhanced expression in a plant plastid
US5545818A (en) 1994-03-11 1996-08-13 Calgene Inc. Expression of Bacillus thuringiensis cry proteins in plant plastids
NZ296581A (en) 1994-12-09 2000-02-28 Imp College Innovations Ltd A method of identifying genes identified in a microorganisms ability to adapt to changes in its environment
HUP0002926A3 (en) * 1997-03-07 2005-11-28 Syngenta Participations Ag Cytochrome p450 monooxygenases
US6900012B1 (en) 1997-06-03 2005-05-31 The University Of Chicago Plant artificial chromosome compositions and methods
US6083731A (en) * 1997-06-24 2000-07-04 Washington State University Research Foundation Recombinant materials and methods for the production of limonene hydroxylases
US6080849A (en) 1997-09-10 2000-06-27 Vion Pharmaceuticals, Inc. Genetically modified tumor-targeted bacteria with reduced virulence
EP0982404A1 (en) * 1998-08-27 2000-03-01 Wallaart, Thorvald Eelco DNA encoding amorpha-4,11-diene synthase
US6645747B1 (en) 1999-09-21 2003-11-11 E. I. Du Pont De Nemours And Company Cis-prenyltransferases from plants
US6369212B1 (en) 2000-02-07 2002-04-09 Korea Kumbo Petrochemical Co., Ltd. Cytochrome P450 gene highly expressed in the incompatible interaction
CN1491282A (zh) * 2000-12-28 2004-04-21 丰田自动车株式会社 异戊二烯醇的制备方法
GB0105924D0 (en) 2001-03-09 2001-04-25 Microscience Ltd Promoter
CA2440278C (en) 2001-03-09 2017-02-28 University Of Kentucky Research Foundation Cytochrome p450s and uses thereof
AUPR446701A0 (en) * 2001-04-18 2001-05-17 Gene Stream Pty Ltd Transgenic mammals for pharmacological and toxicological studies
US7214507B2 (en) 2001-09-17 2007-05-08 Plant Research International B.V. Plant enzymes for bioconversion
US20040162420A1 (en) * 2002-10-16 2004-08-19 U.S. Smokeless Tobacco Company Cloning of cytochrome p450 genes from nicotiana
US7192751B2 (en) 2001-12-06 2007-03-20 The Regents Of The University Of California Biosynthesis of amorpha-4,11-diene
US7172886B2 (en) 2001-12-06 2007-02-06 The Regents Of The University Of California Biosynthesis of isopentenyl pyrophosphate
US6733996B2 (en) 2002-08-26 2004-05-11 Trustees Of Dartmouth College Methods for regulating gene expression using light
WO2007005604A2 (en) * 2005-07-05 2007-01-11 The Regents Of The University Of California Polynucleotides encoding isoprenoid modifying enzymes and methods of use thereof
WO2007048235A1 (en) * 2005-10-24 2007-05-03 National Research Council Of Canada A novel gene encoding amorphadiene hydroxylase and a process to produce artemisinic alcohol therewith

Also Published As

Publication number Publication date
BRPI0612411A2 (pt) 2010-11-09
US8759632B2 (en) 2014-06-24
MX2008000200A (es) 2008-04-07
US20100218283A1 (en) 2010-08-26
DK1919514T3 (da) 2012-08-20
US8163980B2 (en) 2012-04-24
KR20130054468A (ko) 2013-05-24
BRPI0612411B8 (pt) 2021-05-25
JP2009504138A (ja) 2009-02-05
SI1919514T1 (sl) 2012-08-31
CN106939323B (zh) 2021-07-13
CN103667370B (zh) 2016-08-10
CN105950667A (zh) 2016-09-21
EP2489672B1 (en) 2017-01-18
SG176459A1 (en) 2011-12-29
BRPI0612411B1 (pt) 2020-05-05
HK1134495A1 (en) 2010-04-30
CN101495499B (zh) 2013-09-04
KR101487304B1 (ko) 2015-01-28
KR101444090B1 (ko) 2014-09-26
CN106939323A (zh) 2017-07-11
IL188376A (en) 2012-12-31
WO2007005604A3 (en) 2008-12-31
US20120288905A1 (en) 2012-11-15
EP1919514A4 (en) 2009-12-02
AP3827A (en) 2016-09-30
WO2007005604A2 (en) 2007-01-11
AP2013006962A0 (en) 2013-07-31
CN101495499A (zh) 2009-07-29
EP1919514A2 (en) 2008-05-14
CA2613469C (en) 2014-08-12
EP2489672A3 (en) 2013-01-09
BRPI0612411A8 (pt) 2017-12-26
KR20080031054A (ko) 2008-04-07
CN103667370A (zh) 2014-03-26
IL188376A0 (en) 2008-04-13
CA2613469A1 (en) 2007-01-11
ES2621657T3 (es) 2017-07-04
PL1919514T3 (pl) 2012-10-31
EP1919514B1 (en) 2012-05-16
ES2386554T3 (es) 2012-08-22
ZA200800889B (en) 2009-09-30
EP2489672A2 (en) 2012-08-22

Similar Documents

Publication Publication Date Title
US8759632B2 (en) Polynucleotides encoding isoprenoid modifying enzymes and methods of use thereof
US8097438B2 (en) Nucleic acids encoding modified cytochrome P450 enzymes and methods of use thereof
CA2574593C (en) Genetically modified host cells and use of same for producing isoprenoid compounds
TW200846470A (en) Genetically modified host cells for increased P450 activity levels and methods of use thereof
US9856460B2 (en) Nucleic acids encoding synthetic scaffolds and host cells genetically modified with the nucleic acids
CN101283089A (zh) 修饰细胞色素p450酶的编码核酸和其应用方法