BR112020024197A2 - método para produção biocatalítica de compostos de terpeno - Google Patents

método para produção biocatalítica de compostos de terpeno Download PDF

Info

Publication number
BR112020024197A2
BR112020024197A2 BR112020024197-0A BR112020024197A BR112020024197A2 BR 112020024197 A2 BR112020024197 A2 BR 112020024197A2 BR 112020024197 A BR112020024197 A BR 112020024197A BR 112020024197 A2 BR112020024197 A2 BR 112020024197A2
Authority
BR
Brazil
Prior art keywords
seq
amino acid
acid sequence
diphosphate
polypeptide
Prior art date
Application number
BR112020024197-0A
Other languages
English (en)
Inventor
Michel Schalk
Letizia ROCCI
Daniel Solis Escalante
Original Assignee
Firmenich S/A
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Firmenich S/A filed Critical Firmenich S/A
Publication of BR112020024197A2 publication Critical patent/BR112020024197A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • C12P17/04Oxygen as only ring hetero atoms containing a five-membered hetero ring, e.g. griseofulvin, vitamin C
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/18Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01001Alcohol dehydrogenase (1.1.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/07Diphosphoric monoester hydrolases (3.1.7)
    • C12Y301/07003Monoterpenyl-diphosphatase (3.1.7.3)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

“método para produção biocatalítica de compostos de terpeno”. são fornecidos no presente documento métodos biocatalíticos para produzir compostos de terpeno pela aplicação de um tipo inovador de enzima fosfatase. o método permite a síntese totalmente bioquímica de compostos de terpeno, como por exemplo copalol e labdendiol, e derivados dos mesmos, que servem como intermediários valiosos para a produção de ingredientes de perfumaria, tais como, por exemplo, ambrox. também são fornecidos processos de múltiplas etapas totalmente bioquímicos inovadores para a produção de tais compostos, bem como enzimas fosfatase inovadoras e mutantes e variantes derivados das mesmas.

Description

“MÉTODO PARA PRODUÇÃO BIOCATALÍTICA DE COMPOSTOS DE TERPENO” CAMPO DA TÉCNICA
[0001] São fornecidos no presente documento métodos biocatalíticos para produzir compostos de terpeno pela aplicação de um tipo inovador de enzima fosfatase. O método permite a síntese totalmente bioquímica de compostos de terpeno, como por exemplo copalol e labdendiol, e derivados dos mesmos, que servem como intermediários valiosos para a produção de ingredientes de perfumaria, tais como, por exemplo, ambrox ou gama-ambrol. Também são fornecidos processos de múltiplas etapas totalmente bioquímicos inovadores para a produção de tais compostos, bem como enzimas fosfatase inovadoras e mutantes e variantes derivados dos mesmos.
ANTECEDENTES
[0002] Terpenos são encontrados na maioria dos organismos (micro-organismos, animais e plantas). Esses compostos são constituídos por cinco unidades de carbono denominadas unidades de isopreno e são classificados pelo número dessas unidades presentes em sua estrutura. Assim, monoterpenos, sesquiterpenos e diterpenos são terpenos que contêm 10, 15 e 20 átomos de carbono, respectivamente. Sesquiterpenos, por exemplo, são amplamente encontrados no reino vegetal. Muitas moléculas de sesquiterpeno são conhecidas por suas propriedades de sabor e fragrância e seus efeitos cosméticos, medicinais e antimicrobianos. Inúmeros hidrocarbonetos sesquiterpeno e sesquiterpenoides têm sido identificados.
[0003] A produção biossintética de terpenos envolve enzimas chamadas terpeno sintases. Essas enzimas convertem um precursor de terpeno acíclico em um ou mais produtos de terpeno. Em particular, as diterpeno sintases produzem diterpenos pela ciclização do precursor de difosfato de geranilgeranila (GGPP). A ciclização de GGPP frequentemente exige dois polipeptídeos de enzima, uma diterpeno sintase do tipo I e tipo II que funciona em combinação em duas reações enzimáticas sucessivas. As diterpeno sintases do tipo II catalisam uma ciclização/redisposição de GGPP iniciado pela protonação da ligação dupla terminal de GGPP que leva a um intermediário de difosfato de diterpeno cíclico. Esse intermediário é, então, adicionalmente convertido por uma diterpeno sintase do tipo I que catalisa uma ciclização iniciada por ionização.
[0004] As diterpeno sintases estão presentes em plantas e em outros organismos e usam substratos, como GGPP, mas têm diferentes perfis de produto. Os genes e cDNAs que codificam as diterpeno sintases foram clonados e as enzimas recombinantes correspondentes foram caracterizadas.
[0005] As enzimas que catalisam uma clivagem específica ou preferencial ou remoção de grupos difosfato de intermediários difosfato de terpeno, em particular de intermediários difosfato de terpeno cíclico, como os diterpenos difosfato de copalilo (CPP) ou difosfato de labdendiol (LPP), não foram descritas até agora. A fim de realizar a dita clivagem, seria necessária uma clivagem química da ligação fosfoéster.
[0006] O problema a ser resolvido pela presente invenção é fornecer polipeptídeos que mostrem a atividade enzimática de uma fosfatase que seja aplicável na clivagem enzimática de ligações difosfato de terpenilo e que permita a produção biocatalítica de álcoois terpênicos.
SUMÁRIO
[0007] O problema acima mencionado pode ser surpreendentemente resolvido fornecendo-se uma nova classe de enzimas que mostram atividade de difosfato de terpenilo fosfatase que são selecionadas de um subgrupo de enzimas de remoção de difosfato da grande família da proteína tirosina fosfatase. A aplicabilidade de tais enzimas da família da proteína tirosina fosfatase como fosfatases que utilizam difosfatos de terpenilo como substratos, em particular tais compostos bicíclicos complexos como CPP e LPP, não foi descrita na técnica anterior.
[0008] Essa abordagem permite o fornecimento de métodos mais econômicos para produzir intermediários de terpeno tais como copalol e labdendiol, que são blocos de construção para a preparação de ingredientes de perfumaria altamente valiosos tais como Ambrox.
[0009] Em algumas modalidades da invenção, também é fornecida a produção biocatalítica de álcoois terpênicos não cíclicos, como farnesol ou geranilgeraniol, a partir dos precursores de difosfato correspondentes.
[0010] A dita etapa biocatalítica pode ser acoplada a várias outras etapas enzimáticas anteriores ou sucessivas e permitir o fornecimento de um processo de múltiplas etapas biocatalítico para a síntese totalmente enzimática de moléculas de terpeno complexas valiosas a partir de seus respectivos precursores.
DESCRIÇÃO DOS DESENHOS
[0011] Figura 1. Via biossintética de copalol. 1, pirofosfato de farnesilo sintase. 2, pirofosfato de geranilogeranilo sintase. 3, pirofosfato de copalilo sintase. 4, Fosfatase.
[0012] Figura 2a. Cromatograma de uma análise GC-MS de copalol produzido por células de E. coli. Cromatograma Superior: Células de E. coli que produzem as enzimas recombinantes de uma via de mevalonato, uma CPP sintase e AspWeTPP. Cromatograma Intermediário: Células de E. coli que produzem as enzimas recombinantes de uma via de mevalonato, uma CPP sintase e TalVeTPP. Cromatograma Inferior: Controle com células de E. coli que produzem as enzimas recombinantes de uma via de mevalonato e uma CPP sintase.
[0013] Figura 2b. Espectro de massa do copalol produzido por células de E. coli (pico com tempo de retenção de 16,7 na figura 1a) (A) e espectro de massa de copalol autêntico (B).
[0014] Figura 3. Produção de copalol em células de E. coli manipuladas com o uso de TalVeTPP e AspWeTPP.
[0015] Figura 4. Produção de copalol em células de E. coli manipuladas com o uso de TalVeTPP, AspWeTPP, HelGriTPP1, UmbPiTPP1, TalVeTPP2, HydPiTPP1, TalCeTPP1, TalMaTPP1, TalAstroTPP1 ou PeSubTPP1.
[0016] Figura 5. Via biossintética de labdendiol. 1, pirofosfato de farnesilo sintase. 2, pirofosfato de geranilogeranilo sintase. 3, pirofosfato de labdendiol sintase. 4, Fosfatase.
[0017] Figura 6. Produção de labdendiol em células de E. coli manipuladas com o uso de TalVeTPP, AspWeTPP, HelGriTPP1, UmbPiTPP1, TalVeTPP2, HydPiTPP1, TalCeTPP1, TalMaTPP1, TalAstroTPP1 ou PeSubTPP1.
[0018] Figura 7a. Cromatograma de uma análise GC-MS de labdendiol produzido por células de E. coli. Cromatograma Superior: Células de E. coli que produzem as enzimas recombinantes de uma via de mevalonato, uma LPP sintase e HelGriTPP1.
Cromatograma Inferior: Controle com células de E. coli que produzem as enzimas recombinantes de uma via de mevalonato e uma LPP sintase.
[0019] Figura 7b. Espectro de massa do labdendiol produzido por células de E. coli (pico com tempo de retenção de 18,2 na figura 6a) (A) e espectro de massa de copalol autêntico (B).
[0020] Figura 8. Via biossintética do farnesol e geranilogeraniol. 1, pirofosfato de farnesilo sintase. 2, pirofosfato de geranilogeranilo sintase. 3, Fosfatase.
[0021] Figura 9. Produção de farnesol e geranilogeraniol em células de E. coli manipuladas com o uso de TalVeTPP, AspWeTPP, HelGriTPP1, UmbPiTPP1, TalVeTPP2, HydPiTPP1, TalCeTPP1, TalMaTPP1, TalAstroTPP1 ou PeSubTPP1.
[0022] Figura 10. Comparação da produção de farnesol, geranilogeraniol, copalol e labdediol em células de E. coli manipuladas com o uso de TalVeTPP, AspWeTPP, HelGriTPP1, UmbPiTPP1, TalVeTPP2, HydPiTPP1, TalCeTPP1, TalMaTPP1, TalAstroTPP1 ou PeSubTPP1. Os valores são relativos à quantidade máxima produzida para cada composto definido como 100.
[0023] Figura 11. Produção de compostos de terpeno em células de E. coli manipuladas transformadas com o plasmídeo CPOL-2 e LOH-2 e comparação com células que produzem LPP e CPP sem expressar uma fosfatase recombinante.
[0024] Figura 12. Produção de copalal em células manipuladas. A figura mostra os cromatogramas da análise de GC-MS de copalal produzido por células de E. coli. As células foram projetadas para produzir difosfato de copalilo a partir da via de mevalonato e para expressar uma Proteína tirosina fosfatase e uma enzima ADH. As diferentes ADHs expressas nas células são indicadas para cada cromatograma.
[0025] Figura 13. Cromatograma de GCMS que mostra a formação de farnesal a partir de farnesol em células manipuladas para produzir as enzimas recombinantes de uma via de mevalonato, uma CPP sintase, uma proteína tirosina fosfatase e uma ADH.
[0026] Figura 14. Análise de GCMS da produção dos produtos oxidados de labdendiol em células de E. coli manipuladas para produzir as enzimas recombinantes de uma via de mevalonato, uma LPP sintase, uma proteína tirosina fosfatase e uma ADH. As diferentes ADHs expressas nas células são indicadas para cada cromatograma. O pico do labdendiol e seus produtos oxidados são rotulados 1 e 2, respectivamente.
[0027] Figura 15. Representação esquemática da integração cromossômica dos genes que codificam para as enzimas da via de mevalonato e organização dos dois operons de gene sintético. mvaK1, um gene que codifica uma mevalonato quinase de S. pneumoniae; mvaD, um gene que codifica uma fosfomevalonato descarboxilase de S. pneumoniae; mvaK2, um gene que codifica uma fosfomevalonato quinase de S. pneumoniae; fni um gene que codifica uma difosfato de isopentenilo isomerase de S. pneumoniae; mvaA, um gene que codifica uma HMG-CoA sintase de S. aureus; mvaS um gene que codifica uma HMG-CoA redutase de S. aureus; atoB um gene que codifica uma acetoacetil-CoA tiolase de E. coli; ERG20, um gene que codifica uma FPP sintase de S. cerevisiae.
[0028] Figura 16a. Alinhamento das sequências de aminoácidos da difosfato de terpenilo fosfatase e sequência consenso deduzida. Os resíduos conservados estão em letras brancas sobre fundo preto.
[0029] Figura 16b. Alinhamento das sequências de aminoácidos da região do motivo conservado da difosfato de terpenilo fosfatase e sequência consenso deduzida. Os resíduos conservados estão em letras brancas sobre fundo preto.
[0030] Figura 17. Via biossintética de 18,13-epóxi-labdan-15-al. Setas tracejadas representam múltiplas etapas enzimáticas. 1, Fosfatase; 2, álcool desidrogenase. As etapas a seguir são reações de rearranjo não enzimático.
[0031] Figura 18. Análise GC-MS de copalol e copalal produzido com o uso de cepas de S. cereviciae modificadas que expressam a GGPP sintase CrtE, a CPP sintase SmCPS2, a CPP fosfatase TalVeTPP e uma das seguintes álcool desidrogenases: AzTolADH1, PsAeroADH1, SCH23-ADH1 ou SCH24-ADH1.
ABREVIAÇÕES USADAS
[0032] ADH álcool desidrogenase
[0033] bp par de bases
[0034] kb quilobase
[0035] CPP difosfato de copalilo
[0036] CPS difosfato de copalilo sintase
[0037] DNA ácido desoxirribonucleico
[0038] cDNA DNA complementar
[0039] DMAPP difosfato de dimetilalilo
[0040] DTT ditiotreitol
[0041] FPP difosfato de farnesilo
[0042] GPP difosfato de geranilo
[0043] GGPP difosfato de geranilogeranilo
[0044] GGPS difosfato de geranilogeranilo sintase
[0045] GC cromatrografia gasosa
[0046] IPP difosfato de isopentenilo
[0047] LPP Difosfato de labdendiol
[0048] LPS difosfato de labdendiol sintase
[0049] MS espectrômetro de massa/espectrometria de massa
[0050] MVA ácido mevalônico
[0051] PP difosfato, pirofosfato
[0052] PCR reação em cadeia de polimerase
[0053] RNA ácido ribonucleico
[0054] mRNA ácido ribonucleico mensageiro
[0055] miRNA micro-RNA
[0056] siRNA RNA interferente curto
[0057] rRNA RNA ribossômico
[0058] tRNA RNA de transferência
[0059] TPP difosfato de terpenilo
[0060] DEFINIÇÕES
[0061] "Difosfato" e "pirofosfato", como usados no presente documento, são sinônimos.
[0062] "Terpenilo" designa resíduos de hidrocarbilo químicos não cíclicos e cíclicos que são derivados do isopreno do bloco de construção C5 e, em particular, contêm um ou mais desses blocos de construção.
[0063] "Terpeno bicíclico" ou terpenilo bicíclico" ou "diterpeno bicíclico" ou "diterpenilo bicíclico" se refere a um composto de terpeno ou resíduo de terpenilo que compreende em sua estrutura dois anéis carbocíclicos, preferencialmente dois anéis carbocíclicos condensados.
[0064] Um resíduo de "hidrocarbilo" é um grupo químico que é composto essencialmente por átomos de carbono e hidrogênio e pode ser uma porção química cíclica (por exemplo mono ou policíclica) ou não cíclica, linear ou ramificada, saturada ou insaturada. O mesmo compreende mais de um, como 2, 3, 4 ou 5, mas, em particular, 5 ou mais átomos de carbono, tal como 5 a 30, 5 a 25, 5 a 20, 5 a 15 ou 5 a 10 átomos de carbono. O dito grupo hidrocarbilo pode ser não substituído ou pode conter pelo menos um, como 1 a 5, preferencialmente, 0, 1 ou 2 substituintes. O substituinte contém um heteroátomo, como O ou N. Preferencialmente, os substituintes são selecionados independentemente de –OH, C=O ou -COOH. Mais preferencialmente, o dito substituinte é –OH.
[0065] Um "resíduo de hidrocarbilo mono ou policíclico" compreende 1, 2 ou 3 grupos de anel de hidrocarboneto (ou grupos "carbocíclicos") condensados (anelados) ou não condensados, opcionalmente substituídos, saturados ou insaturados. Cada ciclo pode compreender, independentemente um do outro, 3 a 8, em particular 5 a 7, mais particularmente, 6 átomos de carbono no anel. Como exemplos de resíduos monocíclicos, podem ser mencionados grupos "cicloalquilo" que são radicais carbocíclicos com 3 a 7 átomos de carbono no anel, tais como ciclopropilo, ciclobutilo, ciclopentilo, ciclohexilo, ciclo-heptilo e ciclo-octilo; e os grupos "cicloalquenilo" correspondentes. "Cicloalquenilo" (ou "cicloalquilo mono ou poli-insaturado") representa, em particular, grupos carbocíclicos monocíclicos, mono ou poli- insaturados com 5 a 8, preferencialmente até 6, membros do anel de carbono, por exemplo, radicais ciclopentenilo, ciclo-hexenilo, ciclo-heptenilo e ciclo-octenilo monoinsaturados.
[0066] Como exemplos de resíduos policíclicos, podem ser mencionados grupos, em que 1, 2 ou 3 de tal cicloalquilo e/ou cicloalquenilo são ligados entre si, como, por exemplo, anelados, a fim de formar um anel de cicloalquilo ou cicloalquenilo policíclico.
Como exemplo não limitante, pode ser mencionado o resíduo de decalinilo bicíclico composto por dois anéis de carbono de 6 membros anelados.
[0067] O número de substituintes em tais resíduos de hidrocarbilo mono ou policíclicos pode variar de 1 a 10, em particular, 1 a 5 substituintes. Substituintes adequados de tais resíduos cíclicos são selecionados de alquilo inferior, alquenilo inferior, alquilideno, alquenilideno ou resíduos que contêm um heteroátomo tal como O ou N, como, por exemplo, –OH ou –COOH. Em particular, os substituintes são selecionados independentemente de –OH, –COOH, metilo e metilideno.
[0068] O termo "alquilo inferior" ou "alquilo de cadeia curta" representa radicais de hidrocarbonetos saturados, de cadeia linear ou ramificada que tem 1 a 4, 1 a 5, 1 a 6 ou 1 a 7, em particular 1 a 4 átomos de carbono. Como exemplos, podem ser mencionados: metilo, etilo, n-propilo, 1-metiletilo, n-butilo, 1-metilpropilo, 2- metilpropilo, 1,1-dimetiletilo, n-pentilo, 1-metilbutilo, 2-metilbutilo, 3-metilbutilo, 2,2- dimetilpropilo, 1-etilpropilo, n-hexilo, 1,1-dimetilpropilo, 1,2-dimetilpropilo, 1- metilpentilo, 2-metilpentilo, 3-metilpentilo, 4-metilpentilo, 1,1-dimetilbutilo, 1,2- dimetilbutilo, 1,3-dimetilbutilo, 2,2-dimetilbutilo, 2,3-dimetilbutilo, 3,3-dimetilbutilo, 1- etilbutilo, 2-etilbutilo, 1,1,2-trimetilpropilo, 1,2, 2-trimetilpropilo, 1-etil-1-metilpropilo e 1-etil-2-metilpropilo; e também n-heptilo, e análogos individual ou multiplamente ramificados dos mesmos.
[0069] "Alquenilo de cadeia curta" ou "alquenilo inferior" representa radicais de hidrocarboneto mono ou poli-insaturados, especialmente monoinsaturados, de cadeia linear ou ramificada que tem 2 a 4, 2 a 6 ou 2 a 7 átomos de carbono e uma ligação dupla em qualquer posição,, por exemplo, alquenilo C2-C6, tal como etenilo, 1- propenilo, 2-propenilo, 1-metiletenilo, 1-butenilo, 2-butenilo, 3-butenilo, 1-metil-1- propenilo, 2-metil-1-propenilo, 1-metil-2-propenilo, 2-metil-2-propenilo, 1-pentenilo, 2- pentenilo, 3-pentenilo, 4-pentenilo, 1-metil-1-butenilo, 2-metil-1-butenilo, 3-metil-1- butenilo, 1-metil-2-butenilo, 2-metil-2-butenilo, 3-metil-2-butenilo, 1-metil-3-butenilo, 2- metil-3-butenilo, 3-metil-3-butenilo, 1,1-dimetil-2-propenilo, 1,2-dimetil-1-propenilo, 1,2-dimetil-2-propenilo, 1-etil-1-propenilo, 1-etil-2-propenilo, 1-hexenilo, 2-hexenilo, 3- hexenilo, 4-hexenilo, 5-hexenilo, 1-metil-1-pentenilo, 2-metil-1-pentenilo, 3-metil-1-
pentenilo, 4-metil-1-pentenilo, 1-metil-2-pentenilo, 2-metil-2-pentenilo, 3-metil-2- pentenilo, 4-metil-2-pentenilo, 1-metil-3-pentenilo, 2-metil-3-pentenilo, 3-metil-3- pentenilo, 4-metil-3-pentenilo, 1-metil-4-pentenilo, 2-metil-4-pentenilo, 3-metil-4- pentenilo, 4-metil-4-pentenilo, 1,1-dimetil-2-butenilo, 1,1-dimetil-3-butenilo, 1,2- dimetil-1-butenilo, 1,2-dimetil-2-butenilo, 1,2-dimetil-3-butenilo, 1,3-dimetil-1-butenilo, 1,3-dimetil-2-butenilo, 1,3-dimetil-3-butenilo, 2,2-dimetil-3-butenilo, 2,3-dimetil-1- butenilo, 2,3-dimetil-2-butenilo, 2,3-dimetil-3-butenilo, 3,3-dimetil-1-butenilo, 3,3- dimetil-2-butenilo, 1-etil-1-butenilo, 1-etil-2-butenilo, 1-etil-3-butenilo, 2-etil-1-butenilo, 2-etil-2-butenilo, 2-etil-3-butenilo, 1,1,2-trimetil-2-propenilo, 1-etil-1-metil-2-propenilo, 1-etil-2-metil-1-propenil e 1-etil-2-metil-2-propenilo.
[0070] Um grupo "alquilideno" representa um substituinte de hidrocarboneto de cadeia linear ou ramificada ligado por meio de uma ligação dupla ao corpo da molécula. O mesmo compreende de 1 a 6 átomos de carbono. Como exemplos de tais “alquilidenos C1-C6” podem ser mencionados metilideno (=CH2 etilideno), (CH=CH-CH2), n-propilideno, n-butilideno, n-pentilideno, n-hexilideno e os isômeros constitucionais dos mesmos, como, por exemplo, isopropilideno.
[0071] Um "alquenilideno" representa o análogo monoinsaturado dos alquilidenos mencionados acima com mais de 2 átomos de carbono e pode ser denominado "alquenilidenos C3-C6", n-propenilideno, n-butenilideno, n-pentenilideno e n- hexenilideno podem ser mencionados como exemplos.
[0072] Os grupos cíclicos insaturados podem conter 1 ou mais, como, por exemplo, 1, 2 ou 3 ligações C=C e são aromáticos ou, em particular, não aromáticos.
[0073] Exemplos particulares de resíduos cíclicos são grupos da fórmula Cyc-A-, em que A representa uma ponte de alquileno C1-C4 de cadeia linear ou ramificada, em particular, metileno, e Cyc representa um resíduo hidrocarbilo mono ou policíclico, em particular bicíclico, saturado ou insaturado, em particular um resíduo de hidrocarbilo bicíclico anelado, que compreende 5 a 7, em especial 6 átomos de anel por ciclo, eventualmente substituído por 1 a 10, 1 a 5 substituintes os quais são selecionados independentemente de alquilo C1-C4, alquilideno C1-C4, alquenilo C2-C4, oxo, hidroxi ou amino, em alquilo C1-C4 tal como metilo, e alquilideno C1-C4, como metilideno. Cyc-
A representa em particular grupos das fórmulas IIIa, IIIb ou IIIc
OH
[0074] Exemplos típicos de compostos que contêm tais resíduos são aqueles de fórmula (1) abaixo, em particular copalol e labdendiol e seus estereoisômeros.
[0075] Exemplos de não limitantes alquilo C1-C4 são metilo, etilo, n-propilo, 1- metiletilo, n-butilo, 1-metilpropilo, 2-metilpropilo, 1,1-dimetiletilo.
[0076] Exemplos não limitantes de alquilideno C1-C4 são metilideno (=CH2), etilideno, (=CH-CH2), n-propilideno, n-butilideno e os isômeros constitucionais dos mesmos.
[0077] Exemplos não limitantes de alquenilo C2-C4 são etenilo, 1-propenilo, 2- propenilo, 1-metiletenilo, 1-butenilo, 2-butenilo, 3-butenilo, 1-metil-1-propenilo, 2- metil-1-propenilo, 1-metil-2-propenilo, 2-metil-2-propenilo.
[0078] Exemplos não limitantes de alquileno C1-C4 - são -CH2-, -(CH2)2-, -(CH2)3-, -(CH2)4-, -(CH2)2-CH(CH3)-, -CH2-CH(CH3)-CH2-,
[0079] Uma molécula "precursora" de um composto alvo, como descrito no presente documento, é convertida no dito composto alvo, preferencialmente através da ação enzimática de um polipeptídeo adequado realizando pelo menos uma mudança estrutural na dita molécula precursora. Por exemplo, um "precursor de difosfato" (como, por exemplo, um "precursor de difosfato de terpenilo") é convertido no dito composto alvo (como, por exemplo, um álcool terpênico) por meio da remoção enzimática da porção química de difosfato, por exemplo, por remoção de grupos mono ou difosfato por uma enzima fosfatase. Por exemplo, um "precursor não cíclico" (como um "precursor de terpenilo não cíclico") pode ser convertido na molécula alvo cíclica (como um composto de terpeno cíclico) através da ação de uma enzima ciclase ou sintase, independentemente do mecanismo enzimático específico dessa enzima, em uma ou mais etapas.
[0080] Uma "terpeno sintase" designa um polipeptídeo que converte uma molécula precursora de terpeno na respectiva molécula alvo de terpeno como, em particular, um álcool terpênico alvo processado. Exemplos não limitantes de tais moléculas precursoras de terpeno são, por exemplo, compostos não cíclicos, selecionados de pirofosfato de farnesilo (FPP), pirofosfato de geranilogeranilo (GGPP), ou uma mistura de pirofosfato de isopentenilo (IPP) e pirofosfato de dimetilalilo (DMAPP). Caso o terpeno obtido contenha uma porção química difosfato, a sintase é designada "difosfato de terpenilo sintase".
[0081] Os termos "difosfato de terpenilo sintase" ou "polipeptídeo com atividade de difosfato de terpenilo sintetase" ou "proteína difosfato de terpenilo sintase" ou "que tem a capacidade de produzir difosfato de terpenilo" se referem a um polipeptídeo capaz de catalisar a síntese de um difosfato de terpenilo, na forma de qualquer um dos seus estereoisômeros ou uma mistura dos mesmos, partindo de um pirofosfato de terpeno acíclico, particularmente GPP, FPP ou GGPP ou IPP juntamente com DMAPP. O difosfato de terpenilo pode ser o único produto ou pode fazer parte de uma mistura de fosfatos de terpenilo. A dita mistura pode compreender monofosfato de terpenilo e/ou um álcool terpênico. A definição acima também se aplica ao grupo de "difosfato de diterpenilo sintases bicíclicas", que produzem um difosfato de terpenilo bicíclico tal como CPP ou LPP.
[0082] Como exemplo de tais enzimas "difosfato de terpenilo sintetase" ou "difosfato de diterpenilo sintetase" pode ser mencionada difosfato de copalilo sintase (CPS). O difosfato de copalilo pode ser o único produto ou pode fazer parte de uma mistura de fosfatos de copalilo. A dita mistura pode compreender monofosfato de copalilo e/ou outro difosfato de terpenilo.
[0083] Como exemplo de tais enzimas "difosfato de terpenilo sintetase" ou "difosfato de diterpenilo sintetase" podem ser mencionadas enzimas e difosfato de labdendiol sintase (LPS). O difosfato de labdendiol pode ser o único produto ou pode fazer parte de uma mistura de fosfatos de labdendiol. A dita mistura pode compreender monofosfato de labdendiol e/ou difosfato de terpenilo.
[0084] "Atividade de difosfato de terpenilo sintase" ou "difosfato de diterpenilo sintase" (como atividade de CPS ou LPS) é determinada sob "condições padrão", como descrito abaixo no presente documento: As mesmas podem ser determinadas com o uso de células hospedeiras que expressam difosfato de terpenilo sintase recombinante, células que expressam difosfato de terpenilo sintase interrompida, frações dessas ou enzima difosfato de terpenilo sintase enriquecida ou purificada, em um meio de cultura ou meio de reação, preferencialmente tamponado, com um pH na faixa de 6 a 11, preferencialmente, 7 a 9, a uma temperatura na faixa de cerca de 20 a 45 ºC tal como cerca de 25 a 40 ºC, preferencialmente 25 a 32 ºC e na presença de um substrato de referência, aqui, em particular, GGPP, adicionado a uma concentração inicial na faixa de 1 a 100 µM mg/ml, preferencialmente 5 a 50 µM, em particular 30 a 40 µM ou produzida endogenamente pela célula hospedeira. A reação de conversão para formar um difosfato de terpenilo é conduzida de 10 min a 5 h, preferencialmente, cerca de 1 a 2 h. Se nenhuma fosfatase endógena estiver presente, uma ou mais fosfatases exógenas, por exemplo, uma fosfatase alcalina, são adicionadas à mistura de reação para converter o difosfato de terpenilo formado pela sintase no respectivo álcool terpênico. O álcool terpênico pode então ser determinado de maneira convencional, por exemplo, após extração com um solvente orgânico tal como acetato de etilo.
[0085] O termo "proteína tirosina fosfatase" representa um grupo de enzimas que são geralmente conhecidas por remover grupos fosfato de resíduos de tirosina fosforilados em proteínas. Um subgrupo particular da dita família, como descrito no presente documento, são enzimas úteis para desfosforilar moléculas de terpeno fosforiladas.
[0086] Os polipeptídeos da invenção que têm atividade de difosfato de terpenilo fosfatase são identificados como membros da família da proteína tirosina fosfatase em particular da família Y_fosfatase3 com o número de Pfam ID PF13350. Os polipeptídeos podem ser escaneados quanto a correspondências com os bancos de dados de assinatura da família de proteínas Pfam, em particular no banco de dados Pfam versão 32.0 (setembro de 2018), com o uso, por exemplo, dos seguintes web sites: http://pfam.xfam.org/search#tabview=tab0, https://www.ebi.ac.uk/Tools/hmmer/search/hmmscan ou https://www.ebi.ac.uk/Tools/pfa/pfamscan/.
[0087] O termo "Pfam" se refere a uma grande coleção de domínios de proteínas e famílias de proteínas mantidas pelo Consórcio Pfam e disponíveis em vários sítios patrocinados mundialmente, incluindo: pfam.sanger.ac.uk/ (Welcome Trust, Sanger Institute); pfam.sbc.su.se/ (Stockholm Bioinformatics Center) e pfam.janelia.org/ (Janelia Farm, Howard Hughes Medical Institute). A versão mais recente do Pfam é o Pfam 32.0 (setembro de 2018), com base nos Proteomas de referência UniProt (El- Gebali S. et al, 2019, Nucleic Acids Res. 47, Database issue D427 a D432). Domínios e famílias Pfam são identificados com o uso de múltiplos alinhamentos de sequência e modelos ocultos de Markov (HMMs). As atribuições de família ou domínio Pfam-A são atribuições de alta qualidade geradas por um alinhamento de sementes curadas com o uso de membros representativos de uma família de proteínas e modelos de Markov de perfil oculto com base no alinhamento de sementes. (A menos que especificado de outra forma, as correspondências de uma proteína consultada a um domínio ou família Pfam são correspondências Pfam-A) Todas as sequências identificadas pertencentes à família são então usadas para gerar automaticamente um alinhamento completo para a família (Sonnhammer (1998) Nucleic Acids Research 26, 320 a 322; Bateman (2000) Nucleic Acids Research 26, 263 a 266; Bateman (2004) Nucleic Acids Research 32, Database Issue, D138 a D141; Finn (2006) Nucleic Acids Research Database Issue 34, D247 a 251; Finn (2010) Nucleic Acids Research Database Issue 38, D211 a 222). Acessando-se o banco de dados Pfam, por exemplo, com o uso de qualquer um dos websites de referência acima, as sequências de proteínas podem ser consultadas contra os HMMs com o uso de o software de pesquisa de homologia HMMER (por exemplo, HMMER2, HMMER3 ou uma versão superior, hmmer.janelia.org/). Correspondências significativas que identificam uma proteína consultada como estando em uma família pfam (ou como tendo um domínio Pfam particular) são aquelas em que a pontuação de bits é maior ou igual ao limiar de coleta para o domínio Pfam. Os valores de expectativa (valores-e) também podem ser usados como um critério para inclusão de uma proteína consultada em um Pfam ou para determinar se uma proteína consultada tem um domínio Pfam particular, onde valores-e baixos, muito menores do que 1,0, por exemplo, menor de 0,1 ou menos.
[0088] O “valor-E” (valor esperado) é o número de acertos que seriam esperados para ter uma pontuação igual ou melhor que este valor, apenas por acaso. Isso significa que um bom valor-E que fornece uma previsão confiável é muito menor do que 1. Valores-E em torno de 1 é o que é esperado por acaso. Assim, quanto menor o valor-E, mais específica será a busca por domínios. Somente números positivos são permitidos. (definição por Pfam)) Os termos "difosfato de terpenilo fosfatase" ou "polipeptídeo com atividade de difosfato de terpenilo fosfatase" ou "proteína difosfato de terpenilo fosfatase" ou "que tem a capacidade de produzir álcool terpênico" se referem a um polipeptídeo capaz de catalisar a remoção (independentemente de um mecanismo enzimático particular) de uma porção química de difosfato ou porções químicas de monofosfato, para formar um composto desfosforilado, em particular o composto de álcool correspondente da dita porção química terpenilo. O álcool terpênico pode estar presente no produto em qualquer um de seus estereoisômeros ou como uma mistura dos mesmos. O álcool terpênico pode ser o único produto ou pode ser parte de uma mistura com outros compostos terpênicos como, por exemplo, análogos desfosforilados do respectivo (por exemplo não cíclico) precursor de difosfato de terpenilo do dito difosfato de terpenilo. A definição acima também se aplica ao grupo de “difosfato de terpenilo fosfatase bicíclica”, que produz um álcool terpênico bicíclico tal como copalol ou labdendiol. Cada uma das fosfatases mencionadas acima exemplifica uma "enzima de remoção de difosfato".
[0089] Como exemplo de tais enzimas "difosfato de terpenilo fosfatase", pode ser mencionada difosfato de copalilo fosfatase (CPP fosfatase). O copalol pode ser o único produto ou pode ser parte de uma mistura com precursores desfosforilados, como, por exemplo, farnesol e/ou geranilogeraniol; e/ou produtos colaterais resultantes de atividades enzimáticas paralelas na mistura de reação, como ésteres ou aldeídos de tais álcoois ou outros diterpenos cíclicos ou não cíclicos.
[0090] Como outro exemplo de tais enzimas "difosfato de terpenilo fosfatase" podem ser mencionada difosfato de labdendiol fosfatase (LPP fosfatase). O labdendiol pode ser o único produto ou pode ser parte de uma mistura com precursores desfosforilados, como, por exemplo, farnesol e/ou geranilogeraniol; e/ou produtos colaterais resultantes de atividades enzimáticas paralelas na mistura de reação, como ésteres ou aldeídos de tais álcoois ou outros diterpenos cíclicos ou não cíclicos.
[0091] "Atividade de difosfato de terpenilo fosfatase" (como atividade de CPP ou LPP fosfatase) é determinada sob "condições padrão" como descrito abaixo: As mesmas podem ser determinadas com o uso de células hospedeiras que expressam difosfato de terpenilo fosfatase recombinante, células que expressam difosfato de terpenilo fosfatase interrompida, frações dessas ou enzima difosfato de terpenilo fosfatase enriquecida ou purificada, em um meio de cultura ou meio de reação, preferencialmente tamponado, com um pH na faixa de 6 a 11, preferencialmente, 7 a 9, a uma temperatura na faixa de cerca de 20 a 45 ºC tal como cerca de 25 a 40 ºC, preferencialmente 25 a 32 ºC e na presença de um substrato de referência, aqui, por exemplo, CPP ou LPP, adicionado a uma concentração inicial na faixa de 1 a 100 µM mg/ml, preferencialmente 5 a 50 µM, em particular 30 a 40 µM ou produzida endogenamente pela célula hospedeira. A reação de conversão para formar um difosfato de terpenilo é conduzida de 10 min a 5 h, preferencialmente cerca de 1 a 2 h. O álcool terpênico pode então ser determinado de maneira convencional, por exemplo, após extração com um solvente orgânico, como acetato de etilo.
[0092] Exemplos particulares de condições padrão adequadas podem ser retirados da Parte Experimental abaixo.
[0093] Uma "álcool desidrogenase" (ADH), no contexto da presente invenção, se refere a um polipeptídeo que tem a capacidade de oxidar um álcool ao aldeído correspondente na presença de NAD+ ou NADP+ como cofator. Essas enzimas são membros das famílias E.C. 1.1.1.1 (dependente de NAD+) ou 1.1.1.2 (dependente de NADP+). Mais particularmente, uma ADH da invenção tem a capacidade de oxidar copalol em copalal e/ou labdendiol no respectivo aldeído.
[0094] "Copalol", como usado no presente documento, designa (E)-5-[(1S, 4aS,
8aS)-5,5,8a-trimetil-2-metilideno-3,4,4a,6,7,8-hexahidro-1H-naftalen-1-il]-3-metilpent- 2-en-1-ol; Número de registro CAS 10395-43-4.
[0095] "Copalal", como usado no presente documento, designa (2E)-3-metil-5- [(1S,4aS,8aS)-5,5,8a-trimetil-2-metilenodeca-hidro-1-naftalenil]-2-pentenal.
[0096] "Labdendiol", como usado no presente documento designa (1R,2R,4aS,8aS)-1-[(E)-5-hidroxi-3-metilpent-3-enil]-2,5,5,8a-tetrametil-3,4,4a,6,7,8- hexa-hidro-1H-naftalen-2-ol; Número de registro CAS 10267-31-9.
[0097] "Manool como usado no presente documento designa 5-[(1S,4aS,8aS)- 5,5,8a-trimetil-2-metilideno-3,4,4a,6,7,8-hexahidro-1H-naftalen 1-il]-3-metilpent-1-en- 3-ol,
[0098] (+)-Manooloxi como usado no presente documento, designa 4- [(1S,4aS,8aS)-5,5,8a-trimetil-2-metilenodeca-hidro-1-naftalenil]-2-butanona,
[0099] "Z-11" como usado no presente documento, designa (3S,5aR,7aS,11aS,11bR)-3,8,8,11a-tetrametildodecaidro-3,5a-epoxinafto[2,1- c]oxepina,
[00100] "gama-ambrol" como usado no presente documento, designa 2- [(1S,4aS,8aS)-5,5,8a-trimetil-2-metilenodecaidro-1-naftalenil]etanol, e
[00101] Ambrox® como usado no presente documento, designa 3aR,5aS,9aS,9bR)- 3a,6,6,9a-tetrametildodeca-hidronafto[2,1-b]furano.
[00102] "Esclareolida" como usado no presente documento, designa 3a,6,6,9a- tetrametildeca-hidronafto[2,1-b]furano-2(1H)-ona.
[00103] "DOL" como usado no presente documento, designa (1R,2R,4aS,8aS)-1- (2-hidroxietil)-2,5,5,8a-tetrametil-3,4,4a,6,7,8-hexahidro-1H-naftalen-2-ol... Número CAS 38419-75-9.
[00104] "Farnesol" como usado no presente documento, designa (2E,6E)-3,7,11- trimetildodeca-2,6,10-trien-1-ol
[00105] "Geranilogeraniol" como usado no presente documento, designa (2E,6E,10E)-3,7,11,15-Tetrametil-hexadeca-2,6,10,14-tetraen-1-ol.
[00106] Mais genericamente os seguintes significados se aplicam:
[00107] Para compostos semelhantes a Z11: 8,13:13,20-diepóxi-15,16-
dinorlabdano (ou diepóxi-dinorlabdano) da fórmula geral:
[00108] Para compostos semelhantes a Ambrox®: 8,12-epóxi-13,14,15,16- tetranorlabdano (ou epóxi-tetranorlabdano) de fórmula geral
[00109] Os termos "função biológica", "função", "atividade biológica" ou "atividade" de uma difosfato de terpenilo sintase se referem à capacidade de uma difosfato de terpenilo sintase, como descrito no presente documento, para catalisar a formação de pelo menos um difosfato de terpenilo a partir do terpeno precursor correspondente.
[00110] Os termos "função biológica", "função", "atividade biológica" ou "atividade" de uma difosfato de terpenilo fosfatase se referem à capacidade da difosfato de terpenilo fosfatase, como descrito no presente documento, para catalisar a remoção de um grupo difosfato do dito composto de terpenilo para formar o álcool terpênico correspondente.
[00111] A "via de mevalonato", também conhecida como a "via isoprenoide" ou "via da HMG-CoA redutase", é uma via metabólica essencial presente em eucariotos, arqueias e algumas bactérias. A via do mevalonato começa com acetil-CoA e produz dois blocos de construção de cinco carbonos chamados pirofosfato de isopentenilo (IPP) e pirofosfato de dimetilalilo (DMAPP). As enzimas-chave são acetoacetil-CoA tiolase (atoB), HMG-CoA sintase (mvaS), HMG-CoA redutase (mvaA), mevalonato quinase (MvaK1), fosfomevalonato quinase (MvaK2), uma mevalonato difosfato descarboxilase (MvaD) e uma difosfato de isopentenilo isomerase (idi). Combinar a via do mevalonato com a atividade enzimática para gerar os precursores de terpeno GPP, FPP ou GGPP, como, em particular, a sintase FPP (ERG20), permite a produção celular recombinante de terpenos.
[00112] Como usado no presente documento, o termo "célula hospedeira" ou "célula transformada" se refere a uma célula (ou organismo) alterada para abrigar pelo menos uma molécula de ácido nucleico, por exemplo, um gene recombinante que codifica uma proteína ou sequência de ácido nucleico desejada que após a transcrição produz pelo menos um polipeptídeo funcional da presente invenção, i.p. uma proteína difosfato de terpenilo sintase ou enzima difosfato de terpenilo fosfatase como definido no presente documento acima. A célula hospedeira é particularmente uma célula bacteriana, uma célula fúngica ou uma célula vegetal ou plantas. A célula hospedeira pode conter um gene recombinante ou vários genes como, por exemplo, organizado como um operon, que foi integrado nos genomas nucleares ou organelos da célula hospedeira. Alternativamente, o hospedeiro pode conter o gene recombinante extracromossomicamente.
[00113] O termo “organismo” se refere a qualquer organismo multicelular ou unicelular não humano, tal como uma planta ou um micro-organismo. Particularmente, um microrganismo é uma bactéria, uma levedura, uma alga ou um fungo.
[00114] O termo “planta” é usado de forma intercambiável para inclui células vegetais, incluindo protoplasmas vegetais, tecidos vegetais, culturas de tecido de célula vegetal, produzindo plantas regeneradas, ou partes de plantas, ou órgãos de planta, tais como raízes, troncos, folhas, flores, pólen, óvulos, embriões, frutos e similares. Qualquer planta pode ser usada para executar os métodos de uma modalidade no presente documento.
[00115] Um organismo ou célula particular deve ser "capaz de produzir FPP" quando produz FPP naturalmente ou quando não produz FPP naturalmente, mas é transformado para produzir FPP com um ácido nucleico, como descrito no presente documento. Organismos ou células transformadas para produzir uma quantidade de FPP maior do que o organismo ou célula de ocorrência natural também são englobados pelos "organismos ou células capazes de produzir FPP".
[00116] Um organismo ou célula particular deve ser "capaz de produzir GGPP" quando produz GGPP naturalmente ou quando não produz GGPP naturalmente, mas é transformado para produzir GGPP com um ácido nucleico, como descrito no presente documento. Os organismos ou células transformados para produzir uma quantidade maior de GGPP que o organismo ou célula de ocorrência natural também são abrangidos pelos "organismos ou células que têm capacidade para produzir GGPP".
[00117] Um organismo ou célula particular deve ser "capaz de produzir difosfato de terpenilo" quando produz um difosfato de terpenilo naturalmente ou quando não produz difosfato de terpenilo naturalmente, mas é transformado para produzir o dito difosfato com um ácido nucleico, como descrito no presente documento. Organismos ou células transformadas para produzir uma quantidade maior de difosfato de terpenilo do que o organismo ou célula de ocorrência natural também são englobados pelos "organismos ou células capazes de produzir difosfato de terpenilo".
[00118] Um organismo ou célula em particular deve ser "capaz de produzir álcool terpênico" quando produz um álcool terpênico, como definido no presente documento, naturalmente ou quando não produz o dito álcool naturalmente, mas é transformado para produzir o dito álcool com um ácido nucleico, como descrito no presente documento. Organismos ou células transformadas para produzir uma quantidade maior de álcool terpênico do que o organismo ou célula de ocorrência natural também são englobados pelos "organismos ou células capazes de produzir álcool terpênico".
[00119] Para as descrições no presente documento e nas reivindicações anexas, o uso de “ou” significa “e/ou” a não ser que determinado de outro modo. De modo similar, “compreendem”, “compreende”, “compreender”, “incluem” “inclui” e “incluir” são intercambiáveis e não se destinam a serem limitantes.
[00120] Deve ser adicionalmente entendido que, quando as descrições de várias modalidades usam o termo "que compreende", aqueles versados na técnica entenderiam que, em alguns casos específicos, uma modalidade pode ser alternativamente descrita com uso de linguagem "que consiste essencialmente em" ou "que consiste em".
[00121] Os termos “purificado”, “substancialmente purificado” e “isolado”, como usados no presente documento se referem ao estado de estar livre de outros compostos não semelhantes aos quais um composto da invenção está normalmente associado em seu estado natural, de modo que o indivíduo "purificado", "substancialmente purificado", "isolado" compreende pelo menos 0,5%, 1%, 5%, 10% ou 20% ou pelo menos 50% ou 75% da massa, em peso de uma determinada amostra. Em uma modalidade, esses termos se referem ao composto da invenção que compreende pelo menos 95, 96, 97, 98, 99 ou 100% da massa, em peso, de uma determinada amostra. Como usados no presente documento, os termos “purificado”, “substancialmente purificado” e “isolado”, quando se referem a um ácido nucleico ou proteína, ou ácidos nucleicos ou proteínas, também se referem a um estado de purificação ou concentração diferentes daquele que ocorre naturalmente, por exemplo, em um ambiente procariótico ou eucariótico, como, por exemplo, em uma célula bacteriana ou fúngica ou no organismo mamífero, especialmente o corpo humano. Qualquer grau de purificação ou concentração maior que aquele que ocorre naturalmente, incluindo (1) a purificação de outras estruturas ou compostos associados ou (2) a associação com estruturas ou compostos aos quais está normalmente associado no dito ambiente procariótico ou eucariótico, são abrangidos pelo significado de “isolado”. O ácido nucleico ou proteína ou classes de ácidos nucleicos ou proteínas, descritos no presente documento, podem ser isolados, ou associados de outro modo a estruturas ou compostos aos quais os mesmos não são normalmente associados na natureza, de acordo com uma variedade de métodos e processos conhecidos por aqueles versados na técnica.
[00122] O termo “cerca de” indica uma variação potencial de ± 25% do valor declarado, em particular, ± 15%, ±10%, mais particularmente ± 5%, ± 2% ou ± 1%.
[00123] O termo “substancialmente” descreve uma faixa de valores de cerca de 80 a 100%, tal como, por exemplo, 85 a 99,9%, em particular, 90 a 99,9%, mais particularmente 95 a 99,9% ou 98 a 99,9% e especialmente 99 a 99,9%.
[00124] “Predominantemente” se refere a uma proporção na faixa acima de 50%, como, por exemplo, na faixa de 51 a 100%, particularmente na faixa de 75 a 99,9%; mais particularmente, 85 a 98,5%, como 95 a 99%.
[00125] Um “produto principal” no contexto da presente invenção indica um único composto ou um grupo de pelo menos 2 compostos, como 2, 3, 4, 5 ou mais, particularmente 2 ou 3 compostos, sendo que o composto único ou grupo dos compostos é preparado “predominantemente” por uma reação, como descrito no presente documento, e está contido na dita reação em uma proporção predominante com base na quantidade total dos constituintes do produto formado pela dita reação. A dita proporção pode ser uma proporção molar, uma proporção em peso ou, de preferência, com base em análise cromatográfica, uma proporção de área calculada a partir do cromatograma correspondente dos produtos de reação.
[00126] Um “produto secundário” no contexto da presente invenção designa um único composto ou um grupo de pelo menos 2 compostos, como 2, 3, 4, 5 ou mais, particularmente 2 ou 3 compostos, sendo que composto único ou grupo de compostos não é “predominantemente” preparado por uma reação, como descrito no presente documento.
[00127] Devido à reversibilidade de reações enzimáticas, a presente invenção se refere, salvo quando exposto de outro modo, às reações enzimáticas ou biocatalíticas descritas no presente documento em ambas as direções de reação.
[00128] “Mutantes funcionais” dos polipeptídeos descritos no presente documento incluem os “equivalentes funcionais” de tais polipeptídeos, como definido a seguir.
[00129] O termo "estereoisômeros" inclui isômeros conformacionais e, em particular, isômeros de configuração.
[00130] Em geral são incluídas, de acordo com a invenção, todas as "formas estereoisoméricas" dos compostos descritos no presente documento, tais como "isômeros constitucionais" e "estereoisômeros".
[00131] "Formas estereoisoméricas" abrangem, em particular, "estereoisômeros" e misturas dos mesmos, por exemplo, isômeros de configuração (isômeros ópticos), tais como enantiômeros, ou isômeros geométricos (diastereômeros), tais como isômeros E e Z, e combinações dos mesmos. Caso um ou mais centros assimétricos estejam presentes em uma molécula, a invenção abrange todas as combinações de conformações diferentes desses centros assimétricos, por exemplo, pares enantioméricos.
[00132] “Estereosseletividade” descreve a capacidade para produzir um estereoisômero de um composto em uma forma estereoisomericamente pura ou para converter especificamente um estereoisômero particular em um método catalisado por enzima, como descrito no presente documento dentre uma pluralidade de esteroisômeros. Mais especificamente, isso significa que um produto da invenção é enriquecido com relação a um estereoisômero, ou um eduto pode ser submetido à depleção com relação a um estereoisômero particular. Isso pode ser quantificado por meio do parâmetro %ee de pureza calculado de acordo com a fórmula: %ee = [XA-XB]/[ XA+XB]*100, em que XA e XB representa a razão molar (Molenbruch) dos esteroisômeros A e B.
[00133] Os termos "converter seletivamente" ou "aumentar a seletividade" em geral significam que uma forma estereoisomérica particular, como por exemplo a forma E, de um hidrocarboneto insaturado, é convertida em uma proporção ou quantidade maior (em comparação a uma base molar) do que a outra forma estereoisomérica correspondente como, por exemplo, a forma Z, ou durante todo o curso da dita reação (ou seja, entre o início e o término da reação), em um determinado ponto do tempo da dita reação, ou durante um "intervalo" da dita reação. Em particular, a dita seletividade pode ser observada durante um “intervalo” correspondente de 1 a 99%, 2 a 95%, 3 a 90%, 5 a 85%, 10 a 80%, 15 a 75%, 20 a 70%, 25 a 65%, 30 a 60% ou 40 a 50% de conversão da quantidade inicial do substrato. A dita proporção ou quantidade superior pode, por exemplo, ser expressa em termos de: - um rendimento máximo superior de um isômero observado durante todo o curso da reação ou dito intervalo do mesmo; - uma quantidade relativa superior de um isômero em um grau de % definido do valor de conversão do substrato; e/ou - uma quantidade relativa idêntica de um isômero em um grau de % superior do valor de conversão; cada um dos mesmos é, de preferência, observado em relação ao método de referência, sendo que o dito método de referência é realizado sob condições de outro modo idênticas com meios químicos ou bioquímicos conhecidos.
[00134] Em geral também são compreendidas em conformidade com a invenção todas as “formas isoméricas” dos compostos descritos no presente documento, tais como isômeros constitucionais e, em particular, esteroisômeros e misturas dos mesmos, tais como, por exemplo, isômeros ópticos ou isômeros geométricos, tais como E- e Z-isômeros e combinações dos mesmos. Caso diversos centros de assimetria estejam presentes em uma molécula, então, a invenção compreende todas as combinações de diferentes conformações desses centros de assimetria, tais como, por exemplo, pares de enantiômeros ou quaisquer misturas de formas estereoisoméricas.
[00135] “Rendimento” e/ou a “taxa de conversão” de uma reação de acordo com a invenção são determinados em um período definido de, por exemplo, 4, 6, 8, 10, 12, 16, 20, 24, 36 ou 48 horas, no qual a reação ocorre. Em particular, a reação é realizada sob condições precisamente definidas, por exemplo, em “condições padrão” como definido no presente documento.
[00136] Os diferentes parâmetros de rendimento (“Rendimento” ou YP/S;“ Rendimento de Produtividade Específico”; ou Rendimento Espaço-Tempo (STY)) são bem conhecidos na técnica e são determinados, como descrito na literatura.
[00137] “Rendimento” e “YP/S” (cada um expresso em massa de produto/massa de material consumido) são usados no presente documento como sinônimos.
[00138] A relação produtividade-rendimento descreve a quantidade de um produto, que é produzido por caldo de fermentação h e L por g de biomassa. A quantidade peso de célula molhada indicado como WCW descreve a quantidade de micro- organismo biologicamente ativo em uma reação bioquímica. O valor é fornecido como um produto g por g WCW por h (isto é, g/gWCW-1 h-1). Alternativamente, a quantidade de biomassa também pode ser expressa como a quantidade de peso de célula seca indicado como DCW. Além disso, a concentração de biomassa pode ser determinada mais facilmente medindo-se a densidade óptica a 600 nm (OD600) e com o uso de um fator de correlação determinado experimentalmente para estimar o peso de célula molhada ou de célula seca correspondente, respectivamente.
[00139] O termo “produção fermentativa” ou “fermentação” se refere à capacidade de um micro-organismo (auxiliado pela atividade de enzima contida ou gerada pelo micro-organismo) para produzir um composto químico em cultura celular que utiliza pelo menos uma fonte de carbono adicionada à incubação.
[00140] O termo “caldo de fermentação” significa um líquido, particularmente solução aquosa ou aquosa/orgânica que se baseia em um processo fermentativo e não submetida a testes adicionais, por exemplo, como descrito no presente documento.
[00141] Um método "biocatalítico" ou "catalisado enzimaticamente" significa que o dito método é realizado sob a ação catalítica de uma enzima, incluindo mutantes de enzima, como definido no presente documento. Assim, o método pode ser realizado ou na presença da dita enzima em forma isolada (purificada, enriquecida) ou crua ou na presença de um sistema celular, em particular, células microbianas naturais ou recombinantes que contêm a dita enzima em forma ativa e que tem a capacidade para catalisar a reação de conversão, como revelado no presente documento.
[00142] Caso a presente revelação se refira a recursos, parâmetros e faixas dos mesmos de diferente grau de preferência (incluindo recursos gerais não explicitamente preferenciais, parâmetros e faixas dos mesmos), então, salvo quando indicado de maneira diferente, qualquer combinação de dois ou mais desses recursos, parâmetros e faixas dos mesmos, independentemente do respectivo grau de preferência, é abrangida pela revelação da presente descrição.
DESCRIÇÃO DETALHADA A. MODALIDADES PARTICULARES DA INVENÇÃO
[00143] A presente invenção se refere às seguintes modalidades particulares:
1. Uma primeira modalidade principal se refere a um método biocatalítico para produzir um composto de álcool terpênico, de fórmula geral 1 (1)
em que R representa H ou, mais particularmente, um resíduo de hidrocarbilo opcionalmente substituído cíclico ou não cíclico, linear ou ramificado, saturado ou insaturado, preferencialmente com um número total de carbonos divisível por 5, em particular 5, 10, 15 ou 20, mais particularmente 10 ou 15 que compreende as etapas de: (1) estabelecer o contato do precursor de difosfato de terpenilo correspondente do dito composto de terpeno de fórmula (1) com um polipeptídeo com atividade de difosfato de terpenilo fosfatase como, por exemplo, que tem atividade de difosfato de mono-, sesqui- ou diterpenilo fosfatase, para formar o dito álcool terpênico e (2) opcionalmente isolar o álcool terpênico da etapa (1), em que o dito polipeptídeo que tem atividade de difosfato de terpenilo fosfatase é selecionado de um membro da enzima de remoção de difosfato da família da proteína tirosina fosfatase.
[00144] O polipeptídeo desta modalidade com "atividade de difosfato de terpenilo fosfatase" é identificado como membro da família da proteína tirosina fosfatase em particular da família Y_fosfatase3 com o número de Pfam ID PF13350.
2. Uma segunda modalidade principal da invenção se refere a um método biocatalítico para produzir um composto de álcool diterpênico bicíclico, que compreende as etapas de: a) estabelecer o contato do precursor de difosfato de diterpenilo bicíclico correspondente do dito composto de diterpeno bicíclico com um polipeptídeo que tem atividade de difosfato de terpenilo fosfatase como, por exemplo, que tem atividade de difosfato de diterpenilo fosfatase ou, mais particularmente, atividade de difosfato de diterpenilo bicíclico fosfatase, para formar o dito álcool diterpênico bicíclico; e b) opcionalmente isolar o álcool diterpênico bicíclico da etapa (1).
[00145] O polipeptídeo desta modalidade com "atividade de difosfato de terpenilo fosfatase" é identificado como membro da família da proteína tirosina fosfatase em particular da família Y_fosfatase3 com o número de Pfam ID PF13350.
3. O método da modalidade 2, em que o dito polipeptídeo que tem atividade de difosfato de terpenilo fosfatase é selecionado de um membro da enzima de remoção de difosfato da família da proteína tirosina fosfatase.
4. O método da modalidade 1 ou 3, em que o dito polipeptídeo que tem atividade de difosfato de terpenilo fosfatase é selecionado de uma classe de enzimas de remoção de difosfato caracterizadas por uma sequência de aminoácidos que tem o seguinte motivo de assinatura de sítio ativo: HCxxGxxR (SEQ ID NO: 57) em que cada x independentemente um do outro representa qualquer resíduo de aminoácido natural.
5. O método da modalidade 4, em que o dito motivo de assinatura de sítio ativo é: HC(T/S)xGKDRTG (SEQ ID NO: 58) em que x representa qualquer resíduo de aminoácido natural e é, por exemplo, selecionado dos resíduos L, A, G e V.
[00146] Em outra modalidade, o dito polipeptídeo que tem atividade de difosfato de terpenilo fosfatase compreende um motivo de sequência de consenso de aminoácido como representado na Figura 16b.
6. O método de qualquer uma das modalidades anteriores, em que o dito polipeptídeo que tem atividade de difosfato de terpenilo fosfatase é selecionado do grupo que consiste nos polipeptídeos: a) TalVeTPP que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 2, b) AspWeTPP que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 6, c) HelGriTPP que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 10, d) UmbPiTPP1, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 13, e) TalVeTPP2, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 16, f) HydPiTPP1, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 19, g) TalCeTPP1, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 22, h) TalMaTPP1, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 25, i) TalAstroTPP1 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 28 e j) PeSubTPP1 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 31 e k) um polipeptídeo que tem atividade de difosfato de terpenilo fosfatase e compreende uma sequência de aminoácidos que apresenta um grau de identidade de sequência de pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% com pelo menos uma das ditas sequências de aminoácidos de acordo com a) a j).
7. O método de qualquer uma das modalidades 1 e 4 a 6, em que um composto de álcool terpênico da fórmula geral 1 é preparado, em que R representa H ou, mais particularmente, um resíduo de hidrocarbilo não cíclico, linear ou ramificado, saturado ou insaturado, preferencialmente com um número total de carbonos divisível por 5 tal como, por exemplo, 5, 10, 15 ou 20.
8. O método da modalidade 7, em que o álcool terpênico de fórmula 1 é selecionado de farnesol e geranilgeraniol.
9. O método de qualquer uma das modalidades 2 a 6, em que a etapa (1) também compreende o estabelecer o contato de um precursor de difosfato de terpenilo não cíclico com um polipeptídeo que tem atividade de difosfato de diterpenilo sintase bicíclica para formar o dito precursor de difosfato de diterpenilo bicíclico.
10. O método da modalidade 9, em que a difosfato de diterpenilo sintase bicíclica é selecionada de a) SmCPS2 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 34, b) TaTps1-del59 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 40, c) SsLPS que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 38 e d) um polipeptídeo com atividade de difosfato de diterpenilo sintase bicíclica e que compreende uma sequência de aminoácidos que mostra um grau de identidade de sequência de pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95 %, 96%, 97%, 98% ou 99% com pelo menos uma das ditas sequências de aminoácidos de acordo com a), b) e c).
11. O método de qualquer uma das modalidades 2 a 6, 9 e 10, em que o dito álcool diterpênico bicíclico produzido biocataliticamente é selecionado de copalol e labdendiol, cada um na forma estereoisomérica essencialmente pura ou na forma de uma mistura de pelo menos dois estereoisômeros.
12. O método de qualquer uma das modalidades anteriores, que compreende adicionalmente como etapa (3) o processamento do álcool terpênico da etapa (1) ou da etapa (2) em um derivado de álcool com o uso de síntese química ou biocatalítica ou uma combinação de ambas.
13. O método da modalidade 12, em que o derivado é um hidrocarboneto, álcool, diol, triol, acetal, cetal, aldeído, ácido, éter, amida, cetona, lactona, epóxido, acetato, glicosídeo e/ou um éster.
14. O método da modalidade 12 ou 13, em que o dito álcool terpênico é oxidado biocataliticamente.
15. O método da modalidade 14, em que o dito álcool terpênico é convertido pelo contato com uma álcool desidrogenase (ADH).
16. O método da modalidade 15, em que a dita ADH é selecionada de a) CymB que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 42;
b) AspWeADH1 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 44; c) PsAeroADH1 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 46; d) AzTolADH1 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 48; e) AroAroADH1 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 50; f) ThTerpADH1 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 52; g) CdGeoA que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 54; h) VoADH1 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 56 e i) um polipeptídeo que tem atividade de ADH e que compreende uma sequência de aminoácidos que mostra um grau de identidade de sequência de pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96 %, 97%, 98% ou 99% com pelo menos uma das ditas sequências de aminoácidos de acordo com a) a h).
17. O método de qualquer uma das modalidades 2 a 6 e 9 a 11 para a produção biocatalítica de copalol, que compreende as etapas de (1) estabelecer o contato de difosfato de copalilo com um polipeptídeo que tem atividade de difosfato de copalilo (CPP) fosfatase para formar copalol na forma estereoisomérica essencialmente pura, em particular (+)-copalol, ou na forma de uma mistura de pelo menos dois estereoisômeros e (2) opcionalmente isolar copalol da etapa (1).
18. O método da modalidade 17, em que o dito polipeptídeo com atividade de difosfato de copalilo fosfatase é selecionado do grupo que consiste nos polipeptídeos: a) TalVeTPP, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 2,
b) AspWeTPP, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 6, c) HelGriTPP, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 10, d) UmbPiTPP1, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 13, e) TalVeTPP2, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 16, f) HydPiTPP1, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 19, g) TalCeTPP1, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 22, h) TalMaTPP1, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 25, i) TalAstroTPP1, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 28 e j) PeSubTPP1, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 31 e k) um polipeptídeo que tem atividade de difosfato de copalilo fosfatase e compreende uma sequência de aminoácidos que apresenta um grau de identidade de sequência de pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% com pelo menos uma das ditas sequências de aminoácidos de acordo com a) a j).
19. O método de qualquer uma das modalidades 17 e 18, em que a etapa (1) também compreende a conversão biocatalítica de um pirofosfato de terpeno tal como, por exemplo, pirofosfato de geranilogeranilo (GGPP), ou uma mistura de pirofosfato de isopentenilo (IPP) e pirofosfato de dimetilalilo (DMAPP), em difosfato de copalilo (CPP) através da ação catalítica de uma pirofosfato de copalilo sintase (CPS).
20. O método da modalidade 19, em que a dita CPS é selecionada de a) SmCPS2 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 34, b) TaTps1-del59 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 40 e c) um polipeptídeo com atividade de pirofosfato de copalilo sintase e que compreende uma sequência de aminoácidos que mostra um grau de identidade de sequência de pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% com pelo menos uma das ditas sequências de aminoácidos de acordo com a) e b).
21. O método de qualquer uma das modalidades 17 a 20, que compreende adicionalmente como etapa (3) o processamento do copalol da etapa (1) ou da etapa (2) para um derivado de copalol com o uso de síntese química ou biocatalítica ou uma combinação de ambas.
22. O método da modalidade 21, em que o derivado é um hidrocarboneto, álcool, diol, triol, acetal, cetal, aldeído, ácido, éter, amida, cetona, lactona, epóxido, acetato, glicosídeo e/ou um éster.
23. O método da modalidade 21 ou 22, em que copalol é oxidado biocataliticamente.
24. O método da modalidade 23, em que copalol é oxidado pelo contato com uma álcool desidrogenase (ADH).
25. O método da modalidade 24, em que a dita ADH é selecionada de a) CymB que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 42; b) AspWeADH1 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 44; c) PsAeroADH1 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 46; d) AzTolADH1 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 48; e) AroAroADH1 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 50;
f) ThTerpADH1 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 52; g) CdGeoA que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 54; h) VoADH1 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 56 e i) um polipeptídeo que tem atividade de ADH que compreende uma sequência de aminoácidos que mostra um grau de identidade de sequência de pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96 %, 97%, 98% ou 99% com pelo menos uma das ditas sequências de aminoácidos de acordo com a) a h).
26. O método da modalidade 1 para a produção biocatalítica de labdendiol, que compreende as etapas de (1) estabelecer o contato de difosfato de labdendiol (também designado como difosfato de labda-13-en-8-ol ou difosfato de 8α-hidroxicopalilo) com um polipeptídeo que tem atividade de difosfato de labdendiol (LPP) fosfatase para formar labdendiol em forma estereoisomérica essencialmente pura ou na forma de uma mistura de pelo menos dois estereoisômeros e (2) opcionalmente isolar labdendiol da etapa (1).
27. O método da modalidade 26, em que o dito polipeptídeo com atividade de LPP fosfatase é selecionado do grupo que consiste nos polipeptídeos: a) TalVeTPP, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 2, b) AspWeTPP, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 6, c) HelGriTPP, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 10, d) UmbPiTPP1, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 13, e) TalVeTPP2, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 16,
f) HydPiTPP1, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 19, g) TalCeTPP1, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 22, h) TalMaTPP1, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 25, i) TalAstroTPP1, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 28 e j) PeSubTPP1, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 31 e k) um polipeptídeo que tem atividade de LPP fosfatase e compreende uma sequência de aminoácidos que apresenta um grau de identidade de sequência de pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% com pelo menos uma das ditas sequências de aminoácidos de acordo com a) a j).
28. O método de qualquer uma das modalidades 26 e 27, em que a etapa (1) também compreende a conversão biocatalítica de um pirofosfato de terpeno tal como, por exemplo, pirofosfato de geranilogeranilo (GGPP), ou uma mistura de pirofosfato de isopentenilo (IPP) e pirofosfato de dimetilalilo (DMAPP), em difosfato de labdendiol (LPP) através da ação catalítica de uma pirofosfato de labdendiol sintase (LPS).
29. O método da modalidade 28, em que a dita LPS é selecionada de a) SsLPS que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 38 e c) um polipeptídeo com atividade de pirofosfato de labdendiol sintase e que compreende uma sequência de aminoácidos que mostra um grau de identidade de sequência de pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% com pelo menos uma das ditas sequências de aminoácidos de acordo com a).
30. O método de qualquer uma das modalidades 26 a 29, que compreende adicionalmente como etapa (3) o processamento do labdendiol da etapa (1) ou da etapa (2) para um derivado de labdendiol com o uso de síntese química ou biocatalítica ou uma combinação de ambas.
31. O método da modalidade 30, em que o derivado é um hidrocarboneto, álcool, diol, triol, acetal, cetal, aldeído, ácido, éter, amida, cetona, lactona, epóxido, acetato, glicosídeo e/ou um éster.
32. O método da modalidade 30 ou 31, em que labdendiol é oxidado biocataliticamente.
33. O método da modalidade 32, em que labdendiol é oxidado pelo contato com uma álcool desidrogenase (ADH).
34. O método da modalidade 33, em que a dita ADH é selecionada de a) CymB que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 42; b) AspWeADH1 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 44; c) PsAeroADH1 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 46; d) AzTolADH1 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 48; e) AroAroADH1 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 50; f) ThTerpADH1 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 52; g) CdGeoA que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 54; h) VoADH1 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 56; i) SCH23-ADH1 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 68 j) SCH24-ADH1a que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 70 e k) um polipeptídeo que tem atividade de ADH que compreende uma sequência de aminoácidos que mostra um grau de identidade de sequência de pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96 %, 97%, 98% ou 99% com pelo menos uma das ditas sequências de aminoácidos de acordo com a) a j).
35. O método de qualquer uma das modalidades 19 e 28, em que o dito método também compreende a formação biocatalítica de GGPP a partir de pirofosfato de farnesilo (FPP) por meio da ação catalítica de uma pirofosfato de geranilogeranilo sintase (GGPS).
36. O método da modalidade 35, em que a dita GGPS é selecionada de a) um polipeptídeo que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 36 e c) um polipeptídeo com atividade de pirofosfato de geranilogeranilo sintase e que compreende uma sequência de aminoácidos que mostra um grau de identidade de sequência de pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% com pelo menos uma das ditas sequências de aminoácidos de acordo com a).
37. O método de qualquer uma das modalidades anteriores realizado in vitro ou in vivo.
38. O método de qualquer uma das modalidades anteriores realizadas in vivo, que compreende antes da etapa (1) a introdução em um organismo ou célula hospedeira não humana e opcionalmente integrado de forma estável no respectivo genoma; uma ou mais moléculas de ácido nucleico que codificam um ou mais polipeptídeos que têm as atividades enzimáticas necessárias para realizar a respectiva etapa ou etapas de conversão biocatalítica.
39. O método da modalidade 38, em que os ditos ácidos nucleicos, como introduzidos no dito organismo ou célula hospedeira não humana, estão codificando pelo menos um polipeptídeo que tem atividade de difosfato de terpenilo fosfatase, em particular atividade de difosfato de diterpenilo bicíclico fosfatase; e opcionalmente b) pelo menos um polipeptídeo com atividade de difosfato de terpenilo sintase, em particular atividade de difosfato de diterpenilo bicíclico sintase, e/ou c) pelo menos um polipeptídeo com atividade de ADH; e/ou d) pelo menos um polipeptídeo que tem atividade de difosfato de terpenilo acíclico sintase, em particular atividade de difosfato de diterpenilo acíclico sintase.
40. O método da modalidade 39, em que os ditos ácidos nucleicos, como introduzidos no dito organismo ou célula hospedeira não humana, estão codificando a) pelo menos um polipeptídeo que tem atividade de difosfato de diterpenilo bicíclico fosfatase que é selecionada dos polipeptídeos como definido na modalidade 6; ou codificado por uma sequência de nucleotídeos selecionada de SEQ ID NO: 1, 3, 4, 5, 7, 8, 9, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30 e 32; ou uma sequência de nucleotídeos que tem pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com qualquer uma das ditas sequências; e, opcionalmente, pelo menos um dos seguintes b) pelo menos um polipeptídeo que tem atividade de difosfato de diterpenilo bicíclico sintase que é selecionada dos polipeptídeos como definido na modalidade 10; ou codificado por uma sequência de nucleotídeos selecionada de SEQ ID NO: 33, 37 e 39; ou uma sequência de nucleotídeos que tem pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com qualquer uma das ditas sequências; c) pelo menos um polipeptídeo com atividade de ADH que é selecionado dos polipeptídeos como definido na modalidade 16; ou codificado por uma sequência de nucleotídeos selecionada de SEQ ID NO: 41, 43, 45, 47, 49, 51, 53 e 55; ou uma sequência de nucleotídeos que tem pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com qualquer uma das ditas sequências; d) pelo menos um polipeptídeo que tem atividade de difosfato de diterpenilo acíclico sintase como definido na modalidade 36; ou codificado por uma sequência de nucleotídeos selecionada de SEQ ID NO: 35 ou uma sequência de nucleotídeos com pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com a dita sequência.
41. O método de qualquer uma das modalidades 38 a 40, realizado pela aplicação de um organismo hospedeiro não humano ou célula que produz endogenamente FPP e/ou GGPP; ou uma mistura de IPP e DMAPP; ou um organismo hospedeiro não humano que é geneticamente modificado para produzir quantidades aumentadas de FPP e/ou de GGPP e/ou de uma mistura de IPP e DMAPP.
[00147] Algumas dessas células ou organismos hospedeiros não produzem FPP ou GGPP ou uma mistura de IPP e DMAPP naturalmente ou não produzem FPP ou GGPP ou uma mistura de IPP e DMAPP endogenamente em uma quantidade considerada muito baixa e que, portanto, deve ser aumentada. Para serem adequados para realizar o método de uma modalidade como descrito no presente documento, organismos ou células que não produzem um precursor de pirofosfato de terpeno acíclico, por exemplo, FPP ou GGPP ou uma mistura de IPP e DMAPP, naturalmente ou produzem os ditos compostos em quantidade subótima, são geneticamente modificados para produzir o dito precursor. Os mesmos podem ser, por exemplo, transformados desse modo antes da modificação com o ácido nucleico descrito de acordo com qualquer uma das modalidades acima ou simultaneamente. Métodos para transformar organismos de modo que os mesmos produzam um precursor de pirofosfato de terpeno acíclico, por exemplo, FPP ou GGPP ou uma mistura de IPP e DMAPP, já são conhecidos na técnica. Por exemplo, a introdução de atividades enzimáticas da via de mevalonato, da via isoprenoide ou da via MEP, em particular da via de mevalonato, é uma estratégia adequada para fazer o organismo produzir FPP ou GGPP ou uma mistura de IPP e DMAPP.
42. O método de qualquer uma das modalidades 38 a 41, em que o dito organismo ou célula hospedeira não humana é um eucariota ou procariota, em particular uma planta, uma bactéria ou um fungo, em particular uma levedura.
43. O método da modalidade 42, em que a dita bactéria é do gênero Escherichia, em particular E. coli e a dita levedura é do gênero Saccharomyces, em particular S. cerevisiae.
44. O método da modalidade 42, em que a dita célula é uma célula vegetal.
45. Um organismo ou célula hospedeira não humana, como definido em qualquer uma das modalidades 38 a 44.
46. Um construto de ácido nucleico recombinante que compreende pelo menos uma molécula de ácido nucleico, como definido em qualquer uma das modalidades 38 a 44.
47. Um vetor de expressão que compreende pelo menos um construto de ácido nucleico da modalidade 46.
48. O vetor de expressão da modalidade 47 em que o vetor é um vetor procariótico, vetor viral, um vetor eucariótico ou um ou mais plasmídeos.
49. Um organismo ou célula hospedeira não humana recombinante como definido na modalidade 45, transformado com pelo menos um construto de ácido nucleico da modalidade 46 ou pelo menos um vetor da modalidade 47 ou 48.
50. Um polipeptídeo que tem atividade de difosfato de terpenilo fosfatase, em particular atividade de difosfato de diterpenilo bicíclico fosfatase, que é selecionado de um membro da enzima de remoção de difosfato da família da proteína tirosina fosfatase e mutantes ou variantes do mesmo; em que o dito polipeptídeo catalisa a conversão de um difosfato de terpenilo no respectivo álcool terpênico, preferencialmente com uma seletividade de > 50% como, por exemplo, > 60, 70, 80, 90, 95 ou 99%. Em particular, o mesmo catalisa a conversão de pelo menos um difosfato de terpeno, selecionado de CPP e LPP no respectivo álcool terpênico, copalol e labdendiol, preferencialmente com uma seletividade de > 50% tal como, por exemplo, > 60, 70, 80, 90, 95 ou 99%.
[00148] Os polipeptídeos desta modalidade com "atividade de difosfato de terpenilo fosfatase" são identificados como membros da família da proteína tirosina fosfatase em particular da família Y_fosfatase3 com o número de Pfam ID PF13350.
[00149] Em particular, um polipeptídeo da invenção que tem "atividade de difosfato de terpenilo fosfatase" é identificado como membro da família da proteína tirosina fosfatase, em particular da família Y_fosfatase3 que tem o número Pfam ID PF13350 se a pontuação de bits for maior ou igual ao limite de coleta para o domínio Pfam. Os valores de expectativa (valores-e) também podem ser usados como um critério para inclusão de uma proteína pesquisada em uma família Pfam ou para determinar se uma proteína pesquisada tem um domínio Pfam particular. As correspondências com o dito domínio têm um valor-e inferior a 1x10-5 ou inferior a 1x10-10, ou inferior a 1x10- 20 tal como, por exemplo, na faixa de 1x 10-40 a 7,40x 10-80 ou na faixa de 1x 10-45 a 1x 10-70 tal como 3,50x 10-50 a 7,40x 10-66. Como sequência de consulta, é aplicada a sequência de um polipeptídeo que tem "atividade de difosfato de terpenilo fosfatase".
[00150] Por exemplo, os seguintes sites podem ser aplicados para a busca e cálculo de tal valor-e: https://pfam.xfam.org/search#tabview=tab0 ou https://www.ebi.ac.uk/Tools/hmmer/.
[00151] Em uma alternativa preferencial, tal enzima fosfatase também converte FPP e/ou GGPP no respectivo álcool farnesol e geranilogeraniol.
[00152] Em outra alternativa preferida, tal enzima fosfatase não converte FPP e/ou GGPP no respectivo álcool farnesol e geranilogeraniol, enquanto retém a capacidade de converter pelo menos um difosfato de diterpenilo bicíclico, selecionado de CPP e LPP para o respectivo álcool terpênico copalol e labdendiol.
[00153] Em outra alternativa preferencial, tal enzima fosfatase produz pelo menos um álcool selecionado de copalol e labdendiol como produto principal. Nesse caso, tais enzimas convertem FPP e/ou GGPP no respectivo álcool farnesol e geranilogeraniol com um rendimento molar inferior em comparação com sua capacidade para converter pelo menos um difosfato de diterpenilo bicíclico, selecionado de CPP e LPP, no respectivo álcool terpênico copalol e labdendiol. O rendimento molar relativo para pelo menos um álcool diterpênico bicíclico selecionado de copalol e labdendiol pode ser maior por um fator igual ou superior a 2 tal como, por exemplo, um fator de 2 a 1.000 ou 5 a 100, ou 10 a 50, em comparação ao rendimento de pelo menos um dos álcoois terpênicos não cíclicos farnesol e geranilogeraniol.
51. O polipeptídeo da modalidade 50, caracterizado por uma sequência de aminoácidos que tem o seguinte motivo de assinatura de sítio ativo: HCxxGxxR (SEQ ID NO: 57) em que cada x independentemente um do outro representa qualquer resíduo de aminoácido natural.
52. O polipeptídeo da modalidade 51, em que o dito motivo de assinatura de sítio ativo é: HC(T/S)xGKDRTG (SEQ ID NO: 58) em que x representa qualquer resíduo de aminoácido natural.
53. O polipeptídeo de qualquer uma das modalidades 50 a 52, em que o dito polipeptídeo que tem atividade de difosfato de diterpenilo bicíclico fosfatase é selecionado do grupo que consiste nos polipeptídeos: a) TalVeTPP que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 2, b) AspWeTPP que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 6, c) HelGriTPP que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 10, d) UmbPiTPP1, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 13, e) TalVeTPP2, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 16, f) HydPiTPP1, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 19, g) TalCeTPP1, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 22, h) TalMaTPP1, que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 25, i) TalAstroTPP1 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 28, j) PeSubTPP1 que compreende uma sequência de aminoácidos de acordo com o SEQ ID NO: 31 e k) um polipeptídeo que tem atividade de difosfato de diterpenilo fosfatase e compreende uma sequência de aminoácidos que apresenta um grau de identidade de sequência de pelo menos 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% com pelo menos uma das ditas sequências de aminoácidos de acordo com a) a j).
[00154] Outra modalidade particular se refere a variantes de polipeptídeo dos polipeptídeos inovadores da invenção com atividade de difosfato de diterpenilo bicíclico fosfatase, como identificado acima por qualquer uma das sequências de aminoácidos particulares de SEQ ID NO: 2, 6, 10, 13, 16, 19, 22, 25, 28 e 31, e em que as variantes do polipeptídeo são selecionadas de uma sequência de aminoácidos com pelo menos 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com qualquer um dos SEQ ID NOs: 2, 6, 10, 13, 16, 19, 22, 25, 28 e 31 e contêm pelo menos uma modificação de substituição em relação a qualquer um dos SEQ ID NOs não modificados: 2, 6, 10, 13, 16, 19, 22, 25, 28 e 31.
54. Molécula de ácido nucleico que compreende a) uma sequência de ácido nucleico que codifica um polipeptídeo de qualquer uma das modalidades 50 a 53; b) a sequência de ácido nucleico complementar de a) ou c) sequência de ácido nucleico que hibridiza sob condições rigorosas para uma sequência de ácido nucleico de a) ou b).
55. Um construto de expressão que compreende pelo menos uma molécula de ácido nucleico, de acordo com a modalidade 54.
56. Um vetor que compreende pelo menos uma molécula de ácido nucleico de acordo com a modalidade 54.
57. O vetor da modalidade 56, em que o vetor é um vetor procariótico, viral ou eucariótico.
58. O vetor da modalidade 56 ou 57, em que o vetor é um vetor de expressão.
59. O vetor de qualquer uma das modalidades 56 a 58, que é um vetor plasmídeo.
60. Uma célula hospedeira recombinante ou um organismo hospedeiro não humano recombinante que compreende a) pelo menos uma molécula de ácido nucleico isolada da modalidade 54, opcionalmente integrada de forma estável no genoma; ou b) pelo menos um construto de expressão da modalidade 55, opcionalmente integrado de forma estável no genoma ou c) pelo menos um vetor de qualquer uma das modalidades 56 a 59.
61. A célula hospedeira ou organismo hospedeiro da modalidade 60, selecionado dentre um microrganismo procariótico ou eucariótico, ou uma célula derivada do mesmo.
62. A célula hospedeira ou organismo hospedeiro da modalidade 61, selecionada dentre células bacterianas, fúngicas e vegetais ou plantas.
63. A célula hospedeira ou organismo hospedeiro da modalidade 62, em que as ditas células fúngicas são células de levedura.
64. A célula hospedeira ou organismo hospedeiro da modalidade 63, em que as ditas células bacterianas são selecionadas do gênero Escherichia, em particular, da espécie E. coli e as ditas células de levedura são selecionadas do gênero Saccharomyces ou Pichia, em particular, da espécie Saccharomyces cerevisiae ou Pichia pastoris.
65. Método para produzir pelo menos um polipeptídeo cataliticamente ativo de acordo com qualquer uma das modalidades 50 a 53 que compreende: (1) cultivar um organismo hospedeiro não humano ou célula hospedeira de uma das modalidades 60 a 64 para expressar ou superexpressar pelo menos um polipeptídeo de acordo com qualquer uma das modalidades 50 a 53 e (2) opcionalmente isolar o polipeptídeo da célula hospedeira ou organismo não humano cultivado na etapa (1).
66. O método da modalidade 65, que compreende adicionalmente, antes da etapa a), transformar um organismo ou célula hospedeira não humana com pelo menos um ácido nucleico de acordo com a modalidade 54, pelo menos um construto da modalidade 55 ou pelo menos um vetor de qualquer uma das modalidades 56 a 59 de modo que expresse ou superexpresse o polipeptídeo de acordo com qualquer uma das modalidades 50 a 53.
67. Método para preparar um polipeptídeo mutante que compreende a atividade de terpeno sintetase, em particular, a atividade de difosfato de terpenilo sintase, em que o método compreende as etapas de: (1) selecionar uma molécula de ácido nucleico de acordo com a modalidade 54; (2) modificar a molécula de ácido nucleico selecionada para obter pelo menos uma molécula de ácido nucleico mutante; (3) transformar células hospedeiras ou organismos hospedeiros unicelulares com a sequência de ácido nucleico mutante para expressar um polipeptídeo codificado pela sequência de ácido nucleico mutante; (4) rastrear o produto de expressão para pelo menos um mutante que compreende atividade de terpeno sintase, em particular, atividade de difosfato de terpenilo sintase; (5) opcionalmente, se o polipeptídeo não tiver atividade mutante desejada, repetir as etapas (1) a (4) do processo até ser obtido um polipeptídeo com uma atividade mutante desejada e (6) opcionalmente, se um polipeptídeo que tem uma atividade mutante desejada tiver sido identificado na etapa d., isolar o ácido nucleico mutante correspondente obtido na etapa (3).
68. O método da modalidade 22, em que o derivado de copalol é selecionado do grupo que consiste em copalal, manool, (+)-manooloxi, Z-11, gama- ambrol e ambrox e compostos estruturalmente relacionados que, em particular, diferem dos mesmos em estereoquímica.
69. O método da modalidade 31, em que o derivado de labdendiol é selecionado do grupo que consiste em esclareolídeo, DOL e ambrox e compostos estruturalmente relacionados que, em particular, diferem dos mesmos na estereoquímica.
70. Método para preparar ambrox ou um composto semelhante a ambrox como definido acima, em que o método compreende a) fornecer um composto de labdendiol ou copalol realizando-se um processo biocatalítico como definido em qualquer uma das modalidades 1 a 44, opcionalmente isolando o dito composto de labdendiol ou copalol e b) converter o dito composto de labdendiol ou copalol da etapa (1) com o uso de síntese química e/ou síntese bioquímica em ambrox ou um composto semelhante a ambrox.
71. O invento se refere ainda ao uso de um polipeptídeo como definido em qualquer uma das modalidades acima para a preparação de odorantes, aromatizantes ou ingredientes de fragrância, em particular Ambrox; bem como ao uso de um álcool terpênico, como preparado de acordo com qualquer uma das modalidades acima, para a preparação de ingredientes odorantes, de sabores ou de fragrâncias, em particular Ambrox. B. POLIPEPTÍDEOS APLICÁVEIS DE ACORDO COM A INVENÇÃO
[00155] Nesse contexto, se aplicam as seguintes definições:
[00156] Os termos genéricos “polipeptídeo” ou “peptídeo”, que podem ser usados de maneira intercambiável, se referem a uma sequência ou cadeia linear natural ou sintética de resíduos de aminoácido consecutivos ligados por peptídeos que compreende, cerca de 10 a até mais de 1.000 resíduos. Polipeptídeos de cadeia curta com até 30 resíduos também são designados como “oligopeptídeos”.
[00157] O termo “proteína” se refere a uma estrutura macromolecular que consiste em um ou mais polipeptídeos. A sequência de aminoácidos do polipeptídeo (ou polipeptídeos) da mesma representa a “estrutura primária” da proteína. A sequência de aminoácidos também predetermina a “estrutura secundária” da proteína pela formação de elementos estruturais especiais, tais como estruturas de alfa-hélice e folha-beta formadas dentro de uma cadeia de polipeptídeo. A disposição de uma pluralidade de tais elementos estruturais secundários define a “estrutura terciária” ou disposição espacial da proteína. Caso uma proteína compreenda mais de uma cadeia de polipeptídeo, as ditas cadeias são dispostas espacialmente formando a “estrutura quaternária” da proteína. Uma disposição espacial correta ou “dobra” da proteína é pré-requisito da função de proteína. A desnaturação ou desdobragem destrói a função da proteína. Caso tal destruição seja reversível, a função de proteína pode ser restaurada por redobragem.
[00158] Uma típica função de proteína denominada no presente documento é uma “função enzimática”, isto é, a proteína atua como um biocatalisador em um substrato, por exemplo, um composto químico e catalisa a conversão do dito substrato em um produto. Uma enzima pode mostrar um alto ou baixo grau de especificidade de substrato e/ou de produto.
[00159] Um “polipeptídeo” denominado no presente documento como tendo uma “atividade” particular se refere implicitamente a uma proteína dobrada corretamente que mostra a atividade indicada como, por exemplo, uma atividade enzimática específica.
[00160] Assim, salvo quando indicado de outro modo, o termo “polipeptídeo” também abrange os termos “proteína” e “enzima”.
[00161] Da mesma dorma, o termo “fragmento de polipeptídeo” abrange os termos “fragmento de proteína” e “fragmento de enzima”.
[00162] O termo polipeptídeo “isolado” se refere a uma sequência de aminoácidos que é removida de seu ambiente natural por qualquer método ou combinação de métodos conhecidos na técnica e inclui métodos recombinantes, bioquímicos e sintéticos.
[00163] “Peptídeo direcionado” se refere a uma sequência de aminoácidos que direciona uma proteína ou polipeptídeo a organelas intracelulares, isto é, mitocôndria, ou plastídeos, ou ao espaço extracelular (peptídeo de sinalização de secreção). Uma sequência de ácidos nucleicos que codifica um peptídeo direcionado pode ser fundida à sequência de ácidos nucleicos que codifica a extremidade terminal amino, por exemplo, extremidade N-terminal, da proteína ou do polipeptídeo, ou pode ser usada para substituir um polipeptídeo de direcionamento nativo.
[00164] A presente invenção também se refere a “equivalentes funcionais” (também designados como “análogos” ou “mutações funcionais”) dos polipeptídeos descritos especificamente no presente documento.
[00165] Por exemplo, "equivalentes funcionais" se refere a polipeptídeos que, em um teste usado para determinar a atividade enzimática de difosfato de terpenilo sintase, ou atividade de difosfato de terpenilo fosfatase exibem pelo menos 1 a 10%, ou pelo menos 20%, ou pelo menos 50%, ou pelo menos 75%, ou pelo menos 90% de atividade superior ou inferior tal como aquela dos polipeptídeos especificamente descritos no presente documento.
[00166] “Equivalentes funcionais”, de acordo com a invenção, também abrangem mutantes particulares que, em pelo menos uma posição de sequência de uma sequência de aminoácidos indicada no presente documento, têm um aminoácido que é diferente daqueles indicados concretamente, no entanto, possuem uma dentre as atividades biológicas mencionadas acima, por exemplo, atividade enzimática. Assim, “equivalentes funcionais” compreendem mutantes obteníveis por uma ou mais adições, substituições de aminoácidos, como 1 a 20, em particular, 1 a 15 ou 5 a 10, em particular, substituições conservativas, exclusões e/ou inversões, em que as mudanças indicadas podem ocorrer em qualquer posição de sequência, desde que originem um mutante com o perfil de propriedades de acordo com a invenção. A equivalência funcional também é fornecida, em particular, caso os padrões de atividade coincidam qualitativamente entre o mutante e o polipeptídeo não mudado, isto é, caso seja observada, por exemplo, a interação com o mesmo agonista ou antagonista ou substrato, no entanto, em uma taxa diferente, (isto é, expressa por um valor EC50 ou IC50 ou qualquer parâmetro adequado no presente campo da técnica). Exemplos de substituições (conservativas) de aminoácidos são mostradas na tabela que se segue: Resíduo original Exemplos de substituição Ala Ser Arg Lys Asn Gln; His Asp Glu Cys Ser Gln Asn Glu Asp Gly Pro
His Asn; Gln Ile Leu; Val Leu Ile; Val Lys Arg; Gln; Glu Met Leu; Ile Phe Met; Leu; Tyr Ser Thr Thr Ser Trp Tyr Tyr Trp; Phe Val Ile; Leu
[00167] “Equivalentes funcionais” no sentido acima também são “precursores” dos polipeptídeos descritos no presente documento, bem como “derivados funcionais” e “sais” dos polipeptídeos.
[00168] “Precursores” são, nesse caso, precursores naturais ou sintéticos dos polipeptídeos com ou sem a atividade biológica desejada.
[00169] A expressão “sais” significa sais de grupos carboxila bem como sais de adição de ácido de grupos amino das moléculas de proteína, de acordo com a invenção. Os sais de grupos carboxila podem ser produzidos de maneira conhecida e compreendem sais inorgânicos, por exemplo, sais de sódio, cálcio, amônio, ferro e zinco e sais com bases orgânicas, por exemplo, aminas, tais como trietanolamina, arginina, lisina, piperidina e similares. Os sais de adição de ácido, por exemplo, sais com ácidos inorgânicos, tais como, ácido clorídrico ou ácido sulfúrico e sais com ácidos orgânicos, tais como, ácido acético e ácido oxálico, também são abrangidos pela invenção.
[00170] “Derivados funcionais” de polipeptídeos de acordo com a invenção também podem ser produzidos em grupos secundários de aminoácidos funcionais ou em sua extremidade N-terminal ou C-terminal com o uso de técnicas conhecidas. Tais derivados compreendem, por exemplo, ésteres alifáticos de grupos de ácido carboxílicos, amidas de grupos de ácido carboxílicos obteníveis por meio de reação com amônia ou com uma amina primária ou secundária; derivados de N-acila de grupos amino livres produzidos por reação com grupos acila; ou derivados de O-acila de grupos hidroxila livres produzidos por reação com grupos acila.
[00171] “Equivalentes funcionais” também compreendem, naturalmente, polipeptídeos que podem ser obtidos de outros organismos, bem como variantes de ocorrência natural. Por exemplo, áreas de regiões de sequência homóloga podem ser estabelecidas por comparação de sequência, e polipeptídeos equivalentes podem ser determinados com base nos parâmetros concretos da invenção.
[00172] “Equivalentes funcionais” ´também compreendem “fragmentos”, como domínios individuais ou motivos de sequência dos polipeptídeos, de acordo com a invenção, ou formas truncadas N- e ou C-terminal, que podem, ou não, exibir a função biológica desejada. De preferência, tais “fragmentos” retêm a função biológica desejada pelo menos qualitativamente.
[00173] Além disso, “equivalentes funcionais” são proteínas de fusão que têm uma dentre as sequências de polipeptídeo indicadas no presente documento ou equivalentes funcionais derivados das mesmas e pelo menos uma sequência heteróloga adicional funcionalmente diferente em associação funcional N-terminal ou C-terminal (isto é, sem danos funcionais mútuos substanciais das partes de proteína de fusão). Os exemplos não limitantes dessas sequências heterólogas são, por exemplo, peptídeos sinal, âncoras de histidina ou enzimas.
[00174] “Equivalentes funcionais” que também estão compreendidos em conformidade com a invenção são homólogos aos polipeptídeos especificamente revelados. Estes têm pelo menos 60%, preferencialmente, pelo menos 75%, em particular, pelo menos 80 ou 85%, tal como, por exemplo, 90, 91, 92, 93, 94, 95, 96, 97, 98 ou 99%, homologia (ou identidade) a uma dentre as sequências de aminoácido revelados especificamente, calculado pelo algoritmo de Pearson e Lipman, Proc. Natl. Acad, Sci. (USA) 85(8), 1988, 2.444 a 2.448. Uma homologia ou identidade, expressa como uma porcentagem, de um polipeptídeo homólogo, de acordo com a invenção, significa em particular, uma identidade, expressa como uma porcentagem, dos resíduos de aminoácidos com base no comprimento total de uma ou mais das sequências de aminoácido descritas especificamente no presente documento.
[00175] Os dados de identidade, expressos como uma porcentagem, também podem ser determinados com o auxílio de alinhamentos BLAST, algoritmo blastp (proteína-proteína BLAST) ou aplicando-se as configurações de Clustal especificadas no presente documento a seguir.
[00176] No caso de uma possível glicosilação de proteína, os “equivalentes funcionais” de acordo com a invenção compreendem polipeptídeos como descrito no presente documento em forma desglicosilada ou glicosilada bem como formas modificadas que podem ser obtidas alterando-se o padrão de glicosilação.
[00177] Os equivalentes funcionais ou homólogos dos polipeptídeos de acordo com a invenção podem ser produzidos por mutagênese, por exemplo, mutação pontual, alongamento ou encurtamento da proteína ou como descrito mais detalhadamente a seguir.
[00178] Os equivalentes funcionais ou homólogos dos polipeptídeos de acordo com a invenção podem ser identificados triando-se bancos de dados combinatórios de mutantes, por exemplo, mutantes de encurtamento. Por exemplo, um banco de dados variegados de variantes de proteína pode ser produzido por mutagênese combinatória no nível de ácido nucleico, por exemplo, por ligação enzimática de uma mistura de oligonucleotídeos sintéticos. Há muitos métodos que podem ser usados para a produção de bancos de dados de homólogos potenciais de uma sequência de oligonucleotídeos degenerados. A síntese química de uma sequência gênica degenerada pode ser realizada em um sintetizador de DNA automático, e o gene sintético pode, então, ser ligado em um vetor de expressão adequado. O uso de um genoma degenerado possibilita fornecer todas as sequências em uma mistura que codifica para o conjunto desejado de sequências de proteínas potenciais. Os métodos de síntese de oligonucleotídeos degenerados são conhecidos por uma pessoa versada na técnica.
[00179] Na técnica anterior, várias técnicas são conhecidas para a triagem de produtos gênicos de bancos de dados combinatórios, que foram produzidos por mutações pontuais ou encurtamentos, e para a triagem de bibliotecas de cDNA para produtos gênicos com uma propriedade selecionada. Essas técnicas podem ser adaptadas para a triagem rápida dos bancos gênicos que foram produzidos por mutagênese combinatória de homólogos de acordo com a invenção. As técnicas usadas mais frequentemente para a triagem de grandes bancos gênicos, que se baseiam em uma análise de alto rendimento, compreendem clonagem do banco gênico em vetores de expressão que podem ser replicados, transformação das células adequadas com o banco de dados de vetor resultante e expressão dos genes combinatórios em condições em que a detecção da atividade desejada facilita o isolamento do vetor que codifica o gene cujo produto foi detectado. Mutagênese Recursiva de Conjunto (REM), uma técnica que aumenta a frequência de mutantes funcionais nos bancos de dados, pode ser usada em combinação com testes de triagem, a fim de identificar homólogos.
[00180] Uma modalidade fornecida no presente documento fornece ortólogos e parálogos de polipeptídeos revelados no presente documento bem como métodos para identificar e isolar tais ortólogos e parálogos. Uma definição dos termos "ortólogo" e "parálogo" é fornecida abaixo e se aplica às sequências de aminoácidos e ácidos nucleicos. C. SEQUÊNCIAS DE ÁCIDO NUCLEICOS DE CODIFICAÇÃO APLICÁVEIS DE
ACORDO COM A INVENÇÃO
[00181] Nesse contexto, se aplicam as seguintes definições:
[00182] Os termos “sequência de ácidos nucleicos”, “ácido nucleico”, “molécula de ácido nucleico” e “polinucleotídeo” são usados de maneira intercambiável, com o significado de uma sequência de nucleotídeos. Uma sequência de ácidos nucleicos pode ser um desoxirribonucleotídeo, ou ribonucleotídeo, de fita simples ou dupla fita de qualquer comprimento e inclui sequência de codificação e não codificação de um gene, éxons, íntrons, sequências complementares senso e antissenso, DNA genômico, cDNA, miRNA, siRNA, mRNA, rRNA, tRNA, sequências de ácidos nucleicos recombinantes, sequências de DNA e/ou RNA de ocorrência natural isoladas e purificadas, fragmentos, iniciadores e sondas de ácido nucleico. O versado na técnica está ciente de que as sequências de ácidos nucleicos de RNA são idênticas às sequências de DNA com a diferença de timina (T) ser substituída por uracila (U). O termo "sequência de nucleotídeos" também deve ser entendido como compreendendo uma molécula de polinucleotídeo ou uma molécula de oligonucleotídeo na forma de um fragmento separado ou como um componente de um ácido nucleico maior.
[00183] Um “ácido nucleico isolado” ou “sequências de ácidos nucleicos isolados” se refere a um ácido nucleico ou sequências de ácidos nucleicos que estão em um ambiente diferente daquele em que o ácido nucleico ou sequências de ácidos nucleicos ocorrem naturalmente e pode incluir aqueles que são substancialmente livres do material endógeno contaminante.
[00184] O termo “de ocorrência natural”, como usado no presente documento, como aplicado a um ácido nucleico se refere a um ácido nucleico que é encontrado em uma célula de um organismo na natureza e que não foi intencionalmente modificada por um ser humano no laboratório.
[00185] Um “fragmento” de um polinucleotídeo ou sequências de ácidos nucleicos se refere a nucleotídeos contíguos que têm particularmente pelo menos 15 bp, pelo menos 30 bp, pelo menos 40 bp, pelo menos 50 bp e/ou pelo menos 60 bp de comprimento do polinucleotídeo de uma modalidade no presente documento. Particularmente, o fragmento de um polinucleotídeo compreende pelo menos 25, mais particularmente pelo menos 50, mais particularmente pelo menos 75, mais particularmente pelo menos 100, mais particularmente pelo menos 150, mais particularmente pelo menos 200, mais particularmente pelo menos 300, mais particularmente pelo menos 400, mais particularmente pelo menos 500, mais particularmente pelo menos 600, mais particularmente pelo menos 700, mais particularmente pelo menos 800, mais particularmente pelo menos 900, mais particularmente pelo menos 1.000 nucleotídeos contíguos do polinucleotídeo de uma modalidade do presente documento. Sem limitação, o fragmento dos polinucleotídeos do presente documento pode ser usado como um iniciador de PCR, e/ou como uma sonda, ou para silenciamento de gene antissenso ou RNAi.
[00186] Como usado no presente documento, o termo “hibridização” ou hibridiza sob determinadas condições deve descrever condições para hibridização e lavagens sob as quais a sequências de nucleotídeos que são significativamente idênticas ou homólogas entre si permanecem ligadas umas às outras As condições podem ser de modo que essas sequências, que são pelo menos cerca de 70%, tal como pelo menos cerca de 80% e tal como pelo menos cerca de 85%, 90% ou 95% idênticas, permaneçam ligadas entre si. Definições de condições de hibridização de severidade baixa, severidade moderada, severidade alta são fornecidas no presente documento a seguir. Condições apropriadas de hibridização também podem ser selecionadas pelas pessoas versadas na técnica com experimento mínimo, como exemplificado em Ausubel et al. (1995, Current Protocols in Molecular Biology, John Wiley & Sons, seções 2, 4 e 6). Além disso, condições de severidade são descritas em Sambrook et al. (1989, Molecular Cloning: A Laboratory Manual, 2a edição, Cold Spring Harbor Press, capítulos 7, 9 e 11).
[00187] “Sequências de ácido nucleico recombinante” são sequências de ácido nucleicos que resultam do uso de métodos laboratoriais (por exemplo, clonagem molecular) para unir material genético de mais de uma fonte, criando ou modificando uma sequência de ácidos nucleicos de ocorrência não natural e que não é encontrada em organismos biológicos.
[00188] “Tecnologia de DNA recombinante” se refere a procedimentos de biologia molecular para preparar uma sequência de ácidos nucleicos recombinantes, como descrito, por exemplo, em Laboratory Manuals editado por Weigel e Glazebrook, 2002, Cold Spring Harbor Lab Press; e Sambrook et al., 1989, Cold Spring Harbor, NY, Cold Spring Harbor Laboratory Press.
[00189] O termo “gene” significa uma sequência de DNA que compreende uma região, que é transcrita em uma molécula de RNA, por exemplo, um mRNA em uma célula, ligada operacionalmente a regiões reguladoras adequadas, por exemplo, um promotor. Um gene pode compreender, ainda, várias sequências ligadas operacionalmente, tais como um promotor, uma sequência líder 5’ que compreende, por exemplo, sequências envolvidas na iniciação de tradução, uma região de codificação de cDNA ou DNA genômico, íntrons, éxons e/ou uma sequência 3’ não traduzida que compreende, por exemplo, sítios de terminação de transcrição.
[00190] “Policistrônico" se refere a moléculas de ácido nucleico, em particular, mRNAs que podem codificar mais de um polipeptídeo separadamente dentro da mesma molécula de ácido nucleico
[00191] Um “gene quimérico” se refere a qualquer gene que não é normalmente encontrado na natureza em uma espécie, em particular, um gene em que estão presentes uma ou mais partes da sequência de ácidos nucleicos que não estão associadas uma à outra na natureza. Por exemplo, o promotor não está associado na natureza a parte ou a totalidade da região transcrita ou a outra região reguladora. O termo “gene quimérico” é entendido incluindo construtos de expressão em que um promotor ou sequência reguladora de transcrição está ligado operacionalmente a uma ou mais sequências de codificação ou a um complemento antissenso, isto é, reverso, da fita senso, ou sequência de repetição invertida (senso e antissenso, segundo o qual o transcrito de RNA forma RNA com fita dupla mediante transcrição). O termo "gene quimérico" também inclui genes obtidos através da combinação de porções de uma ou mais sequências de codificação para produzir um novo gene.
[00192] Uma “UTR 3’” ou “sequência não traduzida 3’” (também denominada como “região não traduzida 3’” ou “extremidade 3’”) se refere à sequência de ácidos nucleicos encontrada a jusante da sequência de codificação de um gene, que compreende, por exemplo, um sítio de terminação de transcrição e (na maioria, porém, não todos os mRNAs eucarióticos) um sinal de poliadenilação, tal como AAUAAA ou variantes do mesmo. Após a terminação da transcrição, o transcrito de mRNA pode ser clivado a jusante do sinal de poliadenilação e uma cauda poli(A) pode ser adicionada, a qual está envolvida no transporte do mRNA ao sítio de tradução, por exemplo, citoplasma.
[00193] O termo “iniciador” se refere a uma sequência de ácidos nucleicos curta que é hibridizada a uma sequência de ácidos nucleicos de modelo e é usada para polimerização de uma complementariedade de sequência de ácidos nucleicos ao modelo.
[00194] O termo “marcador selecionável” se refere a qualquer gene que mediante expressão pode ser usado para selecionar uma célula ou células que incluem o marcador selecionável. Exemplos de marcadores selecionáveis são descritos a seguir. O versado na técnica saberá que diferentes marcadores selecionáveis antibióticos, fungicidas, auxotróficos ou herbicidas são aplicáveis a diferentes espécies-alvo.
[00195] A invenção também se refere a sequências de ácido nucleicos que codificam polipeptídeos, como definido no presente documento.
[00196] Em particular, a invenção também se refere a sequências de ácido nucleicos (sequências de DNA e RNA de fita simples ou dupla fita, por exemplo, cDNA, DNA e mRNA genômico), que codificam para um dos polipeptídeos acima e seus funcionais equivalentes, que podem ser obtidos, por exemplo, com o uso de análogos de nucleotídeo artificiais.
[00197] A invenção se refere tanto a moléculas de ácido nucleico isoladas que codificam para polipeptídeos de acordo com a invenção ou segmentos biologicamente ativos dos mesmos quanto a fragmentos de ácido nucleico que podem ser usados, por exemplo, como sondas ou iniciadores de hibridização que codificam ácidos nucleicos de acordo com a invenção.
[00198] A presente invenção também se refere a ácidos nucleicos com um determinado grau de “identidade” às sequências especificamente reveladas no presente documento. “Identidade” entre dois ácidos nucleicos significa identidade dos nucleotídeos, em cada caso no comprimento total do ácido nucleico.
[00199] A “identidade” entre duas sequências de nucleotídeos (o mesmo se aplica a sequências de peptídeo ou de aminoácido) é uma função do número de resíduos de nucleotídeo (ou resíduos de aminoácidos) ou que são idênticos nas duas sequências quando um alinhamento dessas duas sequências foi gerado. Os resíduos idênticos são definidos como resíduos que são os mesmos nas duas sequências em uma determinada posição do alinhamento. A porcentagem da identidade de sequência, como usado no presente documento, é calculada a partir do alinhamento ideal tomando-se o número de resíduos idênticos entre duas sequências, dividindo o mesmo pelo número total de resíduos na sequência mais curta e multiplicando por
100. O alinhamento ideal é o alinhamento em que a porcentagem de identidade é a maior possível. Os vãos podem ser introduzidos em uma ou ambas as sequências em uma ou mais posições do alinhamento para obter o alinhamento ideal. Essas lacunas são, então, levadas em consideração como resíduos não idênticos para o cálculo da porcentagem de identidade de sequência. O alinhamento para o propósito de determinar a porcentagem de identidade de sequência de aminoácidos ou ácidos nucleicos pode ser alcançado de vários modos com o uso de programas de computador e, por exemplo, programas de computador publicamente disponíveis na rede mundial de computadores.
[00200] Particularmente, o programa BLAST (Tatiana et al, FEMS Microbiol Lett., 1999, 174:247-250, 1999) ajustado para os parâmetros padrão, disponível junto ao National Center for Biotechnology Information (NCBI) site da web em ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi, pode ser usado para obter um alinhamento ideal de proteína ou sequências de ácido nucleicos e para calcular a porcentagem de identidade de sequência.
[00201] Em outro exemplo, a identidade pode ser calculada por meio do programa Vector NTI Suite 7.1 da empresa Informax (EUA) que empresa o método Clustal (Higgins DG, Sharp PM. ((1989))) com os ajustes a seguir: Parâmetros de alinhamento múltiplos: Penalidade de abertura de lacuna 10 Penalidade de extensão de lacuna 10 Faixa de Penalidade de separação de 8 lacuna Penalidade de separação de lacuna inativa % de identidade para atraso de 40 alinhamento Lacunas específicas de resíduo ausente
Parâmetros de alinhamento múltiplos: Lacuna de resíduo hidrofílica ausente Ponderação de transição 0 Parâmetro de alinhamento em pares: Algoritmo FAST ativo Tamanho da tupla K 1 Penalidade de lacuna 3 Tamanho da janela 5 Número de melhores diagonais 5
[00202] Alternativamente, a identidade pode ser determinada de acordo com Chenna, et al. (2003), a página da web: http://www.ebi.ac.uk/Tools/clustalw/index.html# e os ajustes a seguir Penalidade de Abertura de Lacuna de 15,0
DNA Penalidade de extensão de Lacuna de 6,66
DNA Matriz de DNA Identidade Penalidade de Abertura de Lacuna de 10,0 Proteína Penalidade de Extensão de Lacuna de 0,2 Proteína Matriz de Proteína Gonnet Proteína/DNA ENDGAP -1 Proteína/DNA GAPDIST 4
[00203] Todas as sequências de ácido nucleicos mencionadas no presente documento (sequências de DNA e RNA de fita simples e dupla fita, por exemplo, cDNA e mRNA) podem ser produzidas de maneira conhecida por síntese química dos blocos de construção de nucleotídeo, por exemplo, por condensação de fragmento de sobreposição individual, blocos de construção de ácido nucleico complementar da hélice dupla. A síntese química de oligonucleotídeos pode, por exemplo, ser realizada de maneira conhecida, pelo método de fosfoamidita (Voet, Voet, 2a edição, Wiley Press, New York, páginas 896 a 897). O acúmulo de oligonucleotídeos sintéticos e preenchimento de lacunas por meio do fragmento de DNA polimerase Klenow e reações de ligação assim como técnicas gerais de clonagem são descritos em Sambrook et al. (1989), consultar a seguir.
[00204] As moléculas de ácido nucleico de acordo com a invenção também podem conter sequências não traduzidas da extremidade 3' e/ou 5' da região genética de codificação.
[00205] A invenção se refere adicionalmente às moléculas de ácido nucleico que são complementares às sequências de nucleotídeos descritas concretamente ou a um segmento das mesmas.
[00206] As sequências de nucleotídeos de acordo com a invenção possibilitam a produção de sondas e iniciadores que podem ser usados para a identificação e/ou clonagem de sequências homólogas em outros tipos celulares e organismos. Tais sondas ou iniciadores compreendem geralmente uma região de sequências de nucleotídeos é hibridiza sob condições “rigorosas” (como definido no presente documento) em pelo menos cerca de 12, de preferência, pelo menos cerca de 25, por exemplo, cerca de 40, 50 ou 75 nucleotídeos sucessivos de uma fita senso de uma sequência de ácidos nucleicos de acordo com a invenção ou de uma fita antissenso correspondente.
[00207] Sequências “homólogas” incluem sequências ortólogas ou parálogas. Os métodos para identificar ortólogos e parálogos, que incluem métodos filogenéticos, similaridade de sequência e métodos de hibridização são conhecidos na técnica e são descritos no presente documento.
[00208] “Parálogos” resultam da duplicação de genes que dá origem a dois ou mais genes com sequências semelhantes e funções semelhantes. Os parálogos tipicamente se agrupam e são formados por duplicações de genes dentro de espécies de planta relacionadas. Os parálogos são encontrados em grupos de genes similares com o uso de análise Blast em pareamento ou durante análise filogenética de famílias de genes com o uso de programas, tal como CLUSTAL. Em parálogos, as sequências consenso podem ser uma característica identificada para sequências dentro de genes relacionados e que têm funções similares dos genes.
[00209] “Ortólogos”, ou sequências ortólogas, são sequências similares uma a outra devido ao fato de que são encontradas em espécies que descenderam de um ancestral comum. Por exemplo, espécies vegetais que têm ancestrais comuns são conhecidas por conter muitas enzimas que têm sequências e funções semelhantes. O versado na técnica pode identificar sequências ortólogas e prever funções dos ortólogos, por exemplo, construindo-se uma árvore poligênica para uma família de genes de uma espécie com o uso dos programas CLUSTAL ou BLAST. Um método para identificar ou confirmar funções semelhantes dentre sequências homólogas ocorre comparando-se os perfis de transcrição em células ou organismos hospedeiros, tais como plantas ou micro-organismos, que superexpressam ou carecem (em knockouts/knockdowns) de polipeptídeos relacionados. O versado na técnica entenderá que genes que têm perfis de transcrito similares, com mais de 50% de transcritos regulados em comum, ou com mais de 70% de transcritos regulados em comum, ou mais de 90% transcritos regulados em comum terão funções similares. Espera-se que os homólogos, parálogos, ortólogos e quaisquer outras variantes das sequências no presente documento funcionem de uma maneira similar, fazendo-se as células hospedeiras, organismos tais como plantas ou micro-organismos que produzem proteínas terpeno sintase.
[00210] O termo “marcador selecionável” se refere a qualquer gene que mediante expressão pode ser usado para selecionar uma célula ou células que incluem o marcador selecionável. Exemplos de marcadores selecionáveis são descritos a seguir. O versado na técnica saberá que diferentes marcadores selecionáveis antibióticos, fungicidas, auxotróficos ou herbicidas são aplicáveis a diferentes espécies-alvo.
[00211] Uma molécula de ácido nucleico “isolada” é separada de outras moléculas de ácido nucleico que estão presentes na fonte natural do ácido nucleico e podem, também, estar substancialmente livres de outro material celular ou meio de cultura, caso sejam produzidas por técnicas recombinantes ou possam ser livres de precursores químicos ou outros produtos químicos, caso sejam sintetizadas quimicamente.
[00212] Uma molécula de ácido nucleico de acordo com a invenção pode ser isolada por meio de técnicas padrão de biologia molecular e as informações de sequências fornecidas de acordo com a invenção. Por exemplo, cDNA pode ser isolado de uma biblioteca de cDNA adequada, com o uso de uma dentre as sequências completas concretamente reveladas ou um segmento da mesma como sonda de hibridização e técnicas de hibridização (como descrito, por exemplo, em Sambrook, (1989)).
[00213] Além disso, uma molécula de ácido nucleico que compreende uma dentre as sequências reveladas ou um segmento das mesmas, pode ser isolada pela reação em cadeia da polimerase, com o uso dos iniciadores de oligonucleotídeo que foram construídos com base nessa sequência. O ácido nucleico amplificado dessa maneira pode ser clonado em um vetor adequado e pode ser caracterizado por sequenciamento de DNA. Os oligonucleotídeos de acordo com a invenção também podem ser produzidos por métodos padrão de síntese, por exemplo, com o uso de um sintetizador de DNA automático.
[00214] As sequências de ácido nucleicos de acordo com a invenção ou derivados dos mesmos, homólogos ou partes dessas sequências, podem ser, por exemplo, isoladas por técnicas de hibridização comuns ou a técnica de PCR de outras bactérias, por exemplo, por meio de bibliotecas genômicas ou de cDNA. Essas sequências de DNA hibridizam em condições padrão com as sequências de acordo com a invenção.
[00215] “Hibridizar” significa a capacidade de um polinucleotídeo ou oligonucleotídeo se ligar a uma sequência quase complementar em condições padrão, embora uma ligação não específica não ocorra entre parceiros não complementares nessas condições. Para isso, as sequências podem ser 90 a 100% complementares. A propriedade de sequências complementares de poderem se ligar especificamente entre si é utilizada, por exemplo, em Northern Blotting ou Southern Blotting ou em ligação de iniciador em PCR ou RT-PCR.
[00216] Os oligonucleotídeos curtos das regiões conservadas são usados de maneira vantajosa para hibridização. No entanto, também é possível usar fragmentos mais longos dos ácidos nucleicos de acordo com a invenção ou as sequências completas para a hibridização. Essas “condições padrão” variam dependendo do ácido nucleico usado (oligonucleotídeo, fragmento mais longo ou sequência completa) ou dependendo do tipo de ácido nucleico – DNA ou RNA – que é usado para hibridização. Por exemplo, as temperaturas de fusão para híbridos de DNA:DNA são aproximadamente 10 °C inferiores àquelas de híbridos de DNA:RNA do mesmo comprimento.
[00217] Por exemplo, dependendo do ácido nucleico particular, temperaturas médias de condições padrão entre 42 e 58 °C em uma solução tampão aquosa com uma concentração entre 0,1 a 5 x SSC (1 X SSC = NaCl 0,15 M, citrato de sódio 15 mM, pH 7,2) ou adicionalmente na presença de 50% de formamida, por exemplo, 42 °C em 5 x SSC, 50% de formamida. Vantajosamente, as condições de hibridização para híbridos de DNA:DNA são 0,1 x SSC e temperaturas entre cerca de 20 ºC a 45 ºC, preferencialmente entre cerca de 30 ºC a 45 ºC. Para híbridos de RNA:DNA, as condições de hibridização são vantajosamente 0,1 x SSC e temperaturas entre cerca de 30 ºC a 55 ºC, preferencialmente entre cerca de 45 ºC a 55 ºC. Estas temperaturas declaradas para hibridização são exemplos de valores de temperatura de fusão calculadas para um ácido nucleico com um comprimento de aproximadamente 100 nucleotídeos e um teor G + C de 50% na ausência de formamida. As condições experimentais para hibridização de DNA são descritas em livros didáticos de genéticas relevantes, por exemplo, Sambrook et al., 1989, e podem ser calculadas com o uso de fórmulas que são conhecidas por uma pessoa versada na técnica, por exemplo,
dependendo do comprimento dos ácidos nucleicos, o tipo de híbridos ou o teor G + C. Uma pessoa versada na técnica pode obter informações adicionais sobre hibridização dos livros seguintes didáticos: Ausubel et al. (edições), (1985), Brown (edição) (1991).
[00218] “Hibridização” pode ser realizada, em particular, sob condições rigorosas. Tais condições de hibridização são descritas, por exemplo, em Sambrook (1989) ou em Current Protocols em Molecular Biology, John Wiley & Sons, N.Y. (1989), 6.3.1 a
6.3.6.
[00219] Como usado no presente documento, o termo hibridização ou hibridiza sob determinadas condições deve descrever condições para hibridização e lavagens sob as quais a sequências de nucleotídeos que são significativamente idênticas ou homólogas entre si permanecem ligadas umas às outras As condições podem ser de modo que essas sequências, que são pelo menos cerca de 70%, tais como pelo menos cerca de 80% e tal como pelo menos cerca de 85%, 90% ou 95% idênticas, permaneçam ligadas entre si. Definições de condições de hibridização de severidade baixa, severidade moderada, severidade alta são fornecidas no presente documento.
[00220] Condições apropriadas de hibridização podem ser selecionadas pelas pessoas versadas na técnica com experimento mínimo, como exemplificado em Ausubel et al. (1995, Current Protocols in Molecular Biology, John Wiley & Sons, seções 2, 4 e 6). Além disso, condições de severidade são descritas em Sambrook et al. (1989, Molecular Cloning: A Laboratory Manual, 2a edição, Cold Spring Harbor Press, capítulos 7, 9 e 11).
[00221] Como usado no presente documento, as condições definidas de baixa severidade são como se segue. Os filtros que contêm DNA são pré-aquecidos por 6 horas a 40 °C em uma solução que contém 35% de formamida, 5x SSC, Tris-HCl 50 mM (pH 7,5), EDTA 5 mM, 0,1% de PVP, 0,1% de Ficoll, 1% de BSA e 500 µg/ml de DNA de esperma de salmão desnaturado. As hibridizações são realizadas na mesma solução com as seguintes modificações: 0,02% de PVP, 0,02% de Ficoll, 0,2% de BSA, 100 µg/ml de DNA de esperma de salmão, 10% (em peso/volume) de sulfato de dextrano e sonda identificada como 5-20x106 32P são usados. Os filtros são incubados em mistura de hibridização por 18 a 20 h a 40 °C e, em seguida, lavados por 1,5 hora a 55 °C. Em uma solução que contém 2x SSC, Tris-HCl 25 mM (pH 7,4), EDTA 5 mM e 0,1% de SDS. A solução de lavagem é substituída por nova solução e incubada por mais 1,5 hora a 60 °C. Os filtros são secos com papel e expostos para autorradiografia.
[00222] Como usado no presente documento, as condições definidas de severidade moderada são como se segue. Os filtros que contêm DNA são pré-aquecidos por 7 horas a 50 °C em uma solução que contém 35% de formamida, 5x SSC, Tris-HCl 50 mM (pH 7,5), EDTA 5 mM, 0,1% de PVP, 0,1% de Ficoll, 1% de BSA e 500 µg/ml de DNA de esperma de salmão desnaturado. As hibridizações são realizadas na mesma solução com as seguintes modificações: 0,02% de PVP, 0,02% de Ficoll, 0,2% de BSA, 100 µg/ml de DNA de esperma de salmão, 10% (em peso/volume) de sulfato de dextrano e sonda identificada como 5-20x106 32P são usados. Os filtros são incubados em mistura de hibridização por 30 h a 50 °C e, em seguida, lavados por 1,5 hora a 55 °C. Em uma solução que contém 2x SSC, Tris-HCl 25 mM (pH 7,4), EDTA 5 mM e 0,1% de SDS. A solução de lavagem é substituída por nova solução e incubada por mais 1,5 hora a 60 °C. Os filtros são secos com papel e expostos para autorradiografia.
[00223] Como usado no presente documento, as condições definidas de severidade alta são como se segue. A pré-hibridização de filtros que contêm DNA é realizada por 8 horas de um para o outro a 65 °C em tampão composto de 6x SSC, Tris-HCl 50 mM (pH 7,5), EDTA 1 mM, 0,02% de PVP, 0,02% de Ficoll, 0,02% de BSA e 500 µg/ml de DNA de esperma de salmão desnaturado. Os filtros são hibridizados por 48 horas a 65 °C na mistura de pré-hibridização que contém 100 µg/ml de DNA de esperma de salmão desnaturado e 5-20x106 cpm de sonda identificada como 32P. A lavagem dos filtros é feita a 37 °C por 1 hora em uma solução que contém 2x SSC, 0,01% de PVP, 0,01% de Ficoll e 0,01% de BSA. Após isso, há uma lavagem em 0,1x SSC a 50 °C por 45 minutos.
[00224] Outras condições de baixa, média e alta severidade bem conhecidas na técnica (por exemplo, como empregado para hibridizações de espécie cruzada) podem ser usadas, caso as condições acima sejam inapropriadas (por exemplo, como empregado para hibridizações de espécie cruzada).
[00225] Um kit de detecção para sequências de ácido nucleicos que codificam um polipeptídeo da invenção pode incluir iniciadores e/ou sondas específicas para sequências de ácido nucleicos que codificam o polipeptídeo e um protocolo associado para uso os iniciadores e/ou sondas para detectar sequências de ácidos nucleicos que codificam o polipeptídeo em uma amostra. Tais kits de detecção podem ser usados para determinar se uma planta, organismo, micro-organismo ou célula foram modificados, isto é, transformados com uma sequência que codifica o polipeptídeo.
[00226] A fim de testar uma função de sequências de DNA variantes de acordo com uma modalidade no presente documento, a sequência de interesse é ligada de maneira operacional a um gene marcador selecionável ou passível de triagem e a expressão do dito gene repórter é testada em ensaios de expressão transiente, por exemplo, com micro-organismos ou com protoplastos ou plantas estavelmente transformadas.
[00227] A invenção também se refere a derivados das sequências de ácido nucleicos revelados ou deriváveis.
[00228] Assim, as sequências de ácido nucleicos adicionais, de acordo com a invenção, podem ser derivadas das sequências reveladas especificamente no presente documento e podem diferir das mesmas por uma ou mais adições, substituições, inserções ou deleções, como 1 a 20, em particular, 1 a 15 a 10, de um ou diversos (como, por exemplo, 1 a 10) nucleotídeos e também codificar polipeptídeos com o perfil desejado de propriedades.
[00229] A invenção também abrange sequências de ácido nucleicos que compreendem as então chamadas mutações silenciosas ou foram alteradas, em comparação a uma sequência indicada concretamente, de acordo com o uso de códon de um organismo original especial ou hospedeiro.
[00230] De acordo com uma modalidade particular da invenção, ácidos nucleicos variantes podem ser preparados a fim de adaptar sua sequência de nucleotídeos a um sistema de expressão específico. Por exemplo, são conhecidos sistemas de expressão bacterianos para expressar de modo mais eficaz polipeptídeos se os aminoácidos forem codificados por códons particulares. Devido à degenerescência do código genético, mais de um códon pode codificar a mesma sequência de aminoácidos, múltiplas sequências de ácidos nucleicos podem codificar a mesma proteína ou polipeptídeo, em que todas essas sequências de DNA são abrangidas por uma modalidade do presente documento. Onde apropriado, as sequências de ácidos nucleicos que codificam os polipeptídeos descritos no presente documento podem ser otimizadas para expressão aumentada na célula hospedeira. Por exemplo, ácidos nucleicos de uma modalidade no presente documento podem ser sintetizados com o uso de códons particulares para um hospedeiro para expressão aprimorada.
[00231] A invenção também abrange variantes de ocorrência natural, por exemplo, variantes de splicing ou variantes alélicas das sequências descritas no presente documento.
[00232] As variantes alélicas podem ter pelo menos 60% de homologia no nível do aminoácido derivado, de preferência, pelo menos 80% de homologia, muito especialmente, de preferência, pelo menos 90% de homologia em toda a faixa de sequência (em relação à homologia no nível de aminoácido, referência deve ser feita aos detalhes fornecidos acima para os polipeptídeos). Vantajosamente, as homologias podem ser mais altas em regiões parciais das sequências.
[00233] A invenção também se refere a sequências que podem ser obtidas por substituições conservativas de nucleotídeo (isto é, como um resultado disso, o aminoácido em questão é substituído por um aminoácido da mesma carga, tamanho, polaridade e/ou solubilidade).
[00234] A invenção também se refere às moléculas derivadas dos ácidos nucleicos revelados concretamente por polimorfismos sequenciais. Tais polimorfismos genéticos podem existir em células de diferentes populações ou dentro de uma população devido à variação alélica natural. Variantes alélicas também podem incluir equivalentes funcionais. Essas variações naturais produzem normalmente uma variância de 1 a 5% na sequência de nucleotídeos de um gene. Os ditos polimorfismos podem levar a mudanças na sequência de aminoácidos dos polipeptídeos revelados no presente documento. Variantes alélicas também podem incluir equivalentes funcionais.
[00235] Além disso, os derivados também devem ser entendidos como homólogos das sequências de ácido nucleico de acordo com a invenção, por exemplo animal, vegetal, fúngica ou homólogos bacterianos, sequências encurtadas, DNA ou RNA de fita simples da sequência de DNA de codificação e não codificação. Por exemplo, os homólogos têm, ao nível do DNA, uma homologia de pelo menos 40%, de preferência, de pelo menos 60%, especialmente, de preferência, de pelo menos 70%, com preferência muito especial, de pelo menos 80% em toda a região de DNA fornecida em uma sequência especificamente revelada no presente documento.
[00236] Além disso, derivados devem ser entendidos com sendo, por exemplo, fusões com promotores. Os promotores que são adicionados às sequências de nucleotídeos declaradas podem ser modificados pelo menos por uma troca de nucleotídeo, pelo menos uma inserção, inversão e/ou deleção, embora sem prejudicar a funcionalidade ou eficácia dos promotores. Além disso, a eficácia dos promotores pode ser aumentada alterando-se sua sequência ou podem ser trocados completamente por promotores mais eficazes até mesmo de organismos de um gênero diferente. D. GERAÇÃO DE MUTANTES DE POLIPEPTÍDEO FUNCIONAIS
[00237] Além disso, uma pessoa versada na técnica está familiarizada com métodos para gerar mutantes funcionais, ou seja, sequências de nucleotídeos que codificam um polipeptídeo com pelo menos 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com qualquer um dos SEQ ID NOs de aminoácidos relacionados, como revelado no presente documento, e/ou codificados por uma molécula de ácido nucleico que compreende uma sequência de nucleotídeos que têm pelo menos 70% de identidade de sequência em relação a qualquer um dentre os SEQ ID NOs relacionados de nucleotídeos, como revelado no presente documento.
[00238] Dependendo da técnica usada, uma pessoa versada na técnica pode introduzir mutações completamente aleatórias ou, de outro modo, direcionadas nos genes ou, de outro modo, regiões de ácido nucleico não codificadoras (que são, por exemplo, importantes para regular expressão) e gerar subsequentemente bibliotecas genéticas. Os métodos de biologia molecular exigidos para esse propósito são conhecidos pelo especialista e, por exemplo, descritos em Sambrook e Russell, Molecular Cloning. 3a Edição, Cold Spring Harbor Laboratory Press 2001.
[00239] Os métodos para modificar genes e, desse modo, para modificar o polipeptídeo codificado pelos mesmos são conhecidos pelo especialista por um bom tempo, tal como, por exemplo - mutagênese específica ao local, em que nucleotídeos individuais ou diversos nucleotídeos de um gene são substituídos de maneira direcionada (Trower MK (Ed.) 1996; In vitro mutagenesis protocols. Humana Press, Nova Jérsei), - mutagênese por saturação, na qual um códon para qualquer aminoácido pode ser trocado ou adicionado em qualquer ponto de um gene (Kegler-Ebo DM, Docktor CM, DiMaio D (1994) Nucleic Acids Res 22:1593; Barettino D, Feigenbutz M, Valcárel R, Stunnenberg HG (1994) Nucleic Acids Res 22:541; Barik S (1995) Mol Biotechnol 3:1), - reação em cadeia da polimerase propensa a erro, em que as sequências de nucleotídeos são submetidas à mutação por DNA polimerases propensas a erro (Eckert KA, Kunkel TA (1990) Nucleic Acids Res 18:3739); - o método SeSaM (método de saturação de sequência), no qual as trocas preferenciais são impedias pela polimerase. Schenk et al., Biospektrum, Volume 3, 2006, 277 a 279 - a passagem de genes em cepas de mutação, nas quais, por exemplo, devido a mecanismos de reparo de DNA defeituosos, há uma taxa de mutação aumentada de sequências de nucleotídeos (Greener A, Callahan M, Jerpseth B (1996) An efficient random mutagenesis technique using an E.coli mutator strain. In: Trower MK (Ed.) In vitro mutagenesis protocols. Humana Press, Nova Jérsei); ou - embaralhamento de DNA, no qual um pool de genes relacionados intimamente é formado e digerido, e os fragmentos são usados como moldes para uma reação em cadeia da polimerase na qual, por separação e reassociação de fita repetida, genes de mosaico de comprimento inteiro são gerados ao final (Stemmer WPC (1994) Nature 370:389; Stemmer WPC (1994) Proc Natl Acad Sci EUA 91:10747).
[00240] Com o uso da chamada evolução direcionada (descrita, entre outros, em Reetz MT e Jaeger K-E (1999), Topics Curr Chem 200:31; Zhao H, Moore JC, Volkov AA, Arnold FH (1999), Methods for optimizing industrial polypeptides by directed evolution, In: Demain AL, Davies JE (Edição) Manual of industrial microbiology and biotechnology. American Society for Microbiology), um especialista pode produzir mutantes funcionais de maneira direcionada e em uma larga escala. Com essa finalidade, em uma primeira etapa, as bibliotecas gênicas dos respectivos polipeptídeos são produzidas primeiramente, por exemplo, com o uso dos métodos fornecidos acima. As bibliotecas gênicas são expressas de maneira adequada, por exemplo, por sistemas de exibição de bactérias ou de fago.
[00241] Os genes relevantes dos organismos hospedeiros que expressam mutantes funcionais com propriedades que correspondem amplamente às propriedades desejadas podem ser submetidos a outro ciclo de mutação. As etapas da mutação e seleção ou triagem podem ser repetidas interativamente até que os presentes mutantes funcionais tenham propriedades desejadas até um ponto suficiente. Com o uso desse procedimento interativo, um número limitado de mutações, por exemplo 1, 2, 3, 4 ou 5 mutações, pode ser realizado em estágios e avaliado e selecionado quanto à sua influência na atividade em questão. O mutante selecionado pode, então, ser submetido a uma etapa de mutação adicional da mesma maneira. Dessa maneira, o número de mutantes individuais a ser investigado pode ser reduzido significativamente.
[00242] Os resultados de acordo com a invenção também fornecem informações importantes em relação à estrutura e sequência dos polipeptídeos relevantes, o que é necessário para gerar, da maneira desejada, polipeptídeos com propriedades modificadas desejadas. Em particular, é possível definir os chamados “pontos quentes”, isto é, segmentos da sequência que são potencialmente adequados para modificar uma propriedade introduzindo-se mutações tidas como alvo.
[00243] As informações também podem ser deduzidas em relação às porções de sequência de aminoácidos em cuja região podem ser efetuadas mutações que provavelmente devem ter pouco efeito na atividade e podem ser denominadas de "mutações silenciosas” potenciais E. CONSTRUTOS PARA EXPRESSAR POLIPEPTÍDEOS DA INVENÇÃO
[00244] Nesse contexto, se aplicam as seguintes definições:
[00245] “Expressão de um gene” abrange “expressão heteróloga” e “superexpressão” e envolve a transcrição do gene e tradução do mRNA em uma proteína. A superexpressão se refere à produção do produto de gene como medido por níveis de mRNA, polipeptídeo e/ou atividade enzimática em células transgênicas ou organismos que excedem os níveis de produção em células ou organismos não transformados de um fundamento genético similar.
[00246] “Vetor de expressão”, como usado no presente documento, significa uma molécula de ácido nucleico manipulada com o uso de métodos de biologia molecular e tecnologia de DNA recombinante para entrega de DNA estranho ou exógeno em uma célula hospedeira. O vetor de expressão inclui tipicamente as sequências exigidas para transcrição adequada da sequência de nucleotídeos. A região de codificação codifica usualmente uma proteína de interesse, mas também pode codificar um RNA, por exemplo, um RNA antissenso, siRNA e similares.
[00247] Um "vetor de expressão", como usado no presente documento, inclui qualquer vetor recombinante linear ou circular incluindo, porém, sem limitação, vetores virais, bacteriófagos e plasmídeos. O especialista tem a capacidade de selecionar um vetor adequado de acordo com o sistema de expressão. Em uma modalidade, o vetor de expressão inclui o ácido nucleico de uma modalidade no presente documento operacionalmente ligado a pelo menos uma sequência reguladora, que controla a transcrição, tradução, iniciação e término, tal como um promotor de transcrição, operador ou intensificador ou um sítio de ligação ribossômico de mRNA e que inclui, opcionalmente, pelo menos um marcador de seleção. As sequências de nucleotídeos são "operacionalmente ligadas" quando a sequência reguladora se refere funcionalmente ao ácido nucleico de uma modalidade no presente documento.
[00248] Um “sistema de expressão”, como usado no presente documento abrange qualquer combinação de moléculas de ácido nucleico necessárias para a expressão de um ou a coexpressão de dois ou mais polipeptídeos ou in vivo de um determinado hospedeiro de expressão ou in vitro. As sequências de codificação respectivas podem estar localizadas em uma única molécula de ácido nucleico ou vetor como, por exemplo, um vetor que contém múltiplos locais de clonagem ou em um ácido nucleico policistrônico ou podem estar distribuídas em dois ou mais vetores fisicamente distintos. Como um exemplo particular, pode ser mencionado um operon que compreende uma sequência de promotor, uma ou mais sequências de operador e um ou mais genes estruturais, em que cada um codifica uma enzima como descrito no presente documento.
[00249] Como usados no presente documento, os termos "amplificar" e "amplificação" se referem ao uso de qualquer metodologia de amplificação adequada para gerar ou detectar recombinante de ácido nucleico naturalmente expresso, como descrito em detalhes, a seguir. Por exemplo, a invenção fornece métodos e reagentes (por exemplo, pares de iniciador de oligonucleotídeo degenerado específicos, iniciador oligo dT) para amplificar (por exemplo, por reação em cadeia de polimerase, PCR) ácidos nucleicos naturalmente expressos (por exemplo, DNA ou mRNA genômico) ou recombinantes (por exemplo, cDNA) da invenção in vivo, ex vivo ou in vitro.
[00250] “Sequência reguladora” se refere a uma sequência de ácidos nucleicos que determina o nível de expressão das sequências de ácidos nucleicos de uma modalidade no presente documento e tem capacidade de regular a taxa de transcrição da sequência de ácidos nucleicos ligada operacionalmente à sequência reguladora. As sequências reguladoras compreendem promotores, intensificadores, fatores de transcrição, elementos promotores e similares.
[00251] Entende-se um “promotor”, um “ácido nucleico com atividade de promotor” ou uma “sequência de promotor”, em conformidade com a invenção, como um ácido nucleico que, quando ligado funcionalmente a um ácido nucleico a ser transcrito, regula a transcrição do dito ácido nucleico. “Promotor” se refere, em particular, a uma sequência de ácidos nucleicos que controla a expressão de uma sequência de codificação fornecendo-se um sítio de ligação para RNA polimerase e outros fatores exigidos para transcrição apropriada, incluindo, sem limitação, sítios de ligação de fator de transcrição, sítios de ligação de proteína repressora e ativadora. O significado do termo promotor também inclui o termo “sequência reguladora de promotor”. As sequências reguladoras de promotor podem incluir elementos a montante e a jusante que podem influenciar a transcrição, o processamento de RNA ou a estabilidade da sequência de ácidos nucleicos de codificação associada. Os promotores incluem sequências sintéticas e naturalmente derivadas. As sequências de ácidos nucleicos de codificação estão usualmente localizadas a jusante do promotor em relação à direção da transcrição que se inicia no sítio de iniciação de transcrição.
[00252] Nesse contexto, entende-se uma ligação “funcional” ou “operacional” como, por exemplo, a disposição sequencial de um dentre os ácidos nucleicos com uma sequência reguladora. Por exemplo, a sequência com atividade de promotor e de uma sequência de ácidos nucleicos a ser transcrita e opcionalmente elementos reguladores adicionais, por exemplo, sequências de ácido nucleicos que garantem a transcrição de ácidos nucleicos e, por exemplo, um terminador, são ligados de maneira que cada um dos elementos reguladores possa realizar sua função mediante transcrição das sequências de ácidos nucleicos. Isso não necessariamente exige uma ligação direta no sentido químico. As sequências de controle genético, por exemplo, sequências intensificadoras, podem exercer até mesmo sua função na sequência-alvo de posições mais remotas ou até mesmo de outras moléculas de DNA. As disposições preferenciais são aquelas nas quais a sequência de ácido nucleico a ser transcrita está posicionada atrás (isto é, na extremidade 3’) da sequência de promotor de modo que as duas sequências sejam unidas de maneira covalente. A distância entre a sequência de promotor e a sequência de ácidos nucleicos a ser expressa de maneira recombinante pode ser menor que 200 pares de base ou ainda menor que 100 pares de base ou menor que 50 partes de base.
[00253] Além dos promotores e terminadores, o conteúdo a seguir pode ser mencionado como exemplo de outros elementos reguladores: sequências-alvo, intensificadores, sinais de poliadenilação, marcadores selecionáveis, sinais de amplificação, origens de replicação e similares. As sequências reguladoras são descritas, por exemplo, em Goeddel, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA (1990).
[00254] O termo “promotor constitutivo” se refere a um promotor não regulado que permite a transcrição contínua da sequência de ácidos nucleicos à qual o mesmo está ligado operacionalmente.
[00255] Como usado no presente documento, o termo “ligado operacionalmente” se refere a uma ligação de elementos de polinucleotídeo em uma relação funcional. Um ácido nucleico está “ligado operacionalmente” quando está posicionado em uma relação funcional com outra sequência de ácidos nucleicos. Por exemplo, um promotor, ou, de preferência, uma sequência reguladora de transcrição, está ligado operacionalmente a uma sequência de codificação se o mesmo afetar a transcrição da sequência de codificação. Ligado operacionalmente significa que as sequências de DNA que estão ligadas são tipicamente contíguas. A sequência de nucleotídeos associada à sequência promotora pode ser de origem homóloga ou heteróloga em relação à planta ser transformada. A sequência também pode ser inteira ou parcialmente sintética. Independentemente da origem, a sequência de ácidos nucleicos associada à sequência promotora será expressa ou silenciada de acordo com propriedades de promotor à qual a mesma está ligada após se ligar ao polipeptídeo de uma modalidade no presente documento. O ácido nucleico associado pode codificar uma proteína que se deseja expressar ou suprimir em todo o organismo sempre ou, alternativamente, em um momento específico ou em tecidos, células ou compartimentos celulares específicos. Tais sequências de nucleotídeos codificam particularmente proteínas que conferem traços fenotípicos desejáveis às células hospedeiras ou organismos alterados ou transformados com as mesmas. Mais particularmente, a sequência de nucleotídeos associada leva à produção do produto ou produtos de interesse, como definido no presente documento, na célula ou organismo. Particularmente, a sequência de nucleotídeos codifica um polipeptídeo que tem uma atividade enzimática como definido no presente documento.
[00256] A sequência de nucleotídeos, como descrito no presente documento acima,
pode ser parte de um “cassete de expressão”. Os termos “cassete de expressão” e “construto de expressão” são usados como sinônimos. O construto de expressão (preferencialmente, recombinante) contém uma sequência de nucleotídeos que codifica um polipeptídeo de acordo com a invenção e que está sob controle genético de sequências reguladoras de ácido nucleicos.
[00257] Em um processo aplicado, de acordo com a invenção, o cassete de expressão pode ser parte de um “vetor de expressão”, em particular, de um vetor de expressão recombinante.
[00258] Entende-se uma “unidade de expressão”, em conformidade com a invenção, como um ácido nucleico com atividade de expressão que compreende um promotor, como definido no presente documento, e, após ligação funcional com um ácido nucleico a ser expresso ou um gene, regula a expressão, isto é, a transcrição e a tradução do dito ácido nucleico ou do dito gene. Portanto, nessa conexão a mesma também é denominada como uma “sequência reguladora de ácido nucleico”. Além do promotor, outros elementos reguladores, por exemplo, intensificadores, também podem estar presentes.
[00259] Entende-se por um “cassete de expressão” ou “construto de expressão”, em conformidade com a invenção, uma unidade de expressão que está ligada funcionalmente ao ácido nucleico a ser expresso ou o gene a ser expresso. Em contrapartida a uma unidade de expressão, portanto, um cassete de expressão compreende não apenas sequências de ácido nucleicos que regulam transcrição e tradução, como também as sequências de ácido nucleicos que devem ser expressas como proteína como resultado de transcrição e tradução.
[00260] Os termos “expressão” ou “superexpressão” descrevem, no contexto da invenção, a produção ou aumento em atividade intracelular de um ou mais polipeptídeos em um micro-organismo, que são codificados pelo DNA correspondente. Com essa finalidade, é possível, por exemplo, introduzir um gene em um organismo, substituir um gene existente por outro gene, aumentar o número de cópia do gene (ou genes), usar um promotor forte ou usar um gene que codifica para um polipeptídeo correspondente com uma alta atividade; opcionalmente, essas medidas podem ser combinadas.
[00261] De preferência, tais construtos de acordo com a invenção compreendem um promotor 5’ a montante da sequência de codificação respectiva e uma sequência de terminador 3’ a jusante e, opcionalmente, outros elementos reguladores comuns, em cada caso em ligação operacional com a sequência de codificação.
[00262] Os construtos de ácido nucleico de acordo com a invenção compreendem, em particular, uma sequência que codifica para um polipeptídeo, por exemplo, derivado dos SEQ ID NOs relacionados de aminoácidos, como descrito no presente documento, ou o complemento reverso dos mesmos, ou derivados e homólogos dos mesmos e que foram ligados de maneira operacional ou funcional com um ou mais sinais reguladores, vantajosamente para controlar, por exemplo, aumentando a expressão gênica.
[00263] Além dessas sequências reguladoras, a regulação natural dessas sequências ainda pode estar presente antes de os reais genes estruturais e, opcionalmente, possam ter sido geneticamente modificados de modo que a regulação natural tenha sido desligada, e a expressão tenha sido intensificada. No entanto, o construto de ácido nucleico também pode ter construção mais simples, isto é, nenhum sinal regulador adicional ter sido inserido antes de a sequência de codificação e do promotor natural, com sua regulação, não ter sido removida. Em vez disso, a sequência reguladora natural é submetida à mutação de modo que a regulação não mais ocorra, e a expressão gênica seja aumentada.
[00264] Um construto de ácido nucleico preferencial também compreende vantajosamente uma ou mais das sequências "intensificadoras" já mencionadas na ligação funcional com o promotor, sendo que as sequências possibilitam uma expressão intensificada da sequência de ácidos nucleicos. Vantagens adicionais também podem ser inseridas na extremidade 3’ das sequências de DNA, tais como elementos reguladores ou terminadores adicionais. Uma ou mais cópias dos ácidos nucleicos de acordo com a invenção podem estar presentes em um construto. No construto, outros marcadores, tais como genes que complementam auxotrofismos ou resistência antibióticas, também podem estar presentes opcionalmente de modo a selecionar o construto.
[00265] Exemplos de sequências reguladoras adequadas estão presentes em promotores tais como cos, tac, trp, tet, trp-tet, lpp, lac, lpp-lac, lacIq, T7, T5, T3, gal, trc, ara, rhaP (rhaPBAD )SP6, lambda-PR ou no promotor lambda-PL, e estes são vantajosamente empregados em bactérias Gram-negativas. Sequências reguladoras vantajosas adicionais estão presentes, por exemplo, nos promotores Gram-positivos amy e SPO2, nos promotores de levedura ou fúngicos ADC1, MFalfa, AC, P-60, CYC1, GAPDH, TEF, rp28, ADH. Promotores artificiais também podem ser usados para a regulação.
[00266] Para expressão em um organismo hospedeiro, o construto de ácido nucleico é inserido vantajosamente em um vetor, tal como, por exemplo, um plasmídeo ou um fago, o que possibilita expressão ideal dos genes no hospedeiro. Por vetores entende-se também, além dos plasmídeos e fagos, todos os outros vetores que são conhecidos pelo especialista, ou seja, por exemplo, vírus, tais como SV40, CMV, baculovírus e adenovírus, transposons, elementos IS, fasmídeos, cosmídeos e DNA linear ou circular ou cromossomos artificiais. Esses vetores têm capacidade para se replicar de maneira autônoma no organismo hospedeiro ou, de outro modo, no cromossomo. Esses vetores são um desenvolvimento adicional da invenção. Vetores binários ou de integração de cpo também são aplicáveis.
[00267] Os plasmídeos estão, por exemplo, em E. coli pLG338, pACYC184, pBR322, pUC18, pUC19, pKC30, pRep4, pHS1, pKK223-3, pDHE19.2, pHS2, pPLc236, pMBL24, pLG200, pUR290, pIN-III113-B1, λgt11 ou pBdCI, em Streptomyces pIJ101, pIJ364, pIJ702 ou pIJ361, em Bacillus pUB110, pC194 ou pBD214, em Corynebacterium pSA77 ou pAJ667, em fungos pALS1, pIL2 ou pBB116, em leveduras 2alphaM, pAG-1, YEp6, YEp13 ou pEMBLYe23 ou em plantas pLGV23, pGHlac+, pBIN19, pAK2004 ou pDH51. Os plasmídeos mencionados acima são uma pequena seleção dos plasmídeos que são possíveis. Plasmídeos adicionais são bem conhecidos pelo especialista e podem ser constatados, por exemplo, no livro Cloning Vectors (Eds. Pouwels P. H. et al. Elsevier, Amsterdam-Nova York-Oxford, 1985, ISBN 0 444 904018).
[00268] Em um desenvolvimento adicional do vetor, o vetor que compreende o construto de ácido nucleico de acordo com a invenção ou o ácido nucleico de acordo com a invenção também pode ser introduzido vantajosamente nos micro-organismos na forma de um DNA linear e integrado no genoma do organismo hospedeiro por meio de recombinação heteróloga ou homóloga. Esse DNA linear pode consistir em um vetor linearizado, tal como um plasmídeo, ou apenas no construto de ácido nucleico ou no ácido nucleico de acordo com a invenção.
[00269] Para expressão ideal de genes heterólogo em organismos, é vantajoso modificar as sequências de ácido nucleicos de modo que sejam compatíveis com o “uso de códon” específico usado no organismo. O “uso de códon” pode ser determinado prontamente por avaliações no computador de outros genes conhecidos do organismo em questão.
[00270] Um cassete de expressão de acordo com a invenção é gerado fundindo-se um promotor adequado à sequência de nucleotídeos de codificação e um sinal de terminador ou poliadenilação. Técnicas rotineiras de recombinação e clonagem são usadas para esse propósito, como são descritas, por exemplo, em T. Maniatis, E.F. Fritsch and J. Sambrook, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1989) e em T.J. Silhavy, M.L. Berman and L.W. Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1984) e em Ausubel, F.M. et al., Current Protocols in Molecular Biology, Greene Publishing Assoc. and Wiley Interscience (1987).
[00271] Para expressão em um organismo hospedeiro adequado, o construto de ácido nucleico recombinante ou construto gênico é inserido vantajosamente em um vetor específico ao hospedeiro que possibilita expressão ideal dos genes no hospedeiro. Os vetores são bem conhecidos pelo profissional versado na técnica e podem ser constatados, por exemplo, em “cloning vectors” (Pouwels P. H. et al., Ed., Elsevier, Amsterdam-New York-Oxford, 1985).
[00272] Uma modalidade alternativa de uma modalidade do presente documento fornece um método para alterar a expressão gênica em uma célula hospedeira. Por exemplo, o polinucleotídeo de uma modalidade no presente documento pode ser intensificado ou superexpresso ou induzido em determinados contextos (por exemplo, mediante exposição a determinadas temperaturas ou condições de cultura) em uma célula hospedeira ou organismo hospedeiro.
[00273] A alteração de expressão de um polinucleotídeo fornecido no presente documento também pode resultar em “expressão ectópica”, que é um padrão de expressão diferente em um organismo alterado e de controle ou do tipo selvagem. A alteração de expressão ocorre a partir de interações de polipeptídeo de uma modalidade do presente documento com moduladores exógenos ou endógenos ou como um resultado de modificação química do polipeptídeo. O termo também se refere a um padrão de expressão alterado do polinucleotídeo de uma modalidade do presente documento, que é alterado abaixo do nível de detecção ou atividade completamente suprimida.
[00274] Em uma modalidade, é fornecido no presente documento um polinucleotídeo isolado, recombinante ou sintético que codifica um polipeptídeo ou polipeptídeo variante fornecido no presente documento.
[00275] Em uma modalidade, diversas sequências de ácido nucleicos codificadoras de polipeptídeo são coexpressas em um único hospedeiro, particularmente, sob o controle de diferentes promotores. Em outra modalidade, diversas sequências de ácidos nucleicos codificadoras de polipeptídeo podem estar presentes em um único vetor de transformação ou podem ser cotransformadas ao mesmo tempo com o uso de vetores e transformantes de seleção que compreendem genes quiméricos. Da mesma forma, um ou mais genes de codificação de polipeptídeo podem ser expressos em uma única planta, célula, micro-organismo ou organismo junto com outros genes quiméricos. F. HOSPEDEIROS A SEREM APLICADOS PARA A PRESENTE INVENÇÃO
[00276] Dependendo do contexto, o termo "hospedeiro" pode significar o hospedeiro de tipo selvagem ou um hospedeiro recombinante geneticamente alterado ou ambos.
[00277] Em princípio, todos os organismos procarióticos ou eucarióticos podem ser considerados como hospedeiros ou organismos hospedeiros recombinantes para os ácidos nucleicos ou os construtos de ácido nucleico de acordo com a invenção.
[00278] Com o uso dos vetores de acordo com a invenção, podem ser produzidos hospedeiros recombinantes, os quais são, por exemplo, transformados com pelo menos um vetor de acordo com a invenção e podem ser usados para produzir os polipeptídeos de acordo com a invenção. Vantajosamente, os construtos recombinantes, de acordo com a invenção, descritos acima, são introduzidos em um sistema de hospedeiro adequado e expressos. De preferência, métodos de clonagem e de transfecção comuns, conhecidos por uma pessoa versada na técnica, são usados, por exemplo, coprecipitação, fusão de protoplastos, eletroporação, transfecção retroviral e similares, para expressar os ácidos nucleicos indicados no sistema de expressão respectivo. Os sistemas adequados são descritos, por exemplo, em Current Protocols em biologia molecular, F. Ausubel et al., Ed., Wiley Interscience, New York 1997 ou Sambrook et al. Molecular Cloning: A Laboratory Manual. 2a edição, Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989.
[00279] Vantajosamente, micro-organismos, tais como bactérias, fungos ou leveduras são usados como organismos hospedeiros. Vantajosamente, bactérias gram-positivas ou gram-negativas são usadas, preferencialmente, bactérias das famílias Enterobacteriaceae, Pseudomonadaceae, Rhizobiaceae, Streptomycetaceae, Streptococcaceae ou Nocardiaceae, com preferência especial, bactérias dos gêneros Escherichia, Pseudomonas, Streptomyces, Lactococcus, Nocardia, Burkholderia, Salmonella, Agrobacterium, Clostridium ou Rhodococcus. O gênero e espécie Escherichia coli é especialmente preferencial. Além disso, outras bactérias vantajosas devem ser constatadas no grupo de alfa-Proteobacteria, beta- Proteobacteria ou gamma-Proteobacteria. Vantajosamente, também leveduras de famílias como Saccharomyces ou Pichia são hospedeiros adequados.
[00280] Alternativamente, plantas inteiras ou células vegetais podem servir como hospedeiros naturais ou recombinantes. Como exemplos não limitantes, as seguintes plantas ou células derivadas das mesmas podem ser mencionadas os gêneros Nicotiana, em particular, Nicotiana benthamiana e Nicotiana tabacum (tabaco); bem como Arabidopsis, em particular, Arabidopsis thaliana.
[00281] Dependendo do organismo hospedeiro, os organismos usados no método de acordo com a invenção crescem ou são cultivados da maneira conhecida por uma pessoa versada na técnica. A cultura pode ocorrer em lotes, em semilotes ou continuamente. Os nutrientes podem estar presentes no começo da fermentação ou podem ser fornecidos posteriormente, de maneira semicontínua ou contínua. Isso também é descrito mais detalhadamente abaixo. G. PRODUÇÃO RECOMBINANTE DE POLIPEPTÍDEOS DE ACORDO COM A
INVENÇÃO
[00282] A invenção se refere adicionalmente a métodos para produção recombinante de polipeptídeos, de acordo com a invenção ou funcional, fragmentos biologicamente ativos dos mesmos, em que um micro-organismo que produz polipeptídeo é cultivado, opcionalmente, a expressão dos polipeptídeos é induzida aplicando-se pelo menos um indutor que induz expressão gênica e os polipeptídeos expressos são isolados da cultura. Os polipeptídeos também podem ser produzidos dessa maneira em escala industrial, caso desejado.
[00283] Os micro-organismos produzidos de acordo com a invenção podem ser cultivados de maneira contínua ou não contínua em lote ou no método em lote descontínuo alimentado ou no método em lote descontínuo alimentado repetido. Um sumário de métodos de cultivo conhecidos pode ser encontrado no livro didático por Chmiel (Bioprozesstechnik 1. Einführung in die Bioverfahrenstechnik [Bioprocess technology 1. Introduction to bioprocess technology] (Gustav Fischer Verlag, Stuttgart, 1991)) ou no livro didático de Storhas (Bioreaktoren und periphere Einrichtungen [Bioreactors and peripheral equipment] (Vieweg Verlag, Braunschweig/Wiesbaden, 1994)).
[00284] O meio de cultura a ser usado precisa atender adequadamente a exigências das cepas repetitivas. As descrições dos meios de cultura para vários micro-organismos são fornecidas no manual “Manual of Methods for General Bacteriology” da Sociedade Americana de Microbiologia (Washington D. C., EUA, 1981).
[00285] Os meios utilizáveis de acordo com a invenção compreendem normalmente uma ou mais fontes de carbono, fontes de nitrogênio, sais inorgânicos, vitaminas e/ou elementos característicos.
[00286] Fontes de carbono preferenciais são açúcares, tais como mono, di ou polissacarídeos. Fontes de carbono muito boas são, por exemplo, glicose, frutose, manose, galactose, ribose, sorbose, ribulose, lactose, maltose, sacarose, rafinose, amido ou celulose. Os açúcares podem ser adicionados aos meios por meio de compostos complexos, tais como melaços ou outros subprodutos de refinamento de açúcar. Pode ser vantajoso, também, adicionar misturas de diferentes fontes de carbono. Outras fontes de carbono possíveis são óleos e gorduras, por exemplo, óleo de soja, óleo girassol, óleo de amendoim e óleo de coco, ácidos graxos, por exemplo ácido palmítico, ácido esteárico ou ácido linoleico, álcoois, por exemplo, glicerol, metanol ou etanol e ácidos orgânicos, por exemplo, ácido acético ou ácido lático.
[00287] Fontes de nitrogênio são normalmente compostos ou materiais de nitrogênio orgânico ou inorgânico que contêm esses compostos. Os exemplos de fontes de nitrogênio compreendem gás de amônia ou sais de amônio, tais como sulfato de amônio, cloreto de amônio, fosfato de amônio, carbonato de amônio ou nitrato de amônio, nitratos, ureia, aminoácidos ou fontes complexas de nitrogênio, tais como licor de maceração de milho, farinha de soja, proteína de soja, extrato de levedura, extrato de carne e outros. As fontes de nitrogênio podem ser usadas isoladamente ou como uma mistura.
[00288] Os compostos de sal inorgânico que podem estar presentes nos meios compreendem o cloreto, fósforo ou sulfato sais de cálcio, magnésio, sódio, cobalto, molibdênio, potássio, manganês, zinco, cobre e ferro.
[00289] Compostos inorgânicos que contêm enxofre, por exemplo sulfatos, sulfitos, ditionitas, tetrationatos, tiosulfatos, sulfetos, assim como compostos orgânicos de enxofre, tais como mercaptanos e tióis, podem ser usados como a fonte de enxofre.
[00290] Ácido fosfórico, di-hidrogênio fosfato de potássio ou hidrogênio fosfato dipotássico ou os sais que contêm sódio correspondentes podem ser usados como a fonte de fósforo.
[00291] Agentes quelantes podem ser adicionados ao meio, a fim de manter os íons de metal na solução. Agentes quelantes especialmente adequados compreendem di- hidroxifenóis, tais como as catecol ou protocatecuato ou ácidos orgânicos, tais como ácido cítrico.
[00292] Os meios de fermentação usados de acordo com uma invenção normalmente também contêm outros fatores de crescimento, tais como vitaminas ou promotores de crescimento, que incluem, por exemplo, biotina, riboflavina, tiamina, ácido fólico, ácido nicotínico, pantotenato e piridoxina. Fatores de crescimento e sais, muitas vezes, se originam dos componentes de meios complexos, tais como extrato de levedura, melaços, licor de maceração de milho e similares. Além disso, precursores adequados podem ser adicionados ao meio de cultura. A composição exata dos compostos no meio depende fortemente do experimento respectivo e é decidida para cada caso específico individualmente. Informações sobre otimização de meios podem ser constatadas no livro didático “Applied Microbiol. Physiology, A Practical Approach” (Edição P.M. Rhodes, P.F. Stanbury, IRL Press (1997) páginas 53 a 73, ISBN 0 19 963577 3). Os meios de crescimento também podem ser obtidos de fornecedores comerciais, tais como Padrão 1 (Merck) ou BHI (infusão cérebro coração, DIFCO) e similares.
[00293] Todos os componentes do meio são esterilizados, ou por calor (20 min a 1,5 bar e 121 °C) ou por filtração estéril. Os componentes podem ser esterilizados juntos ou separadamente, caso necessário. Todos os componentes do meio podem estar presentes no início da cultura ou podem ser adicionados ou continuamente ou em lotes.
[00294] A temperatura de cultura é normalmente entre 15 °C e 45 °C, preferencialmente, 25 °C a 40 °C e pode ser variada ou mantida constante durante o experimento. O pH do meio deve estar na faixa de 5 a 8,5, de preferência, cerca de 7,0. O pH para crescimento pode ser controlado durante o crescimento adicionando- se compostos básicos, tais como hidróxido de sódio, hidróxido de potássio, amônia ou água de amônia ou compostos ácidos, tais como ácido fosfórico ou ácido sulfúrico. Agentes antiespumantes poliglicol ésteres de graxo, podem ser usados para controlar a formação de espuma. A fim de manter a estabilidade de plasmídeos, substâncias seletivas adequadas, por exemplo, antibióticos, podem ser adicionadas ao meio. A fim de manter condições aeróbicas, o oxigênio ou misturas de gás que contêm oxigênio, por exemplo, ar ambiente, são misturados na cultura. A temperatura da cultura está normalmente na faixa de 20 ºC a 45 ºC. A cultura é continuada até que um máximo do produto desejado seja formado. Essa meta é normalmente atingida dentro de 10 horas a 160 horas.
[00295] Em seguida, o caldo de fermentação é processado adicionalmente. Dependendo das exigências, a biomassa pode ser removida do caldo de fermentação completa ou parcialmente por técnicas de separação, por exemplo, centrifugação, filtração ou decantação ou uma combinação desses métodos ou pode ser deixada no mesmo completamente.
[00296] Caso os polipeptídeos não sejam secretados no meio de cultura, as células também pode ser lisadas, e o produto pode ser obtido do lisado por métodos conhecidos para isolamento de proteínas. As células podem ser, opcionalmente, rompidas com ultrassom de alta frequência, alta pressão, por exemplo, em uma prensa francesa, por osmólise, pela ação de detergentes, enzimas líticas ou solventes orgânicos, por meio de homogeneizadores ou por uma combinação de diversos dos métodos mencionados acima.
[00297] Os polipeptídeos podem ser purificados por técnicas de cromatografia conhecidas, tais como cromatografia de peneira molecular (filtração em gel), tais como cromatografia por Q-sefarose, cromatografia de troca de íons e cromatografia hidrofóbica e com outras técnicas comuns, tais como usual ultra filtração, cristalização, relargagem, diálise e electroforese em gel nativa. Os métodos adequados são descritos, por exemplo, em Cooper, T. G., Biochemische Arbeitsmethoden [Biochemical processes], Verlag Walter de Gruyter, Berlin, New York ou em Scopes, R., Protein Purification, Springer Verlag, New York, Heidelberg, Berlin.
[00298] Para isolar a proteína recombinante, pode ser vantajoso usar sistemas de vetor ou oligonucleotídeos que alongam o cDNA pode sequências de nucleotídeos definidas e, portanto, código para polipeptídeos alterados ou proteínas de fusão que,
por exemplo, servem para purificação. As modificações adequadas desse tipo são, por exemplo, as chamadas “tags” que funcionam como âncoras, por exemplo, a modificação conhecida como âncora de hexa-histidina ou epítopos que podem ser reconhecidos como antígenos de anticorpos (descrito, por exemplo, in Harlow, E. e Lane, D., 1988, Antibodies: A Laboratory Manual. Cold Spring Harbor (N.Y.) Press). Essas âncoras podem servir para fixar as proteínas a um carreador sólido, por exemplo, uma matriz polimérica, o que pode, por exemplo, ser usado como invólucro em uma coluna de cromatografia ou pode ser usado em uma placa de microtitulação ou em algum outro carreador.
[00299] Ao mesmo tempo, essas âncoras também podem ser usadas para reconhecimento das proteínas. Para reconhecimento das proteínas, também é possível usar marcadores comuns, tais como corantes fluorescentes, marcadores de enzima, que formam um produto de reação detectável após a reação com um substrato ou marcadores radioativos, isoladamente ou em combinação com as âncoras para derivatização das proteínas. H. IMOBILIZAÇÃO DE POLIPEPTÍDEO
[00300] As enzimas ou polipeptídeos, de acordo com a invenção, podem ser usados livres ou imobilizados no método descrito no presente documento. Uma enzima imobilizada é uma enzima que é fixada a um carreador inerte. Materiais carreadores adequados e as enzimas imobilizadas nos mesmos são conhecidos dos documentos EP-A-1149849, EP-A-1 069 183 e DE-OS 100193773 e das referências citadas nos mesmos. Referência é feita em relação à revelação desses documentos em sua totalidade. Os materiais carreadores adequados incluem, por exemplo, argilas, argila minerais, tais como caulinita, terra diatomácea, perlita, sílica, óxido de alumínio, carbonato de sódio, carbonato de cálcio, pó de celulose, materiais de troca de ânions, polímeros sintéticos, tal como poliestireno, resinas acrílicas, resinas de fenol formaldeído, poliuretanos e poliolefinas, tais como polietileno e polipropileno. Para produzir as enzimas sustentadas, os materiais carreadores são empregados normalmente em uma forma particulada dividida com granulação fina, em que formas porosas são preferenciais. O tamanho de partícula do carreador material é normalmente, no máximo, 5 mm, em particular, no máximo 2 mm (curva de distribuição de tamanho de partícula). Da mesma forma, durante o uso da desidrogenase como catalisador de célula inteira, uma forma livre imobilizada pode ser selecionada. Os materiais carreadores são, por exemplo, Ca-alginato e carragenina. Enzimas assim como células podem ser reticuladas diretamente com glutaraldeído (reticulação com CLEAs). As técnicas correspondentes e outras técnicas de imobilização são descritas, por exemplo, em J. Lalonde and A. Margolin “Immobilization of Enzymes” em K. Drauz and H. Waldmann, Enzyme Catalysis in Organic Synthesis 2002, Volume III, 991 a
1.032, Wiley-VCH, Weinheim. Mais informações sobre biotransformações e biorreatores para realizar métodos de acordo com a invenção também são fornecidos, por exemplo, em Rehm et al. (Edição) Biotechnology, 2a edição, Volume 3, Capítulo 17, VCH, Weinheim.
CONDIÇÕES DE REAÇÃO PARA MÉTODOS DE PRODUÇÃO BIOCATALÍTICA DA INVENÇÃO
[00301] A reação da presente invenção pode ser realizada em condições in vivo ou in vitro.
[00302] O pelo menos um polipeptídeo/enzima que está presente durante um método da invenção ou uma etapa individual de um método de múltiplas etapas, como definido acima no presente documento, pode estar presente em células vivas que produzem de forma natural ou recombinante a enzima ou enzimas, em células colhidas, ou seja, em condições in vivo, ou, em células mortas, em células permeabilizadas, em extratos celulares brutos, em extratos purificados, ou na forma essencialmente pura ou completamente pura, ou seja, em condições in vitro. A pelo menos uma enzima pode estar presente na solução ou como uma enzima imobilizada em um carreador. Uma ou diversas enzimas podem estar presentes simultaneamente em forma solúvel e/ou imobilizadas.
[00303] Os métodos, de acordo com a invenção, podem ser realizados em reatores comuns, que são conhecidos pelas pessoas versadas na técnica, e em diferentes faixas de escala, por exemplo, de uma escala laboratorial (alguns milímetros a dúzias de litros do volume de reação) a uma escala industrial (diversos litros a milhares metros cúbicos de volume de reação). Caso o polipeptídeo seja usado em uma forma encapsulada por células não vivas, opcionalmente permeabilizadas, na forma de um extrato celular mais ou menos purificado ou em forma purificada, um reator químico pode ser usado. O reator químico geralmente permite controlar a quantidade da pelo menos uma enzima, a quantidade do pelo menos um substrato, o pH, a temperatura e a circulação do meio de reação. Quando o pelo menos um polipeptídeo/enzima está presente nas células vivas, o processo será uma fermentação. Nesse caso, a produção biocatalítica ocorrerá em um biorreator (fermentador), em que os parâmetros necessários para condições vivas adequadas para as células vivas (por exemplo, meio de cultura com nutrientes, temperatura, aeração, presença ou ausência de oxigênio ou outros gases, antibióticos e similares) podem ser controlados. Os versados na técnica estão familiarizados com reatores ou biorreatores químicos, por exemplo, com procedimentos para métodos químicos ou biotecnologias de escalonamento ascendente de escala laboratorial para escala industrial ou para otimizar parâmetros de processo, que também são descritos extensivamente na literatura (para métodos biotecnológicos, consultar, por exemplo, Crueger und Crueger, Biotechnologie – Lehrbuch der angewandten Mikrobiologie, 2. Ed., R. Oldenbourg Verlag, München, Wien, 1984).
[00304] Células que contêm a pelo menos uma enzima podem ser permeabilizadas por meios físicos ou mecânicos, tais como pulsos de ultrassom ou radiofrequência, prensas francesas ou meios químicos, tais como meios hipotônicos, enzimas líticas e detergentes presentes no meio ou combinação de tais métodos. Exemplos para detergentes são digitonina, n-dodecilmaltosida, octilglicosídeo, Triton® X-100, Tween ® 20, deoxicolato, CHAPS (3-[(3-Colamidopropil)dimetilamônio]-1-propansulfonato), Nonidet ® P40 (etilfenolpoli(etilenoglicol éter) e similares.
[00305] Em vez de células vivas, biomassa de células não vivas contendo o biocatalisador (ou biocatalisadores) necessário também pode ser aplicada às reações de biotransformação da invenção.
[00306] Caso a pelo menos uma enzima seja imobilizada, a mesma é fixada a um carreador inerte, como descrito acima.
[00307] A reação de conversão pode ser realizada em lotes, semilotes ou continuamente. Os reagentes (e opcionalmente, nutrientes) podem ser fornecidos na reação ou podem ser fornecidos subsequentemente, seja semicontínua ou continuamente.
[00308] A reação da invenção, dependendo do tipo de reação particular, pode ser realizada em um meio de reação aquoso, aquoso-orgânico ou não aquoso.
[00309] Um meio aquoso ou aquoso orgânico pode conter um tampão adequado a fim de ajustar o pH para um valor na faixa de 5 a 11, como 6 a 10.
[00310] Em um meio aquoso-orgânico, um solvente orgânico miscível, parcialmente miscível ou imiscível com água pode ser aplicado. Exemplos não limitantes de solventes orgânicos adequados são listrados a seguir. Exemplos adicionais são álcoois mono ou poli-hídricos, aromáticos ou alifáticos, em particular, álcoois alifáticos poli-hídricos como glicerol.
[00311] O meio não aquoso pode conter água, ou ser substancialmente livre da mesma, isto é, conterá menos de cerca de 1% em peso ou 0,5% em peso de água.
[00312] Métodos biocatalíticos também podem ser realizados em um meio não aquoso orgânico. Como solventes orgânicos adequados podem ser mencionados hidrocarbonetos alifáticos que têm, por exemplo, 5 a 8 átomos de carbono, como pentano, ciclopentano, hexano, ciclo-hexano, heptano, octano ou ciclo-octano; carbo- hidratos aromáticos, como benzeno, tolueno, xilenos, clorobenzeno ou diclorobenzeno, acílico alifático e éteres, como dietiléter, metil-terc-butiléter, etil-terc- butiléter, dipropiléter, di-isopropiléter, dibutiléter; ou misturas dos mesmos.
[00313] A concentração dos reagentes/substratos pode ser adaptada às condições de reação ideal, o que pode depender da enzima específica aplicada. Por exemplo, a concentração de substrato inicial pode estar na 0,1 a 0,5 M, como, por exemplo, 10 a 100 mM.
[00314] A temperatura de reação pode ser adaptada às condições ideais de reação, o que pode depender da enzima específica aplicada. Por exemplo, a reação pode ser realizada a uma temperatura em uma faixa de 0 a 70 °C, como, por exemplo 20 a 50 ou 25 a 40 °C. Exemplos de temperaturas de reação são cerca de 30 ºC, cerca de 35
ºC, cerca de 37 ºC, cerca de 40 ºC, cerca de 45 ºC, cerca de 50 ºC, cerca de 55 ºC e cerca de 60 ºC.
[00315] O processo pode prosseguir até que o equilíbrio entre o substrato e, em seguida, produto (ou produtos) seja obtido, porém pode ser interrompido antes. Os tempos normais de processo estão na faixa de 1 minuto a 25 horas, em particular, 10 minutos a 6 horas, como, por exemplo, na faixa de 1 hora a 4 horas, em particular, 1,5 horas a 3,5 horas. Esses parâmetros são exemplos não limitantes de condições de processo adequadas.
[00316] Caso o hospedeiro seja uma planta transgênica, podem ser fornecidas, condições de crescimento ideais, tais como condições de luz, água e nutriente ideais, por exemplo.
ISOLAMENTO DE PRODUTO
[00317] A metodologia da presente invenção pode incluir adicionalmente uma etapa de recuperar um produto final ou intermediário, opcionalmente em forma substancialmente pura de maneira estereoisomérica ou enantiomérica. O termo “recuperar” inclui extrair, colher, isolar ou purificar o composto do meio de cultura ou de reação. A recuperação do composto pode ser realizada de acordo com qualquer metodologia de isolamento ou purificação convencional conhecida na técnica incluindo, porém, sem limitação, tratamento com uma resina convencional (por exemplo, resina de troca aniônica ou catiônica, resina de adsorção não iônica etc.), tratamento com um adsorvente convencional (por exemplo, carvão ativado, ácido silícico, gel de sílica, celulose, alumina etc.), alteração do pH, extração de solvente (por exemplo, com um solvente convencional, tal como um álcool, acetato de etilo, hexano e similares), destilação, diálise, filtração, concentração, cristalização, recristalização, ajuste de pH, liofilização e similares.
[00318] A identidade e pureza do produto isolado podem ser determinadas por técnicas conhecidas, como cromatografia líquida de alto desempenho (HPLC), cromatografia gasosa (GC), Espectroscopia (como IR, UV, RMN), Métodos de Coloração, TLC, NIRS, ensaios enzimáticos ou microbianos. (consultar, por exemplo: Patek et al. (1994) Appl. Environ. Microbiol. 60:133 a 140; Malakhova et al. (1996)
Biotekhnologiya 11 27 a 32; und Schmidt et al. (1998) Bioprocess Engineer. 19:67 a
70. Ullmann's Encyclopedia of Industrial Chemistry (1996) Bd. A27, VCH: Weinheim, S. 89 a 90, S. 521 a 540, S. 540 a 547, S. 559 a 566, 575 a 581 und S. 581 a 587; Michal, G (1999) Biochemical Pathways: An Atlas of Biochemistry and Molecular Biology, John Wiley and Sons; Fallon, A. et al. (1987) Applications of HPLC in Biochemistry in: Laboratory Techniques in Biochemistry and Molecular Biology, Bd. 17).
[00319] O composto de terpeno cíclico produzido em qualquer um dos métodos no presente documento descritos pode ser convertido em derivados, tais como, porém, sem limitação, hidrocarbonetos, ésteres, amidas, glicosídeos, éteres, epóxidos, aldeídos, cetonas, álcoois, dióis, acetais ou cetais. Os derivados de composto terpeno podem ser obtidos por um método químico, tal como, porém, sem limitação, oxidação, redução, alquilação, acilação e/ou rearranjo. Alternativamente, os derivados de composto de terpeno podem ser obtidos com o uso de um método bioquímico colocando-se o composto de terpeno em contato com uma enzima tal como, porém, sem limitação, uma oxidorredutase, uma mono-oxigenase, uma dioxigenase, uma transferase. A conversão bioquímica pode ser realizada in-vitro com o uso de enzimas isoladas, enzimas de células lisadas ou in-vivo com o uso de células inteiras.
PRODUÇÃO FERMENTATIVA DE ÁLCOOL TERPÊNICO
[00320] A invenção também se refere a métodos para a produção fermentativa de álcoois terpênicos.
[00321] Uma fermentação, como usado, de acordo com a presente invenção pode, por exemplo, ser realizada em fermentadores agitados, colunas de bolha e reatores em ciclo. Uma visão geral abrangente dos possíveis tipos de método incluindo tipos de agitadores e modelos geométricos pode ser encontrada em “Chmiel: Bioprozesstechnik: Einfuhrung in die Bioverfahrenstechnik, Band 1 “. No processo da invenção, variantes típicas disponíveis são as seguintes variantes conhecidas pelas pessoas versadas na técnica ou explicadas, por exemplo, em “Chmiel, Hammes e Bailey: Biochemical Engineering”, tais como fermentação em lote, em lote descontínuo alimentado, em lote descontínuo alimentado repetido ou, até mesmo, contínua com e sem reciclagem da biomassa. Dependendo da cepa de produção, aspersão com ar, oxigênio, dióxido de carbono, hidrogênio, nitrogênio ou misturas de gás adequadas podem ser efetuadas a fim de obter bom rendimento (YP/S).
[00322] O meio de cultura que deve ser usado precisa satisfazer às exigências das cepas particulares de maneira apropriada. As descrições dos meios de cultura para vários micro-organismos são fornecidas no livro didático “Manual of Methods for General Bacteriology” da Sociedade Americana de Microbiologia (Washington D. C., EUA, 1981).
[00323] Esses meios que podem ser usados de acordo com a invenção podem compreender uma ou mais fontes de carbono, fontes de nitrogênio, sais inorgânicos, vitaminas e/ou elementos característicos.
[00324] Fontes preferenciais de carbono são açúcares, tais como mono, di ou polissacarídeos. Muitas boas fontes de carbono são, por exemplo, glicose, frutose, manose, galactose, ribose, sorbose, ribulose, lactose, maltose, sacarose, rafinose, amido ou celulose. Os açúcares podem ser adicionados aos meios por meio de compostos complexos, tais como melaços ou outros subprodutos de refinamento de açúcar. Além disso, pode ser vantajoso adicionar misturas de várias fontes de carbono. Outras fontes possíveis de carbono são óleos e gorduras, tais como óleo de soja, óleo girassol, óleo de amendoim e óleo de coco, ácidos graxos, tais como ácido palmítico, ácido esteárico ou ácido linoleico, álcoois, tais como glicerol, metanol ou etanol e ácidos orgânicos, tais como ácido acético ou ácido lático.
[00325] As fontes de nitrogênio são normalmente compostos ou materiais de nitrogênio orgânico ou inorgânico que contêm esses compostos. Os exemplos de fontes de nitrogênio incluem gás de amônia ou sais de amônio, tais como sulfato de amônio, cloreto de amônio, fosfato de amônio, carbonato de amônio ou nitrato de amônio, nitratos, ureia, aminoácidos ou fontes complexas de nitrogênio, tais como licor de maceração de milho, farinha de soja, proteína de soja, extrato de levedura, extrato de carne e outros. As fontes de nitrogênio podem ser usadas separadamente ou como uma mistura.
[00326] Os compostos de sal inorgânico que podem estar presentes nos meios compreendem o cloreto, sais de fosfato ou sulfato de cálcio, magnésio, sódio, cobalto, molibdênio, potássio, manganês, zinco, cobre e ferro.
[00327] Os compostos inorgânicos que contêm enxofre, por exemplo, sulfatos, sulfitos, di-tionitas, tetrationatos, tiosulfatos, sulfetos, e também compostos orgânicos de enxofre, tais como mercaptanos e tióis podem ser usados como fontes de enxofre.
[00328] Ácido fosfórico, di-hidrogêniofosfato de potássio ou hidrogêniofosfato de dipotássio ou os sais correspondentes que contêm sódio podem ser usados como fontes de fósforo.
[00329] Agentes quelantes podem ser adicionados ao meio, a fim de manter os íons de metal na solução. Agentes especialmente adequados compreendem di- hidroxifenóis, tais como catecol ou protocatecuato ou ácidos orgânicos, tais como ácido cítrico.
[00330] Os meios de fermentação usados de acordo com uma invenção também podem conter outros fatores de crescimento, tais como vitaminas ou promotores de crescimento, que incluem, por exemplo, biotina, riboflavina, tiamina, ácido fólico, ácido nicotínico, pantotenato e piridoxina. Os fatores de crescimento e sais são oriundos, muitas vezes, de componentes complexos dos meios, tais como extrato de levedura, melaços, licor de maceração de milho e similares. Além disso, precursores adequados podem ser adicionados ao meio de cultura. A composição precisa dos compostos do meio depende fortemente do experimento particular e deve ser decidida individualmente para cada caso específico. Informações sobre otimização de meios podem ser encontradas no livro didático “Applied Microbiol. Physiology, A Practical Approach” (1997). Os meios de crescimento também podem ser obtidos de fornecedores comerciais, tais como Padrão 1 (Merck) ou BHI (Infusão Cérebro Coração, DIFCO) etc.
[00331] Todos os componentes do meio são esterilizados, por aquecimento (20 min a 1,5 bar e 121 °C) ou por filtração estéril. Os componentes podem ser esterilizados juntos ou separadamente, caso necessário. Todos os componentes do meio podem ser estar presentes no início do crescimento ou, opcionalmente, podem ser adicionados continuamente ou por alimentação em lote.
[00332] A temperatura da cultura está normalmente entre 15 °C e 45 °C, de preferência, 25 °C a 40 °C e pode ser mantida constante ou pode ser variada durante o experimento. O valor do pH do meio deve estar na faixa de 5 a 8,5, de preferência, cerca de 7,0. O valor do pH para crescimento pode ser controlado durante o crescimento adicionando-se compostos básicos, tais como hidróxido de sódio, hidróxido de potássio, amônia ou água de amônia ou compostos ácidos, tais como ácido fosfórico ou ácido sulfúrico. Agentes antiespumantes, por exemplo, poliglicol ésteres de ácido graxo, podem ser usados para controlar a formação de espuma. A fim de manter a estabilidade de plasmídeos, substâncias adequadas com ação seletiva, por exemplo, antibióticos, podem ser adicionadas ao meio. A cultura é alimentada com oxigênio ou misturas de gás que contêm oxigênio, por exemplo, o ar ambiente, a fim de manter condições aeróbicas. A temperatura da cultura é normalmente de 20 ºC a 45 ºC. A cultura é continuada até que um máximo do produto desejado seja formado. Isso é normalmente obtido dentro de 1 hora a 160 horas.
[00333] A metodologia da presente invenção pode incluir adicionalmente uma etapa de recuperação do dito álcool terpênico.
[00334] O termo “recuperar” inclui extrair, colher, isolar ou purificar o composto do meio de cultura. A recuperação do composto pode ser realizada de acordo com qualquer metodologia de isolamento ou purificação convencional conhecida na técnica incluindo, porém, sem limitação, tratamento com uma resina convencional (por exemplo, resina de troca aniônica ou catiônica, resina de adsorção não iônica etc.), tratamento com um adsorvente convencional (por exemplo, carvão ativado, ácido silícico, gel de sílica, celulose, alumina etc.), alteração do pH, extração de solvente (por exemplo, com um solvente convencional, tal como um álcool, acetato de etilo, hexano e similares), destilação, diálise, filtração, concentração, cristalização, recristalização, ajuste de pH, liofilização e similares.
[00335] Antes do isolamento pretendido, a biomassa do caldo pode ser removida. Os processos para remover a biomassa são conhecidos pelas pessoas versadas na técnica, por exemplo, filtração, sedimentação e flutuação. Consequentemente, a biomassa pode ser removida, por exemplo, com centrífugas, separadores,
decantadores, filtros ou em aparelhos de flutuação. Para recuperação máxima do produto de valor, a lavagem da biomassa é frequentemente aconselhável, por exemplo, na forma de uma diafiltração. A seleção do método depende do teor de biomassa no caldo de fermentador e das propriedades da biomassa e também da interação da biomassa com o produto de valor.
[00336] Em uma modalidade, o caldo de fermentação pode ser esterilizado ou pasteurizado. Em uma modalidade, o caldo de fermentação é concentrado. Dependendo da exigência, essa concentração pode ser feita em lotes ou continuamente. A faixa de pressão e de temperatura devem ser selecionadas de modo que, em primeiro lugar, não ocorra danos ao produto e, em segundo lugar, seja necessário uso mínimo de aparelho e energia. A seleção habilidosa de níveis de pressão e temperatura para evaporação de múltiplos estágios possibilita, em particular, poupar energia.
[00337] Os seguintes exemplos são ilustrativos apenas e não se destinam a limitar o escopo das modalidades às modalidades descritas no presente documento.
[00338] As inúmeras variações possíveis que ficarão imediatamente evidentes a uma pessoa versada na técnica após ter considerado a revelação fornecida no presente documento também são abrangidas pelo escopo da invenção.
PARTE EXPERIMENTAL
[00339] A invenção será descrita agora em mais detalhes por meio dos exemplos que se seguem. MATERIAIS:
[00340] A menos que indicado de outra forma, todos materiais químicos ou bioquímicos e micro-organismos ou células empregados no presente documento são produtos comercialmente disponíveis.
[00341] A menos que indicado de outra forma, proteínas recombinantes são clonadas e expressas por métodos padrão, tais como, por exemplo, como descrito por Sambrook, J., Fritsch, E.F. e Maniatis, T., Molecular cloning: A Laboratory Manual, 2a Edição, Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989.
MÉTODOS GERAIS: ENSAIO PADRÃO PARA DETERMINAR A ATIVIDADE DA DIFOSFATO DE COPALILO FOSFATASE
[00342] Células de E. coli (cepa DP1205) são transformadas com dois plasmídeos, - um plasmídeo que porta os genes que codificam para enzimas necessárias para a biossíntese de difosfato de copalilo (CPP), por exemplo, o plasmídeo pACYC-CrtE-SmCPS2 - um plasmídeo que porta um gene que codifica para uma proteína com atividade de fosfato de terpenilo fosfatase, por exemplo, o plasmídeo pJ401-TalVeTPP ou pJ401-AspWeTPP.
[00343] As células são cultivadas e a produção de copalol é analisada por GC-MS como descrito abaixo. ENSAIO PADRÃO PARA DETERMINAR ATIVIDADE DE DIFOSFATO DE 8- HIDROXI-COPALILo FOSFATASE
[00344] Células de E. coli (cepa DP1205) são transformadas com dois plasmídeos, - um plasmídeo que porta o gene que codifica para as enzimas necessárias para a biossíntese de difosfato de 8-hidroxi-copalilo (LPP), por exemplo, o plasmídeo pACYC-CrtE-SsLPS - um plasmídeo que porta um gene que codifica para uma proteína com atividade de fosfato de terpenilo fosfatase, por exemplo, o plasmídeo pJ401-TalVeTPP ou pJ401-AspWeTPP.
[00345] As células são cultivadas e a produção de labdendiol é analisada por GC- MS como descrito abaixo.
ENSAIO PADRÃO PARA DETERMINAR ATIVIDADE DE COPALOL DESIDROGENASE
[00346] Células de E. coli (cepa DP1205) são transformadas com dois plasmídeos, - um plasmídeo que porta os genes que codificam para as enzimas necessárias para a biossíntese de Copalol, por exemplo, o plasmídeo pJ401-CPOL- 2, - um plasmídeo que porta um gene que codifica para uma álcool desidrogenase, por exemplo, com o uso de pJ423 como plasmídeo de fundo.
[00347] As células são cultivadas e a produção de copalal é analisada por GC-MS como descrito abaixo.
ENSAIO PADRÃO PARA DETERMINAR ATIVIDADE DE LABDENDIOL DESIDROGENASE
[00348] Células de E. coli (cepa DP1205) são transformadas com dois plasmídeos, - um plasmídeo que porta os genes que codificam para as enzimas necessárias para a biossíntese de labdendiol, por exemplo, o plasmídeo pJ401-LOH- 2, - um plasmídeo que porta um gene que codifica para uma álcool desidrogenase, por exemplo, com o uso de pJ423 como plasmídeo de fundo.
[00349] As células são cultivadas e a produção dos produtos é analisada por GC- MS como descrito abaixo. ESPECTROMETRIA DE MASSA POR CROMATOGRAFIA GASOSA (GC-MS)
[00350] O conteúdo de terpeno foi analisado por GC-MS com o uso de um sistema Agilent 6890 Series GC conectado a um detector de massa Agilent 5975. O GC foi equipado com coluna capilar de diâmetro interno de 0,25 mm por 30 m HP-5MS (Agilent). O gás carreador foi hélio a um fluxo constante de 1 ml/min. A temperatura de entrada foi fixada em 250 ºC. A temperatura inicial do forno foi de 100 ºC por 1 min, seguida por um gradiente de 10 ºC/min até 300 ºC. A identificação dos produtos foi baseada na comparação dos espectros de massa e índices de retenção com padrões autênticos e bancos de dados de espectros de massa proprietários. As concentrações foram estimadas com base no padrão interno.
PREPARAÇÃO DE UMA CEPA BACTERIANA RECOMBINANTE COM INTEGRAÇÃO CROMOSSÔMICA DE GENES QUE CODIFICAM ENZIMAS DA VIA DE MEVALONATO
[00351] Uma cepa de E. coli foi manipulada para produzir o precursor de terpeno, pirofosfato de farnesilo (FPP), por integração cromossômica de genes recombinantes que codificam enzimas da via de mevalonato. Consultar também o esquema de construção e os eventos de recombinação representados na Figura 15.
[00352] Foi projetado um operon de via superior (operon 1 de acetil-CoA para mevalonato) que consiste no gene atoB de E. coli que codifica uma acetoacetil-CoA tiolase e os genes mvaA e mvaS de Staphylococcus aureus que codificam uma HMG- CoA sintase e uma HMG-CoA redutase, respectivamente.
[00353] Como um operon da via inferior de mevalonato (operon 2 de mevalonato para pirofosfato de farnesilo), foi selecionado um operon natural da bactéria Gram- negativa, Streptococcus pneumoniae, que codifica uma mevalonato quinase (mvaK1), uma fosfomevalonato quinase (mvaK2), um fosfomevalonato descarboxilase (mvaD) e uma difosfato de isopentenilo isomerase (fni).
[00354] Um gene que codifica a sintase FPP de Saccharomyces cerevisiae otimizado por códon (ERG20) foi introduzido na extremidade 3'do operon da via superior para converter difosfato de isopentenilo (IPP) e difosfato de dimetilalilo (DMAPP) em FPP.
[00355] Os operons descritos acima foram sintetizados por DNA2.0 e integrados no gene araA da cepa de Escherichia coli BL21 (DE3). A via heteróloga foi introduzida em duas etapas de recombinação separadas com o uso do sistema de engenharia de genoma CRISPR/Cas9. O primeiro operon (via inferior; operon 2) a ser integrado porta um marcador de espectinomicina (Spec) que foi usado para triar integrantes candidatos resistentes a Spec. O segundo operon foi projetado para deslocar o marcador Spec do operon previamente integrado e foi adequadamente triado para integrantes candidatos a Spec após o segundo evento de recombinação (ver Figura 15). Os vetores de expressão de RNA guia direcionados ao gene araA foram projetados e sintetizados por DNA 2.0. A PCR foi usada para verificar a integração do operon, projetando iniciadores de PCR para amplificar através do alvo de integração do gene araA e através das junções de recombinação de integrantes. Um clone que produziu resultados de PCR corretos foi então totalmente sequenciado e arquivado como cepa DP1205.
CULTIVO DE CÉLULAS DE BACTÉRIAS E ANÁLISE PARA PRODUÇÃO DE TERPENO
[00356] As células de E. coli foram transformadas com um ou dois plasmídeos de expressão contendo os genes de biossíntese de terpeno e as células transformadas foram cultivadas com os antibióticos apropriados (canamicina (50 µg/ml) e/ou cloranfenicol (34 µg/ml) em placas de agarose LB. Colônias únicas foram usadas para inocular 5 mL de meio LB líquido suplementado com os mesmos antibióticos, 4g/l de glicose e 10% (v/v) de dodecano. No dia seguinte, 2 ml de meio TB suplementado com os mesmos antibióticos e 10% (v/v) dodecano foram inoculados com 0,2 ml da cultura durante a noite. As culturas foram incubadas a 37 ºC até que fosse atingida uma densidade óptica de 3. A expressão das proteínas recombinantes foi induzida pela adição de IPTG 1 mM e as culturas foram incubadas por 72h a 20 ºC.
[00357] As culturas foram então extraídas com éter terc-butilmetílico (MTBE) e o padrão interno (α-longipineno (Aldrich)) foi adicionado à fase orgânica. O teor de terpeno da fase orgânica foi analisado por GC-MS como descrito acima. EXEMPLO 1: IDENTIFICAÇÃO E CARACTERIZAÇÃO DA ATIVIDADE DE DIFOSFATO DE COPALILO FOSFATASE DE TALVETPP E ASPVETPP.
[00358] As proteínas TalVeTPP e AspWeTPP são codificadas por dois genes previstos no genoma de Talaromyces verruculosus e Aspergillus wentii, respectivamente. O gene que codifica TalVeTPP está localizado na região
150095..151030 da sequência de arcabouço genômico de Talaromyces verruculosus que tem o número de acesso NCBI LHCL01000010.1. A proteína codificada é relatada como uma proteína putativa sem caracterização funcional (número de acesso NCBI KUL89334.1). O gene de codificação AspWeTPP está localizado na região
2482776..2483627 do arcabouço genômico DTO 134E9 não posicionado de Aspergillus wentii ASPWEscaffold_5 (número de acesso NCBI KV878213.1). A proteína codificada tem o número de acesso NCBI OJJ34585.1 e também é relatada como uma proteína putativa sem caracterização funcional.
[00359] Os genes que codificam TalVeTPP e AspWeTPP estão localizados no genoma próximo a genes potencialmente envolvidos na biossíntese de metabólitos secundários tais como genes que codificam para oxidases, hidroxilases, desidrogenases e, particularmente, genes com forte homologia com difosfato de copalilo monofuncional sintases ou difosfato de copalilo bifuncional sintases relatadas em Mitsuhashi et al, Chembiochem. 2 de novembro de 2017; 18 (21):2104 a 2109. A análise funcional das sequências de aminoácidos TalVeTPP e AspWeTPP por pesquisa da presença de assinaturas de domínios da família de proteínas (por exemplo, com o uso da ferramenta de análise de sequência Interpro em www.ebi.ac.uk/interpro/ ou a ferramenta de pesquisa de banco de dados Pfam http://pfam.xfam.org/search#tabview=tab0 ou https://www.ebi.ac.uk/Tools/pfa/pfamscan/) revelou que é previsto que as duas proteínas contenham assinaturas de proteína tirosina fosfatase. É descrito que as enzimas da família da tirosina fosfatase removem grupos fosfato de várias moléculas fosforiladas e, particularmente, de proteínas. Mas as enzimas dessa família de proteínas nunca demonstraram atuar em compostos como o difosfato de copalilo. No entanto, dada a localização no genoma dos genes que codificam para TalVeTPP e AspWeTP, formulamos a hipótese de que TalVeTPP e AspWeTPP poderiam catalisar a clivagem do grupo difosfato de difosfato de copalilo ou outros compostos isoprenóide-difosfato (Figura 1).
[00360] O cDNA que codifica TalVeTPP e AspWeTPP (SEQ ID NO: 3 e 7, respectivamente) foram otimizados por códon (SEQ ID NO: 1 e 5, respectivamente) e clonados individualmente no plasmídeo de expressão pJ401 (ATUM, Newark, Califórnia) fornecendo os plasmídeos pJ401-TalVeTPP e pJ401-AspWeTPP.
[00361] Outro plasmídeo de expressão que porta um gene que codifica uma pirofosfato de geranilogeranilo sintase (GGPS) e um gene que codifica uma pirofosfato de copalilo sintase (CPS) foi construído. Para o gene CPS, o cDNA que codifica para um CPS de Salvia miltiorrhiza (número de acesso NCBI ABV57835.1) foi otimizado por códons para expressão ótima em células de E. coli. Além disso, os primeiros 58 códons foram removidos e um códon de iniciação ATG foi adicionado. O cDNA otimizado que codifica o CPS de Salvia miltiorrhiza truncado (SmCPS2) (SEQ ID NO:33) foi sintetizado in-vitro e primeiro clonado no plasmídeo pJ208 flanqueado com os sítios de reconhecimento das enzimas de restrição NdeI e KpnI (ATUM, Newark, Califórnia). Para a GGPS, o gene CrtE de Pantoea agglomerans (acesso NCBI M38424.1) que codifica uma sintase de GGPP (acesso NCBI número AAA24819.1)
foi usado. O gene CrtE foi sintetizado com otimização de códons (SEQ ID NO:35) e adição dos sítios de reconhecimento das enzimas de restrição NcoI e BamHI nas extremidades 3' e 5' (ATUM, Newark, Califórnia) e ligado entre o sítio NcoI e BamHI do plasmídeo pACYCDuet™-1 (Merck) para obter o plasmídeo pACYC-CrtE. O SmCPS2 modificado que codifica cDNA foi digerido com Ndel e Kpnl e ligado no plasmídeo pACYC-CrtE fornecendo, desse modo, o construto de pACYC-CrtE- SmCPS2.
[00362] As células de E. coli (cepa DP1205 preparada acima) foram transformadas com dois plasmídeos, o plasmídeo pACYC-CrtE-SmCPS2 e o pJ401-TalVeTPP ou pJ401-AspWeTPP. As células foram cultivadas e a produção de compostos de terpeno foi analisada como descrito na seção de métodos. A Figura 2 mostra GC-MS típico de copalol produzido por células de E. coli recombinantes. As células que expressam apenas as enzimas da via de mevalonato e um SmCPS2 produziram pequenas quantidades de copalol (6,7 mg/l, Figura 3) devido à hidrólise do CPP pelas enzimas da fosfatase alcalina endógena. As células de E. coli transformadas para expressar em adição o TalVeTPP ou AspWeTPP produzem quantidades significativamente maiores de copalol: 462 mg/l e 298 mg/l para TalVeTPP e AspWeTPP, respectivamente (Figura 2 e 3). Esse experimento mostra que TalVeTPP e AspWeTPP podem hidrolisar eficientemente (+)-CPP para produzir (+)-copalol. O Copalol é produzido com alta pureza (>95%). As menores quantidades de acetato de copalilo observadas na análise de GC-MS (Figura 2) são devido à atividade de acetil transferase endógena das células. EXEMPLO 2: IDENTIFICAÇÃO E CARACTERIZAÇÃO DE VARIANTES DE
TALVETPP E ASPVETPP COM ATIVIDADE DE PIROFOSFATO DE COPALILO FOSFATASE.
[00363] As sequências TalVeTPP e AspVeTPP foram utilizadas para pesquisar sequências homólogas em bancos de dados públicos. Oito novas sequências com as assinaturas da família de proteínas tirosina fosfatase Pfam PF13350 foram selecionadas: HelGriTPP1, uma proteína hipotética Helicocarpus griseus (SEQ ID NO: 10) (GenBank: PGG95910.1); UmbPiTPP1, uma tirosina fosfatase de Umbilicaria pustulata (SEQ ID NO: 13) (GenBank: SLM34787.1); TAlVeTPP2, uma proteína hipotética de Talaromyces verruculosus (SEQ ID NO: 16) (GenBank: KUL92314.1); HydPiTPP1, uma proteína hipotética de Hydnomerulius pinastri (SEQ ID NO: 19) (GenBank: KIJ69780.1); TalCeTPP1, uma proteína hipotética de Talaromyces cellulolyticus (SEQ ID NO: 22) (GenBank: GAM42000.1); TalMaTPP1, uma proteína hipotética de Talaromyces marneffei (SEQ ID NO: 25) (NCBI XP_002152917.1); TalAstroTPP1, uma proteína hipotética de Talaromyces atroroseus (SEQ ID NO: 28) (NCBI XP_020117849.1); PeSubTPP1, PeSubTPP1, uma proteína hipotética de Penicillium subrubescens (SEQ ID NO: 31) (GenBank: OKP14340.1). A busca por assinaturas da família de proteínas mostrou que as oito sequências de aminoácidos são membros da família de proteínas PF13350 da proteína tirosina fosfatase Pfam.
[00364] A comparação de sequências das sequências de 10 aminoácidos mostra identidades de sequências variando de 24% a 93% (Tabela 1). TABELA 1. COMPARAÇÃO DE SEQUÊNCIAS EM PARES DA TERPENO FOSFATASE PUTATIVA SELECIONADA. A PORCENTAGEM DE IDENTIDADE DE SEQUÊNCIA É LISTADA PARA CADA COMPARAÇÃO DE PAR. UmbPiTPP1 PeSubTPP1 HelGriTPP1 TalMaTPP1 AspWeTPP HydPiTPP1 TalCeTPP1 TalVeTPP2 TalAstroTP TalVeTPP P1 TalVeTPP - 26,3 28,1 35,6 28,9 28,6 93,5 76,8 62,9 56,6 AspWeTPP 26,3 - 52,2 38,2 36 34,8 26,3 23,8 27,6 26,4 HelGriTPP1 28,1 52,2 - 43,2 41,3 40,2 27,5 25,4 28,8 28,9 UmbPiTPP1 35,6 38,2 43,2 - 38,6 39,5 34,7 31,6 34,6 34,1 TalVeTPP2 28,9 36 41,3 38,6 - 36,7 28 25,7 29 29 HydPiTPP1 28,6 34,8 40,2 39,5 36,7 - 28 26,2 30,5 30,1 TalCeTPP1 93,5 26,3 27,5 34,7 28 28 - 75,9 63,2 57,3 TalMaTPP1 76,8 23,8 25,4 31,6 25,7 26,2 75,9 - 59,2 51,8
TalAstroTPP1 62,9 27,6 28,8 34,6 29 30,5 63,2 59,2 - 55,5 PeSubTPP1 56,6 26,4 28,9 34,1 29 30,1 57,3 51,8 55,5 -
[00365] As sequências de cDNA que codificam para HelGriTPP1 (SEQ ID NO: 11), UmbPiTPP1 (SEQ ID NO: 14), TalVeTPP2 (SEQ ID NO: 17), HydPiTPP1 (SEQ ID NO: 20), TalCeTPP1 (SEQ ID NO: 23), TalMaTPP1 (SEQ ID NO: 26), TalAstroTPP1 (SEQ ID NO: 29) e PeSubTPP1 (SEQ ID NO: 32) foram otimizadas por códons (para expressão de E. coli e clonadas individualmente no plasmídeo de expressão pJ401 (ATUM, Newark, Califórnia).
[00366] As células de E. coli DP1205 foram transformadas com o plasmídeo pACYC-CrtE-SmCPS2 e um plasmídeo pJ401 que porta um cDNA otimizado que codifica para HelGriTPP1 (SEQ ID NO: 9), UmbPiTPP1 (SEQ ID NO: 12), TalVeTPP2 (SEQ ID NO: 15), HydPiTPP1 (SEQ ID NO: 18), TalCeTPP1 (SEQ ID NO: 21), TalMaTPP1 (SEQ ID NO: 24), TalAstroTPP1 (SEQ ID NO: 27) e PeSubTPP1 (SEQ ID NO: 30). As células foram cultivadas e a produção de copalol foi analisada nas condições descritas na seção de métodos. As células transformadas com o plasmídeo pACYC-CrtE-SaLPS e um plasmídeo pJ401 vazio foram utilizadas como uma cepa de controle. Todas as cepas que expressam as proteínas recombinantes TalVeTPP, AspWeTPP, HelGriTPP1, UmbPiTPP1, TalVeTPP2, HydPiTPP1, TalCeTPP1, TalMaTPP1, TalAstroTPP1 ou PeSubTPP1 acumularam copalol em quantidades que variam de 32 a 240 mg/l de confirmando a conversão enzimática de CPP copalol com todas essas enzimas recombinantes (Figura 4).
[00367] Esse exemplo mostra que TalVeTPP, AspWeTPP, HelGriTPP1, UmbPiTPP1, TalVeTPP2, HydPiTPP1, TalCeTPP1, TalMaTPP1, TalAstroTPP1 e PeSubTPP1 podem ser usados para a conversão enzimática de CPP para copalol e podem ser usados para produzir copalol em células manipuladas. EXEMPLO 3: PRODUÇÃO DE LABDENDIOL EM CÉLULAS DE E. COLI.
[00368] Foi construído um plasmídeo de expressão que porta um gene que codifica uma pirofosfato de geranilogeranilo sintase (GGPS) e um gene que codifica uma pirofosfato de labdendiol sintase (LPS). Para a GGPS, foi usado o gene CrtE de P.
agglomerans descrito no Exemplo 1. Para o gene LPS, foi usado o cDNA que codifica para SsLPS de Salvia sclarea (WO2009095366, GenBank: AET21246.1). A sequência de cDNA que codifica SsLPS foi otimizada (SEQ ID NO:37) como descrito em WO2009095366 e clonada entre os sítios NdeI e KpnI no plasmídeo pACYC-Crte fornecendo o plasmídeo pACYC-CrtE-SaLPS que porta um gene da sintase GGP e um gene da sintase LPP. As células de E. coli tais como a cepa DP1205, transformadas com o pACYC-CrtE-SsLPS acumulam LPP como o composto precursor de diterpeno (Figura 5).
[00369] As células de E. coli DP1205 (tal como preparado acima) foram transformadas com a plasmídeo pACYC-CrtE-SsLPS e um dos plasmídeos pJ401 que porta um cDNA otimizado que codifica para TalVeTPP, AspWeTPP, HelGriTPP1, UmbPiTPP1, TalVeTPP2, HydPiTPP1, TalCeTPP1, TalMaTPP1, TalAstroTPP1 ou PeSubTPP1 (consultar Exemplos 1 e 2, acima). As células foram cultivadas e a produção de labdendiol analisada nas condições descritas na seção de métodos. Em comparação com as células de controle transformadas com um plasmídeo pJ401 vazio e o pACYC-CrtE-SsLPS, todas as células transformadas para produzir qualquer uma das proteínas TalVeTPP, AspWeTPP, HelGriTPP1, UmbPiTPP1, TalVeTPP2, HydPiTPP1, TalCeTPP1, TalMaTPP1, TalAstroTPP1 ou PeSubTPP1 recombinantes produziu quantidades significativamente aumentadas de labdendiol (aumento de 5 a 25 vezes) (Figura 6). As concentrações de labdendiol nas culturas de células estavam entre 50 e 272 g/l no final do período de cultivo.
[00370] A Figura 7 mostra a análise de GC-MS de uma célula de labdendiol típica que produz E. coli. O cromatograma de íons total mostra que o labdendiol produzido nessas condições tem pureza de pelo menos 98%. EXEMPLO 4: PRODUÇÃO DE FARNESOL E GERANILOGERANIOL EM CÉLULAS DE E. COLI.
[00371] As proteínas TalVeTPP, AspWeTPP, HelGriTPP1, UmbPiTPP1, TalVeTPP2, HydPiTPP1, TalCeTPP1, TalMaTPP1, TalAstroTPP1 e PeSubTPP1 recombinantes também foram avaliadas quanto à atividade enzimática em substratos lineares tais como de pirofosfato de farnesilo (FPP) e pirofosfato de geranilogeranilo
(GGPP). Os ensaios foram realizados em condições semelhantes aos exemplos 1 e 2 e na seção de métodos, exceto para o plasmídeo pACYCDuet™-1 que foi adaptado para produzir FPP e GGPP in vivo. Para as células de E. coli que acumulam FPP, foi usado um plasmídeo vazio pACYCDuet™-1. As células de E. coli tais como a cepa DP1205, transformadas com o plasmídeo vazio pACYCDuet™-1 (Merck) irão acumular FPP como o composto precursor de terpeno (Figura 8). Para as células de E. coli que acumulam GGPP, foi usado o plasmídeo pACYC-CrtE (Exemplo 1). As células de E. coli tal como a cepa DP1205, transformadas com o plasmídeo pACYC- CrtE acumularão o GGPP como o composto precursor de terpeno (Figura 5 e Figura 8).
[00372] As células de E. coli DP1205 foram transformadas com o plasmídeo pACYC-CrtE ou pACYCDuet™-1 e com um dos plasmídeos pJ401 que porta um cDNA otimizado que codifica para TalVeTPP, AspWeTPP, HelGriTPP1, UmbPiTPP1, TalVeTPP2, HydPiTPP1, TalCeTPP1, TalMaTPP1, TalAstroTPP1 ou PeSubTPP1 (consultar os Exemplos 1 e 2). As células foram cultivadas e a produção de farnesol e geranigeraniol foi analisada nas condições descritas na seção de métodos. Em comparação com as células de controle transformadas com um pJ401 vazio, algumas das células transformadas para produzir as proteínas TalVeTPP, AspWeTPP, HelGriTPP1, UmbPiTPP1, TalVeTPP2, HydPiTPP1, TalCeTPP1, TalMaTPP1, TalAstroTPPP1 ou PeSubTPP1, recombinante produziram quantidades significativamente aumentada de farnesol e geranilogeraniol (Figura 9). Por exemplo, células que expressam TalVeTPP2, TalCeTPP1 e TalVeTPP produzem grandes quantidades (763 a 976 mg/ml) de farnesol. Da mesma forma, as células que expressam PeSubTPP1 e TalVeTPP produzem grandes quantidades (196 a 198 mg/ml) de geranilogeraniol. Em contraste, HelGriTPP1, UmbPiTPP1, HydPiTPP1 ou TalMaTPP1 mostram baixa atividade de fosfatase de FPP e GGPP. EXEMPLO 5: SELETIVIDADE DE SUBSTRATO DAS FOSFATASES.
[00373] A comparação das atividades enzimáticas observadas nos exemplos anteriores com os quatro substratos diferentes revela seletividade de substrato distinta para TalVeTPP, AspWeTPP, HelGriTPP1, UmbPiTPP1, TalVeTPP2, HydPiTPP1,
TalCeTPP1, TalMaTPP1, TalAstroTPP1 ou PeSubTPP1 (Figura 10). Essa abordagem permite, portanto, selecionar enzimas com atividade de fosfatase com base em sua seletividade de substrato. Por exemplo, HelGriTPP1, HydPiTPP1 ou AspWeTPP mostram atividade relativamente superior para CPP e LPP e atividade inferior para FPP e GGP em comparação com outras enzimas listadas. Essas enzimas podem, portanto, ser usadas para produzir com mais eficácia copalol ou labdendiol com atividade secundária limitada nos intermediários de via. UmbPiTPP1, TalMaTPP1 e TalAstroTPP1 também mostram atividade secundária limitada em FPP e GGPP, no entanto, produzem quantidades inferiores de labdendiol e copalol. EXEMPLO 6: PRODUÇÃO DE COPALOL E LABDENDIOL COM O USO DE OPERONS QUE CONTÊM UMA SINTASE DE GGPP, UMA SINTASE DE DITERPENO E UMA FOSFATASE.
[00374] Foi construído um operon contendo 3 cDNAs que codificam TalVeTPP; TaTps1-del59 e uma sintase GGPP. TaTps1-del59 é uma sintase CPP truncada N- terminal de Triticum aestivum (número de acesso NCBI BAH56559.1). A codificação de cDNA para TaTps1-del59 foi otimizada por códons (SEQ ID NO: 39). Para a sintase GGPP, foi usada a versão otimizada de códons do gene CrtE de Pantoea agglomerans (acesso NCBI M38424.1) (SEQ ID NO: 35). O operon foi clonado no plasmídeo de expressão pJ401 (ATUM, Newark, Califórnia) fornecendo o construto pJ401-CPOL-2.
[00375] Outro operon foi construído com uma organização semelhante ao CPOL-2 acima, exceto para o gene que codifica para TaTps1-del59 que foi substituído pelo gene otimizado que codifica para SaLPS (SEQ ID NO:37). Este operon foi clonado no plasmídeo pJ401 (ATUM, Newark, Califórnia) fornecendo o construto pJ401-LOH-2.
[00376] As células de E. coli DP1205 preparadas acima foram transformadas com o plasmídeo pJ401-CPOL-2 ou pJ401-LOH-2. As células foram cultivadas como descrito e a produção de diterpenos foi analisada como descrito na seção de métodos. Paralelamente, as células transformadas com o plasmídeo PJ401 vazio e com o plasmídeo pACYC-CrtE-SsLPS ou pACYC-CrtE-SmCPS foram utilizadas como controles.
[00377] As células transformadas com o plasmídeo CPOL-2 produziram copalol e farnesol com uma concentração média de 200 mg/l e 300 mg/l para copalol e farnesol, respectivamente. As células transformadas com o plasmídeo LOH-2 produziram labdendiol e farnesol com uma concentração média de 1.260 mg/l e 830 mg/l para copalol e farnesol, respectivamente (Figura 11). As quantidades significativas de farnesol produzidas com o uso desses dois construtos são devidas a uma conversão incompleta do pool FPP em GGPP e à atividade enzimática de TalVeTPP em FPP além de CPP (consultar Figura 10). Experimentos correspondentes com, por exemplo, HelGriTPP1 (e outros mostrados na Figura 10 com maior especificidade) produzirão menos farnesol. EXEMPLO 7: OXIDAÇÃO ENZIMÁTICA DOS COMPOSTOS DE TERPENO PRODUZIDOS PELA FOSFATASE RECOMBINANTE PARA PRODUZIR OS ALFA, BETA ALDEÍDOS NÃO SATURADOS CORRESPONDENTES.
[00378] As seguintes álcool desidrogenases (ADH) podem ser usadas para a oxidação dos compostos de terpeno produzidos pelas fosfatases descritas nos exemplos anteriores: - CymB (SEQ ID NO: 42) (acesso GenBank AEO27362.1) da cepa Pseudomonas sp. 19-rlim; - AspWeADH1 (SEQ ID NO: 44) (acesso GenBank OJJ34588.1) codificado pelo gene localizado na região 2487333..2488627 do arcabouço genômico não colocado de Aspergillus wentii DTO 134E9 ASPWEscaffold_5 (acesso NCBI No. KV878213.1); - PsAeroADH1 (SEQ ID NO: 46) (acesso GenBank WP_079868259.1) de Pseudomonas aeruginosa; - AzTolADH1 (SEQ ID NO: 48) (acesso GenBank WP_018990713.1) de Azoarcus toluclasticus; - AroAroADH1 (SEQ ID NO: 50) (acesso GenBank KM105875.2) de Aromatoleum aromaticum. - ThTerpADH1 (SEQ ID NO: 52) (acesso no Genbank WP_021250577.1) de Thauera terpenica. - CdGeoA (SEQ ID NO: 54) (acesso NCBI WP_043683915.1) de
Castellaniella defragrans. - VoADH1 (SEQ ID NO: 56) (acesso GenBan AVX32614.1) de Valeriana officinalis.
[00379] cDNAs otimizados por códon que codificam para cada uma das ADHs acima foram sintetizados (consultar SEQ ID NO: 41, 43, 45, 47, 49, 51, 53 e 55, respectivamente) e clonados no plasmídeo de expressão pJ423 (ATUM, Newark, Califórnia).
[00380] As células DP1205 de E. coli preparadas acima foram transformadas com o plasmídeo pJ401-CPOL-2 e um desses plasmídeos pJ423-ADH. As células foram cultivadas como descrito e a produção de diterpenos foi analisada como descrito na seção de métodos. Paralelamente, as células transformadas com o plasmídeo pJ401- CPOL-2 e com o plasmídeo pJ423 vazio foram utilizadas como controle (Figura 12). A formação de copalal foi observada com todas as células mostrando que a combinação de enzimas de uma via biossintética de copalol incluindo uma proteína tirosina fosfatase e uma ADH selecionada das ADHs listadas acima pode ser usada para produzir copalal com eficiência. Era esperado que, para AspWeADH1 e VoADH1, a conversão de copalol em copalal nas células fosse de pelo menos 90%. Uma mistura de isômeros cis e trans de copalal foi observada devido à isomerização não enzimática do transcopalal produzido pelas ADHs. Com o uso das mesmas ADHs, a conversão de farnesol para farnesal também foi observada (Figura 13).
[00381] Com células de E. coli cotransformadas com o pJ401-LOH-2 e um dos plasmídeos pJ423-ADH, foi observada a formação de dois produtos de oxidação de labdendiol (Figura 14). A análise de NMR confirmou os dois compostos como sendo dois isômeros ((13R) e (13S)) de 8,13-epóxi-labdan-15-al tal como mostrado no esquema da Figura 17. Esses dois compostos resultam da instabilidade do aldeído alfa, beta-insaturado 8-hidroxi-labd-13-en-15-al produzido pela oxidação de labdendiol. Um mecanismo postulado de desidratação e rearranjo do aldeído para os ditos isômeros é mostrado no esquema abaixo. EXEMPLO 8: ENGENHARIA DE CÉLULAS BACTERIANAS RECOMBINANTES
PARA A PRODUÇÃO DE COPALOL COM O USO DE UMA SINTASE CPP MULTIFUNCIONAL
[00382] Um operon foi construído contendo dois cDNAs que codificam para: - AspWeTPP de Aspergillus wentii (SEQ ID NO: 6), - PvCPS, uma proteína que tem atividades de prenil-transferase e difosfato de copalilo sintase de Talaromyces verruculosus (SEQ ID NO: 59) (acesso do GenBank BBF88128.1). A PvCPS catalisa a produção de copalilo PP de IPP e DMAPP.
[00383] Os cDNAs que codificam para AspWeTPP e PvCPS foram otimizados por códons (SEQ ID NOs: 8 e 60). Um operon foi projetado contendo os dois cDNAs e uma sequência RBS (AAGGAGGTAAAAAA) (SEQ ID NO: 61 posicionado a montante de cada um dos cDNAs. O operon foi sintetizado e clonado no plasmídeo de expressão pJ401 (ATUM, Newark, Califórnia) fornecendo o plasmídeo pJ401-CPOL-
4.
[00384] As células de E. coli DP1205 foram transformadas com o plasmídeo pJ401- CPOL-4. As células transformadas foram cultivadas como descrito e a produção de diterpenos foi analisada como descrito na seção de métodos. Nessas condições, as células transformadas com o plasmídeo pJ401-CPOL-4 produziram copalol como produto principal com uma concentração significativamente superior (até 1 mg/l) do que as células transformadas com o plasmídeo pJ401-CPOL-2. Esse experimento mostra que concentrações superiores de copalol podem ser obtidas com o uso de uma proteína multifuncional que porta atividade de prenil transferase e atividade de CPP sintase em comparação com múltiplas proteínas monofuncionais. EXEMPLO 9: PRODUÇÃO DE COPALOL E COPALAL IN VIVO EM CÉLULAS
SACCHAROMYCES CEREVISIAE COM O USO DE UMA PIRFOSFATO DE COPALILO FOSFATASE E ÁLCOOL DESIDROGENASES DIFERENTES.
[00385] Para a produção de copalol e copalal, os genes (cDNA otimizado para expressão em levedura) que codificam para a sintase GGPP CrtE (SEQ ID NO: 61) (de Pantoea agglomerans, acesso NCBI M38424.1), a pirofosfato de copalilo sintase SmCPS2 (SEQ ID NO: 63) (de Salvia miltiorrhiza, acesso NCBI ABV57835.1), a pirofosfato de copalilo fosfatase TalVeTPP (SEQ ID NO: 65) e diferentes álcool desidrogenases foram expressos em células de Saccharomyces cerevisiae manipuladas com nível aumentado de farnesil-difosfato endógeno (FPP).
[00386] Quatro álcool desidrogenases foram avaliadas. - AzTolADH1 (SEQ ID NO: 48) (cDNA otimizado para levedura SEQ ID NO: 66) - PsAeroADH1 (SEQ ID NO: 46), (cDNA otimizado para levedura SEQ ID NO: 67) - SCH23-ADH1 de Hyphozyma roseonigra (SEQ ID NOs: 69) (cDNA otimizado para levedura SEQ ID NO: 68) - SCH24-ADH1a de Cryptococcus albidus (SEQ ID NOs: 71) (cDNA otimizado para levedura SEQ ID NO: 70)
[00387] Para aumentar o nível de agrupamento de farnesil-difosfato endógeno (FPP) em células de S. cerevisiae, uma cópia extra de todos os genes endógenos de levedura envolvidos na via do mevalonato, de ERG10 que codifica para acetil-CoA C- acetiltransferase para ERG20 que codifica sintetase FPP, foi integrada ao genoma da cepa de S. cerevisiae CEN.PK2-1C (Euroscarf, Frankfurt, Alemanha) sob o controle de promotores induzíveis por galactose, similarmente ao descrito em Paddon et al., Nature, 2013, 496:528 a 532. Resumidamente, três cassetes foram integrados nos loci LEU2, TRP1 e URA3, respectivamente. Um primeiro cassete contendo os genes ERG20 e um HMG1 truncado (tHMG1 como descrito em Donald et al., Proc Natl Acad Sci USA, 1997, 109:E111-8), sob o controle do promotor bidirecional GAL10/GAL1 e os genes ERG19 e ERG13 também sob o controle do promotor GAL10/GAL1, o cassete foi flanqueado por duas regiões de 100 nucleotídeos correspondentes às seções de fluxo ascendente e descendente LEU2. Um segundo cassete em que os genes IDI1 e tHMG1 estavam sob o controle do promotor GAL10/GAL1 e o gene ERG13 sob o controle da região promotora de GAL7, o cassete foi flanqueado por duas regiões de 100 nucleotídeos correspondentes às seções a jusante e a montante de TRP1. Um terceiro cassete com os genes ERG10, ERG12, tHMG1 e ERG8, todos sob o controle dos promotores GAL10/GAL1, o cassete foi flanqueado por duas regiões de 100 nucleotídeos correspondentes às seções a jusante e a montante de
URA3. Todos os genes nos três cassetes incluíram 200 nucleotídeos das suas próprias regiões terminadoras. Além disso, uma cópia extra de GAL4 sob o controle de uma versão mutada de seu próprio promotor, como descrito em Griggs e Johnston, Proc Natl Acad Sci USA, 1991, 88:8.597 a 8.601, foi integrada a montante da região promotora ERG9. Além disso, a expressão de ERG9 foi modificada por troca de promotor. Os genes GAL7, GAL10 e GAL1 foram excluídos com o uso de um cassete contendo o gene HIS3 com seu próprio promotor e terminador. A cepa resultante foi cruzada com a cepa CEN.PK2-1D (Euroscarf, Frankfurt, Alemanha) obtendo uma cepa diploide denominada YST045 que foi induzida para esporulação de acordo com Solis-Escalante et al, FEMS Yeast Res, 2015, 15: 2. A separação de esporos foi alcançada por ressuspensão de asci em 200 μl de sorbitol 0,5 M com 2 μl de zimoliase (1.000 U ml−1, Zymo research, Irvine, CA) e incubado a 37 ºC por 20 minutos. A mistura foi então plaqueada em meio contendo 20 g/l de peptona, 10 g/l de extrato de levedura e 20 g/l de ágar, um esporo germinado foi isolado e denominado YST075.
[00388] Para a expressão dos diferentes genes que codificam álcool desidrogenases, foram realizadas integrações de genoma na cepa YST075. Cada cassete de integração foi formado por quatro fragmentos. 1) Um fragmento contendo 261 bp que correspondem à seção a montante do gene BUD9 e a sequência 5'-
GCACTTGCTACACTGTCAGGATAGCTTCCGTCACATGGTGGCGATCACCGTACA TCTGAG-3’ (SEQ ID NO: 72), esse fragmento foi obtido por PCR com DNA genômico da cepa YST075 como modelo; 2) um fragmento contendo a sequência 5'-
GCACTTGCTACACTGTCAGGATAGCTTCCGTCACATGGTGGCGATCACCGTACA TCTGAG-3’ (SEQ ID NO: 72), a região promotora do gene GAL1, um dos genes que codificam uma álcool desidrogenase otimizada por códon para expressão em S. cerevisiae, a região terminadora do gene PGK1 e a sequência 5'-
AGGTGCAGTTCGCGTGCAATTATAACGTCGTGGCAACTGTTATCAGTCGTACCG CGCCAT-3’ (SEQ ID NO: 73), esse fragmento foi obtido por síntese de DNA (ATUM, Menlo Park, CA 94025),
3) um fragmento contendo a sequência 5'-
AGGTGCAGTTCGCGTGCAATTATAACGTCGTGGCAACTGTTATCAGTCGTACCG CGCCAT-3’ (SEQ ID NO: 73), o gene TRP1 com as suas próprias regiões promotoras e terminadoras e a sequência 5'-
TGGTCAGCAACAACGCCGAAGAATCACTCTCGTGTTGAGAATTGCACGCCTTGA CCACGA-3’ (SEQ ID NO: 74), esse fragmento foi obtido por PCR com pESC-TRP1 (Agilent Technologies, Califórnia, EUA) como modelo; e 4) um fragmento contendo a sequência 5'-
TGGTCAGCAACAACGCCGAAGAATCACTCTCGTGTTGAGAATTGCACGCCTTGA CCACGA-3’ (SEQ ID NO: 74) e 344 bp que corresponde ao gene BUD9, esse fragmento foi obtido por PCR com DNA genômico da cepa YST075 como modelo.
[00389] YST075 foi transformada com os quatro fragmentos necessários para a integração do genoma para cada uma das álcool desidrogenases avaliadas. As transformações de leveduras foram realizadas com o protocolo de acetato de lítio como descrito em Gietz and Woods, Methods Enzymol., 2002, 350:87 a 96. Misturas de transformação foram plaqueadas em meio SmTrp contendo 6,7 g/l de Base de Nitrogênio de Levedura sem aminoácidos (BD Difco, Nova Jersey, EUA), 1,92 g/l de suplemento Dropout sem leucina (Sigma Aldrich, Missouri, EUA), 20 g/l de glicose e 20 g/l de ágar. As placas foram incubadas por 3 a 4 dias a 30 ºC. Colônias únicas contendo as integrações corretas foram isoladas e denominadas YST149 (com SCH23-ADH1), YST150 (com SCH24-ADH1a), YST151 (com AzTolADH1) e YST152 (com PsAeroADH1).
[00390] Para a expressão de CrtE, SmCPS2 e TalVeTPP em YST149, YST150, YST151 e YST152, um plasmídeo foi construído in vivo com o uso de recombinação homóloga endógena de levedura como descrito previamente em Kuijpers et al., Microb Cell Fact., 2013, 12:47. O plasmídeo é composto por seis fragmentos de DNA que foram usados para a cotransformação de S. cerevisiae. Os fragmentos foram: a) marcador de levedura LEU2, construído por PCR com o uso dos iniciadores 5’AGGTGCAGTTCGCGTGCAATTATAACGTCGTGGCAACTGTTATCAGTCGTACC
GCGCCATTCGACTACGTCGTAAGGCC-3’ (SEQ ID NO: 75) e 5’TCGTGGTCAAGGCGTGCAATTCTCAACACGAGAGTGATTCTTCGGCGTTGTTG CTGACCATCGACGGTCGAGGAGAACTT-3’ (SEQ ID NO: 76) com o plasmídeo pESC-LEU (Agilent Technologies, Califórnia, UA) como modelo; b) marcador de E. coli AmpR, construído por PCR com o uso dos iniciadores 5’-
TGGTCAGCAACAACGCCGAAGAATCACTCTCGTGTTGAGAATTGCACGCCTTGA CCACGACACGTTAAGGGATTTTGGTCATGAG-3’ (SEQ ID NO: 77) e 5’-
AACGCGTACCCTAAGTACGGCACCACAGTGACTATGCAGTCCGCACTTTGCCAA TGCCAAAAATGTGCGCGGAACCCCTA-3’ (SEQ ID NO: 78) com o plasmídeo pESC- URA como modelo; c) Origem de replicação de levedura, obtida por PCR com o uso dos iniciadores 5’-
TTGGCATTGGCAAAGTGCGGACTGCATAGTCACTGTGGTGCCGTACTTAGGGTA CGCGTTCCTGAACGAAGCATCTGTGCTTCA-3’ (SEQ ID NO: 79) e 5’-
CCGAGATGCCAAAGGATAGGTGCTATGTTGATGACTACGACACAGAACTGCGG GTGACATAATGATAGCATTGAAGGATGAGACT-3’ (SEQ ID NO: 80) com pESC- URA como modelo; d) Origem de replicação de E. coli, obtida por PCR com o uso dos iniciadores 5’-
ATGTCACCCGCAGTTCTGTGTCGTAGTCATCAACATAGCACCTATCCTTTGGCAT CTCGGTGAGCAAAAGGCCAGCAAAAGG-3’ (SEQ ID NO: 81) e 5’-
CTCAGATGTACGGTGATCGCCACCATGTGACGGAAGCTATCCTGACAGTGTAGC AAGTGCTGAGCGTCAGACCCCGTAGAA-3’ (SEQ ID NO: 82) com o plasmídeo pESC-URA como modelo; e) um fragmento composto pelos últimos 60 nucleotídeos do fragmento "d", 200 nucleotídeos a jusante do códon de parada do gene de levedura PGK1, da sequência de codificação da sintase GGPP CrtE otimizada por códon para sua expressão em S. cerevisiae (SEQ ID NO: 62), o promotor de levedura bidirecional de GAL10/GAL1, a sequência de codificação de TalVeTPP otimizada por códon para sua expressão em S. cerevisiae (SEQ ID NO: 65), 200 nucleotídeos a jusante do códon de parada do gene de levedura CYC1 e a sequência 5'-
ATTCCTAGTGACGGCCTTGGGAACTCGATACACGATGTTCAGTAGACCGCTCAC ACATGG-3’(SEQ ID NO: 83), esse fragmento foi obtido por síntese de DNA (ATUM, Menlo Park, CA 94025) e f) um fragmento composto pelos últimos 60 nucleotídeos do fragmento "e", 200 nucleotídeos a jusante do códon de parada do gene de levedura CYC1, a sequência de codificação da sintase SmCPS2 otimizada por códon para sua expressão em S. cerevisiae (SEQ ID NO: 63), o promotor de levedura bidirecional de GAL10/GAL1 e 60 nucleotídeos correspondentes ao início do fragmento “a”, esse fragmento foi obtido por síntese de DNA (ATUM, Menlo Park, CA 94025).
[00391] Todas as cepas foram transformadas com os fragmentos necessários para a montagem do plasmídeo in vivo. As transformações de leveduras foram realizadas com o protocolo de acetato de lítio como descrito em Gietz and Woods, Methods Enzymol., 2002, 350:87 a 96. A mistura de transformação foi plaqueadas em meio SmLeu contendo 6,7 g/l de Base de Nitrogênio de Levedura sem aminoácidos (BD Difco, Nova Jersey, EUA), 1,6 g/l de suplemento Dropout sem leucina (Sigma Aldrich, Missouri, EUA), 20 g/l de glicose e 20 g/l de ágar. A placa foi incubada por 3 a 4 dias a 30 ºC. Colônias individuais foram usadas para produzir copalol e copalal em tubos de vidro contendo 2 ml de meio, como descrito em Westfall et al., Proc Natl Acad Sci USA, 2012, 109:E111 a 118 e dodecano como sobreposição orgânica.
[00392] Sob essas condições de cultura, a concentração média mais elevada de copalol foi de 153,51 mg/l produzida pela cepa YST152 contendo o plasmídeo de biossíntese de copalol. A concentração média mais alta de copalal foi 98,47 mg/l produzida pela cepa YST149 com o plasmídeo de biossíntese de copalol. A porcentagem média de conversão de copalol para copalal nas cepas YST149, YST150, YST151 e YST152 contendo o plasmídeo de biossíntese de copalol foi de 61,6%, 39,9%, 30,1% e 22,1%, respectivamente. A produção de copalol e copalal foi identificada e quantificada com o uso da análise GC-MS (Figura 18) com um padrão interno.
SEQUÊNCIAS COMO APLICADAS NA PRESENTE INVENÇÃO: SEQ ID NO Nome Fonte Tipo
1 cDNA otimizado POR Talaromyces na TalVeTPP para ORF verruculosus apenas
2 Sequência de “ aa aminoácidos TalVeTPP
3 cDNA de tipo selvagem “ na TalVeTPP
4 CDNA otimizado por “ na TalVeTPP incluindo sequências não codificantes
5 CDNA otimizado por Aspergillus wentii na AspWeTPP
6 Sequência de “ aa aminoácidos AspWeTPP
7 cDNA de tipo selvagem “ na AspWeTPP
8 CDNA otimizado por “ na AspWeTPP incluindo extremidades não codificantes
9 CDNA otimizado por Helicocarpus griseus na
HelGriTPP1
10 Sequência de “ aa aminoácidos HelGriTPP1
11 cDNA de tipo selvagem “ na HelGriTPP1
12 CDNA otimizado por Umbilicaria pustulata na UmbPiTPP1
13 Sequência de “ aa aminoácidos UmbPiTPP1
14 cDNA de tipo selvagem “ na UmbPiTPP1
15 CDNA otimizado por Talaromyces na TalVeTPP2 verruculosus
16 Sequência de “ aa aminoácidos TalVeTPP2
17 cDNA de tipo selvagem “ na TalVeTPP2
18 CDNA otimizado por Hydnomerulius pinastri na HydPiTPP1
19 Sequência de “ aa aminoácidos HydPiTPP1
20 cDNA de tipo selvagem “ na
HydPiTPP1
21 CDNA otimizado por Talaromyces na TalVeTPP1 cellulolyticus
22 Sequência de “ aa aminoácidos TalVeTPP1
23 cDNA de tipo selvagem “ na TalVeTPP1
24 CDNA otimizado por Talaromyces marneffei na TalMaTPP1
25 Sequência de “ aa aminoácidos TalMaTPP1
26 cDNA de tipo selvagem “ na TalMaTPP1
27 CDNA otimizado por Talaromyces na TalAstroTPP1 atroroseus
28 Sequência de “ aa aminoácidos TalAstroTPP1
29 cDNA de tipo selvagem “ na TalAstroTPP1
30 CDNA otimizado por Penicillium na PeSubTPP1 subrubescens
31 Sequência de “ aa aminoácidos
PeSubTPP1
32 cDNA de tipo selvagem “ na PeSubTPP1
33 SmCPS, cDNA Salvia miltiorrhiza na otimizado por códon
34 Sequência de “ aa aminoácidos, SmCPS
35 CrtE, cDNA otimizado Pantoea agglomerans na por códon GGPS
36 CrtE, Sequência de “ aa aminoácidos GGPS
37 cDNA otimizado por “ na SsLPS para codificação de
38 Sequência de “ aa aminoácidos SsLPS
39 cDNA otimizado por Triticum aestivum na TaTps1-del59
40 TaTps1-del59, “ AA difosfato de copalilo sintase truncada
41 cDNA otimizado por Pseudomonas sp. 19- na CymB rlim
42 Sequência de “ aa aminoácidos, CymB
43 cDNA otimizado por Aspergillus wentii DTO na
AspWeADH1 134E9
44 Sequência de “ aa aminoácidos, AspWeADH1
45 cDNA otimizado por Pseudomonas na PsAerADH1 aeruginosa;
46 Sequência de “ aa aminoácidos, PsAerADH1
47 cDNA otimizado por Azoarcus toluclasticus na AzTolADH1
48 Sequência de “ aa aminoácidos, AzTolADH1
49 cDNA otimizado por Aromatoleum na AroAroADH1 aromaticum
50 Sequência de “ aa aminoácidos, AroAroADH1
51 cDNA otimizado por Thauera terpenica na ThTerpADH1
52 Sequência de “ aa aminoácidos, ThTerpADH1
53 CDNA otimizado por Castellaniella na CdGeoA defragrans
54 Sequência de “ aa aminoácidos, CdGeoA
55 cDNA otimizado por Valeriana officinalis na VoADH1
56 Sequência de “ aa aminoácidos, VoADH1
57 motivo de assinatura artificial AA de sítio ativo
58 motivo de assinatura artificial AA de sítio ativo
59 cDNA otimizado por Talaromyces NA PvCPS ferruculosus
60 Sequência de Talaromyces AA aminoácidos, PvCPS ferruculosus
61 Sequência RBS artificial NA
62 cDNA otimizado por Pantoea agglomerans NA CrtE (levedura)
63 cDNA otimizado por Salvia miltiorrhiza NA SmCPS2 (levedura)
64 Sequência de Salvia miltiorrhiza AA aminoácidos, SmCPS2
65 cDNA otimizado por Talaromyces NA TalVeTPP (levedura) verruculosus
66 cDNA otimizado por Azoarcus toluclasticus NA AzTolADH1 (levedura)
67 cDNA otimizado por Pseudomonas NA
PSAeroADH1 aeruginosa (levedura)
68 cDNA otimizado por Hyphozyma roseonigra NA SCH23-ADH1 (levedura)
69 Sequência de Hyphozyma roseonigra AA aminoácidos, SCH23- ADH1
70 cDNA otimizado por Cryptococcus albus NA SCH24-ADH1a (levedura)
71 SCH24-ADH1a Cryptococcus albus AA
72 Sequência para artificial NA recombinação homóloga
73 Sequência para artificial NA recombinação homóloga
74 Sequência para artificial NA recombinação homóloga
75 Iniciador para artificial NA marcador de levedura LEU2
76 Iniciador para artificial NA marcador de levedura LEU2
77 Iniciador para artificial NA marcador bacteriano AmpR 78 Iniciador para artificial NA marcador bacteriano AmpR 79 Iniciador para origem artificial NA de replicação de levedura 80 Iniciador para origem artificial NA de replicação de levedura 81 Iniciador para origem artificial NA de replicação de E.coli 82 Iniciador para origem artificial NA de replicação de E.coli 83 Sequência para artificial NA recombinação homóloga NA = Ácido nucleico AA = Aminoácido cDNA otimizado por TalVeTPP para ORF apenas – SEQ ID NO: 1
ATGAGCAATGACACGACGACCACCGCGAGCGCCGGTACTGCAACTTCTAGCCG TTTTCTGAGCGTCGGCGGCGTTGTGAATTTTCGCGAGCTGGGTGGCTATCCATG CGACAGCGTGCCGCCGGCTCCGGCAAGCAACGGTTCGCCTGATAATGCGTCC GAGGCAACGCTGTGGGTTGGTCACTCCAGCATTCGTCCGGGTTTCCTGTTCCG CAGCGCGCAGCCGAGCCAGATTACGCCGGCGGGTATCGAAACGCTGATCCGC CAACTGGGCATCCAGACCATTTTTGATTTCCGTAGCCGTACCGAGATCGAACTG GTGGCGACCCGTTACCCGGACTCTCTGTTGGAAATTCCGGGCACCACGCGCTA TTCCGTCCCGGTTTTCTCCGAGGGTGACTATTCTCCGGCGAGCCTGGTGAAGC GCTATGGTGTTAGCAGCGATACCGCCACGGACAGCACCTCTAGCAAGAGCGCG AAGCCGACCGGCTTCGTTCATGCATACGAAGCCATTGCGCGCAGCGCCGCTGA GAACGGTAGCTTCCGTAAAATTACCGACCACATCATCCAGCATCCTGATCGTCC AATTTTGTTCCACTGTACCCTGGGTAAAGACCGTACGGGTGTCTTTGCGGCGCT GTTGCTGAGCCTGTGTGGTGTGCCGGACGAAACCATCGTCGAAGATTACGCGA TGACCACCGAAGGCTTTGGTGCATGGCGTGAGCACCTGATCCAACGTCTGCTG CAACGTAAAGACGCTGCAACCCGTGAAGATGCCGAGAGCATCATTGCGTCGCC GCCGGAGACTATGAAAGCATTTCTGGAAGATGTTGTGGCAGCGAAATTTGGTGG CGCGCGTAACTACTTCATTCAACATTGCGGCTTCACTGAAGCTGAAGTCGATAA
GCTGAGCCACACCCTGGCGATCACGAACTAA Sequência de aminoácidos TalVeTPP – SEQ ID NO: 2
MSNDTTTTASAGTATSSRFLSVGGVVNFRELGGYPCDSVPPAPASNGS PDNASEATLWVGHSSIRPGFLFRSAQPSQITPAGIETLIRQLGIQTIFDFRSRTEIELV ATRYPDSLLEIPGTTRYSVPVFSEGDYSPASLVKRYGVSSDTATDSTSSKSAKPTGF VHAYEAIARSAAENGSFRKITDHIIQHPDRPILFHCTLGKDRTGVFAALLLSLCGVPDE TIVEDYAMTTEGFGAWREHLIQRLLQRKDAATREDAESIIASPPETMKAFLEDVVAA
KFGGARNYFIQHCGFTEAEVDKLSHTLAITN CDNA TalVeTPP de tipo selvagem – SEQ ID NO: 3 Atgtctaatgacaccactaccacggcttctgccggaacagcaacttcttcgcggtttctttccgtggggg gagttgtgaacttccgtgaactgggcggttacccatgtgattctgtccctcctgctcctgcctcaaacggctcaccggaca atgcatctgaagcgaccctttgggttggccactcgtccattcggcctggatttctgtttcgatcggcacagccgtctcagat taccccggccggtattgagacattgatccgccagcttggcatccagacaatttttgactttcgttcaaggacggaaattg agcttgttgccactcgctatcctgattcgctacttgagatacctggcacgactcgctattccgtgcccgtcttctcggaagg cgactattccccagcgtcattagtcaagaggtacggagtgtcctccgatactgcaaccgattccacttcctccaaaagt gctaagcctacaggattcgtccacgcatatgaggctatcgcacgcagtgcagcagaaaacggcagttttcgtaagat aacggaccacataatacaacatccggaccggcctattctgtttcactgtacactggggaaagaccgaaccggtgtgttt gcagcattgttattgagtctttgcggggtaccagacgagacgatagttgaagactatgctatgactaccgagggatttgg agcctggcgggaacatctaattcaacgcttgctacaaaggaaggatgcagctacgcgcgaggatgcagaatccatt attgccagccccccggagactatgaaggcttttctagaagatgtggtagcagccaagttcgggggtgctcgaaattact ttatccagcactgtggatttacggaagctgaggttgataagttaagccatacactggccattacgaattga CDNA otimizado por TalVeTPP incluindo sequências não codificantes – SEQ ID NO: 4
GGTACCAAGGAGGTAAAAAATGAGCAATGACACGACGACCACCGCG AGCGCCGGTACTGCAACTTCTAGCCGTTTTCTGAGCGTCGGCGGCGTTGTGAA TTTTCGCGAGCTGGGTGGCTATCCATGCGACAGCGTGCCGCCGGCTCCGGCAA GCAACGGTTCGCCTGATAATGCGTCCGAGGCAACGCTGTGGGTTGGTCACTCC AGCATTCGTCCGGGTTTCCTGTTCCGCAGCGCGCAGCCGAGCCAGATTACGCC GGCGGGTATCGAAACGCTGATCCGCCAACTGGGCATCCAGACCATTTTTGATTT CCGTAGCCGTACCGAGATCGAACTGGTGGCGACCCGTTACCCGGACTCTCTGT TGGAAATTCCGGGCACCACGCGCTATTCCGTCCCGGTTTTCTCCGAGGGTGAC TATTCTCCGGCGAGCCTGGTGAAGCGCTATGGTGTTAGCAGCGATACCGCCAC GGACAGCACCTCTAGCAAGAGCGCGAAGCCGACCGGCTTCGTTCATGCATACG AAGCCATTGCGCGCAGCGCCGCTGAGAACGGTAGCTTCCGTAAAATTACCGAC CACATCATCCAGCATCCTGATCGTCCAATTTTGTTCCACTGTACCCTGGGTAAAG ACCGTACGGGTGTCTTTGCGGCGCTGTTGCTGAGCCTGTGTGGTGTGCCGGAC GAAACCATCGTCGAAGATTACGCGATGACCACCGAAGGCTTTGGTGCATGGCG TGAGCACCTGATCCAACGTCTGCTGCAACGTAAAGACGCTGCAACCCGTGAAG ATGCCGAGAGCATCATTGCGTCGCCGCCGGAGACTATGAAAGCATTTCTGGAA GATGTTGTGGCAGCGAAATTTGGTGGCGCGCGTAACTACTTCATTCAACATTGC GGCTTCACTGAAGCTGAAGTCGATAAGCTGAGCCACACCCTGGCGATCACGAA
CTAACTCGAG cDNA otimizado por AspWeTPP – SEQ ID NO: 5
ATGGCGTCTGTCCCTGCTCCACCGTTTGTTCATGTTGAAGGTATGTCT AATTTTCGTAGCATCGGTGGCTACCCGCTGGAGACTGCCTCCACGAATAACCAT CGCTCGACCCGTCAAGGCTTCGCGTTTCGTAGCGCGGACCCGACGTATGTGAC GCAGAAAGGCCTGGAAACCATTCTGTCCCTGGATATTACCCGCGCATTTGACTT GCGTAGCTTGGAAGAAGCAAAGGCACAACGTGCGAAGTTGCAGGCCGCGAGC GGTTGTCTGGATTGCAGCATTAGCCAACACATGATCCACCAACCGACCCCGCTG TTCCCGGATGGTGACTGGTCCCCGGAAGCGGCGGGTGAGCGCTACTTGCAGTA CGCACAAGCTGAGGGTGATGGTATCAGCGGTTATGTCGAAGTTTATGGTAATAT GCTGGAAGAGGGCTGGATGGCGATCCGTGAGATTCTGCTGCACGTCCGTGACC GCCCGACCGAAGCATTCCTGTGCCACTGTTCCGCCGGTAAAGATCGTACGGGT ATCGTGATTGCTGTTCTGCTCAAAGTCGCGGGTTGCAGCGACGACCTGGTGTGT CGTGAGTACGAACTGACCGAGATTGGCCTGGCGCGCCGTAGAGAGTTCATCGT TCAGCATCTGCTGAAGAAACCGGAAATGAACGGCAGCCGTGAGCTGGCGGAGC GCGTCGCAGGCGCCCGTTACGAGAACATGAAAGAAACCCTGGAAATGGTGCAG ACCCGTTACCGCGGCATGCGCGGCTATTGCAAAGAAATCTGCGGTCTGACCGA CGAAGATCTGAGCATTATCCAGGGTAACCTGACGAGCCCGGAGAGCCCGATTT
TCTAA Sequência de aminoácidos AspWeTPP – SEQ ID NO: 6
MASVPAPPFVHVEGMSNFRSIGGYPLETASTNNHRSTRQGFAFRSADP TYVTQKGLETILSLDITRAFDLRSLEEAKAQRAKLQAASGCLDCSISQHMIHQPTPLF PDGDWSPEAAGERYLQYAQAEGDGISGYVEVYGNMLEEGWMAIREILLHVRDRPT EAFLCHCSAGKDRTGIVIAVLLKVAGCSDDLVCREYELTEIGLARRREFIVQHLLKKP EMNGSRELAERVAGARYENMKETLEMVQTRYRGMRGYCKEICGLTDEDLSIIQGNL
TSPESPIF CDNA AspWeTPP de tipo selvagem – SEQ ID NO: 7
ATGGCATCTGTACCAGCTCCCCCATTTGTCCACGTCGAAGGAATGAG CAATTTCCGATCGATAGGAGGATATCCCCTTGAGACAGCATCGACAAACAATCA CCGCTCCACGAGGCAAGGATTCGCATTTCGCAGTGCCGATCCAACCTACGTCA CCCAGAAAGGCCTGGAAACCATCCTTTCGCTCGACATCACTCGAGCCTTTGACC TCCGCTCACTGGAAGAAGCAAAGGCACAGCGCGCAAAACTCCAGGCCGCCTCA GGATGTCTCGACTGCAGCATCAGCCAGCACATGATCCACCAGCCCACACCCCT ATTTCCAGATGGGGACTGGAGTCCAGAGGCCGCAGGGGAGCGGTATCTGCAGT ACGCCCAGGCTGAGGGAGATGGGATATCGGGCTACGTGGAGGTCTACGGAAA CATGCTCGAGGAAGGTTGGATGGCGATTCGCGAGATTCTGCTTCATGTCCGGG ACCGGCCTACAGAGGCGTTTCTATGCCATTGTAGTGCAGGGAAAGATCGTACG GGGATTGTCATTGCGGTTTTGTTGAAGGTTGCAGGGTGCTCGGATGATCTTGTG TGCAGAGAGTATGAGTTGACCGAGATCGGGTTGGCTCGACGGAGGGAGTTTAT CGTGCAGCATCTGCTTAAGAAGCCGGAAATGAATGGATCGAGGGAACTGGCCG AAAGAGTGGCGGGGGCCAGGTATGAGAATATGAAGGAAACGCTGGAGATGGTG CAAACTAGATATAGAGGGATGAGGGGCTATTGCAAGGAGATTTGCGGCTTGACC GACGAAGATCTATCTATTATCCAGGGGAACTTGACTAGTCCGGAGAGTCCTATC
TTCTAA CDNA otimizado por AspWeTPP incluindo extremidades não codificantes – SEQ ID NO: 8
GGTACCAAGGAGGTAAAAAATGGCGTCTGTCCCTGCTCCACCGTTTG TTCATGTTGAAGGTATGTCTAATTTTCGTAGCATCGGTGGCTACCCGCTGGAGA CTGCCTCCACGAATAACCATCGCTCGACCCGTCAAGGCTTCGCGTTTCGTAGCG CGGACCCGACGTATGTGACGCAGAAAGGCCTGGAAACCATTCTGTCCCTGGAT ATTACCCGCGCATTTGACTTGCGTAGCTTGGAAGAAGCAAAGGCACAACGTGCG AAGTTGCAGGCCGCGAGCGGTTGTCTGGATTGCAGCATTAGCCAACACATGAT CCACCAACCGACCCCGCTGTTCCCGGATGGTGACTGGTCCCCGGAAGCGGCG GGTGAGCGCTACTTGCAGTACGCACAAGCTGAGGGTGATGGTATCAGCGGTTA TGTCGAAGTTTATGGTAATATGCTGGAAGAGGGCTGGATGGCGATCCGTGAGAT TCTGCTGCACGTCCGTGACCGCCCGACCGAAGCATTCCTGTGCCACTGTTCCG CCGGTAAAGATCGTACGGGTATCGTGATTGCTGTTCTGCTCAAAGTCGCGGGTT GCAGCGACGACCTGGTGTGTCGTGAGTACGAACTGACCGAGATTGGCCTGGCG CGCCGTAGAGAGTTCATCGTTCAGCATCTGCTGAAGAAACCGGAAATGAACGG CAGCCGTGAGCTGGCGGAGCGCGTCGCAGGCGCCCGTTACGAGAACATGAAA GAAACCCTGGAAATGGTGCAGACCCGTTACCGCGGCATGCGCGGCTATTGCAA AGAAATCTGCGGTCTGACCGACGAAGATCTGAGCATTATCCAGGGTAACCTGAC
GAGCCCGGAGAGCCCGATTTTCTAACTCGAG cDNA otimizado por HelGriTPP1 – SEQ ID NO: 9
ATGGCATCCCCACCAGGTCATCCGTTCGTTCAAGTTGAAGGCGTTAA TAATTTTCGCTCTGTGGGTGGCTATCCGATTACGCCTAGCAGCGATGCGCGCTT CACGCGTGACAACTTTATCTACCGTAGCGCTGATCCGTGTTACATTACTCCGGA AGGCCGTAGCAAGATTCGCAGCCTGGGTATCACCACCGTGTTCGATCTGCGTA GCCAGCCGGAGGTTGACAAGCAACTGGCGAAAGACCCGAGCAGCGGTGTGCC GATTGCGGATGGTGTCATTCGTCGCTTCACCCCGGTTTTTAGCCGCGAGGATTG GGGTCCGGAAGCATCCGCGGTTCGTCACAACCTGTATGCAGACGCGTCCGGTG CTAGCGGTTACGTCGATGTGTACGCGGATATCCTGGAAAACGGTGGCGCAGCG TTCCGTGAGATCCTGCTGCACGTGCGTGACCGTCCGGGTGACGCTCTGTTGTG CCACTGCTCCGCAGGCAAAGACCGTACCGGCGTTGCGATTGCGATCCTGCTCA AACTGGCCGGTTGCGAAGATGAGTGCATTTCGAAAGAGTATGAACTGACCGAG GTCGGTCTGGCCAGCCGTAAAGAATTTATTATCGAGTACCTGATTAAGCAACCT GAGCTGGAAGGCGACCGTGCGAAAGCCGAGAAAATTGCTGGCGCGAAATACGA AAACATGTTGGGTACGCTGCAGATGATGGAACAGAAATATGGTGGCGTTGAGG GCTACGTGAAGGCCTACTGTAAGTTGACGGATAAAGACATCGCAACCATCCGTC
GCAATCTGGTCAGCGGTGACAAGATGATTGCGTAA Sequência de aminoácidos HelGriTPP1 – SEQ ID NO: 10
MASPPGHPFVQVEGVNNFRSVGGYPITPSSDARFTRDNFIYRSADPCYI TPEGRSKIRSLGITTVFDLRSQPEVDKQLAKDPSSGVPIADGVIRRFTPVFSREDWG PEASAVRHNLYADASGASGYVDVYADILENGGAAFREILLHVRDRPGDALLCHCSA GKDRTGVAIAILLKLAGCEDECISKEYELTEVGLASRKEFIIEYLIKQPELEGDRAKAE
KIAGAKYENMLGTLQMMEQKYGGVEGYVKAYCKLTDKDIATIRRNLVSGDKMIA CDNA HelGriTPP1 de tipo selvagem – SEQ ID NO: 11
ATGGCATCACCCCCAGGGCACCCTTTCGTGCAAGTTGAAGGCGTCAA CAACTTCCGCTCTGTAGGAGGATATCCCATCACCCCATCCTCCGACGCACGCTT CACACGAGATAACTTCATCTATCGCAGCGCCGACCCGTGTTACATCACGCCCGA AGGACGCTCCAAAATCCGCTCACTCGGAATCACGACTGTTTTTGATCTGCGCTC CCAGCCAGAGGTTGACAAGCAGCTTGCCAAAGACCCTTCCTCAGGGGTTCCAA TCGCCGACGGCGTCATTAGACGTTTTACGCCGGTATTTTCCCGAGAGGATTGGG GTCCGGAAGCTTCCGCCGTCCGCCATAATCTGTATGCTGATGCCTCTGGGGCTT CTGGGTACGTCGATGTGTATGCCGACATTCTGGAGAATGGAGGGGCGGCATTC CGCGAGATCTTGTTGCACGTAAGAGACCGGCCTGGTGATGCGCTGCTATGTCA TTGTAGTGCCGGAAAAGATCGTACCGGCGTGGCGATAGCGATACTGCTCAAGC TTGCGGGGTGCGAGGATGAATGTATCTCAAAGGAGTACGAGCTGACCGAGGTT GGTCTAGCCTCAAGAAAGGAGTTCATTATAGAGTACCTCATCAAGCAGCCGGAA CTAGAGGGGGATAGAGCAAAAGCTGAAAAAATTGCGGGAGCCAAATATGAGAA CATGTTAGGGACCTTGCAAATGATGGAACAGAAATACGGGGGTGTTGAGGGGT ACGTGAAAGCGTATTGCAAGTTGACGGATAAAGATATTGCTACGATACGCAGGA
ATCTCGTCTCAGGTGACAAAATGATTGCCTAG cDNA otimizado por UmbPiTPP1 – SEQ ID NO: 12
ATGTCCCTGCTGCCTAGCCCACCGTTTGTTCCAGTTGAAGGTATTCA CAATTTTCGCGATCTGGGCGGCTATCCGGTTAGCACCAGCCCGAGCAAGACCA TTCGTCGCAATATCATCTTTCGTTGTGCCGAACCGTCGAAAATCACCCCGAACG GCATTCAAACGCTGCAGAGCCTGGGTGTGGCGACGTTCTTTGACCTCCGTAGC GGTCCGGAAATCGAGAAAATGAAAGCGCATGCACCGGTCGTTGAGATCAAGGG TATTGAGCGTGTTTTCGTGCCGGTGTTCGCGGATGGTGATTATAGCCCGGAACA AATTGCGCTGCGTTACAAAGACTATGCGTCCTCTGGCACTGGTGGCTTCACCCG TGCGTACCACGACATTCTGCGTTCTGCCCCTCCGAGCTATCGTCGTATCCTGCT GCACCTGGCAGAGAAGCCGAACCAGCCGTGCGTGATCCACTGTACCGCTGGCA AAGACCGCACGGGTGTTCTGGCAGCGCTGATTCTGGAACTGGCGGGTGTCGAT CAAGACACCATCGCGCATGAGTACGCCCTGACCGAGCTGGGCCTGAAGGCATG GCGTCCGACGGTTGTCGAGCACTTACTGCAGAATCCGGCGCTGGAAGGCAATC GCGAGGGTGCATTGAATATGGTCAGCGCTCGTGCGGAGAACATGCTGGCCGCC TTGGAAATGATTCGCGAGATCTACGGTGGTGCTGAGGCGTACGTGAAAGAAAA GTGCGGTCTGAGCGACGAAGATATTGCACGCATTCGCCAGAACATTTTGCATAC
GCCGAGCCCGTAA Sequência de aminoácidos UmbPiTPP1 – SEQ ID NO: 13
MSLLPSPPFVPVEGIHNFRDLGGYPVSTSPSKTIRRNIIFRCAEPSKITPN GIQTLQSLGVATFFDLRSGPEIEKMKAHAPVVEIKGIERVFVPVFADGDYSPEQIALR YKDYASSGTGGFTRAYHDILRSAPPSYRRILLHLAEKPNQPCVIHCTAGKDRTGVLA ALILELAGVDQDTIAHEYALTELGLKAWRPTVVEHLLQNPALEGNREGALNMVSARA
ENMLAALEMIREIYGGAEAYVKEKCGLSDEDIARIRQNILHTPSP CDNA UmbPiTPP1 de tipo selvagem – SEQ ID NO: 14
ATGTCTCTGCTACCGTCACCTCCCTTCGTACCCGTTGAGGGTATCCA CAACTTCCGGGACCTAGGCGGCTACCCCGTCTCGACTTCCCCTTCCAAGACCAT ACGTCGCAACATCATCTTTCGCTGCGCCGAACCCTCGAAAATCACTCCCAATGG CATCCAGACGCTCCAATCTTTGGGCGTCGCTACGTTCTTCGACCTCCGCTCCGG CCCGGAAATCGAGAAGATGAAAGCACATGCACCTGTCGTCGAGATTAAGGGCA TCGAGCGTGTGTTCGTTCCCGTCTTCGCCGACGGGGATTACTCGCCCGAACAA ATCGCTCTGCGATACAAAGACTACGCTTCCAGCGGAACGGGGGGTTTTACCAG GGCGTACCATGATATCCTCCGAAGTGCCCCTCCGAGCTATCGGCGCATACTATT ACATCTGGCGGAGAAGCCCAACCAGCCATGCGTCATTCATTGCACGGCCGGGA AAGATAGGACGGGCGTATTGGCGGCGTTGATACTCGAGTTGGCCGGGGTTGAT CAGGATACAATTGCGCACGAGTACGCATTGACGGAACTGGGGTTGAAGGCCTG GCGTCCCACTGTGGTGGAGCACCTCTTGCAGAATCCAGCGTTGGAGGGAAATC GGGAAGGGGCATTGAACATGGTCAGCGCGAGGGCAGAGAACATGCTGGCAGC CTTGGAGATGATCCGGGAGATCTATGGCGGCGCCGAAGCATATGTGAAGGAGA AGTGTGGCCTCAGCGACGAAGACATTGCGCGGATACGGCAGAATATTCTACAC
ACGCCATCTCCGTGA cDNA otimizado por TalVeTPP2 – SEQ ID NO: 15
ATGTCTGTCACCGAACATGTTGTCGAAGCTAGCACCCCGTCCACTCT GCCGCCACCGTTCATTCACGTGGACGGTGTTCCGAACTTCCGTGACATTGGTG GCTATCCGATTACCGATCTGCTGAGCACCCGTCGCAATTTCGTTTATCGCTCCG CAGTTCCTACCCGCATCACCCCAACGGGCCTGCAGACGCTGACCCAAGATCTG CAGATTACGACGGTCTACGACTTACGTTCGAATGCTGAGCTGCGTAAAGATCCT ATCGCGAGCAGCCCGTTGGACACCCACGACAGCGTGACTGTCCTGCATACCCC GGTTTTCCCGGAGCGCGATTCTAGCCCGGAACAGCTGGCAAAGCGTTTTGCCA ACTATATGAGCGCGAACGGTTCCGAGGGTTTCGTTGCGGCGTACGCAGAGATT CTGCGTGATGGTGTGGATGCCTACCGCAAGGTTTTTGAACACGTGCGTGACCG TCCGCGTGATGCGTTTCTGGTGCACTGCACCGGTGGCAAAGACCGTACGGGTG TGTTGGTTGCGCTGATGCTGTTGGTGGCAGGCGTCAAAGACCGTGACGTTATTG CCGATGAGTACAGCCTGACGGAAAAGGGTTTTGCGGCTGTCATCAAAGCCGAT GCTGCGGAAAAGATCATCAAAGACATGGGTGTTGACGGTGCCAATCGTGCGGG CATCGAGCGTCTGTTGAGCGCACGCAAAGAAAACATGAGCGCGACCCTGGAGT ACATTGAGAAGCAATTTGGTGGCGCAGAGGGCTATCTGCGCGACCAACTGGGT TTCGGCGACGAAGATGTGGAACAGATCCGTAAGAGCCTGGTCGTTGAGGATAA
AGGCCTGTTCTAA Sequência de aminoácidos TalVeTPP2 – SEQ ID NO: 16
MSVTEHVVEASTPSTLPPPFIHVDGVPNFRDIGGYPITDLLSTRRNFVYR SAVPTRITPTGLQTLTQDLQITTVYDLRSNAELRKDPIASSPLDTHDSVTVLHTPVFP ERDSSPEQLAKRFANYMSANGSEGFVAAYAEILRDGVDAYRKVFEHVRDRPRDAF LVHCTGGKDRTGVLVALMLLVAGVKDRDVIADEYSLTEKGFAAVIKADAAEKIIKDMG VDGANRAGIERLLSARKENMSATLEYIEKQFGGAEGYLRDQLGFGDEDVEQIRKSL
VVEDKGLF CDNA TalVeTPP2 de tipo selvagem – SEQ ID NO: 17
ATGAGCGTCACAGAACATGTAGTCGAAGCCTCGACACCATCAACCCT TCCACCACCCTTCATCCATGTCGACGGCGTCCCCAACTTCCGCGACATCGGCG GCTACCCCATCACAGACTTACTGTCAACACGACGAAACTTCGTGTATCGCTCCG CAGTCCCAACACGCATCACTCCCACAGGTCTACAGACACTCACCCAAGACCTCC AAATCACAACAGTCTACGACCTACGCTCCAACGCTGAACTGCGCAAGGATCCCA TTGCCTCCAGCCCTCTAGACACCCATGACTCTGTAACGGTGCTACACACCCCCG TCTTTCCCGAACGGGACTCAAGTCCCGAACAACTCGCAAAGAGGTTTGCGAATT ACATGTCCGCCAACGGCTCGGAAGGGTTTGTAGCCGCCTACGCCGAGATTTTG CGTGATGGCGTTGATGCATACCGCAAGGTGTTTGAGCATGTCCGTGATCGGCC CCGGGATGCGTTTTTGGTGCATTGTACTGGTGGGAAGGATAGAACGGGTGTCC TTGTAGCGCTCATGTTACTTGTTGCGGGTGTCAAGGATAGAGATGTGATTGCCG ACGAGTACTCGTTGACGGAGAAGGGGTTTGCTGCTGTTATTAAGGCGGATGCG GCGGAGAAGATTATAAAGGATATGGGAGTGGATGGGGCGAATAGGGCGGGCAT TGAGAGATTGCTGTCGGCGAGGAAGGAGAATATGAGTGCTACGTTGGAGTATAT CGAGAAACAGTTTGGTGGGGCGGAGGGTTATTTGAGGGATCAGTTAGGGTTTG GTGATGAGGATGTTGAGCAGATTAGGAAGAGTCTTGTCGTGGAGGATAAGGGTT
TATTTTAG cDNA otimizado por HydPiTPP1 – SEQ ID NO: 18
ATGACTGCAACCGACAATGGCTTAGAACCGCTGGACCCTGCATACGT TGCTGATGTGTTGAGCCGTCCGCCGTTTGTCCAGATCTCCGGCGTGTGTAACGT CAGAGATCTGGGCAGCTATCCGACCGCTACCCCGAATGTGATTACCAAGCCTG GTTATGCATACCGTGGTGCCGAAGTTTCCAATATCACCGAAGAGGGCAGCCAAC AAATGAAAGCACTGGGTATTACCACGATCTTTGATCTGCGTTCTGACCCAGAGA TGCAGAAGTACAGCACGCCGATTCCGCATATCGAGGGTGTCCTGATTCTGCGTA CCCCGGTGTTCGCCACCGAGGACTATAGCCCGGAGTCGATGGCGAAGCGTTTT GAGCTGTACGCGTCTGGTACGACCGAAGCATTCATGAAGCTGTATAGCCAGATT CTGGACCACGGCGGCAAAGCGTTCGGTACTATTCTGCGTCATGTTCGTGACCG CCCGAACAGCGTTTTTCTGTTTCACTGCACGGCCGGTAAAGATCGCACGGGCAT TATTGCGGCCATCCTGTTCAAATTGGCGGGTGTGGATGATCACTTGATCTGTCA GGACTACAGCCTGACGCGCATCGGTCGTGAGCCAGACCGTGAAAAAGTTCTGC GCCGTCTGCTGAATGAACCGCTGTTCGCGGCGAATACCGAGCTTGCGCTGCGC ATGTTGACGAGCCGCTACGAAACCATGCAAGCGACCCTGGGTCTGTTGAGCGA CAAATATGGCGGTGTGGAAGCATACGTCAAGAACTTCTGCGGTCTGACCGATAA CGACATCAGCGTTATCCGTACCAACCTGGTTGTGCCGACGAAAGCGCGTATGTA
A Sequência de aminoácidos HydPiTPP1 – SEQ ID NO: 19
MTATDNGLEPLDPAYVADVLSRPPFVQISGVCNVRDLGSYPTATPNVITK PGYAYRGAEVSNITEEGSQQMKALGITTIFDLRSDPEMQKYSTPIPHIEGVLILRTPVF ATEDYSPESMAKRFELYASGTTEAFMKLYSQILDHGGKAFGTILRHVRDRPNSVFLF HCTAGKDRTGIIAAILFKLAGVDDHLICQDYSLTRIGREPDREKVLRRLLNEPLFAANT ELALRMLTSRYETMQATLGLLSDKYGGVEAYVKNFCGLTDNDISVIRTNLVVPTKAR
M CDNA HydPiTPP1 de tipo selvagem – SEQ ID NO: 20
ATGACCGCAACAGACAACGGACTAGAACCCTTAGACCCTGCATATGT CGCAGATGTGCTCTCAAGACCACCATTCGTACAAATATCTGGTGTTTGCAACGT CCGTGATCTAGGATCCTACCCTACCGCCACTCCCAATGTCATAACAAAGCCGGG ATATGCATACCGGGGCGCAGAGGTCTCTAACATTACCGAAGAAGGTAGCCAGC AAATGAAGGCGCTAGGCATAACGACTATATTTGATCTTAGATCGGATCCAGAGA TGCAGAAATACAGCACTCCAATACCCCACATTGAAGGCGTACTGATATTGCGCA CGCCTGTCTTCGCGACCGAGGATTATAGTCCGGAAAGTATGGCCAAGAGATTTG AGCTATACGCAAGTGGTACTACTGAAGCATTTATGAAACTATACTCTCAAATACT AGACCATGGAGGCAAAGCCTTCGGAACAATTCTCCGGCACGTTCGGGACAGGC CAAATTCTGTCTTTCTTTTCCATTGCACTGCGGGGAAAGACCGGACCGGCATCA TTGCTGCAATTCTGTTCAAGCTCGCCGGCGTAGACGACCATCTCATATGTCAAG ATTACTCCCTCACACGAATAGGTCGCGAGCCTGATCGTGAAAAGGTCCTCCGGC GACTCTTGAATGAACCTCTATTTGCCGCCAACACGGAACTTGCACTACGAATGC TCACGTCTCGATATGAAACTATGCAAGCAACGTTGGGGCTTCTTAGCGATAAGT ATGGCGGGGTGGAGGCGTATGTGAAGAATTTCTGTGGGCTCACGGATAATGAT
ATATCGGTCATACGAACAAATCTCGTTGTACCTACAAAGGCGCGGATGTAG cDNA otimizado por TalCeTPP1 – SEQ ID NO: 21
ATGAGCAACGACACGACCAGCACCGCATCCGCAGGCACCGCAACTT CTTCGCGCTTTCTGAGCGTCGGTGGCGTGGTTAACTTCCGTGAGTTGGGTGGC TACCCGTGCGACAGCGTTCCTCCTGCACCAGCAAGCAATGGTAGCCCGGACAA TGCGAGCGAAGCGATTCTGTGGGTTGGTCACAGCAGCATTCGTCCGCGCTTCT TGTTTCGTAGCGCACAGCCGTCCCAGATCACCCCGGCCGGTATTGAAACGCTG ATTCGCCAACTCGGTATTCAAGCGATCTTTGACTTTCGTTCCCGTACCGAGATCC AACTGGTGGCAACCCGCTACCCAGATAGCCTGCTGGAAATTCCGGGCACGACT CGTTACTCTGTTCCGGTCTTTACCGAGGGCGACTACAGCCCGGCTTCTCTGGTT AAGCGTTATGGTGTCTCTAGCGACACGGCAACGGATAGCACCAGCTCAAAGTG CGCGAAACCGACCGGCTTTGTGCATGCTTATGAAGCGATTGCTCGTTCTGCCGC GGAGAACGGTAGCTTCCGCAAGATCACCGACCACATTATCCAACATCCGGATCG CCCGATCCTGTTTCACTGCACGCTGGGCAAAGACCGTACCGGTGTTTTCGCAG CGCTGCTGCTGAGCTTGTGTGGTGTCCCGAATGACACCATCGTGGAAGATTATG CGATGACGACCGAAGGCTTCGGTGTGTGGCGTGAGCACTTGATTCAGCGTCTG CTGCAGCGCAAAGATGCGGCTACGCGTGAAGATGCCGAGTTCATTATCGCGAG CCATCCGGAGAGCATGAAAGCGTTCCTGGAAGATGTCGTTGCGACCAAATTCG GTGACGCCCGCAACTACTTTATCCAGCACTGTGGTCTGACCGAAGCCGAAGTG GATAAGCTGATCCGTACGCTGGTGATCGCGAATTAA
Sequência de aminoácidos TalCeTPP1 – SEQ ID NO: 22
MSNDTTSTASAGTATSSRFLSVGGVVNFRELGGYPCDSVPPAPASNGS PDNASEAILWVGHSSIRPRFLFRSAQPSQITPAGIETLIRQLGIQAIFDFRSRTEIQLVA TRYPDSLLEIPGTTRYSVPVFTEGDYSPASLVKRYGVSSDTATDSTSSKCAKPTGFV HAYEAIARSAAENGSFRKITDHIIQHPDRPILFHCTLGKDRTGVFAALLLSLCGVPNDT IVEDYAMTTEGFGVWREHLIQRLLQRKDAATREDAEFIIASHPESMKAFLEDVVATK
FGDARNYFIQHCGLTEAEVDKLIRTLVIAN CDNA TalCeTPP1 de tipo selvagem – SEQ ID NO: 23
ATGTCTAATGACACCACTAGCACGGCTTCTGCCGGAACAGCAACTTC TTCGCGGTTTCTTTCTGTGGGCGGAGTTGTGAATTTCCGTGAACTGGGCGGTTA TCCATGTGATTCTGTCCCTCCTGCTCCTGCCTCAAACGGCTCACCGGACAACGC ATCTGAAGCGATCCTTTGGGTTGGCCACTCGTCCATTCGGCCTAGGTTTCTCTT TCGATCGGCACAGCCGTCTCAGATTACCCCGGCCGGTATTGAGACATTGATCC GCCAGCTTGGCATCCAGGCAATTTTTGACTTTCGTTCACGGACGGAAATTCAGC TTGTCGCCACTCGCTATCCTGATTCGCTACTCGAGATACCTGGTACGACTCGCT ATTCCGTGCCCGTCTTCACGGAGGGCGACTATTCCCCGGCGTCATTAGTCAAGA GGTACGGAGTGTCCTCCGATACTGCAACTGATTCCACTTCCTCCAAATGTGCCA AGCCTACAGGATTCGTCCACGCATATGAGGCTATCGCACGCAGCGCAGCAGAA AACGGCAGTTTTCGTAAAATAACGGACCACATAATACAACATCCGGACCGGCCT ATCCTGTTTCACTGTACATTGGGAAAAGACCGAACCGGTGTATTTGCAGCATTGT TATTGAGTCTTTGCGGGGTACCAAACGACACGATAGTTGAAGACTATGCTATGA CTACCGAGGGATTTGGGGTCTGGCGAGAACATCTAATTCAACGCCTGTTACAAA GAAAGGATGCAGCTACGCGTGAGGATGCAGAATTCATTATTGCCAGCCACCCG GAGAGTATGAAGGCTTTTCTAGAAGATGTGGTAGCAACCAAGTTCGGGGATGCT CGAAATTACTTTATCCAGCACTGTGGATTGACGGAAGCGGAGGTTGATAAGCTA
ATTCGGACACTGGTCATTGCGAATTGA cDNA otimizado por TalMaTPP1 – SEQ ID NO: 24
ATGTGGAATTTGCACTATTATATTCCGGGCTCTGCACCAGTTAATTTG AACGACATGCCGAACGATACGGCGACGACGGCTTCCGCAGGCACTAGCGCCAC GAGCCGCTTCCTCTGTGTCAGCGGTGTTGCGAACTTCCGTGAACTGGGTGGCT ATCCGTGCGACACCGTTCCTCCAGCACCGGCGAGCAATGGTAGCCCGCATAAT GCATCCGAGGCCACGCTGCAAGGTTCCCACTCTAGCATTCGTCCGGGCTTCAT CTTCCGTAGCGCGCAACCGAGCCAGATCAATCCGGCAGGCATCGCGACGCTGG CGCATGAACTGTCTATTCAAGTCATCTTCGACTTCCGTTCGCAGACCGAGATCC AGCTGGTCACCACCCACTACCCGGATAGCCTGTTGGAGATCCCGTGTACCACC CGTTACAGCGTGCCGGTGTTTAACGAGGGTGACTATAGCCCGGCTTCGCTGGT CAAGAAATACGGTGTGAGCCCGGACCCAGTGACGCATTCCGCTAGCAGCACCA GCGCGAATCCTGCCGGCTTTGTGCCGGCCTACGAAGCAATCGCTCGTAGCGCA GCCGAAAACGGTAGCTTTCGCAAAATCACCGAGCACATTATTCAGCACCCGGAT CAGCCGATTTTGTTTCATTGCACCCTGGGTAAAGATCGCACGGGTGTGTTTGCG GCCCTGCTGCTGAGCCTGTGCGGTGTTTCCACCGAAAAGATCGTGGAAGATTA CGCGATGACCACCGAGGGTTTCGGTGCTTGGCGTGAGCACCTGATTAAGCGCC TGCTGCAGCGTAAAGATGCGGCAACCCGCCAAGACGCTGAGTTCATCATTGCC AGCCACCCGGAAACCATGAAATCTTTTCTGGACGACGTTGTTCGTGCGAAGTTT GGCTCCGCGCGTAACTATTTCGTGCAACAGTGCGGTCTGACTGAGTACGAAGTT
GATAAGCTGATTCATACGCTGGTCATTATCAAGTAA Sequência de aminoácidos TalMaTPP1 – SEQ ID NO: 25
MWNLHYYIPGSAPVNLNDMPNDTATTASAGTSATSRFLCVSGVANFREL GGYPCDTVPPAPASNGSPHNASEATLQGSHSSIRPGFIFRSAQPSQINPAGIATLAH ELSIQVIFDFRSQTEIQLVTTHYPDSLLEIPCTTRYSVPVFNEGDYSPASLVKKYGVSP DPVTHSASSTSANPAGFVPAYEAIARSAAENGSFRKITEHIIQHPDQPILFHCTLGKD RTGVFAALLLSLCGVSTEKIVEDYAMTTEGFGAWREHLIKRLLQRKDAATRQDAEFII
ASHPETMKSFLDDVVRAKFGSARNYFVQQCGLTEYEVDKLIHTLVIIK CDNA TalMaTPP1 de tipo selvagem – SEQ ID NO: 26
ATGTGGAACCTACACTACTATATTCCTGGATCAGCACCAGTCAACTTG AACGACATGCCTAATGACACCGCTACCACGGCTTCTGCCGGAACATCAGCAACT TCACGGTTTCTTTGCGTGAGCGGAGTGGCGAATTTCCGTGAACTGGGCGGTTA CCCATGCGATACTGTCCCTCCTGCTCCTGCGTCAAACGGTTCACCGCACAATGC ATCTGAAGCGACCCTCCAGGGTAGTCATTCGTCTATTCGGCCTGGATTTATCTTT CGATCGGCTCAGCCGTCGCAGATTAACCCGGCTGGTATTGCCACATTAGCACA CGAGCTTAGCATCCAGGTGATTTTTGACTTTCGTTCGCAAACCGAAATTCAGCTT GTCACTACTCATTATCCTGATTCGCTACTTGAGATACCTTGCACGACTCGCTATT CCGTGCCGGTCTTCAATGAGGGCGACTATTCCCCAGCGTCGTTAGTCAAGAAGT ACGGGGTATCCCCCGATCCTGTAACACATTCCGCTTCCTCCACGAGTGCCAATC CTGCAGGATTTGTCCCCGCGTATGAAGCCATCGCACGAAGCGCAGCAGAAAAC GGCAGTTTCCGTAAAATAACAGAGCACATAATACAGCATCCGGACCAGCCGATC CTGTTTCATTGTACTCTGGGAAAGGACCGGACCGGAGTTTTTGCAGCATTGCTA TTGAGCCTTTGCGGTGTTTCGACTGAGAAGATAGTTGAAGACTATGCTATGACTA CCGAGGGTTTCGGAGCCTGGCGGGAACATCTAATTAAACGCCTGCTGCAAAGG AAAGATGCAGCAACACGCCAGGATGCGGAATTCATTATCGCCAGCCACCCGGA GACTATGAAGTCTTTCCTAGACGATGTCGTGCGAGCTAAGTTCGGAAGTGCTCG AAATTACTTTGTCCAGCAGTGTGGATTGACAGAATATGAGGTTGATAAGTTAATC
CATACACTCGTGATTATAAAATGA cDNA otimizado por TalAstroTPP1 – SEQ ID NO: 27
ATGTCCACCAATGCAGATCCGACCACGTTTTCCGATAAGTCCCCGTT CATCAATGTCAGCGGCGTGGTGAATTTTCGTGACCTGGGCGGCTACAGCTGCTT GACCCCGTTGACGCCAGTCAGCAACGGCAGCCCGGTAATTGCGTCGAAGGGTA GCCCTTCTAGCTATATCCGTCCAGGTTTCCTGTTTCGCTCTGCTCAGCCGAGCC AGATTACCGAAACCGGTATCGAGGTCCTGACCCACAAGCTGAATATCGGTGCGA TTTTTGACTTCCGTTCCCAAACCGAGATCCAACTGGTTGCGACGCGTTACCCGG ACAGCCTGCTGGAAATTCCGTTTACCTCTCGTTATGCAGTCCCGGTTTTCGAGC ATTGTGATTTCAGCCCGGTTAGCTTGAGCAAGAAATATGGTGCGCCGAGCAACG CACCGCCTACCGAAGCGGAGCACGGTAGCTTTGTGCAGGCGTACGAAGATATT GCCCGTAGCGCAGCAGAGAACGGCAGCTTCCGCAGCATCACGGACCACATTTT GCGCTACCCGGATATGCCGATCCTGTTCCACTGCACCGTGGGCAAAGACCGCA CCGGCGTTTTTGCGGCGCTGCTGCTGAAACTGTGTGGTGTGAGCGACGAAGTT GTGATTCAGGACTATGCCCTGACTACGCAAGGTCTGGGTGCCTGGAGAGAGCA TCTGATCCAACGCCTGCTGCAGCGTAATGACGTCGCGACGCGTGAAGATGCAG AGTTTATCCTGGCTAGCCGTCCGGAGACTATGAAATCGTTCCTGGCCGATGTTG TGGAAACCAAGTTCGGTGGCGCTCGCAACTACTTCACGCTGCTGTGCGGTCTG ACCGAAGATGATGTTAACAACCTGATTAGCCTGGTTGTCATTCATAACACGAATT
AA Sequência de aminoácidos TalAstroTPP1 – SEQ ID NO: 28
MSTNADPTTFSDKSPFINVSGVVNFRDLGGYSCLTPLTPVSNGSPVIASK GSPSSYIRPGFLFRSAQPSQITETGIEVLTHKLNIGAIFDFRSQTEIQLVATRYPDSLL EIPFTSRYAVPVFEHCDFSPVSLSKKYGAPSNAPPTEAEHGSFVQAYEDIARSAAEN GSFRSITDHILRYPDMPILFHCTVGKDRTGVFAALLLKLCGVSDEVVIQDYALTTQGL GAWREHLIQRLLQRNDVATREDAEFILASRPETMKSFLADVVETKFGGARNYFTLLC
GLTEDDVNNLISLVVIHNTN CDNA TalAstroTPP1 de tipo selvagem – SEQ ID NO: 29
ATGTCTACCAACGCTGACCCTACTACTTTTTCCGATAAATCACCGTTT ATTAACGTAAGCGGCGTTGTCAATTTTCGTGATCTGGGCGGTTACTCATGTCTCA CTCCTCTCACCCCTGTCTCAAATGGTTCACCGGTGATAGCGTCAAAGGGATCCC CCTCATCATACATTCGCCCCGGCTTCTTGTTCCGTTCAGCACAGCCTTCACAAAT TACCGAGACTGGTATCGAAGTTCTGACGCACAAGCTTAATATCGGAGCTATATTT GACTTTCGGTCACAGACAGAAATCCAGCTTGTTGCGACTCGATATCCAGATTCC CTGCTCGAAATACCATTTACTAGCCGATACGCTGTTCCAGTGTTCGAACATTGC GACTTTTCTCCGGTCTCGCTGTCTAAGAAGTATGGGGCTCCGTCAAACGCTCCT CCTACAGAAGCCGAGCACGGTAGCTTCGTCCAGGCTTATGAAGATATCGCCCG CAGTGCAGCGGAAAATGGAAGTTTTCGCAGCATAACAGATCATATTCTGCGATA TCCCGACATGCCAATTCTTTTTCATTGTACGGTTGGCAAAGACAGAACTGGTGT GTTTGCAGCATTGTTGTTGAAGCTGTGTGGAGTGTCTGATGAAGTAGTTATTCAA GACTACGCACTCACTACTCAAGGCCTAGGTGCATGGCGCGAACACCTGATTCA GCGCCTGCTGCAAAGGAATGATGTTGCTACCCGTGAGGATGCCGAGTTCATACT CGCTAGCCGACCAGAGACTATGAAGTCATTCTTGGCAGATGTGGTGGAAACCAA ATTTGGAGGAGCTCGCAACTATTTTACTCTGCTGTGCGGATTGACCGAGGACGA
TGTCAATAACTTGATCTCCCTTGTAGTTATTCATAATACAAATTAG cDNA otimizado por PeSubTPP1 – SEQ ID NO: 30
ATGCAACCTTTTATTAGCGTCGATGGTGTGGTGAATTTTCGTGATATT GGTGGTTATGTTTGCCGTAATCCGGCCGGTTTGTCGAGCCTGCCGAGCAACGT TGACGAAACCCCGGAAAAGCAATGGTGTATCCGCCCAGGCTTCGTTTTCCGTGC AGCGCAACCGTCCCAAATTACGCCGGCTGGTATCGAGATTCTTAAGAAAACGCT GGCGATCCAAGCGATTTTCGATTTTCGTAGCGAGTCCGAGATCCAACTGGTGAG CAAGCGTTACCCGGACAGCCTGCTGGACATCCCGGGCACTACGCGTCATGCTG TTCCGGTGTTTCAGGAGGGTGATTACAGCCCGATCTCGTTGGCCAAACGTTACG GTGTGACCGCGGACGAGAGCACCAACGATCAGTCCTTCCGTCCGGGTTTTGTC AAAGCGTATGAAGCCATCGCACGCAACGCAGCACAGGCTGGTAGCTTCCGCGC CATTATCCAGCATATCCTGCAGGACTCCGCTGGCCCAGTTTTGTTTCACTGCAC CGTAGGCAAAGATCGCACGGGTGTTTTCTCTGCACTGATTCTGAAGCTGTGCGG TGTGGCCGACGAAGATATTGTGGCAGACTATGCGCTGACCACTCAGGGCCTGG GTGTCTGGCGTGAGCACCTGATCCAGCGCCTGTTGCAGCGTGGTGAAGCGACC ACCAAAGAACAAGCGGAAGCGATCATCTCTAGCGACCCGCGCGACATGAAAGC GTTCCTGAGCAACGTCGTTGAGGGCGAGTTTGGTGGCGCACGCAACTACTTCG TGAATCTGTGTGGCCTGCCTGAAGGCGAGGTTGACCGTGTCATTACCAAACTGG
TCGTCCCGAAAACCACCAAGTAA Sequência de aminoácidos PeSubTPP1 – SEQ ID NO: 31
MQPFISVDGVVNFRDIGGYVCRNPAGLSSLPSNVDETPEKQWCIRPGFV FRAAQPSQITPAGIEILKKTLAIQAIFDFRSESEIQLVSKRYPDSLLDIPGTTRHAVPVF QEGDYSPISLAKRYGVTADESTNDQSFRPGFVKAYEAIARNAAQAGSFRAIIQHILQ DSAGPVLFHCTVGKDRTGVFSALILKLCGVADEDIVADYALTTQGLGVWREHLIQRL LQRGEATTKEQAEAIISSDPRDMKAFLSNVVEGEFGGARNYFVNLCGLPEGEVDRVI
TKLVVPKTTK CDNA PeSubTPP1 de tipo selvagem – SEQ ID NO: 32
ATGCAGCCATTCATCTCGGTGGATGGAGTCGTCAACTTCCGCGATAT CGGAGGCTATGTATGCCGGAATCCCGCTGGTTTATCCTCCTTGCCCTCGAATGT CGACGAAACCCCAGAGAAACAGTGGTGCATTCGGCCAGGATTCGTCTTCCGCG CGGCACAGCCATCCCAAATCACCCCTGCAGGGATTGAGATCCTGAAAAAGACC CTTGCTATCCAAGCCATCTTTGACTTTCGGTCAGAGAGTGAGATTCAGCTTGTGT CTAAGCGCTATCCAGACTCCCTCCTCGATATTCCCGGGACAACTCGCCATGCAG TACCGGTCTTCCAAGAAGGTGATTACTCTCCCATCTCACTGGCAAAACGGTATG GAGTCACCGCGGACGAATCCACGAATGATCAGTCCTTTAGACCGGGATTCGTCA AGGCCTACGAGGCCATTGCGCGCAACGCGGCTCAAGCGGGCAGCTTCCGTGC AATCATACAGCACATTCTGCAGGATTCGGCCGGCCCGGTACTTTTCCACTGCAC GGTGGGCAAGGACCGGACAGGGGTCTTTTCGGCTTTGATCCTCAAGCTGTGCG GGGTGGCCGATGAGGACATTGTCGCTGATTATGCACTCACCACGCAAGGCTTA GGTGTGTGGCGGGAGCATTTGATTCAACGGCTCTTGCAGAGAGGGGAGGCCAC AACCAAGGAACAAGCCGAAGCCATAATCAGCAGTGACCCGAGAGACATGAAGG CGTTTTTGAGCAATGTAGTGGAAGGGGAATTTGGAGGTGCTCGGAACTACTTCG TCAACCTCTGCGGACTACCGGAAGGCGAAGTCGATCGGGTTATCACCAAGCTT
GTGGTACCAAAGACTACTAAATAG Sequência de cDNA otimizada por códon que codifica para SmCPS - SEQ ID NO: 33
ATGGCAACTGTTGATGCACCACAAGTTCACGATCATGACGGCACCAC TGTTCACCAAGGCCACGATGCAGTCAAGAATATCGAGGACCCGATCGAGTACAT TCGCACGCTGTTGCGCACCACGGGCGACGGTCGTATTTCCGTGAGCCCGTATG ATACCGCATGGGTCGCGATGATCAAAGACGTTGAGGGCCGTGATGGTCCGCAG TTTCCGTCTAGCTTGGAATGGATCGTGCAAAATCAGTTGGAAGATGGTTCGTGG GGTGACCAGAAACTGTTTTGTGTGTATGATCGCTTGGTTAATACGATCGCGTGT GTGGTTGCTTTGCGTTCTTGGAACGTGCACGCGCACAAAGTGAAGCGTGGTGT GACCTATATTAAGGAAAACGTTGATAAGCTGATGGAGGGTAACGAGGAGCACAT GACTTGCGGCTTCGAAGTCGTTTTCCCGGCACTGCTGCAGAAAGCCAAAAGCCT GGGTATTGAGGATTTGCCTTACGATTCGCCGGCGGTCCAAGAAGTGTATCACGT CCGCGAACAAAAGCTGAAGCGCATCCCGTTGGAAATTATGCACAAAATTCCGAC CAGCCTGCTGTTTAGCCTGGAAGGTCTGGAGAATCTCGACTGGGACAAACTGCT GAAACTCCAGAGCGCTGACGGCTCTTTTCTGACGAGCCCGAGCAGCACGGCGT TCGCATTTATGCAGACGAAAGACGAAAAATGCTATCAATTTATTAAGAATACGAT TGACACCTTCAATGGTGGCGCGCCGCATACCTATCCGGTGGATGTTTTTGGTCG TTTATGGGCGATTGATCGTCTGCAGAGACTGGGTATTAGCCGTTTCTTTGAGCC GGAAATTGCCGATTGCCTGTCTCATATTCACAAATTTTGGACCGACAAGGGTGTT TTCTCTGGTCGCGAGAGCGAATTTTGCGACATCGACGACACCAGCATGGGCAT GCGCCTGATGCGCATGCACGGTTATGACGTCGATCCAAATGTCCTGCGCAATTT CAAACAAAAGGACGGCAAGTTCAGCTGCTACGGCGGCCAGATGATCGAGTCTC CGAGCCCGATCTATAATCTGTATCGTGCGAGCCAGTTGCGCTTCCCGGGTGAA GAAATCCTGGAAGATGCCAAACGCTTTGCTTACGACTTCTTGAAAGAGAAACTG GCGAACAACCAGATTCTGGACAAGTGGGTTATTTCGAAACACTTGCCGGACGAG ATCAAACTGGGCTTAGAAATGCCGTGGTTGGCAACCCTGCCGCGCGTGGAGGC GAAGTACTACATCCAGTACTACGCGGGCAGCGGTGATGTTTGGATCGGCAAAA CGTTGTACCGCATGCCTGAGATCTCGAACGACACCTATCACGACCTGGCTAAGA CCGATTTTAAACGTTGTCAGGCCAAACACCAATTCGAGTGGCTGTACATGCAAG AGTGGTATGAAAGCTGCGGCATCGAAGAGTTTGGTATCAGCCGTAAAGACCTCC TGCTGAGCTATTTTCTGGCGACGGCGAGCATCTTCGAGTTGGAGCGCACCAAC GAACGTATTGCGTGGGCAAAATCTCAGATTATCGCAAAAATGATCACGAGCTTC TTTAACAAAGAAACCACGAGCGAGGAAGATAAGCGCGCCCTGCTGAATGAGCT GGGCAACATCAATGGTCTGAATGATACGAACGGTGCAGGCCGCGAGGGTGGTG CTGGTAGCATCGCGCTGGCGACCCTGACCCAATTTCTGGAAGGTTTCGACCGTT ATACCCGCCATCAACTCAAAAACGCCTGGAGCGTGTGGCTGACTCAGTTACAGC ATGGCGAGGCAGATGATGCTGAGCTGCTGACCAATACGCTCAACATCTGCGCG GGCCATATCGCGTTCCGTGAGGAAATTCTGGCCCATAACGAGTACAAGGCCTTG AGCAACCTGACCAGCAAAATCTGCCGCCAACTGAGCTTTATTCAAAGCGAAAAG GAAATGGGCGTCGAGGGCGAGATTGCGGCAAAGAGCAGCATCAAGAATAAAGA ACTGGAAGAAGATATGCAGATGCTGGTCAAACTGGTCCTGGAAAAGTACGGTG GTATCGACCGTAACATCAAAAAAGCGTTTCTGGCTGTCGCGAAAACCTATTACTA TCGTGCATATCATGCTGCGGACACCATCGACACCCACATGTTTAAGGTTCTGTTT
GAGCCGGTTGCATAA Sequência de aminoácidos de SmCPS, uma sintase CPP de Salvia miltiorrhiza - SEQ ID NO: 34
MATVDAPQVHDHDGTTVHQGHDAVKNIEDPIEYIRTLLRTTGDGRISVSP YDTAWVAMIKDVEGRDGPQFPSSLEWIVQNQLEDGSWGDQKLFCVYDRLVNTIAC VVALRSWNVHAHKVKRGVTYIKENVDKLMEGNEEHMTCGFEVVFPALLQKAKSLGI EDLPYDSPAVQEVYHVREQKLKRIPLEIMHKIPTSLLFSLEGLENLDWDKLLKLQSAD GSFLTSPSSTAFAFMQTKDEKCYQFIKNTIDTFNGGAPHTYPVDVFGRLWAIDRLQR LGISRFFEPEIADCLSHIHKFWTDKGVFSGRESEFCDIDDTSMGMRLMRMHGYDVD PNVLRNFKQKDGKFSCYGGQMIESPSPIYNLYRASQLRFPGEEILEDAKRFAYDFLK EKLANNQILDKWVISKHLPDEIKLGLEMPWLATLPRVEAKYYIQYYAGSGDVWIGKTL YRMPEISNDTYHDLAKTDFKRCQAKHQFEWLYMQEWYESCGIEEFGISRKDLLLSY FLATASIFELERTNERIAWAKSQIIAKMITSFFNKETTSEEDKRALLNELGNINGLNDT NGAGREGGAGSIALATLTQFLEGFDRYTRHQLKNAWSVWLTQLQHGEADDAELLT NTLNICAGHIAFREEILAHNEYKALSNLTSKICRQLSFIQSEKEMGVEGEIAAKSSIKN KELEEDMQMLVKLVLEKYGGIDRNIKKAFLAVAKTYYYRAYHAADTIDTHMFKVLFE
PVA cDNA otimizado por códon que codifica para uma sintase GGPP de Pantoea agglomerans. - SEQ ID NO: 35
ATGGTTTCTGGTTCGAAAGCAGGAGTATCACCTCATAGGGAAATCGA AGTCATGAGACAGTCCATTGATGACCACTTAGCAGGATTGTTGCCAGAAACAGA TTCCCAGGATATCGTTAGCCTTGCTATGAGAGAAGGTGTTATGGCACCTGGTAA ACGTATCAGACCTTTGCTGATGTTACTTGCTGCAAGAGACCTGAGATATCAGGG TTCTATGCCTACACTACTGGATCTAGCTTGTGCTGTTGAACTGACACATACTGCT TCCTTGATGCTGGATGACATGCCTTGTATGGACAATGCGGAACTTAGAAGAGGT CAACCAACAACCCACAAGAAATTCGGAGAATCTGTTGCCATTTTGGCTTCTGTAG GTCTGTTGTCGAAAGCATTTGGCTTGATTGCTGCAACTGGTGATCTTCCAGGTG AAAGGAGAGCACAAGCTGTAAACGAGCTATCTACTGCAGTTGGTGTTCAAGGTC TAGTCTTAGGACAGTTCAGAGATTTGAATGACGCAGCTTTGGACAGAACTCCTG ATGCTATCCTGTCTACGAACCATCTGAAGACTGGCATCTTGTTCTCAGCTATGTT GCAAATCGTAGCCATTGCTTCTGCTTCTTCACCATCTACTAGGGAAACGTTACAC GCATTCGCATTGGACTTTGGTCAAGCCTTTCAACTGCTAGACGATTTGAGGGAT GATCATCCAGAGACAGGTAAAGACCGTAACAAAGACGCTGGTAAAAGCACTCTA GTCAACAGATTGGGTGCTGATGCAGCTAGACAGAAACTGAGAGAGCACATTGAC TCTGCTGACAAACACCTGACATTTGCATGTCCACAAGGAGGTGCTATAAGGCAG TTTATGCACCTATGGTTTGGACACCATCTTGCTGATTGGTCTCCAGTGATGAAGA TCGCCTAA
Sequência de aminoácidos de sintase GGPP de Pantoea agglomerans – SEQ ID NO: 36
MVSGSKAGVSPHREIEVMRQSIDDHLAGLLPETDSQDIVSLAMREGVMA PGKRIRPLLMLLAARDLRYQGSMPTLLDLACAVELTHTASLMLDDMPCMDNAELRR GQPTTHKKFGESVAILASVGLLSKAFGLIAATGDLPGERRAQAVNELSTAVGVQGLV LGQFRDLNDAALDRTPDAILSTNHLKTGILFSAMLQIVAIASASSPSTRETLHAFALDF GQAFQLLDDLRDDHPETGKDRNKDAGKSTLVNRLGADAARQKLREHIDSADKHLTF
ACPQGGAIRQFMHLWFGHHLADWSPVMKIA cDNA otimizado que codifica para SsLPS - SEQ ID NO: 37
ATGGCATCCCAAGCGTCCGAGAAAGATATTAGCCTGGTTCAAACCCC GCATAAGGTCGAGGTCAACGAAAAGATCGAAGAGAGCATCGAGTACGTCCAAA ATCTGCTGATGACGAGCGGTGACGGTCGTATCTCCGTGTCTCCGTACGATACC GCGGTCATCGCTCTGATTAAAGATCTGAAGGGTCGCGACGCACCGCAGTTCCC GAGCTGTCTGGAGTGGATTGCGCACCACCAGTTAGCGGATGGTAGCTGGGGCG ACGAGTTCTTTTGTATCTATGACCGCATTTTGAATACCCTGGCGTGCGTCGTCG CACTGAAATCTTGGAATCTGCACAGCGACATTATTGAAAAAGGCGTGACCTACA TTAAGGAAAACGTCCATAAGCTGAAAGGCGCGAATGTTGAGCATAGAACCGCCG GTTTTGAGCTGGTTGTTCCGACCTTCATGCAGATGGCGACTGACCTGGGTATTC AGGATCTGCCGTACGATCATCCTCTTATCAAAGAAATCGCTGATACGAAGCAAC AGCGCCTGAAAGAAATTCCGAAAGATTTGGTTTATCAGATGCCGACCAATCTGC TGTATAGCCTGGAAGGCCTGGGCGATTTAGAGTGGGAGCGTTTGCTGAAGCTG CAGTCTGGTAATGGTAGCTTCCTGACGAGCCCAAGCAGCACGGCGGCAGTTCT GATGCATACCAAAGACGAGAAGTGTTTGAAATACATTGAGAATGCGCTGAAGAA CTGCGACGGTGGCGCTCCTCATACGTATCCGGTTGACATCTTTAGCCGCTTGTG GGCGATCGACCGTTTGCAACGTCTGGGCATTAGCCGTTTCTTCCAACACGAGAT CAAATACTTTCTGGACCACATCGAGTCAGTCTGGGAAGAAACCGGCGTGTTTAG CGGTCGTTACACGAAGTTTAGCGACATCGATGACACGAGCATGGGTGTCCGCC TGCTGAAAATGCACGGTTACGACGTAGACCCAAACGTGTTGAAACACTTTAAGC AGCAAGACGGCAAATTCAGCTGCTACATCGGCCAGAGCGTCGAGAGCGCGAGC CCGATGTATAATCTGTACCGTGCCGCCCAGCTGCGTTTCCCGGGTGAAGAAGT GCTTGAAGAAGCAACTAAATTCGCGTTTAACTTCCTGCAAGAGATGCTGGTGAA GGATCGCTTGCAAGAGCGTTGGGTTATTAGCGATCACCTGTTTGACGAGATTAA GCTCGGTCTGAAGATGCCGTGGTATGCTACCCTGCCGCGTGTTGAGGCCGCTT ATTACCTGGATCACTATGCGGGTAGCGGTGATGTGTGGATTGGTAAGTCTTTTT ACCGCATGCCGGAGATTAGCAATGACACCTACAAAGAATTGGCCATCCTGGACT TTAACCGTTGTCAGACTCAGCATCAGCTGGAGTGGATTCACATGCAAGAGTGGT ATGACCGCTGCTCTCTGTCCGAGTTTGGTATTAGCAAGCGTGAGCTGCTGCGTA GCTACTTCCTGGCTGCCGCAACCATTTTCGAACCGGAACGCACCCAAGAGCGT CTGCTCTGGGCAAAGACCCGCATCCTGAGCAAGATGATTACCAGCTTCGTCAAC ATCTCCGGTACGACCCTGAGCCTGGATTACAACTTCAACGGTTTGGATGAGATC ATTTCCAGCGCGAATGAAGATCAGGGTCTGGCGGGTACGCTGTTGGCCACGTT CCATCAACTGCTGGATGGTTTCGACATTTACACCCTGCACCAACTGAAACACGT CTGGTCGCAATGGTTTATGAAAGTTCAGCAAGGCGAGGGCTCCGGCGGCGAAG ATGCGGTCCTGCTGGCAAATACTCTGAATATCTGCGCGGGTCTGAATGAAGATG TGCTGTCGAACAACGAGTATACCGCGCTGAGCACGCTGACGAACAAGATCTGC AACCGTCTGGCCCAGATCCAGGACAACAAGATTCTGCAAGTGGTGGACGGCAG CATCAAAGACAAAGAACTGGAACAGGATATGCAGGCATTGGTTAAACTGGTGCT GCAGGAAAACGGTGGCGCAGTGGACCGTAACATCCGTCACACGTTTCTGAGCG TTAGCAAGACCTTCTACTATGACGCGTATCACGACGATGAAACCACCGATCTGC
ATATCTTTAAAGTCCTGTTCCGTCCGGTTGTTTAA Sequência de aminoácidos SsLPS. - SEQ ID NO: 38
MASQASEKDISLVQTPHKVEVNEKIEESIEYVQNLLMTSGDGRISVSPYD TAVIALIKDLKGRDAPQFPSCLEWIAHHQLADGSWGDEFFCIYDRILNTLACVVALKS WNLHSDIIEKGVTYIKENVHKLKGANVEHRTAGFELVVPTFMQMATDLGIQDLPYDH PLIKEIADTKQQRLKEIPKDLVYQMPTNLLYSLEGLGDLEWERLLKLQSGNGSFLTSP SSTAAVLMHTKDEKCLKYIENALKNCDGGAPHTYPVDIFSRLWAIDRLQRLGISRFF QHEIKYFLDHIESVWEETGVFSGRYTKFSDIDDTSMGVRLLKMHGYDVDPNVLKHF KQQDGKFSCYIGQSVESASPMYNLYRAAQLRFPGEEVLEEATKFAFNFLQEMLVKD RLQERWVISDHLFDEIKLGLKMPWYATLPRVEAAYYLDHYAGSGDVWIGKSFYRMP EISNDTYKELAILDFNRCQTQHQLEWIHMQEWYDRCSLSEFGISKRELLRSYFLAAA TIFEPERTQERLLWAKTRILSKMITSFVNISGTTLSLDYNFNGLDEIISSANEDQGLAG TLLATFHQLLDGFDIYTLHQLKHVWSQWFMKVQQGEGSGGEDAVLLANTLNICAGL NEDVLSNNEYTALSTLTNKICNRLAQIQDNKILQVVDGSIKDKELEQDMQALVKLVLQ
ENGGAVDRNIRHTFLSVSKTFYYDAYHDDETTDLHIFKVLFRPVV cDNA otimizado que codifica para TaTps1-del59 - SEQ ID NO: 39
ATGTATCGCCAAAGAACTGATGAGCCAAGCGAAACCCGCCAGATGAT CGATGATATTCGCACCGCTTTGGCTAGCCTGGGTGACGATGAAACCAGCATGA GCGTGAGCGCATACGACACCGCCCTGGTTGCCCTGGTGAAGAACCTGGACGGT GGCGATGGCCCGCAGTTCCCGAGCTGCATTGACTGGATTGTTCAGAACCAGCT GCCGGACGGTAGCTGGGGCGACCCGGCTTTCTTTATGGTTCAGGACCGTATGA TCAGCACCCTGGCCTGTGTCGTGGCCGTGAAATCCTGGAATATCGATCGTGACA ACTTGTGCGATCGTGGTGTCCTGTTTATCAAAGAAAACATGTCGCGTCTGGTTG AAGAAGAACAAGATTGGATGCCATGTGGCTTCGAGATTAACTTTCCTGCACTGTT GGAGAAAGCTAAAGACCTGGACTTGGACATTCCGTACGATCATCCTGTGCTGGA AGAGATTTACGCGAAGCGTAATCTGAAACTGCTGAAGATTCCGTTAGATGTCCT CCATGCGATCCCGACGACGCTGTTGTTTTCCGTTGAGGGTATGGTCGATCTGCC GCTGGATTGGGAGAAACTGCTGCGTCTGCGTTGCCCGGACGGTTCTTTTCATTC TAGCCCGGCGGCGACGGCAGCGGCGCTGAGCCACACGGGTGACAAAGAGTGT CACGCCTTCCTGGACCGCCTGATTCAAAAGTTCGAGGGTGGCGTCCCGTGCTC CCACAGCATGGACACCTTCGAGCAACTGTGGGTTGTTGACCGTTTGATGCGTCT GGGTATCAGCCGTCATTTTACGAGCGAGATCCAGCAGTGCTTGGAGTTCATCTA TCGTCGTTGGACCCAGAAAGGTCTGGCGCACAATATGCACTGCCCGATCCCGG ACATTGATGACACTGCGATGGGTTTTCGTCTGTTGAGACAGCACGGTTACGACG TGACCCCGTCGGTTTTCAAGCATTTCGAGAAAGACGGCAAGTTCGTATGCTTCC CGATGGAAACCAACCATGCGAGCGTGACGCCGATGCACAATACCTACCGTGCG AGCCAGTTCATGTTCCCGGGTGATGACGACGTGCTGGCCCGTGCCGGCCGCTA CTGTCGCGCATTCTTGCAAGAGCGTCAGAGCTCTAACAAGTTGTACGATAAGTG GATTATCACGAAAGATCTGCCGGGTGAGGTTGGCTACACGCTGAACTTTCCGTG GAAAAGCTCCCTGCCGCGTATTGAAACTCGTATGTATCTGGATCAGTACGGTGG CAATAACGATGTCTGGATTGCAAAGGTCCTGTATCGCATGAACCTGGTTAGCAA TGACCTGTACCTGAAAATGGCGAAAGCCGACTTTACCGAGTATCAACGTCTGTC TCGCATTGAGTGGAACGGCCTGCGCAAATGGTATTTTCGCAATCATCTGCAGCG TTACGGTGCGACCCCGAAGTCCGCGCTGAAAGCGTATTTCCTGGCGTCGGCAA ACATCTTTGAGCCTGGCCGCGCAGCCGAGCGCCTGGCATGGGCACGTATGGC CGTGCTGGCTGAAGCTGTAACGACTCATTTCCGTCACATTGGCGGCCCGTGCTA CAGCACCGAGAATCTGGAAGAACTGATCGACCTTGTTAGCTTCGACGACGTGAG CGGCGGCTTGCGTGAGGCGTGGAAGCAATGGCTGATGGCGTGGACCGCAAAA GAATCACACGGCAGCGTGGACGGTGACACGGCACTGCTGTTTGTCCGCACGAT TGAGATTTGCAGCGGCCGCATCGTTTCCAGCGAGCAGAAACTGAATCTGTGGG ATTACAGCCAGTTAGAGCAATTGACCAGCAGCATCTGTCATAAACTGGCCACCA TCGGTCTGAGCCAGAACGAAGCTAGCATGGAAAATACCGAAGATCTGCACCAAC AAGTCGATTTGGAAATGCAAGAACTGTCATGGCGTGTTCACCAGGGTTGTCACG GTATTAATCGCGAAACCCGTCAAACCTTCCTGAATGTTGTTAAGTCTTTTTATTAC TCCGCACACTGCAGCCCGGAAACCGTGGACAGCCATATTGCAAAAGTGATCTTT
CAAGACGTTATCTGA TaTps1-del59, difosfato de copalila sintase truncada de Triticum aestivum. - SEQ ID NO: 40
MYRQRTDEPSETRQMIDDIRTALASLGDDETSMSVSAYDTALVALVKNL DGGDGPQFPSCIDWIVQNQLPDGSWGDPAFFMVQDRMISTLACVVAVKSWNIDRD NLCDRGVLFIKENMSRLVEEEQDWMPCGFEINFPALLEKAKDLDLDIPYDHPVLEEIY AKRNLKLLKIPLDVLHAIPTTLLFSVEGMVDLPLDWEKLLRLRCPDGSFHSSPAATAA ALSHTGDKECHAFLDRLIQKFEGGVPCSHSMDTFEQLWVVDRLMRLGISRHFTSEI QQCLEFIYRRWTQKGLAHNMHCPIPDIDDTAMGFRLLRQHGYDVTPSVFKHFEKDG KFVCFPMETNHASVTPMHNTYRASQFMFPGDDDVLARAGRYCRAFLQERQSSNKL YDKWIITKDLPGEVGYTLNFPWKSSLPRIETRMYLDQYGGNNDVWIAKVLYRMNLV SNDLYLKMAKADFTEYQRLSRIEWNGLRKWYFRNHLQRYGATPKSALKAYFLASAN IFEPGRAAERLAWARMAVLAEAVTTHFRHIGGPCYSTENLEELIDLVSFDDVSGGLR EAWKQWLMAWTAKESHGSVDGDTALLFVRTIEICSGRIVSSEQKLNLWDYSQLEQL TSSICHKLATIGLSQNEASMENTEDLHQQVDLEMQELSWRVHQGCHGINRETRQTF
LNVVKSFYYSAHCSPETVDSHIAKVIFQDVI cDNA otimizado por CymB – SEQ ID NO: 41
ATGACTATCAATTCTATTCAACCGATTCAAGCAAAAGCCGCTGTGCTG CGTGCCGTAGGCTCCCCGTTTAACATTGAGCCGATTCGTATCAGCCCGCCGAA GGGTGATGAAGTTCTGGTCCGTATTGTGGGTGTGGGTGTCTGCCATACCGACG TCGTTTGCCGTGACAGCTTCCCGGTTCCGCTGCCAATCATCCTGGGTCACGAAG GCTCGGGTGTGATTGAAGCGATCGGTGATCAAGTTACGAGCCTGAAGCCAGGT GACCACGTCGTTCTGAGCTTCAATAGCTGCGGCCACTGTTATAACTGCGGTCAT GCGGAGCCGGCAAGCTGCCTGCAGATGTTACCGTTGAACTTTGGTGGCGCGGA GCGTGCGGCGGACGGCACCATCCAAGACGACAAGGGTGAAGCCGTCCGCGGT ATGTTCTTTGGCCAGTCCAGCTTTGGCACGTACGCAATCGCACGTGCGGTGAAT GCTGTCAAAGTTGACGACGATCTGCCGCTGCCTCTGTTGGGCCCGCTGGGCTG TGGTATCCAGACCGGTGCGGGTGCAGCGATGAACAGCCTGTCTCTGCAGAGCG GTCAGAGCTTCATCGTTTTCGGTGGCGGCGCGGTCGGTCTGAGCGCTGTTATG GCAGCTAAAGCGCTGGGCGTGAGCCCGCTGATCGTTGTGGAGCCGAACGAAA GCCGCCGCGCCCTGGCCCTGGAACTGGGTGCATCCCACGTGTTTGATCCGTTC AACACCGAAGATCTGGTTGCCAGCATTCGCGAAGTCGTGCCTGCGGGTGCGAA CCATGCACTGGACACGACCGGTCTGCCGAAAGTGATCGCGAGCGCGATTGATT GTATTATGAGCGGTGGCAAACTGGGTTTGCTGGGTATGGCGAGCCCGGAAGCG AATGTGCCGGCTACCCTGTTGGATTTGCTGAGCAAAAATGTCACGCTGAAGCCG ATCACCGAGGGCGATGCGAACCCACAAGAGTTCATCCCGCGTATGCTGGCACT CTACCGTGAGGGTAAGTTCCCGTTTGAGAAACTGATCACGACCTTTCCGTTTGA GCACATTAATGAAGCAATGGAAGCCACTGAGTCCGGTAAGGCCATTAAACCGGT
TCTGACGCTGTAA Sequência de aminoácidos CymB – SEQ ID NO: 42
MTINSIQPIQAKAAVLRAVGSPFNIEPIRISPPKGDEVLVRIVGVGVCHTDV VCRDSFPVPLPIILGHEGSGVIEAIGDQVTSLKPGDHVVLSFNSCGHCYNCGHAEPA SCLQMLPLNFGGAERAADGTIQDDKGEAVRGMFFGQSSFGTYAIARAVNAVKVDD DLPLPLLGPLGCGIQTGAGAAMNSLSLQSGQSFIVFGGGAVGLSAVMAAKALGVSP LIVVEPNESRRALALELGASHVFDPFNTEDLVASIREVVPAGANHALDTTGLPKVIAS AIDCIMSGGKLGLLGMASPEANVPATLLDLLSKNVTLKPITEGDANPQEFIPRMLALY
REGKFPFEKLITTFPFEHINEAMEATESGKAIKPVLTL cDNA otimizado por AspWeADH1 – SEQ ID NO: 43
ATGGGTAGCATTACTGAAGATATCCCAACCATGCGCGCTGCTACTGT TGTTGAGTACAATAAGCCGCTTCAAATCCTGAATATCCCTATTCCGACCCCGTCC CAGGATCAGATTCTGGTCAAGGTCACCGCATGCAGCCTGTGCAACAGCGACCT GGCGGGCTGGCTGGGTGTTGTTGGTGCGGTTGCGCCGTATTGTCCGGGCCAT GAACCGGTGGGTGTAATTGAGAGCGTCGGTAGCGCCGTTCGCGGTTTCAAGAA AGGCGACCGTGCCGGTTTCATGCCGAGCTCCTTTACGTGTAAAGACTGCAATGA ATGTCAAACCGGTAATCATCGTTTTTGTAATAAGAAAACCAGCGTGGGTTTCCAG GGTCCGTATGGCGGCTTCAGCCAATATGCCGTTGCTGACCCGTTGAGCACGGT TAAGATCCCGGACGCGCTGTCTGATGAAGTCACGGCGCCGCTGTTGTGCGCGG GTGTGACGGCGTATGGCGCACTGCGCAAGGTCCCGCCAGGCGTGCAGAGCGT GAACGTTATCGGTTGCGGTGGCGTTGGCCACCTGGTGATCCAATATGCGAAGG CTCTGGGTTACTACGTGCGTGGCTTTGACGTTAACGACAAGAAACTGGGCCTGG CAGCGCGTAGCGGTGCGGATGAAACCTTTTACAGCACCGATGCCACCCATGCG GACCAGGCATCTGCAACGATCGTCGCGACCGGCGCGGTTGCAGCGTACAAAGC CGCATTCGCAGTCACCGCCAACCACGGTCGTATCATTGCGATCGGTGTCCCGA AGGGTGAGATTCCGGTGTCGCTGCTGGACATGGTCAAACGTGATCTGAGCTTA GTGGCGACGAACCAAGGCTCCAAAGAAGAATTGGAAGAGGCTCTGGAAATTGC AGTGCAACACCAGATCGCACCGGAGTACGAAATTCGCCAGCTGGACCAGCTGA ACGATGGCTTTCAAGAGATGATGAAAGGTGAGAGCCACGGTCGTCTGGTGTAC
CGTCTGTGGTAA Sequência de aminoácidos AspWeADH1 – SEQ ID NO: 44
MGSITEDIPTMRAATVVEYNKPLQILNIPIPTPSQDQILVKVTACSLCNSDL AGWLGVVGAVAPYCPGHEPVGVIESVGSAVRGFKKGDRAGFMPSSFTCKDCNEC QTGNHRFCNKKTSVGFQGPYGGFSQYAVADPLSTVKIPDALSDEVTAPLLCAGVTA YGALRKVPPGVQSVNVIGCGGVGHLVIQYAKALGYYVRGFDVNDKKLGLAARSGA DETFYSTDATHADQASATIVATGAVAAYKAAFAVTANHGRIIAIGVPKGEIPVSLLDM VKRDLSLVATNQGSKEELEEALEIAVQHQIAPEYEIRQLDQLNDGFQEMMKGESHG
RLVYRLW cDNA otimizado por PsAerADH1 – SEQ ID NO: 45
ATGAACTCGATCCAACCTACTCAAGCAAAAGCAGCAGTCTTGCGCGC AGTCGGCGGCCCGTTCTCTATTGAGCCGATCCGCATCAGCCCACCGAAGGGTG ACGAAGTGCTGGTTCGTATCGTTGGTGTGGGTGTCTGCCACACCGACGTCGTC TGTCGTGATAGCTTTCCGGTGCCGTTGCCGATCATTCTGGGTCACGAGGGCTC CGGTGTGATTGAAGCTGTGGGTGACCAAGTGACCGGTCTGAAACCGGGTGACC ACGTTGTGCTGTCCTTCAATAGCTGCGGCCATTGCTACAACTGTGGTCATGACG AGCCTGCGTCTTGTCTGCAGATGCTGCCGTTGAATTTCGGTGGCGCGGAGCGT GCGGCGGACGGCACCATCGAAGATGACCAGGGCGCAGCTGTTCGTGGCCTGT TCTTCGGCCAAAGCTCCTTTGGTAGCTACGCGATTGCACGTGCGGTTAACACTG TCAAAGTTGATGACGATCTGCCGTTGGCGCTGCTGGGTCCGCTGGGTTGCGGT ATTCAGACCGGCGCGGGTGCAGCCATGAATAGCCTGGGTTTACAGGGTGGCCA GAGCTTCATTGTGTTTGGCGGCGGCGCCGTCGGTCTGAGCGCGGTCATGGCC GCCAAGGCCCTGGGTGTTAGCCCGCTGATTGTTGTGGAGCCGAACGAAGCTCG CCGTGCGCTGGCACTGGAATTGGGTGCGAGCCACGCGTTTGACCCATTTAACA CCGAAGATCTGGTCGCGAGCATTCGCGAAGTCGTTCCGGCTGGCGCAAACCAC GCGCTGGACACGACGGGTCTGCCGAAAGTTATTGCCAACGCGATCGATTGCAT CATGAGCGGCGGCAAACTGGGTCTGCTCGGTATGGCGAATCCGGAAGCGAATG TGCCGGCGACCCTGCTGGATCTGCTGAGCAAAAATGTGACGCTGAAGCCGATC ACCGAGGGTGACGCAAACCCACAAGAATTTATTCCGCGTATGCTGGCTCTGTAT CGTGAGGGTAAGTTTCCGTTCGATAAGCTGATCACCACGTTCCCGTTCGAGCAT ATCAACGAAGCAATGGAAGCTACCGAGAGCGGTAAGGCCATTAAACCGGTTCT
GACCCTGTAA Sequência de aminoácidos PsAerADH1– SEQ ID NO: 46 mnsiqptqakaavlravggpfsiepirisppkgdevlvrivgvgvchtdvvcrdsfpvplpiilghegsgv ieavgdqvtglkpgdhvvlsfnscghcyncghdepasclqmlplnfggaeraadgtieddqgaavrglffgqssfgsy aiaravntvkvdddlplallgplgcgiqtgagaamnslglqggqsfivfgggavglsavmaakalgvsplivvepnearr alalelgashafdpfntedlvasirevvpaganhaldttglpkvianaidcimsggklgllgmanpeanvpatlldllskn vtlkpitegdanpqefiprmlalyregkfpfdklittfpfehineameatesgkaikpvltl cDNA otimizado por AzTolADH1 – SEQ ID NO: 47
ATGGGTTCTATTCAAGATTCTCTGTTCATCCGTGCACGCGCCGCTGTT CTGCGTACTGTCGGTGGCCCGCTGGAAATTGAAAACGTCCGCATTAGCCCTCC GAAGGGTGACGAAGTGCTCGTGCGTATGGTTGGTGTTGGTGTGTGCCATACCG ACGTTGTGTGTCGCGATGGCTTCCCGGTTCCGCTGCCGATTGTGCTGGGTCAC GAGGGCAGCGGTATTGTCGAGGCAGTGGGCGAGCGTGTGACCAAGGTTAAAC CGGGTCAGCGTGTCGTTTTATCCTTCAATAGCTGTGGTCATTGCGCGTCCTGCT GCGAGGACCACCCGGCCACCTGTCACCAGATGCTGCCACTGAACTTTGGTGCG GCGCAGCGCGTGGATGGTGGCACCGTTATCGACGCGAGCGGCGAGGCAGTGC AGAGCCTGTTTTTTGGTCAAAGCTCTTTCGGTACGTATGCATTGGCGCGTGAAG TCAATACCGTACCGGTGCCGGATGCAGTTCCGTTGGAAATCCTGGGCCCGTTG GGTTGCGGCATCCAGACGGGTGCGGGTGCGGCTATCAACAGCCTGGCGCTGA AACCTGGTCAATCGCTGGCAATCTTCGGTGGCGGCAGCGTCGGTCTGTCCGCC CTGCTGGGCGCGCTGGCCGTGGGCGCGGGCCCGGTCGTTGTCATTGAGCCGA ACGAACGTCGTCGTGCGTTGGCGCTGGACCTGGGTGCGAGCCATGCATTTGAT CCGTTCAACACTGAAGATTTGGTTGCGAGCATCAAAGCCGCTACGGGTGGCGG CGTTACCCACAGCCTGGACAGCACGGGTCTGCCGCCGGTCATCGCGAATGCAA TCAACTGTACCTTGCCGGGCGGCACGGTCGGTCTGCTGGGCGTCCCGAGCCC AGAGGCTGCCGTTCCGGTGACGCTGCTGGATCTGCTGGTTAAATCAGTTACCCT GCGTCCGATTACCGAGGGTGACGCCAATCCGCAAGAATTTATTCCGCGTATGGT CCAGCTGTACCGCGACGGTAAATTTCCGTTTGATAAGCTGATTACGACCTACCG CTTCGACGACATCAATCAAGCGTTCAAGGCAACCGAAACCGGTGAAGCGATTAA
GCCAGTGCTGGTGTTTTAA Sequência de aminoácidos AzTolADH1 – SEQ ID NO: 48 mgsiqdslfiraraavlrtvggpleienvrisppkgdevlvrmvgvgvchtdvvcrdgfpvplpivlgheg sgiveavgervtkvkpgqrvvlsfnscghcasccedhpatchqmlplnfgaaqrvdggtvidasgeavqslffgqssf gtyalarevntvpvpdavpleilgplgcgiqtgagaainslalkpgqslaifgggsvglsallgalavgagpvvviepnerr ralaldlgashafdpfntedlvasikaatgggvthsldstglppvianainctlpggtvgllgvpspeaavpvtlldllvksvtl rpitegdanpqefiprmvqlyrdgkfpfdklittyrfddinqafkatetgeaikpvlvf cDNA otimizado por AroAroADH1 – SEQ ID NO: 49
ATGGGCTCAATTCAAGATTCTCTGTTCATCCCGGCTAGAGCGGCAGT GTTGCGTGCGGTCGGTGGCCCACTGGAAATCGAAGATGTTCGTATCAGCCCGC CTAAGGGCGACGAAGTTCTGGTCCGTATGGTTGGCGTGGGCGTTTGCCACACC GACGTTGTGTGCCGCGATGGTTTCCCGGTCCCGCTGCCGATTGTCTTGGGTCA CGAGGGTGCGGGTATCGTGGAAGCTGTGGGTGAGCGTGTGACCAAGGTCAAA CCTGGCCAGCGTGTGGTGCTGAGCTTCAACAGCTGCGGTCACTGCAGCTCCTG TGGTGAGGATCACCCGGCGACGTGTCATCAGATGCTGCCGCTGAATTTTGGTG CAGCGCAACGTGTTGACGGTGGCTGTGTCACCGATGCGAGCGGTGAAGCTGTA CATAGCCTGTTTTTCGGTCAGAGCTCTTTTTGCACCTTTGCACTGGCGCGCGAA GTGAACACCGTTCCTGTCGGTGACGGCGTTCCGCTGGAAATTCTGGGTCCGCT GGGTTGTGGTATTCAAACCGGTGCAGGCGCAGCGATCAACAGCCTGGCCATTA AACCGGGTCAGAGCCTGGCGATTTTCGGTGGCGGCAGCGTTGGTCTGTCCGCC CTGCTGGGCGCACTGGCCGTGGGCGCGGGTCCGGTTGTTGTGGTGGAGCCGA ATGATCGTCGTCGTGCACTGGCCCTGGACCTGGGTGCGTCGCATGTGTTTGAC CCGTTCAATACCGAAGATCTGGTTGCGAGCATTAAAGCCGCGACGGGTGGCGG CGTTACTCACAGCCTGGACAGCACTGGCTTGCCGCCGGTGATCGCAAAGGCCA TTGATTGTACGTTGCCGGGTGGCACCGTCGGTTTACTGGGTGTTCCGGCTCCG GACGCCGCAGTGCCGGTCACGCTGCTGGACTTGCTGGTGAAGTCCGTTACCCT GCGCCCGATCACCGAGGGTGACGCAAACCCGCAAGAATTTATTCCACGCATGG TTCAGCTCTACCGTGATGGTAAGTTCCCATTTGATAAACTGATCACCACGTATCG TTTTGAGAACATCAATGACGCGTTCAAAGCGACGGAAACGGGTGAAGCGATCAA
ACCGGTCCTGGTTTTCTAA Sequência de aminoácidos AroAroADH1 – SEQ ID NO: 50 mgsiqdslfiparaavlravggpleiedvrisppkgdevlvrmvgvgvchtdvvcrdgfpvplpivlghe gagiveavgervtkvkpgqrvvlsfnscghcsscgedhpatchqmlplnfgaaqrvdggcvtdasgeavhslffgqs sfctfalarevntvpvgdgvpleilgplgcgiqtgagaainslaikpgqslaifgggsvglsallgalavgagpvvvvepnd rrralaldlgashvfdpfntedlvasikaatgggvthsldstglppviakaidctlpggtvgllgvpapdaavpvtlldllvksv tlrpitegdanpqefiprmvqlyrdgkfpfdklittyrfenindafkatetgeaikpvlvf cDNA otimizado por ThTerpADH1 – SEQ ID NO: 51
ATGTGTAGCAATCATGATTTCACCGCAGCCCGTGCAGCAGTCTTACG TAAAGTTGGTGGCCCGTTGGAAATCGAAGATGTCCGTATTTCTGCCCCGAAAGG CGACGAAGTCCTGGTGCGTATGGTTGGCGTGGGTGTGTGTCATACCGACCTCG TCTGCCGTGATGCGTTCCCGGTGCCGCTGCCTATTGTTCTGGGTCACGAGGGT GCAGGCATCGTTGAAGCCGTGGGTGAGGGCGTGCGCTCCCTGGAGCCGGGTG ACCGTGTTGTGCTGAGCTTCAATAGCTGCGGCCGCTGTGGCAACTGCGGTAGC GGTCACCCGAGCAACTGCCTGCAAATGCTGCCGCTGAATTTTGGTGGCGCGCA ACGCGTTGACGGTGGCCGCATGTTGGACGCGGCGGGTAACGCTGTCCAGGGT CTGTTTTTTGGTCAATCTAGCTTCGGCACGTATGCGATCGCGCGTGAGATTAAC GCCGTGAAAGTCGCCGAAGATCTGCCGCTGGAAATCCTGGGTCCGCTGGGTTG CGGTATTCAGACCGGTGCGGGTGCGGCGATTAACAGCCTGGGTATTGGTCCGG GTCAGTCCTTGGCTGTGTTCGGTGGCGGCGGCGTGGGTCTTAGCGCGTTGCTG GGCGCTCGTGCTGTGGGTGCCGCCCAAGTTGTTGTTGTTGAGCCGAACGCCGC ACGTCGCGCGCTGGCGCTGGAACTGGGTGCGAGCCATGCATTCGACCCGTTTG CGGGTGACGACCTGGTCGCGGCGATCCGCGCAGCGACGGGTGGCGGCGCAA CCCACGCGCTGGATACGACCGGCCTGCCGTCGGTGATTGGCAATGCAATCGAT TGTACTTTGCCGGGTGGCACGGTTGGTATGGTCGGCATGCCAGCGCCTGACGC TGCGGTCCCGGCGACCCTGCTGGATTTGCTGACTAAGAGCGTCACGCTGCGTC CGATCACCGAGGGTGACGCAGATCCGCAGGCCTTCATCCCACAGATGCTGCGC TTTTACCGTGAGGGTAAGTTCCCGTTTGACCGTCTGATTACCCGTTACCGTTTTG ATCAGATCAATGAAGCTCTGCACGCAACCGAAAAGGGTGGCGCGATTAAACCG
GTTCTGGTGTTCTAA Sequência de aminoácidos ThTerpADH1 – SEQ ID NO: 52
MCSNHDFTAARAAVLRKVGGPLEIEDVRISAPKGDEVLVRMVGVGVCHT DLVCRDAFPVPLPIVLGHEGAGIVEAVGEGVRSLEPGDRVVLSFNSCGRCGNCGSG HPSNCLQMLPLNFGGAQRVDGGRMLDAAGNAVQGLFFGQSSFGTYAIAREINAVK VAEDLPLEILGPLGCGIQTGAGAAINSLGIGPGQSLAVFGGGGVGLSALLGARAVGA AQVVVVEPNAARRALALELGASHAFDPFAGDDLVAAIRAATGGGATHALDTTGLPS VIGNAIDCTLPGGTVGMVGMPAPDAAVPATLLDLLTKSVTLRPITEGDADPQAFIPQ
MLRFYREGKFPFDRLITRYRFDQINEALHATEKGGAIKPVLVF cDNA otimizado por CdGeoA – SEQ ID NO: 53
ATGAACGATACGCAGGATTTTATTAGCGCCCAAGCCGCAGTGTTACG TCAGGTCGGTGGCCCGCTGGCCGTTGAGCCTGTTCGTATCAGCATGCCGAAGG GTGACGAAGTCCTGATTCGTATCGCGGGTGTTGGTGTGTGCCACACCGACTTG GTGTGCCGTGATGGCTTCCCGGTGCCGCTGCCAATTGTGCTGGGTCACGAGGG TAGCGGTACTGTCGAAGCCGTCGGTGAACAAGTCCGTACCCTGAAACCGGGCG ATCGCGTCGTGCTGAGCTTTAACAGCTGCGGTCATTGCGGTAACTGTCACGACG GTCACCCGAGCAATTGCCTGCAGATGCTGCCGCTGAACTTCGGTGGCGCGCAA CGCGTGGACGGTGGCCAAGTTTTGGACGGTGCGGGTCATCCGGTTCAGTCCAT GTTTTTCGGCCAGTCCAGCTTTGGCACCCACGCAGTAGCGCGCGAGATCAACG CAGTCAAGGTCGGCGATGATCTGCCACTGGAACTGCTGGGTCCGTTGGGTTGT GGCATTCAAACCGGTGCGGGTGCAGCTATCAATTCTCTGGGCATTGGTCCGGG TCAGTCTCTGGCTATCTTCGGCGGCGGCGGCGTGGGTCTGAGCGCACTGCTGG GCGCCCGTGCGGTGGGTGCCGACCGTGTTGTTGTCATTGAGCCGAATGCAGCG CGCCGTGCGCTGGCATTGGAACTGGGTGCCAGCCACGCACTGGACCCGCATG CCGAGGGCGACCTTGTTGCGGCGATTAAAGCTGCGACGGGTGGCGGCGCTAC GCATAGCTTGGATACGACCGGCCTGCCGCCAGTCATTGGCTCCGCGATCGCGT GTACTCTGCCGGGTGGCACCGTTGGTATGGTTGGTCTGCCGGCGCCGGACGC ACCGGTCCCTGCGACGCTGTTGGATCTGCTGAGCAAATCGGTTACCCTGCGTC CGATTACCGAGGGTGACGCTGACCCGCAACGCTTCATCCCGCGTATGCTGGAT TTCCATCGTGCGGGCAAGTTTCCGTTCGACCGCCTGATCACCCGTTACCGCTTT GATCAGATCAATGAAGCGCTGCACGCGACCGAGAAAGGTGAAGCAATCAAACC
GGTTCTGGTGTTTTAA Sequência de aminoácidos CdGeoA – SEQ ID NO: 54
MNDTQDFISAQAAVLRQVGGPLAVEPVRISMPKGDEVLIRIAGVGVCHTD LVCRDGFPVPLPIVLGHEGSGTVEAVGEQVRTLKPGDRVVLSFNSCGHCGNCHDG HPSNCLQMLPLNFGGAQRVDGGQVLDGAGHPVQSMFFGQSSFGTHAVAREINAV KVGDDLPLELLGPLGCGIQTGAGAAINSLGIGPGQSLAIFGGGGVGLSALLGARAVG ADRVVVIEPNAARRALALELGASHALDPHAEGDLVAAIKAATGGGATHSLDTTGLPP VIGSAIACTLPGGTVGMVGLPAPDAPVPATLLDLLSKSVTLRPITEGDADPQRFIPRM
LDFHRAGKFPFDRLITRYRFDQINEALHATEKGEAIKPVLVF cDNA otimizado por VoADH1 – SEQ ID NO: 55
ATGACTAAATCCAGCGGTGAAGTGATTTCTTGTAAGGCAGCAGTGAT CTATAAGAGCGGTGAGCCTGCTAAAGTTGAAGAAATTCGTGTTGATCCGCCTAA GAGCAGCGAAGTTCGTATTAAGATGCTGTACGCCTCCTTGTGTCACACGGACAT TCTGTGTTGCAACGGCCTGCCGGTGCCGCTGTTTCCGCGCATTCCGGGTCACG AGGGCGTGGGTGTTGTGGAGAGCGCGGGTGAAGATGTGAAAGATGTTAAAGAG GGCGACATCGTTATGCCACTGTACCTGGGCGAGTGTGGTGAGTGCCTCAATTG CAGCAGCGGTAAGACGAATCTGTGCCACAAGTACCCACTGGACTTCTCTGGTGT GCTGCCGAGCGACGGTACGAGCCGCATGTCAGTAGCAAAATCCGGTGAGAAAA TTTTCCATCACTTCAGCTGTAGCACCTGGTCCGAATATGTTGTCATCGAGAGCTC GTATGTCGTCAAAGTTGATAGCCGTCTGCCGCTGCCGCATGCGTCCTTTCTGGC ATGCGGCTTCACCACGGGTTACGGCGCGGCGTGGAAAGAGGCTGACATTCCGA AGGGCAGCACCGTCGCGGTGCTGGGCCTGGGTGCGGTCGGTCTGGGTGTGGT TGCTGGTGCGCGTTCTCAGGGTGCGAGCCGCATTATTGGCGTGGACATCAACG ACAAGAAAAAAGCAAAAGCCGAGATCTTTGGTGTTACTGAGTTTCTGAATCCGAA GCAACTGGGTAAAAGCGCGAGCGAAAGCATCAAAGACGTCACCGGCGGCCTG GGCGTTGACTACTGTTTCGAGTGCACCGGTGTCCCGGCCCTGTTGAACGAAGC CGTGGATGCGAGCAAGATCGGCTTGGGTACGATCGTCATGATTGGTGCGGGTA TGGAAACCAGCGGTGTTATTAACTATATCCCGCTGCTGTGCGGCCGTAAACTGA TCGGTAGCATTTACGGTGGCGTTCGCATCCGTAGCGACTTACCGCTGATCATTG AGAAATGCATCAACAAAGAAATTCCGCTGAACGAACTGCAGACCCACGAAGTGA GCTTGGAAGGCATTAATGATGCATTCGGCATGCTGAAGCAACCGGACTGCGTTA
AGATCGTCATCAAGTTCGAGCAGAAATAA Sequência de aminoácidos VoADH1 – SEQ ID NO: 56
MTKSSGEVISCKAAVIYKSGEPAKVEEIRVDPPKSSEVRIKMLYASLCHTD ILCCNGLPVPLFPRIPGHEGVGVVESAGEDVKDVKEGDIVMPLYLGECGECLNCSS GKTNLCHKYPLDFSGVLPSDGTSRMSVAKSGEKIFHHFSCSTWSEYVVIESSYVVK VDSRLPLPHASFLACGFTTGYGAAWKEADIPKGSTVAVLGLGAVGLGVVAGARSQ GASRIIGVDINDKKKAKAEIFGVTEFLNPKQLGKSASESIKDVTGGLGVDYCFECTGV PALLNEAVDASKIGLGTIVMIGAGMETSGVINYIPLLCGRKLIGSIYGGVRIRSDLPLIIE KCINKEIPLNELQTHEVSLEGINDAFGMLKQPDCVKIVIKFEQK
Motivo de assinatura de sítio ativo - SEQ ID NO: 57 HCxxGxxR em que cada x independentemente um do outro representa qualquer resíduo de aminoácido natural. Motivo de assinatura de sítio ativo - SEQ ID NO: 58 HC(T/S)xGKDRTG em que x representa qualquer resíduo de aminoácido natural. PvCPS, Proteína multifuncional que tem prenil-transferase e difosfato de copalilo sintase, cDNA otimizado por códon - SEQ ID NO: 59
ATGAGCCCTATGGATTTGCAAGAAAGCGCCGCAGCCCTGGTCCGTCA ATTGGGTGAACGCGTTGAGGATCGCCGCGGTTTTGGTTTCATGAGCCCGGCCA TTTATGACACGGCCTGGGTTAGCATGATTAGCAAGACCATCGACGACCAAAAAA CTTGGCTGTTTGCGGAGTGCTTCCAGTACATTCTGTCTCACCAACTGGAAGATG GTGGCTGGGCGATGTACGCATCCGAAATCGATGCCATCTTGAATACTTCCGCGT CACTGCTGTCCCTGAAACGCCACCTGTCCAACCCTTACCAGATCACCAGCATCA CTCAGGAAGATCTGAGCGCTCGCATCAACCGCGCTCAAAACGCCCTGCAGAAA TTGCTGAACGAGTGGAACGTTGACTCCACGCTGCACGTCGGTTTCGAGATTCTG GTTCCGGCGCTGCTGCGCTATCTGGAAGATGAAGGCATCGCGTTTGCGTTCTC GGGTCGTGAGCGTTTGTTAGAGATTGAGAAACAAAAACTGTCCAAGTTTAAAGC GCAGTATTTGTACTTACCGATTAAGGTCACCGCACTGCATAGCCTGGAAGCCTT CATCGGCGCTATTGAGTTCGACAAAGTCAGCCATCACAAAGTATCCGGTGCTTT CATGGCGTCGCCGTCTAGCACCGCAGCATACATGATGCATGCGACGCAATGGG ATGACGAATGTGAGGATTACTTGCGTCACGTGATCGCGCATGCGTCAGGTAAG GGTTCTGGCGGCGTGCCGAGCGCCTTTCCGAGCACCATCTTCGAGAGCGTTTG GCCGCTGTCTACTCTGCTGAAAGTTGGCTATGATCTGAATAGCGCTCCGTTCAT CGAGAAAATTCGTAGCTACTTGCACGATGCCTATATCGCAGAGAAAGGTATTCT CGGTTTCACCCCGTTCGTTGGCGCTGACGCGGACGACACCGCTACCACGATTC TGGTGTTGAATCTGCTGAACCAACCGGTGAGCGTGGACGCGATGTTGAAAGAAT TTGAAGAGGAACATCACTTCAAGACCTACAGCCAAGAGCGTAATCCGAGCTTTT CCGCAAACTGTAATGTTCTGCTGGCGCTGCTGTACAGCCAGGAACCGAGCCTG TACAGCGCGCAAATCGAAAAAGCGATCCGTTTTCTGTATAAGCAATTCACCGAC TCTGAGATGGATGTGCGCGATAAATGGAACCTGTCCCCGTATTATAGCTGGATG CTGATGACCCAGGCCATCACCCGTCTGACGACCCTGCAAAAGACCAGCAAGCT GAGCACGCTGCGTGATGACAGCATTAGCAAGGGCCTGATTTCTCTGCTGTTCCG CATTGCATCCACCGTGGTTAAAGATCAAAAACCGGGTGGCAGCTGGGGCACGC GTGCGAGCAAAGAAGAAACGGCATACGCCGTGCTGATTCTGACCTACGCGTTTT ATCTGGACGAGGTGACCGAGTCTCTGCGCCACGATATCAAAATTGCAATCGAGA ATGGTTGCTCGTTCCTGAGCGAGCGCACCATGCAAAGCGACAGCGAGTGGCTG TGGGTCGAAAAGGTTACCTACAAGAGCGAAGTGCTGAGCGAAGCATACATCCT GGCAGCTCTGAAACGTGCGGCAGACTTGCCGGATGAGAACGCTGAGGCAGCC CCAGTGATCAACGGTATCTCTACCAATGGCTTTGAGCACACCGACCGCATTAAT GGTAAACTCAAGGTCAATGGTACGAATGGCACCAACGGTTCCCACGAAACGAAC GGTATCAATGGCACCCATGAGATTGAGCAAATTAATGGTGTCAACGGCACGAAT GGCCATAGCGACGTGCCACATGACACGAATGGTTGGGTCGAGGAACCGACGG CGATTAATGAAACGAACGGTCACTACGTTAACGGCACCAACCATGAGACTCCGC TGACCAATGGTATTAGCAATGGTGACTCCGTGAGCGTTCACACCGACCATAGCG ACAGCTACTATCAGCGTAGCGACTGGACCGCGGATGAAGAACAGATCCTGCTG GGTCCATTCGATTACCTGGAATCCCTGCCTGGTAAAAATATGCGCAGCCAGCTG ATCCAGTCTTTCAATACGTGGCTGAAGGTCCCGACCGAGAGCTTGGACGTGATT ATTAAGGTCATTAGCATGCTGCACACTGCTAGCCTGCTGATCGACGATATTCAG GACCAAAGCATCCTGCGTCGTGGTCAGCCTGTGGCGCACTCGATCTTCGGCAC CGCGCAAGCGATGAACTCTGGTAACTATGTTTACTTCCTGGCATTGCGTGAAGT TCAGAAATTGCAAAACCCGAAGGCTATCAGCATTTATGTGGACAGCTTGATCGA TCTTCATCGCGGCCAGGGCATGGAACTGTTCTGGCGTGATTCTCTGATGTGCCC GACTGAAGAACAGTATCTGGACATGGTGGCGAACAAGACCGGTGGCCTGTTTT GTCTGGCGATTCAGCTGATGCAGGCAGAAGCGACCATTCAGGTTGATTTTATTC CGCTGGTGCGTCTGCTGGGTATCATTTTCCAGATTTGCGACGACTACCTGAACT TGAAAAGCACTGCGTATACCGACAACAAAGGTCTGTGTGAAGATCTTACCGAGG GTAAATTCTCCTTCCCGATCATTCACAGCATCCGTAGCAATCCGGGCAATCGTC AGCTGATCAATATTCTGAAGCAAAAACCGCGCGAAGATGACATCAAGCGTTACG CACTGTCCTATATGGAGAGCACGAATAGCTTCGAGTACACCCGTGGCGTCGTCC GTAAATTGAAAACCGAAGCAATTGACACGATTCAAGGTCTGGAGAAGCATGGCC TGGAAGAAAACATTGGTATTCGTAAGATTCTGGCGCGTATGAGCCTGGAACTGT
AA PvCPS, Proteína multifuncional que tem prenil-transferase e difosfato de copalilo sintase, sequência de aminoácidos - SEQ ID NO: 60
MSPMDLQESAAALVRQLGERVEDRRGFGFMSPAIYDTAWVSMISKTIDD QKTWLFAECFQYILSHQLEDGGWAMYASEIDAILNTSASLLSLKRHLSNPYQITSITQ EDLSARINRAQNALQKLLNEWNVDSTLHVGFEILVPALLRYLEDEGIAFAFSGRERLL EIEKQKLSKFKAQYLYLPIKVTALHSLEAFIGAIEFDKVSHHKVSGAFMASPSSTAAY MMHATQWDDECEDYLRHVIAHASGKGSGGVPSAFPSTIFESVWPLSTLLKVGYDL NSAPFIEKIRSYLHDAYIAEKGILGFTPFVGADADDTATTILVLNLLNQPVSVDAMLKE FEEEHHFKTYSQERNPSFSANCNVLLALLYSQEPSLYSAQIEKAIRFLYKQFTDSEM DVRDKWNLSPYYSWMLMTQAITRLTTLQKTSKLSTLRDDSISKGLISLLFRIASTVVK DQKPGGSWGTRASKEETAYAVLILTYAFYLDEVTESLRHDIKIAIENGCSFLSERTMQ SDSEWLWVEKVTYKSEVLSEAYILAALKRAADLPDENAEAAPVINGISTNGFEHTDRI NGKLKVNGTNGTNGSHETNGINGTHEIEQINGVNGTNGHSDVPHDTNGWVEEPTAI NETNGHYVNGTNHETPLTNGISNGDSVSVHTDHSDSYYQRSDWTADEEQILLGPF DYLESLPGKNMRSQLIQSFNTWLKVPTESLDVIIKVISMLHTASLLIDDIQDQSILRRG QPVAHSIFGTAQAMNSGNYVYFLALREVQKLQNPKAISIYVDSLIDLHRGQGMELFW RDSLMCPTEEQYLDMVANKTGGLFCLAIQLMQAEATIQVDFIPLVRLLGIIFQICDDYL NLKSTAYTDNKGLCEDLTEGKFSFPIIHSIRSNPGNRQLINILKQKPREDDIKRYALSY
MESTNSFEYTRGVVRKLKTEAIDTIQGLEKHGLEENIGIRKILARMSLEL Sítio de ligação de ribossomo - SEQ ID NO:
AAGGAGGTAAAAAA CrtE, sintase GGPP de Pantoea agglomerans, códon otimizado para expressão em S. cerevisiae - SEQ ID NO: 62
ATGGTTTCTGGTTCTAAGGCTGGTGTTTCTCCACACAGAGAAATCGAA GTTATGAGACAATCTATCGACGACCACTTGGCTGGTTTGTTGCCAGAAACTGAC TCTCAAGACATCGTTTCTTTGGCTATGAGAGAAGGTGTTATGGCTCCAGGTAAG AGAATCAGACCATTGTTGATGTTGTTGGCTGCTAGAGACTTGAGATACCAAGGT TCTATGCCAACTTTGTTGGACTTGGCTTGTGCTGTTGAATTGACTCACACTGCTT CTTTGATGTTGGACGACATGCCATGTATGGACAACGCTGAATTGAGAAGAGGTC AACCAACTACTCACAAGAAGTTCGGTGAATCTGTTGCTATCTTGGCTTCTGTTGG TTTGTTGTCTAAGGCTTTCGGTTTGATCGCTGCTACTGGTGACTTGCCAGGTGA AAGAAGAGCTCAAGCTGTTAACGAATTGTCTACTGCTGTTGGTGTTCAAGGTTTG GTTTTGGGTCAATTCAGAGACTTGAACGACGCTGCTTTGGACAGAACTCCAGAC GCTATCTTGTCTACTAACCACTTGAAGACTGGTATCTTGTTCTCTGCTATGTTGC AAATCGTTGCTATCGCTTCTGCTTCTTCTCCATCTACTAGAGAAACTTTGCACGC TTTCGCTTTGGACTTCGGTCAAGCTTTCCAATTGTTGGACGACTTGAGAGACGA CCACCCAGAAACTGGTAAGGACAGAAACAAGGACGCTGGTAAGTCTACTTTGGT TAACAGATTGGGTGCTGACGCTGCTAGACAAAAGTTGAGAGAACACATCGACTC TGCTGACAAGCACTTGACTTTCGCTTGTCCACAAGGTGGTGCTATCAGACAATT CATGCACTTGTGGTTCGGTCACCACTTGGCTGACTGGTCTCCAGTTATGAAGAT
CGCTTAA SmCPS2, pirofosfato de copalilo sintase de Salvia miltiorrhiza, otimizada por códon para expressão em S. cerevisiae - SEQ ID NO: 63
ATGGCTACTGTTGACGCTCCACAAGTTCACGACCACGACGGTACTAC TGTTCACCAAGGTCACGACGCTGTTAAGAACATCGAAGACCCAATCGAATACAT CAGAACTTTGTTGAGAACTACTGGTGACGGTAGAATCTCTGTTTCTCCATACGAC ACTGCTTGGGTTGCTATGATCAAGGACGTTGAAGGTAGAGACGGTCCACAATTC CCATCTTCTTTGGAATGGATCGTTCAAAACCAATTGGAAGACGGTTCTTGGGGT GACCAAAAGTTGTTCTGTGTTTACGACAGATTGGTTAACACTATCGCTTGTGTTG TTGCTTTGAGATCTTGGAACGTTCACGCTCACAAGGTTAAGAGAGGTGTTACTTA CATCAAGGAAAACGTTGACAAGTTGATGGAAGGTAACGAAGAACACATGACTTG TGGTTTCGAAGTTGTTTTCCCAGCTTTGTTGCAAAAGGCTAAGTCTTTGGGTATC GAAGACTTGCCATACGACTCTCCAGCTGTTCAAGAAGTTTACCACGTTAGAGAA CAAAAGTTGAAGAGAATCCCATTGGAAATCATGCACAAGATCCCAACTTCTTTGT TGTTCTCTTTGGAAGGTTTGGAAAACTTGGACTGGGACAAGTTGTTGAAGTTGC AATCTGCTGACGGTTCTTTCTTGACTTCTCCATCTTCTACTGCTTTCGCTTTCATG CAAACTAAGGACGAAAAGTGTTACCAATTCATCAAGAACACTATCGACACTTTCA ACGGTGGTGCTCCACACACTTACCCAGTTGACGTTTTCGGTAGATTGTGGGCTA TCGACAGATTGCAAAGATTGGGTATCTCTAGATTCTTCGAACCAGAAATCGCTGA CTGTTTGTCTCACATCCACAAGTTCTGGACTGACAAGGGTGTTTTCTCTGGTAGA GAATCTGAATTCTGTGACATCGACGACACTTCTATGGGTATGAGATTGATGAGAA TGCACGGTTACGACGTTGACCCAAACGTTTTGAGAAACTTCAAGCAAAAGGACG GTAAGTTCTCTTGTTACGGTGGTCAAATGATCGAATCTCCATCTCCAATCTACAA CTTGTACAGAGCTTCTCAATTGAGATTCCCAGGTGAAGAAATCTTGGAAGACGC TAAGAGATTCGCTTACGACTTCTTGAAGGAAAAGTTGGCTAACAACCAAATCTTG GACAAGTGGGTTATCTCTAAGCACTTGCCAGACGAAATCAAGTTGGGTTTGGAA ATGCCATGGTTGGCTACTTTGCCAAGAGTTGAAGCTAAGTACTACATCCAATACT ACGCTGGTTCTGGTGACGTTTGGATCGGTAAGACTTTGTACAGAATGCCAGAAA TCTCTAACGACACTTACCACGACTTGGCTAAGACTGACTTCAAGAGATGTCAAG CTAAGCACCAATTCGAATGGTTGTACATGCAAGAATGGTACGAATCTTGTGGTAT CGAAGAATTCGGTATCTCTAGAAAGGACTTGTTGTTGTCTTACTTCTTGGCTACT GCTTCTATCTTCGAATTGGAAAGAACTAACGAAAGAATCGCTTGGGCTAAGTCTC AAATCATCGCTAAGATGATCACTTCTTTCTTCAACAAGGAAACTACTTCTGAAGA AGACAAGAGAGCTTTGTTGAACGAATTGGGTAACATCAACGGTTTGAACGACAC TAACGGTGCTGGTAGAGAAGGTGGTGCTGGTTCTATCGCTTTGGCTACTTTGAC TCAATTCTTGGAAGGTTTCGACAGATACACTAGACACCAATTGAAGAACGCTTG GTCTGTTTGGTTGACTCAATTGCAACACGGTGAAGCTGACGACGCTGAATTGTT GACTAACACTTTGAACATCTGTGCTGGTCACATCGCTTTCAGAGAAGAAATCTTG GCTCACAACGAATACAAGGCTTTGTCTAACTTGACTTCTAAGATCTGTAGACAAT TGTCTTTCATCCAATCTGAAAAGGAAATGGGTGTTGAAGGTGAAATCGCTGCTAA GTCTTCTATCAAGAACAAGGAATTGGAAGAAGACATGCAAATGTTGGTTAAGTTG GTTTTGGAAAAGTACGGTGGTATCGACAGAAACATCAAGAAGGCTTTCTTGGCT GTTGCTAAGACTTACTACTACAGAGCTTACCACGCTGCTGACACTATCGACACT CACATGTTCAAGGTTTTGTTCGAACCAGTTGCTTAA
SmCPS2, pirofosfato de copalilo sintase de Salvia miltiorrhiza, sequência de aminoácidos - SEQ ID NO: 64
MATVDAPQVHDHDGTTVHQGHDAVKNIEDPIEYIRTLLRTTGDGRISVSP YDTAWVAMIKDVEGRDGPQFPSSLEWIVQNQLEDGSWGDQKLFCVYDRLVNTIAC VVALRSWNVHAHKVKRGVTYIKENVDKLMEGNEEHMTCGFEVVFPALLQKAKSLGI EDLPYDSPAVQEVYHVREQKLKRIPLEIMHKIPTSLLFSLEGLENLDWDKLLKLQSAD GSFLTSPSSTAFAFMQTKDEKCYQFIKNTIDTFNGGAPHTYPVDVFGRLWAIDRLQR LGISRFFEPEIADCLSHIHKFWTDKGVFSGRESEFCDIDDTSMGMRLMRMHGYDVD PNVLRNFKQKDGKFSCYGGQMIESPSPIYNLYRASQLRFPGEEILEDAKRFAYDFLK EKLANNQILDKWVISKHLPDEIKLGLEMPWLATLPRVEAKYYIQYYAGSGDVWIGKTL YRMPEISNDTYHDLAKTDFKRCQAKHQFEWLYMQEWYESCGIEEFGISRKDLLLSY FLATASIFELERTNERIAWAKSQIIAKMITSFFNKETTSEEDKRALLNELGNINGLNDT NGAGREGGAGSIALATLTQFLEGFDRYTRHQLKNAWSVWLTQLQHGEADDAELLT NTLNICAGHIAFREEILAHNEYKALSNLTSKICRQLSFIQSEKEMGVEGEIAAKSSIKN
KELEEDMQMLVKLVLEKYGGIDRNIKKAFLAVAKTYYYRAYHAADTIDTHMFKVLFE PVA* TalVeTPP, pirofosfato de copalilo fosfatase, otimizada por códon para expressão em S. cerevisiae - SEQ ID NO: 65
ATGTCTAACGACACTACTACTACTGCTTCTGCTGGTACTGCTACTTCT TCTAGATTCTTGTCTGTTGGTGGTGTTGTTAACTTCAGAGAATTGGGTGGTTACC CATGTGACTCTGTTCCACCAGCTCCAGCTTCTAACGGTTCTCCAGACAACGCTT CTGAAGCTACTTTGTGGGTTGGTCACTCTTCTATCAGACCAGGTTTCTTGTTCAG ATCTGCTCAACCATCTCAAATCACTCCAGCTGGTATCGAAACTTTGATCAGACAA TTGGGTATCCAAACTATCTTCGACTTCAGATCTAGAACTGAAATCGAATTGGTTG CTACTAGATACCCAGACTCTTTGTTGGAAATCCCAGGTACTACTAGATACTCTGT TCCAGTTTTCTCTGAAGGTGACTACTCTCCAGCTTCTTTGGTTAAGAGATACGGT GTTTCTTCTGACACTGCTACTGACTCTACTTCTTCTAAGTCTGCTAAGCCAACTG GTTTCGTTCACGCTTACGAAGCTATCGCTAGATCTGCTGCTGAAAACGGTTCTTT CAGAAAGATCACTGACCACATCATCCAACACCCAGACAGACCAATCTTGTTCCA CTGTACTTTGGGTAAGGACAGAACTGGTGTTTTCGCTGCTTTGTTGTTGTCTTTG TGTGGTGTTCCAGACGAAACTATCGTTGAAGACTACGCTATGACTACTGAAGGT TTCGGTGCTTGGAGAGAACACTTGATCCAAAGATTGTTGCAAAGAAAGGACGCT GCTACTAGAGAAGACGCTGAATCTATCATCGCTTCTCCACCAGAAACTATGAAG GCTTTCTTGGAAGACGTTGTTGCTGCTAAGTTCGGTGGTGCTAGAAACTACTTC ATCCAACACTGTGGTTTCACTGAAGCTGAAGTTGACAAGTTGTCTCACACTTTGG
CTATCACTAACTAA AzTolADH1, álcool desidrogenase de Azoarcus toluclasticus, otimizada por códon para expressão em S. cerevisiae - SEQ ID NO: 66
ATGGGTTCTATCCAAGACTCTTTGTTCATCAGAGCTAGAGCTGCTGTT TTGAGAACTGTTGGTGGTCCATTGGAAATCGAAAACGTTAGAATCTCTCCACCAA AGGGTGACGAAGTTTTGGTTAGAATGGTTGGTGTTGGTGTTTGTCACACTGACG TTGTTTGTAGAGACGGTTTCCCAGTTCCATTGCCAATCGTTTTGGGTCACGAAG GTTCTGGTATCGTTGAAGCTGTTGGTGAAAGAGTTACTAAGGTTAAGCCAGGTC AAAGAGTTGTTTTGTCTTTCAACTCTTGTGGTCACTGTGCTTCTTGTTGTGAAGA CCACCCAGCTACTTGTCACCAAATGTTGCCATTGAACTTCGGTGCTGCTCAAAG AGTTGACGGTGGTACTGTTATCGACGCTTCTGGTGAAGCTGTTCAATCTTTGTTC TTCGGTCAATCTTCTTTCGGTACTTACGCTTTGGCTAGAGAAGTTAACACTGTTC CAGTTCCAGACGCTGTTCCATTGGAAATCTTGGGTCCATTGGGTTGTGGTATCC AAACTGGTGCTGGTGCTGCTATCAACTCTTTGGCTTTGAAGCCAGGTCAATCTTT GGCTATCTTCGGTGGTGGTTCTGTTGGTTTGTCTGCTTTGTTGGGTGCTTTGGC TGTTGGTGCTGGTCCAGTTGTTGTTATCGAACCAAACGAAAGAAGAAGAGCTTT GGCTTTGGACTTGGGTGCTTCTCACGCTTTCGACCCATTCAACACTGAAGACTT GGTTGCTTCTATCAAGGCTGCTACTGGTGGTGGTGTTACTCACTCTTTGGACTC TACTGGTTTGCCACCAGTTATCGCTAACGCTATCAACTGTACTTTGCCAGGTGGT ACTGTTGGTTTGTTGGGTGTTCCATCTCCAGAAGCTGCTGTTCCAGTTACTTTGT TGGACTTGTTGGTTAAGTCTGTTACTTTGAGACCAATCACTGAAGGTGACGCTAA CCCACAAGAATTCATCCCAAGAATGGTTCAATTGTACAGAGACGGTAAGTTCCC ATTCGACAAGTTGATCACTACTTACAGATTCGACGACATCAACCAAGCTTTCAAG
GCTACTGAAACTGGTGAAGCTATCAAGCCAGTTTTGGTTTTCTAA PsAeroADH1, álcool desidrogenase de Pseudomonas aeruginosa,
otimizada por códon para expressão em S. cerevisiae - SEQ ID NO: 67
ATGAACTCTATCCAACCAACTCAAGCTAAGGCTGCTGTTTTGAGAGCT GTTGGTGGTCCATTCTCTATCGAACCAATCAGAATCTCTCCACCAAAGGGTGAC GAAGTTTTGGTTAGAATCGTTGGTGTTGGTGTTTGTCACACTGACGTTGTTTGTA GAGACTCTTTCCCAGTTCCATTGCCAATCATCTTGGGTCACGAAGGTTCTGGTG TTATCGAAGCTGTTGGTGACCAAGTTACTGGTTTGAAGCCAGGTGACCACGTTG TTTTGTCTTTCAACTCTTGTGGTCACTGTTACAACTGTGGTCACGACGAACCAGC TTCTTGTTTGCAAATGTTGCCATTGAACTTCGGTGGTGCTGAAAGAGCTGCTGA CGGTACTATCGAAGACGACCAAGGTGCTGCTGTTAGAGGTTTGTTCTTCGGTCA ATCTTCTTTCGGTTCTTACGCTATCGCTAGAGCTGTTAACACTGTTAAGGTTGAC GACGACTTGCCATTGGCTTTGTTGGGTCCATTGGGTTGTGGTATCCAAACTGGT GCTGGTGCTGCTATGAACTCTTTGGGTTTGCAAGGTGGTCAATCTTTCATCGTTT TCGGTGGTGGTGCTGTTGGTTTGTCTGCTGTTATGGCTGCTAAGGCTTTGGGTG TTTCTCCATTGATCGTTGTTGAACCAAACGAAGCTAGAAGAGCTTTGGCTTTGGA ATTGGGTGCTTCTCACGCTTTCGACCCATTCAACACTGAAGACTTGGTTGCTTCT ATCAGAGAAGTTGTTCCAGCTGGTGCTAACCACGCTTTGGACACTACTGGTTTG CCAAAGGTTATCGCTAACGCTATCGACTGTATCATGTCTGGTGGTAAGTTGGGT TTGTTGGGTATGGCTAACCCAGAAGCTAACGTTCCAGCTACTTTGTTGGACTTGT TGTCTAAGAACGTTACTTTGAAGCCAATCACTGAAGGTGACGCTAACCCACAAG AATTCATCCCAAGAATGTTGGCTTTGTACAGAGAAGGTAAGTTCCCATTCGACAA GTTGATCACTACTTTCCCATTCGAACACATCAACGAAGCTATGGAAGCTACTGAA
TCTGGTAAGGCTATCAAGCCAGTTTTGACTTTGTAA SCH23-ADH1, álcool desidrogenase de Hyphozyma roseonigra, otimizada por códon para expressão em S. cerevisiae - SEQ ID NO: 68
ATGCAATTCTCTATCGGTGACGTTTTGGCTATCGTTGACAAGACTATC TTGAACCCATTGGTTGTTTCTGCTGGTTTGTTGTCTTTGCACTTCTTGACTAACG ACAAGTACGCTATCACTGCTAACGACGGTTTGTTCCCATACCAAATCTCTACTCC AGACTCTCACAGAAAGGCTTTGTTCGCTTTGGGTTTCGGTTTGTTGTTGAGAGCT AACAGATACATGTCTAGAAAGGCTTTGAACAACAACACTGCTGCTCAATTCGACT GGAACAGAGAAATCATCGTTGTTACTGGTGGTTCTGGTGGTATCGGTGCTCAAG CTGCTCAAAAGTTGGCTGAAAGAGGTTCTAAGGTTATCGTTATCGACGTTTTGCC ATTGACTTTCGACAAGCCAAAGAACTTGTACCACTACAAGTGTGACTTGACTAAC TACAAGGAATTGCAAGAAGTTGCTGCTAAGATCGAAAGAGAAGTTGGTACTCCA ACTTGTGTTGTTGCTAACGCTGGTATCTGTAGAGGTAAGAACATCTTCGACGCTA CTGAAAGAGACGTTCAATTGACTTTCGGTGTTAACAACTTGGGTTTGTTGTGGAC TGCTAAGACTTTCTTGCCATCTATGGCTAAGGCTAACCACGGTCACTTCTTGATC ATCGCTTCTCAAACTGGTCACTTGGCTACTGCTGGTGTTGTTGACTACGCTGCT ACTAAGGCTGCTGCTATCGCTATCTACGAAGGTTTGCAAACTGAAATGAAGCAC TTCTACAAGGCTCCAGCTGTTAGAGTTTCTTGTATCTCTCCATCTGCTGTTAAGA CTAAGATGTTCGCTGGTATCAAGACTGGTGGTAACTTCTTCATGCCAATGTTGAC TCCAGACGACTTGGGTGACTTGATCGCTAAGACTTTGTGGGACGGTGTTGCTGT TAACATCTTGTCTCCAGCTGCTGCTTACATCTCTCCACCAACTAGAGCTTTGCCA GACTGGATGAGAGTTGGTATGCAAGACGCTGGTGCTGAAATCATGACTGAATTG
ACTCCACACAAGCCATTGGAATAA CH23-ADH1, álcool desidrogenase de Hyphozyma roseonigra, otimizada por códon para expressão em S. cerevisiae - SEQ ID NO: 69
MQFSIGDVLAIVDKTILNPLVVSAGLLSLHFLTNDKYAITANDGLFPYQIST PDSHRKALFALGFGLLLRANRYMSRKALNNNTAAQFDWNREIIVVTGGSGGIGAQA AQKLAERGSKVIVIDVLPLTFDKPKNLYHYKCDLTNYKELQEVAAKIEREVGTPTCVV ANAGICRGKNIFDATERDVQLTFGVNNLGLLWTAKTFLPSMAKANHGHFLIIASQTG HLATAGVVDYAATKAAAIAIYEGLQTEMKHFYKAPAVRVSCISPSAVKTKMFAGIKTG GNFFMPMLTPDDLGDLIAKTLWDGVAVNILSPAAAYISPPTRALPDWMRVGMQDAG
AEIMTELTPHKPLE SCH24-ADH1a, álcool desidrogenase de Cryptococcus albidus, otimizada por códon para expressão em S. cerevisiae - SEQ ID NO: 70
ATGCCAACTCCAATCTTCGGTGCTAGAGAAGGTTTCACTATCGACTCT GTTTTGTCTATCTTGGACGCTACTGTTTTGAACCCATGGTTCACTGGTGTTTGTT TGATCGCTGTTTGTGCTAGAGACAGAACTATCACTTACCCAGACTGGCCAGCTG CTTTGGACCAAGTTTTGCCATTCTTGTCTCAAATGTGGAGAGAAACTGTTAGACC AACTTTCGGTGACAGAAACGTTTTGCACTTGTTGACTACTGTTTGTGTTGGTTTG GCTATCAGAACTAACAGAAGAATGTCTAGAGGTGCTAGAAACAACTGGGTTTGG GACACTTCTTACGACTGGAAGAAGGAAATCGTTGTTGTTACTGGTGGTGCTGCT GGTTTCGGTGCTGACATCGTTCAACAATTGGACACTAGAGGTATCCAAGTTGTT GTTTTGGACGTTGGTTCTTTGACTTACAGACCATCTTCTAGAGTTCACTACTACA AGTGTGACGTTTCTAACCCACAAGACGTTGCTTCTGTTGCTAAGGCTATCGTTTC TAACGTTGGTCACCCAACTATCTTGGTTAACAACGCTGGTGTTTTCAGAGGTGCT ACTATCTTGTCTACTACTCCAAGAGACTTGGACATGACTTACGACATCAACGTTA AGGCTCACTACCACTTGACTAAGGCTTTCTTGCCAAACATGATCTCTAAGAACCA CGGTCACATCGTTACTGTTTCTTCTGCTACTGCTTACGCTCAAGCTTGTTCTGGT GTTTCTTACTGTTCTTCTAAGGCTGCTATCTTGTCTTTCCACGAAGGTTTGTCTG AAGAAATCTTGTGGATCTACAAGGCTCCAAAGGTTAGAACTTCTGTTATCTGTCC AGGTCACGTTAACACTGCTATGTTCACTGGTATCGGTGCTGCTGCTCCATCTTTC ATGGCTCCAGCTTTGCACCCATCTACTGTTGCTGAAACTATCGTTGACGTTTTGT TGTCTTGTGAATCTCAACACGTTTTGATGCCAGCTGCTATGCACATGTCTGTTGC TGGTAGAGCTTTGCCAACTTGGTTCTTCAGAGGTTTGTTGGCTTCTGGTAAGGA
CACTATGGGTTCTGTTGTTAGAAGATAA SCH24-ADH1a, álcool desidrogenase de Cryptococcus albidus, sequência de aminoácidos - SEQ ID NO: 71
MPTPIFGAREGFTIDSVLSILDATVLNPWFTGVCLIAVCARDRTITYPDWP AALDQVLPFLSQMWRETVRPTFGDRNVLHLLTTVCVGLAIRTNRRMSRGARNNWV WDTSYDWKKEIVVVTGGAAGFGADIVQQLDTRGIQVVVLDVGSLTYRPSSRVHYYK CDVSNPQDVASVAKAIVSNVGHPTILVNNAGVFRGATILSTTPRDLDMTYDINVKAH YHLTKAFLPNMISKNHGHIVTVSSATAYAQACSGVSYCSSKAAILSFHEGLSEEILWI
YKAPKVRTSVICPGHVNTAMFTGIGAAAPSFMAPALHPSTVAETIVDVLLSCESQHV LMPAAMHMSVAGRALPTWFFRGLLASGKDTMGSVVRR* Sequência para recombinação homóloga 1 - SEQ ID NO: 72
GCACTTGCTACACTGTCAGGATAGCTTCCGTCACATGGTGGCGATCA
CCGTACATCTGAG Sequência para recombinação homóloga 2 - SEQ ID NO: 73
AGGTGCAGTTCGCGTGCAATTATAACGTCGTGGCAACTGTTATCAGT
CGTACCGCGCCAT Sequência para recombinação homóloga 3 - SEQ ID NO: 74
TGGTCAGCAACAACGCCGAAGAATCACTCTCGTGTTGAGAATTGCAC
GCCTTGACCACGA Iniciador para marcador de levedura LEU2 1- SEQ ID NO: 75
AGGTGCAGTTCGCGTGCAATTATAACGTCGTGGCAACTGTTATCAGT
CGTACCGCGCCATTCGACTACGTCGTAAGGCC Iniciador para marcador de levedura LEU2 2- SEQ ID NO: 76
TCGTGGTCAAGGCGTGCAATTCTCAACACGAGAGTGATTCTTCGGCG
TTGTTGCTGACCATCGACGGTCGAGGAGAACTT Iniciador para marcador bacteriano AmpR 1- -SEQ ID NO: 77
TGGTCAGCAACAACGCCGAAGAATCACTCTCGTGTTGAGAATTGCAC
GCCTTGACCACGACACGTTAAGGGATTTTGGTCATGAG Iniciador para marcador bacteriano AmpR 2- -SEQ ID NO: 78
AACGCGTACCCTAAGTACGGCACCACAGTGACTATGCAGTCCGCACT
TTGCCAATGCCAAAAATGTGCGCGGAACCCCTA Iniciador para origem de replicação de levedura - SEQ ID NO: 79
TTGGCATTGGCAAAGTGCGGACTGCATAGTCACTGTGGTGCCGTACT
TAGGGTACGCGTTCCTGAACGAAGCATCTGTGCTTCA Iniciador para origem de replicação de levedura 2 - SEQ ID NO: 80
CCGAGATGCCAAAGGATAGGTGCTATGTTGATGACTACGACACAGAA
CTGCGGGTGACATAATGATAGCATTGAAGGATGAGACT Iniciador para origem de replicação de E. coli 1 - SEQ ID NO: 81
ATGTCACCCGCAGTTCTGTGTCGTAGTCATCAACATAGCACCTATCCT
TTGGCATCTCGGTGAGCAAAAGGCCAGCAAAAGG Iniciador para origem de replicação de E. coli 2 - SEQ ID NO: 82
CTCAGATGTACGGTGATCGCCACCATGTGACGGAAGCTATCCTGACA
GTGTAGCAAGTGCTGAGCGTCAGACCCCGTAGAA Sequência para recombinação homóloga 4 - SEQ ID NO: 83
ATTCCTAGTGACGGCCTTGGGAACTCGATACACGATGTTCAGTAGAC CGCTCACACATGG

Claims (17)

REIVINDICAÇÕES
1. Método biocatalítico para produção de um composto de álcool terpênico, da fórmula geral 1 (1) em que R representa H ou um resíduo de hidrocarbilo opcionalmente substituído cíclico ou não cíclico, linear ou ramificado, saturado ou insaturado, caracterizado por compreender as etapas de: (1) estabelecer o contato do precursor de difosfato de terpenilo correspondente do dito composto de terpeno de fórmula (1) com um polipeptídeo tendo atividade de difosfato de terpenilo fosfatase para formar o dito álcool terpênico; e (2) opcionalmente isolar o álcool terpênico da etapa (1). em que o dito polipeptídeo tendo atividade de difosfato de terpenilo fosfatase é selecionado de um membro da enzima de remoção de difosfato da família da proteína tirosina fosfatase.
2. Método biocatalítico para produzir um composto de álcool diterpênico bicíclico, caracterizado pelo fato de que compreende as etapas de a) estabelecer o contato do precursor de difosfato de diterpenilo bicíclico correspondente do dito composto de diterpeno bicíclico com um polipeptídeo tendo atividade de difosfato de terpenilo fosfatase para formar o dito álcool diterpênico bicíclico; e b) opcionalmente isolar o álcool diterpênico bicíclico da etapa (1).
3. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que o dito polipeptídeo tendo atividade de difosfato de terpenilo fosfatase é selecionado de um membro da enzima de remoção de difosfato da família da proteína tirosina fosfatase.
4. Método, de acordo com a reivindicação 1 ou 3, caracterizado pelo fato de que o dito polipeptídeo tendo atividade de difosfato de terpenilo fosfatase é selecionado de uma classe de enzimas de remoção de difosfato caracterizadas por uma sequência de aminoácidos tendo o seguinte motivo de assinatura de sítio ativo: HCxxGxxR (SEQ ID NO: 57) em que cada x independentemente um do outro representa qualquer resíduo de aminoácido natural.
5. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que o dito motivo de assinatura de sítio ativo é: HC(T/S)xGKDRTG (SEQ ID NO: 58) em que x representa qualquer resíduo de aminoácido natural.
6. Método, de acordo com qualquer uma das reivindicações 1 a 5, caracterizado pelo fato de que o dito polipeptídeo tendo atividade de difosfato de terpenilo fosfatase é selecionado do grupo que consiste dos polipeptídeos: a) TalVeTPP compreendendo uma sequência de aminoácidos de acordo com o SEQ ID NO: 2, b) AspWeTPP compreendendo uma sequência de aminoácidos de acordo com o SEQ ID NO: 6, c) HelGriTPP compreendendo uma sequência de aminoácidos de acordo com o SEQ ID NO: 10, d) UmbPiTPP1, compreendendo uma sequência de aminoácidos de acordo com o SEQ ID NO: 13, e) TalVeTPP2, compreendendo uma sequência de aminoácidos de acordo com o SEQ ID NO: 16, f) HydPiTPP1, compreendendo uma sequência de aminoácidos de acordo com o SEQ ID NO: 19, g) TalCeTPP1, compreendendo uma sequência de aminoácidos de acordo com o SEQ ID NO: 22,
h) TalMaTPP1, compreendendo uma sequência de aminoácidos de acordo com o SEQ ID NO: 25, i) TalAstroTPP1 compreendendo uma sequência de aminoácidos de acordo com o SEQ ID NO: 28, e j) PeSubTPP1 compreendendo uma sequência de aminoácidos de acordo com o SEQ ID NO: 31 e k) um polipeptídeo tendo atividade de difosfato de terpenilo fosfatase e compreendendo uma sequência de aminoácidos que apresenta um grau de identidade de sequência de pelo menos 60% com pelo menos uma das ditas sequências de aminoácidos de acordo com a) a j).
7. Método, de acordo com qualquer uma das reivindicações 1 e 4 a 6, caracterizado pelo fato de que um composto de álcool terpênico da fórmula geral 1 é preparado, em que R representa H ou um resíduo de hidrocarbilo não cíclico, linear ou ramificado, saturado ou insaturado.
8. Método, de acordo com a reivindicação 7, caracterizado pelo fato de que o álcool terpênico de fórmula 1 é selecionado de farnesol e geranilgeraniol.
9. Método, de acordo com qualquer uma das reivindicações 2 a 6, caracterizado pelo fato de que a etapa (1) também compreende estabelecer contato de um precursor de difosfato de terpenilo não cíclico com um polipeptídeo tendo atividade de difosfato de diterpenilo sintase bicíclica para formar o dito precursor de difosfato de diterpenilo bicíclico.
10. Método, de acordo com a reivindicação 9, caracterizado pelo fato de que a difosfato de diterpenilo sintase bicíclica é selecionada de a) SmCPS2 compreendendo uma sequência de aminoácidos de acordo com o SEQ ID NO: 34, b) TaTps1-del59 compreendendo uma sequência de aminoácidos de acordo com o SEQ ID NO: 40, c) SsLPS compreendendo uma sequência de aminoácidos de acordo com o SEQ ID NO: 38, e d) um polipeptídeo tendo atividade de difosfato de diterpenilo sintase bicíclica e compreendendo uma sequência de aminoácidos que mostra um grau de identidade de sequência de pelo menos 60% com pelo menos uma das ditas sequências de aminoácidos de acordo com a), b) e c).
11. Método, de acordo com qualquer uma das reivindicações 2 a 6, 9 e 10, caracterizado pelo fato de que o dito álcool diterpênico bicíclico produzido biocataliticamente é selecionado de copalol e labdendiol, cada um na forma estereoisomérica essencialmente pura ou na forma de uma mistura de pelo menos dois estereoisômeros.
12. Método, de acordo com qualquer uma das reivindicações 1 a 11, caracterizado pelo fato de que compreende adicionalmente como etapa (3) o processamento do álcool terpênico da etapa (1) ou da etapa (2) em um derivado de álcool usando síntese química ou biocatalítica ou uma combinação de ambas.
13. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que o derivado é um hidrocarboneto, álcool, diol, triol, acetal, cetal, aldeído, ácido, éter, amida, cetona, lactona, epóxido, acetato, glicosídeo e/ou um éster.
14. Método, de acordo com a reivindicação 12 ou 13, caracterizado pelo fato de que o dito álcool terpênico é oxidado biocataliticamente.
15. Método, de acordo com a reivindicação 14, caracterizado pelo fato de que o dito álcool terpênico é convertido pelo contato com uma álcool desidrogenase (ADH).
16. Método, de acordo com a reivindicação 15, caracterizado pelo fato de que a dita ADH é selecionada de a) CymB compreendendo uma sequência de aminoácidos de acordo com o SEQ ID NO: 42; b) AspWeADH1 compreendendo uma sequência de aminoácidos de acordo com o SEQ ID NO: 44; c) PsAeroADH1 compreendendo uma sequência de aminoácidos de acordo com o SEQ ID NO: 46; d) AzTolADH1 compreendendo uma sequência de aminoácidos de acordo com o SEQ ID NO: 48;
e) AroAroADH1 compreendendo uma sequência de aminoácidos de acordo com o SEQ ID NO: 50; f) ThTerpADH1 compreendendo uma sequência de aminoácidos de acordo com o SEQ ID NO: 52; g) CdGeoA compreendendo uma sequência de aminoácidos de acordo com o SEQ ID NO: 54; h) VoADH1 compreendendo uma sequência de aminoácidos de acordo com o SEQ ID NO: 56; i) SCH23-ADH1 compreendendo uma sequência de aminoácidos de acordo com o SEQ ID NO: 68 j) SCH24-ADH1a compreendendo uma sequência de aminoácidos de acordo com o SEQ ID NO: 70; e k) um polipeptídeo tendo atividade de ADH e compreendendo uma sequência de aminoácidos que apresenta um grau de identidade de sequência de pelo menos 60% com pelo menos uma das ditas sequências de aminoácidos de acordo com a) a j).
17. Método para preparar um composto semelhante a ambrox da fórmula geral, o método caracterizado por compreender: (1) fornecer um composto de labdendiol ou copalol realizando-se um método biocatalítico, do tipo definido em qualquer uma das reivindicações 1 a 16, opcionalmente isolando o dito composto de labdendiol ou copalol; e (2) converter o dito composto de labdendiol ou copalol da etapa (1) usando síntese química e/ou síntese bioquímica em um composto semelhante a ambrox.
BR112020024197-0A 2018-07-10 2019-07-10 método para produção biocatalítica de compostos de terpeno BR112020024197A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18182783.3 2018-07-10
EP18182783 2018-07-10
PCT/EP2019/068609 WO2020011883A1 (en) 2018-07-10 2019-07-10 Method for biocatalytic production of terpene compounds

Publications (1)

Publication Number Publication Date
BR112020024197A2 true BR112020024197A2 (pt) 2021-02-17

Family

ID=62916485

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020024197-0A BR112020024197A2 (pt) 2018-07-10 2019-07-10 método para produção biocatalítica de compostos de terpeno

Country Status (7)

Country Link
US (1) US11214775B2 (pt)
EP (1) EP3821023A1 (pt)
JP (2) JP7406511B2 (pt)
CN (1) CN112334581A (pt)
BR (1) BR112020024197A2 (pt)
MX (1) MX2020012933A (pt)
WO (1) WO2020011883A1 (pt)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021178850A1 (en) * 2020-03-06 2021-09-10 Board Of Trustees Of Michigan State University Method to produce the anti-microbial diterpenoid leubethanol and related serrulatane-type diterpenes
EP4370671A1 (en) * 2021-07-16 2024-05-22 Amyris, Inc. Novel enzymes for the production of e-copalol

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6303654B1 (en) * 1998-03-12 2001-10-16 Wisconsin Alumni Research Foundation Acyclic monoterpenoid derivatives
DE19931847A1 (de) 1999-07-09 2001-01-11 Basf Ag Immobilisierte Lipase
DE10019380A1 (de) 2000-04-19 2001-10-25 Basf Ag Verfahren zur Herstellung von kovalent gebundenen biologisch aktiven Stoffen an Polyurethanschaumstoffen sowie Verwendung der geträgerten Polyurethanschaumstoffe für chirale Synthesen
EP2238256B1 (en) 2008-01-29 2015-10-14 Firmenich S.A. Method for producing sclareol
GB201601249D0 (en) * 2016-01-22 2016-03-09 Firmenich & Cie Production of manool
KR102636404B1 (ko) * 2016-06-15 2024-02-13 경상국립대학교산학협력단 터펜 알코올 또는 그 유도체의 제조 방법
CN107119001B (zh) * 2017-04-26 2019-07-19 福建师范大学 基因工程化类球红细菌及其制备方法和法尼醇的生产方法

Also Published As

Publication number Publication date
CN112334581A (zh) 2021-02-05
JP2021524261A (ja) 2021-09-13
US11214775B2 (en) 2022-01-04
WO2020011883A1 (en) 2020-01-16
JP7406511B2 (ja) 2023-12-27
MX2020012933A (es) 2021-02-15
JP2024029002A (ja) 2024-03-05
US20210222138A1 (en) 2021-07-22
EP3821023A1 (en) 2021-05-19

Similar Documents

Publication Publication Date Title
Bai et al. De novo biosynthesis of Gastrodin in Escherichia coli
JP2020507352A (ja) 酵母におけるポリケチドの生成のための方法及び細胞株
US20230183761A1 (en) Biocatalytic method for the controlled degradation of terpene compounds
BR112020017362A2 (pt) Método para produzir vanilina
RU2654670C2 (ru) Способ получения ароматических спиртов
JP2024029002A (ja) テルペン化合物の生体触媒的な製造方法
US20230148463A9 (en) Method for producing albicanol and/or drimenol
US10208326B2 (en) Methods and materials for biosynthesis of manoyl oxide
BR112020023411A2 (pt) Método para produzir compostos de albicanol
BR112021003271A2 (pt) método para produzir compostos de acetato de drimanila
BR112020010924A2 (pt) oxidação de sesquiterpenos catalisada por mono-oxigenase do citocromo p450
JP2015509729A (ja) アルドキシムデヒドラターゼを使用するテルペンオキシムからのテルペンニトリルの製造方法
EP4013862A2 (en) Novel polypeptides for producing albicanol and/or drimenol compounds
Jin et al. Piperonal synthase from black pepper (Piper nigrum) synthesizes a phenolic aroma compound, piperonal, as a CoA-independent catalysis
WO2024115469A2 (en) Process for making flavanone derivatives
US20180112243A1 (en) Biosynthesis of acetylated 13r-mo and related compounds
RUDROFF P168 ENANTIODIVERGENT BAEYER-VILLIGER OXIDATION OF FUNCTIONALIZED PROCHIRAL CYCLOHEXANONE DERIVATIVES UTILIZING RECOMBINANT CELLS

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]