BR112017028183B1 - MANOOL PRODUCTION - Google Patents

MANOOL PRODUCTION Download PDF

Info

Publication number
BR112017028183B1
BR112017028183B1 BR112017028183-0A BR112017028183A BR112017028183B1 BR 112017028183 B1 BR112017028183 B1 BR 112017028183B1 BR 112017028183 A BR112017028183 A BR 112017028183A BR 112017028183 B1 BR112017028183 B1 BR 112017028183B1
Authority
BR
Brazil
Prior art keywords
synthase
nucleic acid
polypeptide
manool
seq
Prior art date
Application number
BR112017028183-0A
Other languages
Portuguese (pt)
Other versions
BR112017028183A2 (en
Inventor
Michel Schalk
Letizia ROCCI
Original Assignee
Firmenich S.A
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB1601249.4A external-priority patent/GB201601249D0/en
Application filed by Firmenich S.A filed Critical Firmenich S.A
Publication of BR112017028183A2 publication Critical patent/BR112017028183A2/en
Publication of BR112017028183B1 publication Critical patent/BR112017028183B1/en

Links

Abstract

PRODUÇÃO DE MANOOL. Métodos de produção de (+)-manool que compreendem: colocar o difosfato de geranilgeranila em contato com uma difosfato de copalila sintase (CPP) para formar um difosfato de (9S, 10S)-copalila em que a CPP sintase compreende uma sequência de aminoácidos que tem pelo menos 90%, 95%, 98%, 99% e 100% de identidade de sequência com um polipeptídeo selecionado a partir do grupo que consiste em SEQ ID NO: 1 e SEQ ID NO:2; e colocar o CPP em contato com uma enzima esclareol sintase para formar (+)-manool.MANOOL PRODUCTION. Methods of producing (+)-manool comprising: bringing geranylgeranyl diphosphate into contact with a copalyl diphosphate synthase (CPP) to form a (9S, 10S)-copalyl diphosphate in which the CPP synthase comprises an amino acid sequence which has at least 90%, 95%, 98%, 99% and 100% sequence identity with a polypeptide selected from the group consisting of SEQ ID NO: 1 and SEQ ID NO: 2; and placing the CPP in contact with a sclareol synthase enzyme to form (+)-manool.

Description

CAMPO DA TÉCNICAFIELD OF TECHNIQUE

[001] São fornecidos no presente documento métodos bioquímicos de produção de (+)-manool com uso de uma difosfato de copalila sintase e uma esclareol sintase. Antecedentes[001] Biochemical methods of producing (+)-manool using a copalyl diphosphate synthase and a sclareol synthase are provided in this document. Background

[002] Terpenos são encontrados na maioria dos organismos (microrganismos, animais e plantas). Esses compostos são constituídos por cinco unidades de carbono denominadas unidades de isopreno e são classificados pelo número dessas unidades presentes em sua estrutura. Desse modo, monoterpenos, sesquiterpenos e diterpenos são terpenos que contêm 10, 15 e 20 átomos de carbono, respectivamente. Sesquiterpenos, por exemplo, são amplamente encontrados no reino vegetal. Muitas moléculas de terpeno (por exemplo, sesquiterpeno) são conhecidas por suas propriedades de sabor e aroma e seus efeitos cosméticos, medicinais e antimicrobianos. Vários hidrocarbonetos de terpeno (por exemplo, sesquiterpeno) e terpenoides (por exemplo, sesquiterpenoides) foram identificados.[002] Terpenes are found in most organisms (microorganisms, animals and plants). These compounds are made up of five carbon units called isoprene units and are classified by the number of these units present in their structure. Thus, monoterpenes, sesquiterpenes and diterpenes are terpenes that contain 10, 15 and 20 carbon atoms, respectively. Sesquiterpenes, for example, are widely found in the plant kingdom. Many terpene molecules (e.g., sesquiterpene) are known for their flavor and aroma properties and their cosmetic, medicinal, and antimicrobial effects. Several terpene hydrocarbons (e.g., sesquiterpene) and terpenoids (e.g., sesquiterpenoids) have been identified.

[003] A produção biossintética de terpenos envolve enzimas chamadas terpeno sintases. Essas enzimas convertem um precursor de terpeno acíclico em um ou mais produtos de terpeno. Em particular, a diterpeno sintases produzem diterpenos pela ciclização do precursor de pirofosfateto de geranilgeranila (GGPP). A ciclização de GGPP frequentemente exige dois polipeptídeos de enzima, uma diterpeno sintase do tipo I e tipo II que funciona em combinação em duas reações enzimáticas sucessivas. As diterpeno sintases do tipo II catalisam uma ciclização/redisposição de GGPP iniciado pela protonação da ligação dupla terminal de GGPP que leva a um intermediário de difosfato de diterpeno cíclico. Esse intermediário é, então, adicionalmente convertido por uma diterpeno sintase do tipo I que catalisa uma ciclização iniciada por ionização.[003] The biosynthetic production of terpenes involves enzymes called terpene synthases. These enzymes convert an acyclic terpene precursor into one or more terpene products. In particular, diterpene synthases produce diterpenes by cyclization of the precursor geranylgeranyl pyrophosphate (GGPP). Cyclization of GGPP often requires two enzyme polypeptides, a type I and type II diterpene synthase that function in combination in two successive enzymatic reactions. Type II diterpene synthases catalyze a cyclization/redisposition of GGPP initiated by protonation of the terminal double bond of GGPP that leads to a cyclic diterpene diphosphate intermediate. This intermediate is then further converted by a type I diterpene synthase that catalyzes an ionization-initiated cyclization.

[004] As diterpeno sintases estão presentes nas plantas e em outros organismos e usam substratos, tal como difosfato de geranligeranila, mas têm diferentes perfis de produto. Os genes e cDNAs que codificam as diterpeno sintases foram clonados e as enzimas recombinantes correspondentes foram caracterizadas.[004] Diterpene synthases are present in plants and other organisms and use substrates, such as geraniumligeranyl diphosphate, but have different product profiles. The genes and cDNAs encoding diterpene synthases were cloned and the corresponding recombinant enzymes were characterized.

[005] As difosfato de copalilas sintases e esclareol sintases são enzimas que ocorrem em plantas. Por conseguinte, deseja-se revelar e usar essas enzimas e variantes em processos bioquímicos para gerar (+)-manool[005] Copalyl diphosphate synthases and sclareol synthases are enzymes that occur in plants. Therefore, it is desired to reveal and use these enzymes and variants in biochemical processes to generate (+)-manool

Sumáriosummary

[006] É fornecido no presente documento um método para produzir (+)-manool que compreende: a) colocar o difosfato de geranilgeranila em contato com uma difosfato de copalila sintase (CPP) para formar um difosfato de (9S, 10S)-copalila em que a CPP sintase compreende uma sequência de aminoácidos que tem pelo menos 90%, 95%, 98%, 99% ou 100% de identidade de sequência com um polipeptídeo selecionado a partir do grupo que consiste em SEQ ID NO: 1 e SEQ ID NO:2; e b) colocar o difosfato de (9S, 10S)-copalila CPP em contato com uma esclareol sintase para formar (+)-manool; e c) isolar opcionalmente o (+)-manool.[006] Provided herein is a method for producing (+)-manool comprising: a) placing geranylgeranyl diphosphate in contact with a copalyl diphosphate synthase (CPP) to form a (9S, 10S)-copalyl diphosphate wherein the CPP synthase comprises an amino acid sequence that has at least 90%, 95%, 98%, 99% or 100% sequence identity with a polypeptide selected from the group consisting of SEQ ID NO: 1 and SEQ ID NO:2; and b) placing the (9S, 10S)-copalyl diphosphate CPP in contact with a sclareol synthase to form (+)-manool; and c) optionally isolating the (+)-manool.

[007] Também é fornecido no presente documento um polipeptídeo em que o polipeptídeo compreende uma sequência de aminoácidos que tem pelo menos 90%, 95%, 98%, 99% ou 100% de identidade de sequência com um polipeptídeo selecionado a partir do grupo que consiste em SEQ ID NO: 1 e SEQ ID NO:2.[007] Also provided herein is a polypeptide wherein the polypeptide comprises an amino acid sequence that has at least 90%, 95%, 98%, 99% or 100% sequence identity with a polypeptide selected from the group which consists of SEQ ID NO: 1 and SEQ ID NO:2.

[008] É também fornecido no presente documento um ácido nucleico que codifica um polipeptídeo descrito acima.[008] Also provided herein is a nucleic acid encoding a polypeptide described above.

[009] Também é fornecido no presente documento um ácido nucleico em que o ácido nucleico compreende uma sequência de nucleotídeos que tem pelo menos 90%, 95%, 98%, 99% ou 100% de identidade de sequência com SEQ ID NO 3.[009] Also provided herein is a nucleic acid wherein the nucleic acid comprises a nucleotide sequence that has at least 90%, 95%, 98%, 99% or 100% sequence identity with SEQ ID NO 3.

[0010] Também é fornecido no presente documento um método para transformar uma célula hospedeira ou organismo não humano com um ácido nucleico que codifica um polipeptídeo que tem uma atividade de difosfato de copalila sintase e um polipeptídeo que tem uma atividade de esclareol sintase em que o polipeptídeo que tem uma atividade de difosfato de copalila sintase compreende uma sequência de aminoácidos que tem pelo menos 90%, 95%, 98%, 99% ou 100% de identidade de sequência com um polipeptídeo selecionado a partir do grupo que consiste em SEQ ID NO: 1 e SEQ ID NO:2 e em que o polipeptídeo que tem a atividade de esclareol sintase compreende uma sequência de aminoácidos que tem pelo menos 90%, 95%, 98%, 99% ou 100% de identidade de sequência com um polipeptídeo selecionado a partir do grupo que consiste em SEQ ID NO:4 e SEQ ID NO:5. Também é fornecido no presente documento uma célula hospedeira ou organismo não humano produzido pelo método.[0010] Also provided herein is a method for transforming a host cell or non-human organism with a nucleic acid encoding a polypeptide having a copalyl diphosphate synthase activity and a polypeptide having a sclareol synthase activity in which the A polypeptide having a copalyl diphosphate synthase activity comprises an amino acid sequence that has at least 90%, 95%, 98%, 99% or 100% sequence identity with a polypeptide selected from the group consisting of SEQ ID NO: 1 and SEQ ID NO: 2 and wherein the polypeptide having sclareol synthase activity comprises an amino acid sequence that has at least 90%, 95%, 98%, 99% or 100% sequence identity with a polypeptide selected from the group consisting of SEQ ID NO:4 and SEQ ID NO:5. Also provided herein is a host cell or non-human organism produced by the method.

[0011] Também é fornecido no presente documento um vetor de expressão que compreende um ácido nucleico que codifica uma CPP sintase em que a CPP sintase compreende uma sequência de aminoácidos que tem pelo menos 90%, 95%, 98%, 99% ou 100% de identidade de sequência com um polipeptídeo selecionado a partir do grupo que consiste em SEQ ID NO: 1 e SEQ ID NO:2, e um ácido nucleico que codifica uma esclareol sintase.[0011] Also provided herein is an expression vector comprising a nucleic acid encoding a CPP synthase wherein the CPP synthase comprises an amino acid sequence that is at least 90%, 95%, 98%, 99% or 100 % sequence identity with a polypeptide selected from the group consisting of SEQ ID NO: 1 and SEQ ID NO: 2, and a nucleic acid encoding a sclareol synthase.

[0012] Também é fornecido no presente documento uma célula ou organismo hospedeiro não humano que compreende pelo menos um ácido nucleico que codifica um polipeptídeo que tem atividade de CPP sintase, e pelo menos um ácido nucleico que codifica um polipeptídeo que tem atividade de esclareol sintase, em que o polipeptídeo que tem atividade de CPP sintase compreende uma sequência de aminoácidos que tem pelo menos 90%, 95%, 98%, 99% ou 100% de identidade de sequência com um polipeptídeo selecionado a partir do grupo que consiste em SEQ ID NO: 1 e SEQ ID NO:2.[0012] Also provided herein is a non-human host cell or organism comprising at least one nucleic acid encoding a polypeptide having CPP synthase activity, and at least one nucleic acid encoding a polypeptide having sclareol synthase activity. , wherein the polypeptide having CPP synthase activity comprises an amino acid sequence that has at least 90%, 95%, 98%, 99% or 100% sequence identity with a polypeptide selected from the group consisting of SEQ ID NO: 1 and SEQ ID NO:2.

[0013] Também é fornecido no presente documento um método para produzir (+)manool que compreende cultivar uma célula ou organismo hospedeiro de acordo com a invenção.[0013] Also provided herein is a method for producing (+)manool comprising culturing a host cell or organism in accordance with the invention.

Descrição dos desenhos.Description of the drawings.

[0014] Figura 1. Trajetória enzimática de difosfato de geranilgeranila (GGPP) para (+)-manool.[0014] Figure 1. Enzymatic trajectory from geranylgeranyl diphosphate (GGPP) to (+)-manool.

[0015] Figura 2. Análise de GCMS da conversão enzimática in vitro de GGPP. A. Uso da enzima recombinante SmCPS. B. Uso da enzima recombinante SsScS. C. Combinação das enzimas SmCPS com SsScS em um único ensaio.[0015] Figure 2. GCMS analysis of the in vitro enzymatic conversion of GGPP. A. Use of the recombinant enzyme SmCPS. B. Use of the recombinant enzyme SsScS. C. Combination of SmCPS enzymes with SsScS in a single assay.

[0016] Figura 3. Análise de GCMS de (+)-manool produzido com uso de células E. coli que expressam SmCPS, SsScS e enzimas de trajetória de mevalonato. A. Cromatograma de íon total de um extrato do meio de cultura E. coli. B. Cromatograma de íon total de um padrão de (+)-manool. C. Espectro de massa do pico principal (tempo de retenção de 14,55 min) no cromatograma A. D. Espectro de massa do padrão autêntico de (+)-manool.[0016] Figure 3. GCMS analysis of (+)-manool produced using E. coli cells expressing SmCPS, SsScS and mevalonate pathway enzymes. A. Total ion chromatogram of an extract from E. coli culture medium. B. Total ion chromatogram of a (+)-manool standard. C. Mass spectrum of the main peak (14.55 min retention time) in the A chromatogram. D. Mass spectrum of the authentic (+)-manool standard.

[0017] Figura 4. Trajetórias enzimáticas de difosfato de geranilgeranila (GGPP) para (+)-manool e esclareol.[0017] Figure 4. Enzymatic trajectories from geranylgeranyl diphosphate (GGPP) to (+)-manool and sclareol.

Descrição DetalhadaDetailed Description

[0018] Abreviações usadas[0018] Abbreviations used

[0019] bp par de bases[0019] bp base pair

[0020] kb quilobase[0020] kb kilobase

[0021] DNA ácido deoxirribonucleico[0021] DNA deoxyribonucleic acid

[0022] cDNA DNA complementar[0022] cDNA complementary DNA

[0023] CPP difosfato de copalila[0023] CPP copalyl diphosphate

[0024] DTT ditiotreitol[0024] DTT dithiothreitol

[0025] FPP difosfato de farnesila[0025] FPP farnesyl diphosphate

[0026] GGPP difosfato de geranlgeranila[0026] GGPP geranylgeranyl diphosphate

[0027] GC cromatografia gasosa[0027] GC gas chromatography

[0028] IPTG isopropil-D-tiogalacto-piranosídeo[0028] IPTG isopropyl-D-thiogalacto-pyranoside

[0029] LB caldo de lisogenia[0029] LB lysogeny broth

[0030] MS espectrômetro de massa[0030] MS mass spectrometer

[0031] MVA ácido mevalônico[0031] MVA mevalonic acid

[0032] PCR reação em cadeia de polimerase[0032] PCR polymerase chain reaction

[0033] RNA ácido ribonucleico[0033] RNA ribonucleic acid

[0034] mRNA ácido ribonucleico mensageiro miRNA microRNA[0034] mRNA messenger ribonucleic acid miRNA microRNA

[0035] siRNA RNA interferente curto[0035] siRNA short interfering RNA

[0036] rRNA RNA ribossômico[0036] rRNA ribosomal RNA

[0037] tRNA RNA de transferência[0037] tRNA transfer RNA

DEFINIÇÕESDEFINITIONS

[0038] O termo “polipeptídeo” significa uma sequência de aminoácidos de resíduos de aminoácidos consecutivamente polimerizados, por exemplo, pelo menos 15 resíduos, pelo menos 30 resíduos, pelo menos 50 resíduos. Em algumas modalidades fornecidas no presente documento, um polipeptídeo compreende uma sequência de aminoácidos que é uma enzima, ou um fragmento, ou uma variante da mesma.[0038] The term “polypeptide” means an amino acid sequence of consecutively polymerized amino acid residues, for example, at least 15 residues, at least 30 residues, at least 50 residues. In some embodiments provided herein, a polypeptide comprises an amino acid sequence that is an enzyme, or a fragment, or a variant thereof.

[0039] O termo polipeptídeo “isolado” se refere a uma sequência de aminoácidos que é removida de seu ambiente natural por qualquer método ou combinação de métodos conhecidos na técnica e inclui métodos recombinantes, bioquímicos e sintéticos.[0039] The term “isolated” polypeptide refers to an amino acid sequence that is removed from its natural environment by any method or combination of methods known in the art and includes recombinant, biochemical and synthetic methods.

[0040] O termo “proteína” se refere a uma sequência de aminoácidos de qualquer comprimento, em que os aminoácidos estão ligados por ligações peptídicas covalentes, e inclui um oligopeptídeo, um peptídeo, um polipeptídeo e uma proteína de comprimento completo seja de ocorrência natural ou sintético.[0040] The term “protein” refers to an amino acid sequence of any length, in which the amino acids are linked by covalent peptide bonds, and includes an oligopeptide, a peptide, a polypeptide and a full-length protein whether naturally occurring or synthetic.

[0041] Os termos "função biológica", "função", "atividade biológica" ou "atividade" se referem à capacidade da CPP sintase e à atividade de esclareol sintase para catalisar a formação de (+)-manool. A "função biológica", "função", "atividade biológica" ou "atividade" de CPP sintase pode, por exemplo, se referir à capacidade da CPP sintase para catalisar a formação de difosfato de (9S, 10S)-copalila de GGPP. A "função biológica", "função", "atividade biológica" ou "atividade" de esclareol sintase pode, por exemplo, se referir à capacidade da esclareol sintase para catalisar a formação de (+)manool do difosfato de (9S, 10S)-copalila.[0041] The terms "biological function", "function", "biological activity" or "activity" refer to the ability of CPP synthase and the activity of sclareol synthase to catalyze the formation of (+)-manool. The "biological function", "function", "biological activity" or "activity" of CPP synthase may, for example, refer to the ability of CPP synthase to catalyze the formation of (9S, 10S)-copalyl diphosphate of GGPP. The "biological function", "function", "biological activity" or "activity" of sclareol synthase may, for example, refer to the ability of sclareol synthase to catalyze the formation of (+)mannol from (9S, 10S) diphosphate -copalyl.

[0042] Uma esclareol sintase pode se referir a uma enzima, por exemplo, uma enzima de ocorrência natural, que tem a capacidade para catalisar a formação de esclareol do difosfato de labdendiol (LPP) conforme mostrado na Figura 4. LPP pode ser produzido a partir de GGPP pela ação de uma difosfato-labdendiol sintase (LPS) (consulte a Figura 4). Para uso na presente invenção, tal como esclareol sintase, conforme visto acima, também tem capacidade para catalisar a formação de (+)manool do difosfato de (9S, 10S)-copalila. Será entendido que, por exemplo, formas variantes, de fragmento e truncadas de esclareol sintases podem ser usadas na invenção visto que têm capacidade para catalisar a formação de (+)manool do difosfato de (9S, 10S)-copalila. Será adicionalmente entendido que tal, por exemplo, forma variante, de fragmento ou truncada de enzimas esclareol sintase podem ter perdido alguma ou toda a capacidade para catalisar a formação de esclareol do LPP sem se desviarem de sua adequabilidade para uso na invenção.[0042] A sclareol synthase can refer to an enzyme, for example, a naturally occurring enzyme, that has the ability to catalyze the formation of sclareol from labdendiol diphosphate (LPP) as shown in Figure 4. LPP can be produced at from GGPP by the action of a labdendiol diphosphate synthase (LPS) (see Figure 4). For use in the present invention, such as sclareol synthase, as seen above, also has the ability to catalyze the formation of (+)manool from (9S, 10S)-copalyl diphosphate. It will be understood that, for example, variant, fragment and truncated forms of sclareol synthases can be used in the invention as they have the ability to catalyze the formation of (+)manool from (9S, 10S)-copalyl diphosphate. It will be further understood that such, for example, variant, fragment or truncated form of sclareol synthase enzymes may have lost some or all of the ability to catalyze the formation of sclareol from LPP without deviating from their suitability for use in the invention.

[0043] Os termos "sequência de ácidos nucleicos", "ácido nucleico" e "polinucleotídeo" são usados de modo intercambiável significando uma sequência de nucleotídeos. Uma sequência de ácidos nucleicos pode ser um desoxirribonucleotídeo de filamento simples ou duplo, ou ribonucleotídeo de qualquer comprimento, e inclui sequências de não codificação e codificação de um gene, éxons, íntrons, sequências complementares de senso e antissenso, DNA genômico, cDNA, miRNA, siRNA, mRNA, rRNA, tRNA, sequências de ácidos nucleicos recombinantes, sequências de RNA e/ou DNA de ocorrência natural isoladas ou purificadas, sequências de DNA e RNA sintéticos, fragmentos, iniciadores e sondas de ácido nucleico. O versado na técnica está ciente de que as sequências de ácidos nucleicos de RNA são idênticas às sequências de DNA com a diferença de timina (T) ser substituída por uracila (U).[0043] The terms "nucleic acid sequence", "nucleic acid" and "polynucleotide" are used interchangeably to mean a sequence of nucleotides. A nucleic acid sequence can be a single- or double-stranded deoxyribonucleotide, or ribonucleotide of any length, and includes non-coding and coding sequences of a gene, exons, introns, complementary sense and antisense sequences, genomic DNA, cDNA, miRNA , siRNA, mRNA, rRNA, tRNA, recombinant nucleic acid sequences, isolated or purified naturally occurring RNA and/or DNA sequences, synthetic DNA and RNA sequences, nucleic acid fragments, primers and probes. The person skilled in the art is aware that RNA nucleic acid sequences are identical to DNA sequences with the difference that thymine (T) is replaced by uracil (U).

[0044] Um “ácido nucleico isolado” ou “sequência de ácidos nucleicos isolada” é definido como um ácido nucleico ou uma sequência de ácidos nucleicos que está em um ambiente diferente daquele em que o ácido nucleico ou a sequência de ácidos nucleicos ocorre naturalmente. O termo “de ocorrência natural”, conforme usado no presente documento e conforme aplicado a um ácido nucleico, se refere a um ácido nucleico que é encontrado em uma célula na natureza. Por exemplo, uma sequência de ácidos nucleicos que está presente em um organismo, por exemplo, nas células de um organismo, que pode ser isolada de uma fonte na natureza e que não foi modificada intencionalmente por um ser humano no laboratório, é de ocorrência natural.[0044] An “isolated nucleic acid” or “isolated nucleic acid sequence” is defined as a nucleic acid or nucleic acid sequence that is in an environment other than that in which the nucleic acid or nucleic acid sequence occurs naturally. The term “naturally occurring”, as used herein and as applied to a nucleic acid, refers to a nucleic acid that is found in a cell in nature. For example, a nucleic acid sequence that is present in an organism, e.g., in the cells of an organism, that can be isolated from a source in nature and that has not been intentionally modified by a human in the laboratory, is naturally occurring .

[0045] “Sequências de ácidos nucleicos recombinantes” são sequências de ácidos nucleicos que resultam do uso de métodos laboratoriais (clonagem molecular) para unir material genético de mais de uma fonte, criando uma sequência de ácidos nucleicos que não ocorre naturalmente ou não é encontrada de outro modo em organismos biológicos.[0045] “Recombinant nucleic acid sequences” are nucleic acid sequences that result from the use of laboratory methods (molecular cloning) to join genetic material from more than one source, creating a nucleic acid sequence that does not occur naturally or is not found otherwise in biological organisms.

[0046] “Tecnologia de DNA recombinante” se refere a procedimentos de biologia molecular para preparar uma sequência de ácidos nucleicos recombinantes, conforme descrito, por exemplo, em Laboratory Manuals editado por Weigel and Glazebrook, 2002 Cold Spring Harbor Lab Press; e Sambrook et al., 1989 Cold Spring Harbor, NY: Cold Spring Harbor Laboratory Press.[0046] “Recombinant DNA technology” refers to molecular biology procedures for preparing a recombinant nucleic acid sequence, as described, for example, in Laboratory Manuals edited by Weigel and Glazebrook, 2002 Cold Spring Harbor Lab Press; and Sambrook et al., 1989 Cold Spring Harbor, NY: Cold Spring Harbor Laboratory Press.

[0047] O termo "gene" significa uma sequência de DNA que compreende uma região, que é transcrita em uma molécula de RNA, por exemplo, um mRNA em uma célula, operacionalmente ligada a regiões reguladoras adequadas, por exemplo, um promotor. Um gene pode compreender, ainda, várias sequências ligadas operacionalmente, tal como um promotor, uma sequência de iniciação 5’ que compreende, por exemplo, sequências envolvidas na iniciação de tradução, uma região de codificação de cDNA ou DNA genômico, íntrons, éxons e/ou uma sequência não traduzida 3’ que compreende, por exemplo, sítios de terminação de transcrição.[0047] The term "gene" means a DNA sequence comprising a region, which is transcribed into an RNA molecule, for example, an mRNA in a cell, operably linked to suitable regulatory regions, for example, a promoter. A gene may further comprise several operably linked sequences, such as a promoter, a 5' initiation sequence comprising, for example, sequences involved in translation initiation, a cDNA or genomic DNA coding region, introns, exons and /or a 3' untranslated sequence comprising, for example, transcription termination sites.

[0048] Um “gene quimérico” se refere a qualquer gene que não é normalmente encontrado na natureza em uma espécie, em particular, um gene em que estão presentes uma ou mais partes da sequência de ácidos nucleicos que não estão associadas uma à outra na natureza. Por exemplo, o promotor não está associado na natureza a parte ou toda a região transcrita ou a uma outra região reguladora. O termo “gene quimérico” é entendido incluindo construtos de expressão em que um promotor ou sequência reguladora de transcrição está operacionalmente ligado a uma ou mais sequências de codificação ou a um complemento antissenso, isto é, reverso, do dito filamento senso, ou sequência de repetição invertida (senso e antissenso, segundo o qual o transcrito de RNA forma RNA de filamento duplo mediante transcrição). O termo "gene quimérico" também inclui genes obtidos através da combinação de porções de uma ou mais sequências de codificação para produzir um novo gene.[0048] A “chimeric gene” refers to any gene that is not normally found in nature in a species, in particular, a gene in which one or more parts of the nucleic acid sequence are present that are not associated with each other in the nature. For example, the promoter is not associated in nature with part or all of the transcribed region or with another regulatory region. The term "chimeric gene" is understood to include expression constructs in which a promoter or transcriptional regulatory sequence is operably linked to one or more coding sequences or to an antisense, i.e., reverse, complement of said sense strand, or sequence. inverted repeat (sense and antisense, whereby the RNA transcript forms double-stranded RNA upon transcription). The term "chimeric gene" also includes genes obtained by combining portions of one or more coding sequences to produce a new gene.

[0049] Uma “UTR 3’” ou “sequência não traduzida 3’” (também denominada como “região não traduzida 3’” ou “extremidade 3’”) se refere à sequência de ácidos nucleicos encontrada a jusante da sequência de codificação de um gene, que compreende, por exemplo, um sítio de terminação de transcrição e (na maioria, porém, não todos os mRNAs eucarióticos) um sinal de poliadenilação, tal como AAUAAA ou variantes do mesmo. Após a terminação da transcrição, o transcrito de mRNA pode ser clivado a jusante do sinal de poliadenilação e uma cauda poli(A) pode ser adicionada, que está envolvida no transporte do mRNA para o sítio de tradução, por exemplo, citoplasma.[0049] A “3' UTR” or “3' untranslated sequence” (also referred to as a “3' untranslated region” or “3' end”) refers to the nucleic acid sequence found downstream of the DNA coding sequence. a gene, which comprises, for example, a transcription termination site and (in most, but not all, eukaryotic mRNAs) a polyadenylation signal, such as AAUAAA or variants thereof. After transcription termination, the mRNA transcript can be cleaved downstream of the polyadenylation signal and a poly(A) tail can be added, which is involved in transporting the mRNA to the translation site, e.g., cytoplasm.

[0050] “Expressão de um gene” envolve a transcrição do gene e a tradução do mRNA em uma proteína. A superexpressão se refere à produção do produto de gene conforme medido por níveis de mRNA, polipeptídeo e/ou atividade enzimática em células transgênicas ou organismos que excedem os níveis de produção em células ou organismos não transformados de um fundamento genético similar.[0050] “Expression of a gene” involves the transcription of the gene and the translation of the mRNA into a protein. Overexpression refers to the production of the gene product as measured by levels of mRNA, polypeptide and/or enzyme activity in transgenic cells or organisms that exceed the levels of production in untransformed cells or organisms of a similar genetic background.

[0051] “Vetor de expressão”, conforme usado no presente documento, significa uma molécula de ácido nucleico manipulada com o uso de métodos de biologia molecular e tecnologia de DNA recombinante para entrega de DNA estranho ou exógeno em uma célula hospedeira. O vetor de expressão inclui tipicamente as sequências exigidas para transcrição adequada da sequência de nucleotídeos. A região de codificação codifica usualmente uma proteína de interesse, mas também codifica um RNA, por exemplo, um RNA antissenso, siRNA e similares.[0051] “Expression vector”, as used herein, means a nucleic acid molecule manipulated using molecular biology methods and recombinant DNA technology for delivery of foreign or exogenous DNA into a host cell. The expression vector typically includes the sequences required for proper transcription of the nucleotide sequence. The coding region usually encodes a protein of interest, but also encodes an RNA, for example, an antisense RNA, siRNA and the like.

[0052] Um "vetor de expressão", conforme usado no presente documento, inclui qualquer vetor recombinante linear ou circular incluindo, porém sem limitação, vetores virais, bacteriófagos e plasmídeos. O versado na técnica tem capacidade para selecionar um vetor adequado de acordo com o sistema de expressão. Em uma modalidade, o vetor de expressão inclui o ácido nucleico de uma modalidade no presente documento operacionalmente ligado a pelo menos uma sequência reguladora, que controla a transcrição, tradução, iniciação e término, tal como um promotor de transcrição, operador ou intensificador ou um sítio de ligação ribossômico de mRNA e que inclui, opcionalmente, pelo menos um marcador de seleção. As sequências de nucleotídeos são "operacionalmente ligadas" quando a sequência reguladora se refere funcionalmente ao ácido nucleico de uma modalidade no presente documento. “Sequência reguladora” se refere a uma sequência de ácidos nucleicos que determina o nível de expressão das sequências de ácidos nucleicos de uma modalidade no presente documento e tem capacidade para regular a taxa de transcrição da sequência de ácidos nucleicos ligada operacionalmente à sequência reguladora. As sequências reguladoras compreendem promotores, intensificadores, fatores de transcrição, elementos promotores e similares.[0052] An "expression vector", as used herein, includes any linear or circular recombinant vector including, but not limited to, viral vectors, bacteriophages and plasmids. One skilled in the art has the ability to select a suitable vector according to the expression system. In one embodiment, the expression vector includes the nucleic acid of an embodiment herein operatively linked to at least one regulatory sequence, which controls transcription, translation, initiation and termination, such as a transcription promoter, operator or enhancer or a ribosomal mRNA binding site and optionally includes at least one selection marker. Nucleotide sequences are "operationally linked" when the regulatory sequence functionally refers to the nucleic acid of an embodiment herein. “Regulatory sequence” refers to a nucleic acid sequence that determines the level of expression of the nucleic acid sequences of an embodiment herein and has the ability to regulate the rate of transcription of the nucleic acid sequence operatively linked to the regulatory sequence. Regulatory sequences comprise promoters, enhancers, transcription factors, promoter elements and the like.

[0053] “Promotor” se refere a uma sequência de ácidos nucleicos que controla a expressão de uma sequência de codificação fornecendo-se um sítio de ligação para RNA polimerase e outros fatores exigidos para transcrição adequada, incluindo, porém sem limitação, sítios de ligação de fator de transcrição, sítios de ligação de proteína repressora e ativadora. O significando do termo promotor também inclui o termo "sequência reguladora de promotor". As sequências reguladoras de promotor podem incluir elementos a montante e a jusante que podem influenciar a transcrição, o processamento de RNA ou a estabilidade da sequência de ácidos nucleicos de codificação associada. Os promotores incluem sequências sintéticas e naturalmente derivadas. As sequências de ácidos nucleicos de codificação estão usualmente localizadas a jusante do promotor em relação à direção da transcrição que se inicia no sítio de iniciação de transcrição.[0053] “Promoter” refers to a nucleic acid sequence that controls the expression of a coding sequence by providing a binding site for RNA polymerase and other factors required for proper transcription, including, but not limited to, binding sites of transcription factor, repressor and activator protein binding sites. The meaning of the term promoter also includes the term "promoter regulatory sequence". Promoter regulatory sequences can include upstream and downstream elements that can influence transcription, RNA processing, or the stability of the associated coding nucleic acid sequence. Promoters include synthetic and naturally derived sequences. The coding nucleic acid sequences are usually located downstream of the promoter relative to the direction of transcription that begins at the transcription initiation site.

[0054] O termo “promotor constitutivo” se refere a um promotor não regulado que permite a transcrição contínua da sequência de ácidos nucleicos à qual estão operacionalmente ligados.[0054] The term “constitutive promoter” refers to an unregulated promoter that allows continuous transcription of the nucleic acid sequence to which it is operably linked.

[0055] Conforme usado no presente documento, o termo “operacionalmente ligado” se refere a uma ligação de elementos de polinucleotídeo em uma relação funcional. Um ácido nucleico está “operacionalmente ligado” quando está posicionado em uma relação funcional com outra sequência de ácidos nucleicos. Por exemplo, um promotor, ou, em vez disso, uma sequência reguladora de transcrição, está operacionalmente ligado a uma sequência de codificação se afetar a transcrição da sequência de codificação. Ligado operacionalmente significa que as sequências de DNA que estão ligadas são tipicamente contíguas. A sequência de nucleotídeos associada à sequência promotora pode ser de origem homóloga ou heteróloga em relação à planta ser transformada. A sequência pode ser também inteira ou parcialmente sintética. Independentemente da origem, a sequência de ácidos nucleicos associada à sequência promotora será expressa ou silenciada de acordo com as propriedades do promotor ao qual está ligada após a ligação ao polipeptídeo de uma modalidade no presente documento. O ácido nucleico associado pode codificar uma proteína que se deseja expressar ou suprimir em todo o organismo sempre ou, alternativamente, em um momento específico ou em tecidos, células ou compartimentos celulares específicos. Tais sequências de nucleotídeos codificam particularmente proteínas que conferem traços fenotípicos desejáveis às células hospedeiras ou organismos alterados ou transformados com as mesmas. Mais particularmente, a sequência de nucleotídeos associada leva à produção de sintase de (+)-manool no organismo.[0055] As used herein, the term “operationally linked” refers to a linkage of polynucleotide elements in a functional relationship. A nucleic acid is “operationally linked” when it is positioned in a functional relationship with another nucleic acid sequence. For example, a promoter, or rather a transcription regulatory sequence, is operably linked to a coding sequence if it affects transcription of the coding sequence. Operably linked means that the DNA sequences that are linked are typically contiguous. The nucleotide sequence associated with the promoter sequence may be of homologous or heterologous origin in relation to the plant being transformed. The sequence may also be entirely or partially synthetic. Regardless of origin, the nucleic acid sequence associated with the promoter sequence will be expressed or silenced according to the properties of the promoter to which it is linked upon binding to the polypeptide of an embodiment herein. The associated nucleic acid may encode a protein that is desired to be expressed or suppressed throughout the organism at all times or, alternatively, at a specific time or in specific tissues, cells or cellular compartments. Such nucleotide sequences particularly encode proteins that confer desirable phenotypic traits to host cells or organisms altered or transformed therefrom. More particularly, the associated nucleotide sequence leads to the production of (+)-manool synthase in the organism.

[0056] “Peptídeo-alvo” se refere a uma sequência de aminoácidos que direciona uma proteína ou polipeptídeo a organelas intracelulares, isto é, mitocôndria, ou plásticos, ou ao espaço extracelular (peptídeo de sinalização de secreção). Uma sequência de ácidos nucleicos que codifica um peptídeo-alvo pode ser fundida à sequência de ácidos nucleicos que codifica a extremidade terminal amino, por exemplo, extremidade N-terminal, da proteína ou do polipeptídeo, ou pode ser usada para substituir um polipeptídeo de direcionamento nativo.[0056] “Target peptide” refers to an amino acid sequence that directs a protein or polypeptide to intracellular organelles, that is, mitochondria, or plastics, or to the extracellular space (secretion signaling peptide). A nucleic acid sequence encoding a target peptide may be fused to the nucleic acid sequence encoding the amino terminal end, e.g., N-terminal end, of the protein or polypeptide, or may be used to replace a targeting polypeptide. native.

[0057] O termo “iniciador” se refere a uma sequência de ácidos nucleicos curta que é hibridizada a uma sequência de ácidos nucleicos de modelo e é usada para polimerização de uma complementariedade de sequência de ácidos nucleicos ao modelo.[0057] The term “primer” refers to a short nucleic acid sequence that is hybridized to a template nucleic acid sequence and is used for polymerization of a nucleic acid sequence complementarity to the template.

[0058] Conforme usado no presente documento, o termo "célula hospedeira" ou "célula transformada" se refere a uma célula (ou um organismo) alterada para abrigar pelo menos uma molécula de ácido nucleico, por exemplo, um gene recombinante que codifica uma proteína ou sequência de ácidos nucleicos desejada que, mediante transcrição, rende uma proteína de CPP sintase e uma proteína de esclareol sintase ou que, juntas, produzem (+)-manool.[0058] As used herein, the term "host cell" or "transformed cell" refers to a cell (or an organism) altered to harbor at least one nucleic acid molecule, for example, a recombinant gene encoding a desired protein or nucleic acid sequence that, upon transcription, yields a CPP synthase protein and a sclareol synthase protein or that together produce (+)-manool.

[0059] A célula hospedeira é particularmente uma célula bacteriana, uma célula fúngica ou uma célula vegetal. A célula hospedeira pode conter um gene recombinante que foi integrado nos genomas nuclear ou de organelas da célula hospedeira. Alternativamente, o hospedeiro pode conter o gene recombinante extracromossomicamente. As sequências homólogas incluem sequências ortólogas ou parálogas. Os métodos para identificar ortólogos e parálogos, que incluem métodos filogenéticos, similaridade de sequência e métodos de hibridização são conhecidos na técnica e são descritos no presente documento.[0059] The host cell is particularly a bacterial cell, a fungal cell or a plant cell. The host cell may contain a recombinant gene that has been integrated into the nuclear or organelle genomes of the host cell. Alternatively, the host may contain the recombinant gene extrachromosomally. Homologous sequences include orthologous or paralogous sequences. Methods for identifying orthologs and paralogs, which include phylogenetic methods, sequence similarity and hybridization methods are known in the art and are described herein.

[0060] Os parálogos resultam da duplicação de gene que gera dois ou mais genes com sequências similares e funções similares. Os parálogos tipicamente se agrupam e são formados por duplicações de genes dentro de espécies de planta relacionadas. Os parálogos são encontrados em grupos de genes similares com o uso de análise Blast em pareamento ou durante análise filogenética de famílias de genes com o uso de programas, tal como CLUSTAL. Em parálogos, as sequências consenso podem ser uma característica identificada de sequências dentro de genes relacionados e que têm funções similares dos genes.[0060] Paralogs result from gene duplication that generates two or more genes with similar sequences and similar functions. Paralogs typically cluster together and are formed by gene duplications within related plant species. Paralogs are found in groups of similar genes using Blast pairwise analysis or during phylogenetic analysis of gene families using programs such as CLUSTAL. In paralogs, consensus sequences may be an identified feature of sequences within related genes that have similar gene functions.

[0061] Ortólogos, ou sequências ortólogas, são sequências similares uma a outra devido ao fato de que são encontradas em espécies que descenderam de um ancestral comum. Por exemplo, espécies de planta que têm ancestrais comuns são conhecidas por conter muitas enzimas que têm sequências e funções similares. O versado na técnica pode identificar sequências ortólogas e prever funções dos ortólogos, por exemplo, construindo-se uma árvore poligênica para uma família de genes de uma espécie com o uso dos programas CLUSTAL ou BLAST.[0061] Orthologs, or orthologous sequences, are sequences that are similar to each other due to the fact that they are found in species that descended from a common ancestor. For example, plant species that have common ancestors are known to contain many enzymes that have similar sequences and functions. Those skilled in the art can identify orthologous sequences and predict functions of the orthologs, for example, by constructing a polygenic tree for a gene family of a species using the CLUSTAL or BLAST programs.

[0062] O termo “marcador selecionável” se refere a qualquer gene que, mediante expressão, pode ser usado para selecionar uma célula ou células que incluem o marcador selecionável. Os exemplos de marcadores selecionáveis são descritos abaixo. O versado na técnica saberá que diferentes marcadores selecionáveis antibióticos, fungicidas, auxotróficos ou herbicidas são aplicáveis a diferentes espécies-alvo.[0062] The term “selectable marker” refers to any gene that, upon expression, can be used to select a cell or cells that include the selectable marker. Examples of selectable markers are described below. One skilled in the art will know that different antibiotic, fungicidal, auxotrophic or herbicide selectable markers are applicable to different target species.

[0063] O termo “organismo” se refere a quaisquer organismos multicelulares ou unicelulares não humanos, tal como uma planta ou um microrganismo. Particularmente, um microrganismo é uma bactéria, uma levedura, uma alga ou um fungo.[0063] The term “organism” refers to any non-human multicellular or unicellular organisms, such as a plant or a microorganism. Particularly, a microorganism is a bacteria, a yeast, an alga or a fungus.

[0064] O termo “planta” é usado de modo intercambiável para incluir células vegetais, incluindo protoplasmas vegetais, tecidos vegetais, culturas de tecido de célula vegetal, produzindo plantas regeneradas, ou partes de plantas, ou órgãos de planta, tais como raízes, troncos, folhas, flores, pólen, óvulos, embriões, frutos e similares. Qualquer planta pode ser usada para executar os métodos de uma modalidade no presente documento.[0064] The term "plant" is used interchangeably to include plant cells, including plant protoplasms, plant tissues, plant cell tissue cultures, producing regenerated plants, or parts of plants, or plant organs, such as roots, trunks, leaves, flowers, pollen, ovules, embryos, fruits and the like. Any plant may be used to perform the methods of an embodiment herein.

[0065] Para as descrições no presente documento e as reivindicações anexas, o uso de “ou” significa “e/ou”, a menos que declarado o contrário. De modo similar, “compreender”, “compreende”, “que compreende”, “incluir”, “inclui” e “que inclui” são intercambiáveis e não se destinam a ser limitantes.[0065] For the descriptions in this document and the attached claims, the use of “or” means “and/or”, unless otherwise stated. Similarly, “understand,” “understands,” “which comprises,” “includes,” “includes” and “which includes” are interchangeable and are not intended to be limiting.

[0066] Deve ser adicionalmente entendido que, quando as descrições de diversas modalidades usam o termo "que compreende", aqueles versados na técnica entenderiam que, em alguns exemplos específicos, uma modalidade pode ser descrita de modo alternativo com o uso da linguagem "que consiste essencialmente em" ou "que consiste em".[0066] It should further be understood that when descriptions of various embodiments use the term "comprising", those skilled in the art would understand that, in some specific examples, an embodiment may be alternatively described with the use of the language "that consists essentially of" or "which consists of".

[0067] Em uma modalidade, é fornecido no presente documento um método para transformar uma célula hospedeira ou organismo não humano com um ácido nucleico que codifica um polipeptídeo que tem uma atividade de difosfato de copalila sintase e com um ácido nucleico que codifica um polipeptídeo que tem uma atividade de esclareol sintase em que o polipeptídeo que tem a atividade de difosfato de copalila compreende uma sequência de aminoácidos que tem pelo menos 90%, 95%, 98%, 99% ou 100% de identidade de sequência com um polipeptídeoselecionado a partir do grupo que consiste em SEQ ID NO: 1 e SEQ ID NO:2. Particularmente, o polipeptídeo que tem a atividade de esclareol sintase compreende uma sequência de aminoácidos que tem pelo menos 90%, 95%, 98%, 99% ou 100% de identidade de sequência com um polipeptídeo selecionado a partir do grupo que consiste em SEQ ID NO:4 e SEQ ID NO:5.[0067] In one embodiment, provided herein is a method for transforming a host cell or non-human organism with a nucleic acid encoding a polypeptide that has copalyl diphosphate synthase activity and with a nucleic acid encoding a polypeptide that has a sclareol synthase activity wherein the polypeptide having copalyl diphosphate activity comprises an amino acid sequence that has at least 90%, 95%, 98%, 99% or 100% sequence identity with a polypeptide selected from of the group consisting of SEQ ID NO: 1 and SEQ ID NO:2. Particularly, the polypeptide having sclareol synthase activity comprises an amino acid sequence that has at least 90%, 95%, 98%, 99% or 100% sequence identity with a polypeptide selected from the group consisting of SEQ ID NO:4 and SEQ ID NO:5.

[0068] Em uma modalidade, é fornecido no presente documento um método que compreende cultivar uma célula ou organismo hospedeiro não humano com capacidade para produzir um difosfato de geranilgeranila (GGPP) e transformado para expressar um polipeptídeo que tem uma atividade de difosfato de copalila sintase em que o polipeptídeo que tem a atividade de difosfato de copalila sintase compreende uma sequência de aminoácidos que tem pelo menos 90%, 95%, 98%, 99% ou 100% de identidade de sequência com um polipeptídeo selecionado a partir do grupo que consiste em SEQ ID NO: 1 e SEQ ID NO:2 e adicionalmente transformado para expressar um polipeptídeo que tem uma atividade de esclareol sintase. Particularmente, o polipeptídeo que tem a atividade de esclareol sintase compreende uma sequência de aminoácidos que tem pelo menos 90%, 95%, 98%, 99% ou 100% de identidade de sequência com um polipeptídeo selecionado a partir do grupo que consiste em SEQ ID NO:4 e SEQ ID NO:5.[0068] In one embodiment, provided herein is a method comprising culturing a non-human host cell or organism capable of producing a geranylgeranyl diphosphate (GGPP) and transformed to express a polypeptide having a copalyl diphosphate synthase activity. wherein the polypeptide having copalyl diphosphate synthase activity comprises an amino acid sequence that has at least 90%, 95%, 98%, 99% or 100% sequence identity with a polypeptide selected from the group consisting in SEQ ID NO: 1 and SEQ ID NO: 2 and further transformed to express a polypeptide that has a sclareol synthase activity. Particularly, the polypeptide having sclareol synthase activity comprises an amino acid sequence that has at least 90%, 95%, 98%, 99% or 100% sequence identity with a polypeptide selected from the group consisting of SEQ ID NO:4 and SEQ ID NO:5.

[0069] Além disso, é fornecido no presente documento um vetor de expressão que compreende um ácido nucleico que codifica uma CPP sintase em que a CPP sintase compreende um polipeptídeo que compreende uma sequência de aminoácidos que tem pelo menos 90%, 95%, 98%, 99% ou 100% de identidade de sequência com um polipeptídeo selecionado a partir do grupo que consiste em SEQ ID NO: 1 e SEQ ID NO: 2 e, além disso, o vetor de expressão compreende um ácido nucleico que codifica uma enzima esclareol sintase. Particularmente, a esclareol sintase tem uma sequência de aminoácidos que é pelo menos 90%, 95%, 98%, 99% ou 100% similar ou idêntica a um polipeptídeo selecionado a partir do grupo que consiste em SEQ ID NO: 4 e SEQ ID NO:5. Em uma modalidade particular, as duas enzimas poderiam estar em dois diferentes vetores transformados na mesma célula. Em uma modalidade adicional, as duas enzimas poderiam estar em dois diferentes vetores transformados em duas células diferentes.[0069] Furthermore, provided herein is an expression vector comprising a nucleic acid encoding a CPP synthase wherein the CPP synthase comprises a polypeptide comprising an amino acid sequence that is at least 90%, 95%, 98 %, 99% or 100% sequence identity with a polypeptide selected from the group consisting of SEQ ID NO: 1 and SEQ ID NO: 2 and, further, the expression vector comprises a nucleic acid encoding an enzyme sclareol synthase. Particularly, sclareol synthase has an amino acid sequence that is at least 90%, 95%, 98%, 99% or 100% similar or identical to a polypeptide selected from the group consisting of SEQ ID NO: 4 and SEQ ID NO:5. In a particular embodiment, the two enzymes could be in two different vectors transformed in the same cell. In an additional embodiment, the two enzymes could be in two different vectors transformed into two different cells.

[0070] Além disso, é fornecido no presente documento uma célula ou organismo hospedeiro não humano transformado para abrigar pelo menos um ácido nucleico que codifica uma CPP sintase em que a CPP sintase compreende um polipeptídeo que compreende uma sequência de aminoácidos que tem pelo menos 90%, 95%, 98%, 99% ou 100% de identidade de sequência com um polipeptídeo selecionado a partir do grupo que consiste em SEQ ID NO: 1 e SEQ ID NO:2 e pelo menos um ácido nucleico que codifica uma enzima esclareol. Particularmente, a esclareol sintase tem uma sequência de aminoácidos que é pelo menos 90%, 95%, 98%, 99% ou 100% similar ou idêntica a um polipeptídeo selecionado a partir do grupo que consiste em SEQ ID NO:4 e SEQ ID NO:5.[0070] Furthermore, provided herein is a non-human host cell or organism transformed to harbor at least one nucleic acid encoding a CPP synthase wherein the CPP synthase comprises a polypeptide comprising an amino acid sequence that is at least 90 %, 95%, 98%, 99% or 100% sequence identity with a polypeptide selected from the group consisting of SEQ ID NO: 1 and SEQ ID NO: 2 and at least one nucleic acid encoding a sclareol enzyme . Particularly, sclareol synthase has an amino acid sequence that is at least 90%, 95%, 98%, 99% or 100% similar or identical to a polypeptide selected from the group consisting of SEQ ID NO:4 and SEQ ID NO:5.

[0071] Em uma modalidade, o ácido nucleico que codifica uma CPP sintase fornecida no presente documento compreende uma sequência de nucleotídeos que tem pelo menos 90%, 95%, 98%, 99% ou 100% de identidade de sequência com a Sequência ID NO: 3.[0071] In one embodiment, the nucleic acid encoding a CPP synthase provided herein comprises a nucleotide sequence that has at least 90%, 95%, 98%, 99% or 100% sequence identity with the Sequence ID NO: 3.

[0072] Em uma modalidade, o ácido nucleico que codifica uma CPP sintase fornecida no presente documento compreende uma sequência de nucleotídeos que tem pelo menos 95%, 98%, 99% ou 100% de identidade de sequência com a Sequência ID NO: 3.[0072] In one embodiment, the nucleic acid encoding a CPP synthase provided herein comprises a nucleotide sequence that has at least 95%, 98%, 99% or 100% sequence identity with Sequence ID NO: 3 .

[0073] Em uma modalidade, o ácido nucleico que codifica uma CPP sintase fornecida no presente documento compreende uma sequência de nucleotídeos que tem pelo menos 98%, 99% ou 100% de identidade de sequência com a Sequência ID NO: 3.[0073] In one embodiment, the nucleic acid encoding a CPP synthase provided herein comprises a nucleotide sequence that has at least 98%, 99% or 100% sequence identity with Sequence ID NO: 3.

[0074] Em uma modalidade, o ácido nucleico que codifica uma CPP sintase fornecida no presente documento compreende uma sequência de nucleotídeos que tem pelo menos 98%, 99% ou 100% de identidade de sequência com a Sequência ID NO: 3.[0074] In one embodiment, the nucleic acid encoding a CPP synthase provided herein comprises a nucleotide sequence that has at least 98%, 99% or 100% sequence identity with Sequence ID NO: 3.

[0075] Em uma modalidade, o ácido nucleico que codifica uma CPP sintase fornecida no presente documento compreende uma sequência de nucleotídeos que tem 99% ou 100% de identidade de sequência com a Sequência ID NO: 3. Em uma modalidade, o ácido nucleico que codifica uma CPP sintase fornecida no presente documento compreende uma sequência de nucleotídeos que é idêntica à Sequência ID NO: 3.[0075] In one embodiment, the nucleic acid encoding a CPP synthase provided herein comprises a nucleotide sequence that has 99% or 100% sequence identity with Sequence ID NO: 3. In one embodiment, the nucleic acid encoding a CPP synthase provided herein comprises a nucleotide sequence that is identical to Sequence ID NO: 3.

[0076] Em uma modalidade, a CPP sintase compreende um polipeptídeo que compreende uma sequência de aminoácidos que tem pelo menos 90%, 95%, 98%,99% ou 100% de identidade de sequência com um polipeptídeo selecionado a partir do grupo que consiste em SEQ ID NO: 1 e SEQ ID NO:2[0076] In one embodiment, the CPP synthase comprises a polypeptide comprising an amino acid sequence that has at least 90%, 95%, 98%, 99% or 100% sequence identity with a polypeptide selected from the group that consists of SEQ ID NO: 1 and SEQ ID NO:2

[0077] Em uma modalidade, a CPP sintase compreende um polipeptídeo que compreende uma sequência de aminoácidos que tem pelo menos 90%, 95%, 98%, 99% ou 100% de identidade de sequência com SEQ ID NO: 1.[0077] In one embodiment, the CPP synthase comprises a polypeptide comprising an amino acid sequence that has at least 90%, 95%, 98%, 99% or 100% sequence identity with SEQ ID NO: 1.

[0078] Em uma modalidade, a CPP sintase compreende um polipeptídeo que compreende uma sequência de aminoácidos que tem pelo menos 95%, 98%, 99% ou 100% de identidade de sequência com uma SEQ ID NO: 1.[0078] In one embodiment, the CPP synthase comprises a polypeptide comprising an amino acid sequence that has at least 95%, 98%, 99% or 100% sequence identity with a SEQ ID NO: 1.

[0079] Em uma modalidade, a CPP sintase compreende um polipeptídeo que compreende uma sequência de aminoácidos que tem pelo menos 98%, 99% ou 100% de identidade de sequência com SEQ ID NO: 1.[0079] In one embodiment, the CPP synthase comprises a polypeptide comprising an amino acid sequence that has at least 98%, 99% or 100% sequence identity with SEQ ID NO: 1.

[0080] Em uma modalidade, a CPP sintase compreende um polipeptídeo que compreende uma sequência de aminoácidos que tem pelo menos 99% ou 100% de identidade de sequência com SEQ ID NO: 1. Em uma modalidade, a CPP sintase compreende um polipeptídeo que compreende uma sequência de aminoácidos que é idêntica à SEQ ID NO: 1.[0080] In one embodiment, the CPP synthase comprises a polypeptide comprising an amino acid sequence that has at least 99% or 100% sequence identity with SEQ ID NO: 1. In one embodiment, the CPP synthase comprises a polypeptide that comprises an amino acid sequence that is identical to SEQ ID NO: 1.

[0081] Em uma modalidade, a CPP sintase compreende um polipeptídeo que compreende uma sequência de aminoácidos que tem pelo menos 90%, 95%, 98%, 99% ou 100% de identidade de sequência com SEQ ID NO: 2.[0081] In one embodiment, the CPP synthase comprises a polypeptide comprising an amino acid sequence that has at least 90%, 95%, 98%, 99% or 100% sequence identity with SEQ ID NO: 2.

[0082] Em uma modalidade, a CPP sintase compreende um polipeptídeo que compreende uma sequência de aminoácidos que tem pelo menos 95%, 98%, 99% ou 100% de identidade de sequência com uma SEQ ID NO: 2.[0082] In one embodiment, the CPP synthase comprises a polypeptide comprising an amino acid sequence that has at least 95%, 98%, 99% or 100% sequence identity with a SEQ ID NO: 2.

[0083] Em uma modalidade, a CPP sintase compreende um polipeptídeo que compreende uma sequência de aminoácidos que tem pelo menos 98%, 99% ou 100% de identidade de sequência com SEQ ID NO: 2.[0083] In one embodiment, the CPP synthase comprises a polypeptide comprising an amino acid sequence that has at least 98%, 99% or 100% sequence identity with SEQ ID NO: 2.

[0084] Em uma modalidade, a CPP sintase compreende um polipeptídeo que compreende uma sequência de aminoácidos que tem pelo menos 99% ou 100% de identidade de sequência com SEQ ID NO: 2.[0084] In one embodiment, the CPP synthase comprises a polypeptide comprising an amino acid sequence that has at least 99% or 100% sequence identity with SEQ ID NO: 2.

[0085] Em uma modalidade, a CPP sintase compreende um polipeptídeo que compreende uma sequência de aminoácidos que é idêntica à SEQ ID NO: 2.[0085] In one embodiment, the CPP synthase comprises a polypeptide comprising an amino acid sequence that is identical to SEQ ID NO: 2.

[0086] Em uma modalidade, o ácido nucleico que codifica a enzima esclareol sintase tem uma sequência de nucleotídeos pelo menos 90%, 95%, 98%,99% ou 100% similar ou idêntica à SEQ ID NO.6.[0086] In one embodiment, the nucleic acid encoding the sclareol synthase enzyme has a nucleotide sequence at least 90%, 95%, 98%, 99% or 100% similar or identical to SEQ ID NO.6.

[0087] Em uma modalidade, a esclareol sintase tem uma sequência de aminoácidos que é pelo menos 90%, 95%, 98%, 99% ou 100% similar ou idêntica à SEQ ID NO: 4.[0087] In one embodiment, sclareol synthase has an amino acid sequence that is at least 90%, 95%, 98%, 99% or 100% similar or identical to SEQ ID NO: 4.

[0088] Em uma modalidade, a esclareol sintase tem uma sequência de aminoácidos que é pelo menos 95%, 98%, 99% ou 100% similar ou idêntica à SEQ ID NO: 4.[0088] In one embodiment, sclareol synthase has an amino acid sequence that is at least 95%, 98%, 99% or 100% similar or identical to SEQ ID NO: 4.

[0089] Em uma modalidade, a esclareol sintase tem uma sequência de aminoácidos que é pelo menos 98%, 99% ou 100% similar ou idêntica à SEQ ID NO: 4.[0089] In one embodiment, sclareol synthase has an amino acid sequence that is at least 98%, 99% or 100% similar or identical to SEQ ID NO: 4.

[0090] Em uma modalidade, a esclareol sintase tem uma sequência de aminoácidos que é pelo menos 99% ou 100% similar ou idêntica à SEQ ID NO: 4.[0090] In one embodiment, sclareol synthase has an amino acid sequence that is at least 99% or 100% similar or identical to SEQ ID NO: 4.

[0091] Em uma modalidade, a esclareol sintase tem uma sequência de aminoácidos que é idêntica à SEQ ID NO: 4.[0091] In one embodiment, sclareol synthase has an amino acid sequence that is identical to SEQ ID NO: 4.

[0092] Em uma modalidade, a esclareol sintase tem uma sequência de aminoácidos que é pelo menos 90%, 95%, 98%, 99% ou 100% similar ou idêntica à SEQ ID NO: 5.[0092] In one embodiment, sclareol synthase has an amino acid sequence that is at least 90%, 95%, 98%, 99% or 100% similar or identical to SEQ ID NO: 5.

[0093] Em uma modalidade, a esclareol sintase tem uma sequência de aminoácidos que é pelo menos 95%, 98%,99% ou 100% similar ou idêntica à SEQ ID NO: 5.[0093] In one embodiment, sclareol synthase has an amino acid sequence that is at least 95%, 98%,99% or 100% similar or identical to SEQ ID NO: 5.

[0094] Em uma modalidade, a esclareol sintase tem uma sequência de aminoácidos que é pelo menos 98%, 99% ou 100% similar ou idêntica à SEQ ID NO: 5.[0094] In one embodiment, sclareol synthase has an amino acid sequence that is at least 98%, 99% or 100% similar or identical to SEQ ID NO: 5.

[0095] Em uma modalidade, a esclareol sintase tem uma sequência de aminoácidos que é pelo menos 99% ou 100% similar ou idêntica à SEQ ID NO: 5.[0095] In one embodiment, sclareol synthase has an amino acid sequence that is at least 99% or 100% similar or identical to SEQ ID NO: 5.

[0096] Em uma modalidade, a esclareol sintase tem uma sequência de aminoácidos que é idêntica à SEQ ID NO: 5.[0096] In one embodiment, sclareol synthase has an amino acid sequence that is identical to SEQ ID NO: 5.

[0097] Em uma outra modalidade, é fornecido no presente documento um vetor de expressão que compreende um ácido nucleico descrito no presente documento. Um vetor de expressão pode compreender um ou mais ácidos nucleicos descritos no presente documento.[0097] In another embodiment, an expression vector comprising a nucleic acid described herein is provided herein. An expression vector may comprise one or more nucleic acids described herein.

[0098] Em uma outra modalidade, é fornecida no presente documento uma célula ou organismo hospedeiro não humano transformado para abrigar pelo menos um ácido nucleico descrito no presente documento de modo que expresse ou superexpresse heterologamente pelo menos um polipeptídeo descrito no presente documento.[0098] In another embodiment, provided herein is a non-human host cell or organism transformed to harbor at least one nucleic acid described herein so that it heterologously expresses or overexpresses at least one polypeptide described herein.

[0099] Em uma modalidade, o organismo hospedeiro não humano fornecido no presente documento é uma planta, um procarionte ou um fungo.[0099] In one embodiment, the non-human host organism provided herein is a plant, a prokaryote or a fungus.

[00100] Em uma modalidade, o hospedeiro não humano fornecido no presente documento é um microrganismo, particularmente uma bactéria ou levedura.[00100] In one embodiment, the non-human host provided herein is a microorganism, particularly a bacteria or yeast.

[00101] Em uma modalidade, o organismo não humano fornecido no presente documento é E. coli e a dita levedura é Sacchromyces cerevisiae.[00101] In one embodiment, the non-human organism provided herein is E. coli and said yeast is Sacchromyces cerevisiae.

[00102] Em uma modalidade, o organismo não humano fornecido no presente documento é Sacchromyces cerevisiae.[00102] In one embodiment, the non-human organism provided herein is Sacchromyces cerevisiae.

[00103] Em uma modalidade, a célula é uma célula procariótica.[00103] In one embodiment, the cell is a prokaryotic cell.

[00104] Em outra modalidade, a célula é uma célula bacteriana.[00104] In another embodiment, the cell is a bacterial cell.

[00105] Em uma modalidade, a célula é uma célula eucariótica.[00105] In one embodiment, the cell is a eukaryotic cell.

[00106] Em uma modalidade, a célula eucariótica é uma célula de levedura ou uma célula vegetal.[00106] In one embodiment, the eukaryotic cell is a yeast cell or a plant cell.

[00107] Em uma modalidade, o processo de produção de (+)-manool produz o (+)- manool em uma pureza de pelo menos 98% ou 98,5%.[00107] In one embodiment, the (+)-manool production process produces the (+)-manool in a purity of at least 98% or 98.5%.

[00108] Em uma outra modalidade, um método fornecido no presente documento compreende adicionalmente processar o (+)-manool para um derivado com uso de uma síntese bioquímica ou química ou uma combinação de ambas com uso de métodos comumente conhecidos na técnica.[00108] In another embodiment, a method provided herein further comprises processing the (+)-manool to a derivative using a biochemical or chemical synthesis or a combination of both using methods commonly known in the art.

[00109] Em uma modalidade, o derivado de (+)-manool é selecionado a partir do grupo que consiste em um hidrocarboneto, álcool, acetal, aldeído, ácido, éter, cetona, lactona, acetato e um éster.[00109] In one embodiment, the (+)-manool derivative is selected from the group consisting of a hydrocarbon, alcohol, acetal, aldehyde, acid, ether, ketone, lactone, acetate and an ester.

[00110] De acordo com qualquer modalidade da invenção, o dito derivado de (+)- manool é um composto C10 a C25 que compreende opcionalmente um, dois ou três átomos de oxigênio.[00110] According to any embodiment of the invention, said (+)-manool derivative is a C10 to C25 compound that optionally comprises one, two or three oxygen atoms.

[00111] Em uma modalidade adicional, o derivado é selecionado a partir do grupo que consiste em manool acetato (acetato de (3R)-3-metil-5-[(1S,4aS,8aS)-5,5,8a- trimetil-2-metilenodecahidro-1-naftalenil]-1-penten-3-ila), copalol((2E)-3-metil-5-[(1 S,4aS,8aS)-5,5,8a-trimetil-2-metilenodecahidro-1-naftalenil]-2-penten-1-ol), copalol acetato (acetato de (2E)-3-metil-5-[(1S,4aS,8aS)-5, 5,8 a-trimetil-2- metilenodecahidro- 1-naftalenil]-2-penten-1-ila), copalal ((2E)-3-metil-5-[(1S,4aS,8aS)-5,5,8a-trimetil-2-metilenodecahidro-1-naftalenil]-2-pentenal), (4-[(l S,4aS,8aS)-5,5,8a-trimetil-2-metilenodecahidro-l -naftalenil]-2-butanono) de (+)- manoolóxi, Z-11 ((3S,5aR,7aS,11aS,11bR)-3,8,8,11a-tetrametildodecahidro-3,5a- epoxinafto[2,1-c]oxepina), gama-ambrol (2-[(1 S,4aS,8aS)-5,5,8a-trimetil-2-metilenodecahidro-1-naftalenil]etanol) e Ambrox® (3aR,5aS,9aS,9bR)-3a,6,6,9a- tetrametildodecahidronafto[2,1-b] furano).[00111] In an additional embodiment, the derivative is selected from the group consisting of manool acetate ((3R)-3-methyl-5-[(1S,4aS,8aS)-5,5,8a-trimethyl acetate -2-methylenedecahydro-1-naphthalenyl]-1-penten-3-yl), copalol((2E)-3-methyl-5-[(1S,4aS,8aS)-5,5,8a-trimethyl-2 -methylenedecahydro-1-naphthalenyl]-2-penten-1-ol), copalol acetate ((2E)-3-methyl-5-[(1S,4aS,8aS)-5, 5,8a-trimethyl-acetate 2-methylenedecahydro-1-naphthalenyl]-2-penten-1-yl), copalal ((2E)-3-methyl-5-[(1S,4aS,8aS)-5,5,8a-trimethyl-2-methylenedecahydro (+)- (+)- mannooloxy, Z-11 ((3S,5aR,7aS,11aS,11bR)-3,8,8,11a-tetramethyldodecahydro-3,5a- epoxynaphtho[2,1-c]oxepin), gamma-ambrol (2-[ (1 S,4aS,8aS)-5,5,8a-trimethyl-2-methylenedecahydro-1-naphthalenyl]ethanol) and Ambrox® (3aR,5aS,9aS,9bR)-3a,6,6,9a- tetramethyldodecahydronaphtho[ 2,1-b] furan).

[00112] Em uma outra modalidade, um método fornecido no presente documento compreende adicionalmente colocar o (+)-manool em contato com um sistema de reação adequado para converter o dito (+)-manool em um derivado de (+)-manool adequado. O dito sistema de reação adequado pode ser de natureza enzimática (por exemplo, exigindo uma ou mais enzimas) ou de natureza química (por exemplo, exigindo um ou mais produtos químicos sintéticos)[00112] In another embodiment, a method provided herein further comprises contacting the (+)-manool with a suitable reaction system to convert said (+)-manool into a suitable (+)-manool derivative . Said suitable reaction system may be enzymatic in nature (e.g., requiring one or more enzymes) or chemical in nature (e.g., requiring one or more synthetic chemicals)

[00113] Por exemplo, (+)-manool pode ser enzimaticamente convertido em manoolóxi ou gama-ambrol com uso de processos descritos na literatura, por exemplo, conforme apresentado na Patente no US 7.294.492, em que a dita patente é incorporada ao presente documento em sua totalidade a título de referência.[00113] For example, (+)-manool can be enzymatically converted into mannooloxy or gamma-ambrole using processes described in the literature, for example, as presented in US Patent No. 7,294,492, in which said patent is incorporated into the this document in its entirety for reference purposes.

[00114] Ainda em uma outra modalidade, o derivado de (+)-manool é copalol e seus ésteres com um C1- C5 ácido carboxílico.[00114] In yet another embodiment, the (+)-manool derivative is copalol and its esters with a C1-C5 carboxylic acid.

[00115] Ainda em uma outra modalidade, o derivado de (+)-manool consiste em (+)-manool ésteres com um C1-C5 ácido carboxílico.[00115] In yet another embodiment, the (+)-manool derivative consists of (+)-manool esters with a C1-C5 carboxylic acid.

[00116] Em uma modalidade, o derivado de (+)-manool é copalal.[00116] In one embodiment, the (+)-manool derivative is copalal.

[00117] Em uma modalidade, o derivado de (+)-manool é manoolóxi.[00117] In one embodiment, the (+)-manool derivative is manooloxy.

[00118] Ainda em uma outra modalidade, o derivado de (+)-manool é Z-11.[00118] In yet another embodiment, the (+)-manool derivative is Z-11.

[00119] Em uma modalidade, o derivado de (+)-manool é gama-ambrol ou é uma mistura dos mesmos e seus ésteres com um C1-C5 ácido carboxílico, e, em particular, gama-ambrol e seus ésteres.[00119] In one embodiment, the (+)-manool derivative is gamma-ambrole or is a mixture thereof and its esters with a C1-C5 carboxylic acid, and, in particular, gamma-ambrole and its esters.

[00120] Em uma modalidade adicional, o derivado de (+)-manool é Ambrox®, esclareolido (também conhecido como 3a,6,6,9a-tetrametildecahidronafto[2,1- b]furan-2(1H)-ona e todos os seus diastereoisômeros e estereoisômeros), 3,4a,7,7,10a-pentametildodecahidro-1H-benzo[f]cromen-3-ol ou 3,4a,7,7,10a-pentametil-4a,5,6,6a,7,8,9,10,10a,10b-decahidro-1H-benzo[f]cromeno e todo o seu diastereoisômero e estereoisômeros, cetona cíclica e forma aberta, (1R,2R,4aS,8aS)-1-(2-hidroxietil)-2,5,5, 8a-tetrametildecahidronaftalen-2 -ol DOL, gama-ambrol.[00120] In an additional embodiment, the (+)-manool derivative is Ambrox®, sclareolide (also known as 3a,6,6,9a-tetramethyldecahydronaphtho[2,1- b]furan-2(1H)-one and all its diastereoisomers and stereoisomers), 3,4a,7,7,10a-pentamethyldodecahydro-1H-benzo[f]chromen-3-ol or 3,4a,7,7,10a-pentamethyl-4a,5,6, 6a,7,8,9,10,10a,10b-decahydro-1H-benzo[f]chromene and all its diastereoisomer and stereoisomers, cyclic ketone and open form, (1R,2R,4aS,8aS)-1-( 2-hydroxyethyl)-2,5,5,8a-tetramethyldecahydronaphthalen-2-ol DOL, gamma-ambrol.

[00121] Os exemplos específicos de como os ditos derivados (por exemplo, um hidrocarboneto de trieno, um acetato ou copalol) podem ser obtidos são detalhados nos Exemplos.[00121] Specific examples of how said derivatives (for example, a triene hydrocarbon, an acetate or copalol) can be obtained are detailed in the Examples.

[00122] Por exemplo, o manool obtido de acordo com a invenção pode ser processado em Manoolóxi (uma cetona, como pelos métodos conhecidos) e, então, em ambrol (um álcool) e Ambrox (um éter), de acordo com o documento no EP 212254.[00122] For example, the manool obtained according to the invention can be processed into Manooloxy (a ketone, as per known methods) and then into ambrol (an alcohol) and Ambrox (an ether), according to the document in EP 212254.

[00123] A capacidade de um polipeptídeo catalisar a síntese de um sesquiterpeno particular pode ser confirmada realizando-se o ensaio de enzima conforme detalhado nos Exemplos fornecidos no presente documento.[00123] The ability of a polypeptide to catalyze the synthesis of a particular sesquiterpene can be confirmed by performing the enzyme assay as detailed in the Examples provided herein.

[00124] Os polipeptídeos também se destinam a incluir polipeptídeos truncados que mantêm sua atividade de sintase de (+)-manool e sua atividade de esclareol sintase. Um polipeptídeo truncado de CPP sintase, por exemplo, tem a atividade de uma CPP sintase conforme definido anteriormente no presente documento. Um polipeptídeo truncado de esclareol sintase, por exemplo, tem a atividade de uma esclareol sintase conforme definido anteriormente no presente documento.[00124] The polypeptides are also intended to include truncated polypeptides that maintain their (+)-manool synthase activity and their sclareol synthase activity. A truncated CPP synthase polypeptide, for example, has the activity of a CPP synthase as defined previously herein. A truncated sclareol synthase polypeptide, for example, has the activity of a sclareol synthase as defined earlier herein.

[00125] Conforme concebido no presente documento abaixo, uma sequência de nucleotídeos obtida modificando-se as sequências descritas no presente documento pode ser realizada com o uso de qualquer método conhecido na técnica, por exemplo, introduzindo-se qualquer tipo de mutações, tais como mutações por deleção, inserção ou substituição. Os exemplos de tais métodos são citados na parte da descrição referente aos polipeptídeos variantes e aos métodos para preparar os mesmos.[00125] As conceived in the present document below, a nucleotide sequence obtained by modifying the sequences described in this document can be carried out using any method known in the art, for example, by introducing any type of mutations, such as mutations by deletion, insertion or substitution. Examples of such methods are cited in the part of the description relating to variant polypeptides and methods for preparing the same.

[00126] A porcentagem de identidade entre duas sequências de peptídeos ou nucleotídeos é uma função do número de aminoácidos ou resíduos de nucleotídeo que são idênticos nas duas sequências quando um alimento dessas duas sequências foi gerado. Os resíduos idênticos são definidos como resíduos que são os mesmos nas duas sequências em uma determinada posição do alinhamento. A porcentagem da identidade de sequência, conforme usado no presente documento, é calculada a partir do alinhamento ideal tomando-se o número de resíduos idênticos entre duas sequências, dividindo o mesmo pelo número total de resíduos na sequência mais curta e multiplicando por 100. O alinhamento ideal é o alinhamento em que a porcentagem de identidade é a maior possível. Os vãos podem ser introduzidos em uma ou ambas as sequências em uma ou mais posições do alinhamento para obter o alinhamento ideal. Esses vãos são, então, levados em consideração como resíduos não idênticos para o cálculo da porcentagem de identidade de sequência. O alinhamento para o propósito de determinar a porcentagem de identidade de sequência de aminoácidos ou ácidos nucleicos pode ser alcançado de vários modos com o uso de programas de computador e, por exemplo, programas de computador publicamente disponíveis na rede mundial de computadores. De preferência, o programa BLAST (Tatiana et al, FEMS Microbiol Lett., 1999, 174:247 250, 1999) definido para os parâmetros padrão, disponíveis junto a National Center for Biotechnology Information (NCBI) em http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi, podem ser usados para obter um alinhamento ideal de proteína ou sequência de ácidos nucleicos e para calcular a porcentagem de identidade de sequência.[00126] The percentage of identity between two peptide or nucleotide sequences is a function of the number of amino acids or nucleotide residues that are identical in the two sequences when a feed of these two sequences was generated. Identical residues are defined as residues that are the same in both sequences at a given position in the alignment. Percent sequence identity, as used herein, is calculated from the ideal alignment by taking the number of identical residues between two sequences, dividing it by the total number of residues in the shorter sequence, and multiplying by 100. Ideal alignment is the alignment in which the percentage of identity is as high as possible. Gaps can be introduced into one or both sequences at one or more alignment positions to obtain the ideal alignment. These gaps are then taken into account as non-identical residues for calculating the percentage of sequence identity. Alignment for the purpose of determining percentage sequence identity of amino acids or nucleic acids can be achieved in various ways using computer programs and, for example, computer programs publicly available on the world wide web. Preferably, the BLAST program (Tatiana et al, FEMS Microbiol Lett., 1999, 174:247 250, 1999) set to the default parameters, available from the National Center for Biotechnology Information (NCBI) at http://www.ncbi .nlm.nih.gov/BLAST/bl2seq/wblast2.cgi, can be used to obtain an optimal protein or nucleic acid sequence alignment and to calculate percentage sequence identity.

[00127] O polipeptídeo a ser colocado em contato com GGPP in vitro pode ser obtido pela extração de qualquer organismo que expressa o mesmo, com uso de tecnologias de extração de enzima ou proteína padrão. Se o organismo hospedeiro for uma célula ou organismo unicelular que libera o polipeptídeo de uma modalidade do presente documento no meio de cultura, o polipeptídeo pode ser simplesmente coletado do meio de cultura, por exemplo, por centrifugação, opcionalmente seguida de etapas de lavagem e ressuspensão em soluções tampão adequadas. Se o organismo ou a célula acumular o polipeptídeo dentro de suas células, o polipeptídeo pode ser obtido por ruptura ou lise das células e extração adicional do polipeptídeo do lisado celular.[00127] The polypeptide to be placed in contact with GGPP in vitro can be obtained by extraction from any organism that expresses it, using standard enzyme or protein extraction technologies. If the host organism is a cell or unicellular organism that releases the polypeptide of an embodiment of this document into the culture medium, the polypeptide may simply be collected from the culture medium, for example, by centrifugation, optionally followed by washing and resuspension steps. in suitable buffer solutions. If the organism or cell accumulates the polypeptide within its cells, the polypeptide can be obtained by disrupting or lysing the cells and further extracting the polypeptide from the cell lysate.

[00128] De acordo com outra modalidade particular, o método de qualquer uma das modalidades descritas acima é executado in vivo. Essas modalidades fornecidas no presente documento são particularmente vantajosas já que é possível executar o método in vivo sem isolar previamente o polipeptídeo. A reação ocorre diretamente dentro do organismo ou da célula transformada para expressar o dito polipeptídeo.[00128] According to another particular embodiment, the method of any of the embodiments described above is performed in vivo. These modalities provided herein are particularly advantageous since it is possible to perform the method in vivo without previously isolating the polypeptide. The reaction occurs directly within the organism or cell transformed to express said polypeptide.

[00129] Desse modo, por exemplo, (+)manool pode ser produzido a partir de GGPP pelo cultivo de um organismo ou célula hospedeira descrita no presente documento.[00129] Thus, for example, (+) manool can be produced from GGPP by culturing an organism or host cell described herein.

[00130] O organismo ou a célula se destina a “expressar” um polipeptídeo, visto que o organismo ou a célula seja transformada para abrigar um ácido nucleico que codifica o dito polipeptídeo, em que esse ácido nucleico é transcrito em mRNA e o polipeptídeo é encontrado na célula ou organismo hospedeiro. O termo “expressar” abrange “expressar de modo heterólogo” e “superexpressar”, em que o último se refere a níveis de mRNA, polipeptídeo e/ou atividade enzimática sobre e acima do que é medido em uma célula ou organismo não transformado. Uma descrição mais detalhada de métodos adequados para transformar uma célula ou organismo hospedeiro não humano será descrita adiante na parte do relatório descritivo que é dedicada a tais células ou organismos hospedeiros não humanos transformados.[00130] The organism or cell is intended to “express” a polypeptide, as the organism or cell is transformed to harbor a nucleic acid encoding said polypeptide, wherein said nucleic acid is transcribed into mRNA and the polypeptide is found in the host cell or organism. The term “express” encompasses “heterologously express” and “overexpress,” where the latter refers to levels of mRNA, polypeptide, and/or enzyme activity over and above that measured in an untransformed cell or organism. A more detailed description of suitable methods for transforming a non-human host cell or organism will be described below in the part of the specification that is devoted to such transformed non-human host cells or organisms.

[00131] Um organismo ou célula particular se destina a ter "capacidade para produzir FPP" quando produz FPP naturalmente ou quando não produz FPP naturalmente, mas é transformado para produzir FPP, antes da transformação com um ácido nucleico conforme descrito no presente documento ou juntamente com o dito ácido nucleico. Os organismos ou células transformados para produzir uma quantidade maior de FPP que o organismo ou célula de ocorrência natural também são abrangidos pelos "organismos ou células que têm capacidade para produzir FPP". Métodos para transformar organismos, por exemplo, microrganismos de modo que os mesmos produzam FPP já são conhecidos na técnica. Por exemplo, um microrganismo pode ser transformado com[00131] A particular organism or cell is intended to have "capacity to produce FPP" when it produces FPP naturally or when it does not produce FPP naturally, but is transformed to produce FPP, prior to transformation with a nucleic acid as described herein or together with said nucleic acid. Organisms or cells transformed to produce a greater amount of FPP than the naturally occurring organism or cell are also covered by "organisms or cells that have the capacity to produce FPP". Methods for transforming organisms, for example microorganisms, so that they produce FPP are already known in the art. For example, a microorganism can be transformed with

[00132] Uma célula ou organismo particular se destina a ter "capacidade para produzir GGPP" quando produz GGPP naturalmente ou quando não produz GGPP naturalmente, mas é transformado para produzir GGPP, antes da transformação com um ácido nucleico conforme descrito no presente documento ou juntamente com o dito ácido nucleico. Os organismos ou células transformados para produzir uma quantidade maior de GGPP que o organismo ou célula de ocorrência natural também são abrangidos pelos "organismos ou células que têm capacidade para produzir GGPP". Métodos para transformar organismos, por exemplo, microrganismos de modo que os mesmos produzam GGPP já são conhecidos na técnica.[00132] A particular cell or organism is intended to have "capacity to produce GGPP" when it produces GGPP naturally or when it does not produce GGPP naturally, but is transformed to produce GGPP, prior to transformation with a nucleic acid as described herein or together with said nucleic acid. Organisms or cells transformed to produce a greater amount of GGPP than the naturally occurring organism or cell are also covered by "organisms or cells that have the capacity to produce GGPP". Methods for transforming organisms, for example microorganisms, so that they produce GGPP are already known in the art.

[00133] Os organismos hospedeiros não humanos adequados para executar o método de uma modalidade no presente documento in vivo podem ser quaisquer organismos multicelulares ou unicelulares não humanos. Em uma modalidade particular, o organismo hospedeiro não humano usado para executar uma modalidade no presente documento in vivo é uma planta, um procarioto ou um fungo.Qualquer planta, procarioto ou fungo pode ser usado. As plantas particularmente úteis são aquelas que produzem naturalmente altas quantidades de terpenos. Em uma modalidade mais particular, o organismo hospedeiro não humano usado para executar o método de uma modalidade no presente documento in vivo é um microrganismo. Qualquer microrganismo pode ser usado, mas, de acordo com uma modalidade ainda mais particular, o dito microrganismo é uma bactéria ou levedura. Mais particularmente, a dita bactéria é E. coli e a dita levedura é Saccharomyces cerevisiae.[00133] Suitable non-human host organisms for carrying out the method of an embodiment herein in vivo can be any non-human multicellular or unicellular organisms. In a particular embodiment, the non-human host organism used to perform an embodiment herein in vivo is a plant, a prokaryote or a fungus. Any plant, prokaryote or fungus can be used. Particularly useful plants are those that naturally produce high amounts of terpenes. In a more particular embodiment, the non-human host organism used to perform the method of an embodiment herein in vivo is a microorganism. Any microorganism can be used, but, according to an even more particular embodiment, said microorganism is a bacteria or yeast. More particularly, said bacteria is E. coli and said yeast is Saccharomyces cerevisiae.

[00134] Alguns desses organismos não produzem GGPP naturalmente ou apenas em pequenas quantidades. Para serem adequados para executar o método de uma modalidade no presente documento, esses organismos têm que ser transformados para produzir o dito precursor ou para produzir o dito precursor em quantidades maiores. Os mesmos podem ser assim transformados antes da modificação com o ácido nucleico descrito de acordo com qualquer uma das modalidades acima ou simultaneamente, conforme explicado acima.[00134] Some of these organisms do not produce GGPP naturally or only in small quantities. To be suitable for carrying out the method of an embodiment herein, these organisms must be transformed to produce said precursor or to produce said precursor in larger quantities. They can be thus transformed before modification with the nucleic acid described according to any of the above embodiments or simultaneously, as explained above.

[00135] Um organismo pode ser transformado, por exemplo, com um ácido nucleico que codifica uma sintase de GGPP. O ácido nucleico pode estar incluído no vetor de expressão igual ou diferente ou diferentes de um ácido nucleico que codifica uma CPP sintase ou um ácido nucleico que codifica uma esclareol sintase conforme descrito no presente documento. Uma sintase de GGPP pode, por exemplo, compreender a sequência de aminoácidos em SEQ ID NO: 7. Um ácido nucleico que codifica uma sintase de GGPP pode, por exemplo, compreender a sequência de ácidos nucleicos em SEQ ID NO: 8. Um método de transformação tal como aquele descrito no presente documento e nos presentes Exemplos pode ser usado.[00135] An organism can be transformed, for example, with a nucleic acid that encodes a GGPP synthase. The nucleic acid may be included in the expression vector the same as or different from a nucleic acid encoding a CPP synthase or a nucleic acid encoding a sclareol synthase as described herein. A GGPP synthase may, for example, comprise the amino acid sequence in SEQ ID NO: 7. A nucleic acid encoding a GGPP synthase may, for example, comprise the nucleic acid sequence in SEQ ID NO: 8. A method transformation method such as that described herein and in the present Examples may be used.

[00136] Um organismo pode ser transformado com um ou mais ácidos nucleicos que codificam uma parte ou um todo da trajetória de mevalonato que leva a FPP. Um método tal como aquele descrito nos presentes Exemplos pode ser usado.[00136] An organism can be transformed with one or more nucleic acids that encode a part or a whole of the mevalonate pathway that leads to FPP. A method such as that described in the present Examples can be used.

[00137] Células eucarióticas maiores isoladas podem também ser usadas, em vez de organismos completos, como hospedeiros para executar o método de uma modalidade do presente documento in vivo. As células eucarióticas adequadas podem ser qualquer célula não humana, mas são, particularmente, células vegetais ou fúngicas.[00137] Isolated larger eukaryotic cells can also be used, instead of whole organisms, as hosts to perform the method of an embodiment of the present document in vivo. Suitable eukaryotic cells may be any non-human cell, but are particularly plant or fungal cells.

[00138] De acordo com uma outra modalidade particular, os polipeptídeos que têm uma atividade de CPP sintase e uma atividade de esclareol sintase usada em qualquer uma das modalidades descritas no presente documento ou codificadas pelos ácidos nucleicos descritos no presente documento podem ser variantes obtidas por engenharia genética, visto que a dita variante mantém sua atividade de CPP sintase e sua atividade de esclareol sintase. Um polipeptídeo de CPP sintase variante, por exemplo, tem a atividade de uma CPP sintase conforme definido anteriormente no presente documento. Um polipeptídeo de esclareol sintase variante, por exemplo, tem a atividade de uma esclareol sintase conforme definido anteriormente no presente documento.[00138] According to another particular embodiment, polypeptides having a CPP synthase activity and a sclareol synthase activity used in any of the modalities described herein or encoded by the nucleic acids described herein may be variants obtained by genetic engineering, since said variant maintains its CPP synthase activity and its sclareol synthase activity. A variant CPP synthase polypeptide, for example, has the activity of a CPP synthase as defined previously herein. A variant sclareol synthase polypeptide, for example, has the activity of a sclareol synthase as defined earlier herein.

[00139] Conforme usado no presente documento, o polipeptídeo é destinado como um fragmento de polipeptídeo ou peptídeo que abrange as sequências de aminoácidos identificadas no presente documento, bem como polipeptídeos truncados ou variantes, visto que mantêm sua atividade de CPP sintase e sua atividade de esclareol sintase conforme definido no presente documento.[00139] As used herein, the polypeptide is intended as a polypeptide fragment or peptide that encompasses the amino acid sequences identified herein, as well as truncated or variant polypeptides, as they maintain their CPP synthase activity and their CPP synthase activity. sclareol synthase as defined herein.

[00140] "Manter atividade" pode, por exemplo, significar que o polipeptídeo mantém pelo menos alguma atividade original do polipeptídeo não truncado ou não mutado, por exemplo, pelo menos 70, 80, 90. 95, 97, 99 ou 100% da atividade. Um polipeptídeo truncado ou variante pode, em alguns casos, ter atividade aumentada em comparação ao polipeptídeo não mutado ou não truncado.[00140] "Maintain activity" may, for example, mean that the polypeptide maintains at least some of the original activity of the untruncated or unmutated polypeptide, for example, at least 70, 80, 90, 95, 97, 99 or 100% of the activity. A truncated or variant polypeptide may, in some cases, have increased activity compared to the unmutated or untruncated polypeptide.

[00141] Os exemplos de polipeptídeos variantes são proteínas de ocorrência natural que resultam dos eventos de entrelaçamento de mRNA alternativos ou da clivagem proteolítica dos polipeptídeos descritos no presente documento. As variações atribuíveis à proteólise incluem, por exemplo, diferenças nas terminações N ou C mediante a expressão em diferentes tipos de células hospedeiras, devido à remoção proteolítica de um ou mais aminoácidos terminais dos polipeptídeos de uma modalidade da presente invenção. Os polipeptídeos codificados por um ácido nucleico obtido pela mutação natural ou artificial de um ácido nucleico de uma modalidade do presente documento, conforme descrito posteriormente, são também abrangidos por uma modalidade do presente documento.[00141] Examples of variant polypeptides are naturally occurring proteins that result from alternative mRNA splicing events or proteolytic cleavage of the polypeptides described herein. Variations attributable to proteolysis include, for example, differences in the N or C termini upon expression in different types of host cells, due to the proteolytic removal of one or more terminal amino acids from the polypeptides of an embodiment of the present invention. Polypeptides encoded by a nucleic acid obtained by natural or artificial mutation of a nucleic acid of an embodiment of the present document, as described below, are also covered by an embodiment of the present document.

[00142] As variantes de polipeptídeo resultantes de uma fusão de sequências de peptídeos adicionais nas extremidades de terminal de amino e carboxila podem também ser usadas nos métodos de uma modalidade do presente documento. Particularmente, tal fusão pode intensificar a expressão dos polipeptídeos, ser útil na purificação da proteína ou aprimorar a atividade enzimática do polipeptídeo em um sistema de expressão ou ambiente desejado. Tais sequências de peptídeos adicionais podem ser peptídeos de sinal, por exemplo. Consequentemente, são abrangidos pelo presente documento métodos que usam polipeptídeos variantes, tais como aqueles obtidos pela fusão com outros oligo ou polipeptídeos e/ou aqueles que são ligados a peptídeos de sinalização. Os polipeptídeos resultantes de uma função com outra proteína funcional, tal como uma outra proteína da trajetória de biossíntese de terpeno, podem também ser vantajosamente usados nos métodos de uma modalidade do presente documento.[00142] Polypeptide variants resulting from a fusion of additional peptide sequences at the amino and carboxyl terminal ends can also be used in the methods of an embodiment of the present document. Particularly, such a fusion may enhance expression of the polypeptides, be useful in purifying the protein, or enhance the enzymatic activity of the polypeptide in a desired expression system or environment. Such additional peptide sequences may be signal peptides, for example. Consequently, covered by this document are methods that use variant polypeptides, such as those obtained by fusion with other oligos or polypeptides and/or those that are linked to signal peptides. Polypeptides resulting from a function with another functional protein, such as another terpene biosynthesis pathway protein, can also be advantageously used in the methods of one embodiment of the present document.

[00143] Conforme mencionado acima, o ácido nucleico que codifica o polipeptídeo de uma modalidade do presente documento é uma ferramenta útil para modificar células ou organismos hospedeiros não humanos destinados a serem usados quando o método é executado in vivo.[00143] As mentioned above, the nucleic acid encoding the polypeptide of an embodiment of the present document is a useful tool for modifying non-human host cells or organisms intended for use when the method is performed in vivo.

[00144] Um ácido nucleico que codifica um polipeptídeo de acordo com qualquer uma das modalidades descritas acima é, portanto, também fornecido no presente documento.[00144] A nucleic acid encoding a polypeptide according to any of the embodiments described above is therefore also provided herein.

[00145] O ácido nucleico de uma modalidade do presente documento pode ser definido como incluindo polímeros de desoxirribonucleotídeo ou ribonucleotídeo nas formas de filamento simples ou duplo (DNA e/ou RNA). O termo "sequência de nucleotídeos" também deve ser entendido como compreendendo uma molécula de polinucleotídeo ou uma molécula de oligonucleotídeo na forma de um fragmento separado ou como um componente de um ácido nucleico maior. Os ácidos nucleicos de uma modalidade do presente documento também abrangem determinadas sequências de nucleotídeos isoladas que incluem aquelas que são substancialmente livres de contaminar o material endógeno. O ácido nucleico de uma modalidade no presente documento pode ser truncado, desde que codifique um polipeptídeo abrangido no presente documento, conforme descrito acima.[00145] The nucleic acid of an embodiment of the present document can be defined as including deoxyribonucleotide or ribonucleotide polymers in single or double stranded forms (DNA and/or RNA). The term "nucleotide sequence" should also be understood as comprising a polynucleotide molecule or an oligonucleotide molecule in the form of a separate fragment or as a component of a larger nucleic acid. The nucleic acids of an embodiment herein also encompass certain isolated nucleotide sequences that include those that are substantially free from contaminating endogenous material. The nucleic acid of an embodiment herein may be truncated as long as it encodes a polypeptide covered herein as described above.

[00146] Em uma modalidade, o ácido nucleico de uma modalidade no presente documento que codifica uma CPP sintase pode estar presente naturalmente em uma planta, tal como Salvia miltiorrhiza, ou outras espécies, ou ser obtido modificando-se SEQ ID NO: 3.[00146] In one embodiment, the nucleic acid of an embodiment herein that encodes a CPP synthase may be present naturally in a plant, such as Salvia miltiorrhiza, or other species, or be obtained by modifying SEQ ID NO: 3.

[00147] Em uma modalidade adicional, o ácido nucleico de uma modalidade no presente documento que codifica uma esclareol sintase pode estar presente naturalmente em uma planta, tal como Salvia sclarea, ou outra espécie, ou pode ser obtido modificando-se SEQ ID NO: 6.[00147] In a further embodiment, the nucleic acid of an embodiment herein that encodes a sclareol synthase may be present naturally in a plant, such as Salvia sclarea, or another species, or may be obtained by modifying SEQ ID NO: 6.

[00148] As mutações podem ser qualquer tipo de mutações desses ácidos nucleicos, tais como mutações pontuais, mutações por deleção, mutações por inserção e/ou mutações por deslocamento de quadro. Um ácido nucleico variante pode ser preparado a fim de adaptar sua sequência de nucleotídeos a um sistema de expressão específico. Por exemplo, são conhecidos sistemas de expressão bacterianos para expressar de modo mais eficaz polipeptídeos se os aminoácidos forem codificados por códons particulares.[00148] Mutations can be any type of mutations of these nucleic acids, such as point mutations, deletion mutations, insertion mutations and/or frameshift mutations. A variant nucleic acid can be prepared in order to adapt its nucleotide sequence to a specific expression system. For example, bacterial expression systems are known to more efficiently express polypeptides if the amino acids are encoded by particular codons.

[00149] Devido à degenerescência do código genético, mais de um códon pode codificar a mesma sequência de aminoácidos, múltiplas sequências de ácidos nucleicos podem codificar a mesma proteína ou polipeptídeo, em que todas essas sequências de DNA são abrangidas por uma modalidade do presente documento. Quando apropriado, as sequências de ácidos nucleicos que codificam a CPP sintase e a esclareol sintase podem ser otimizadas para expressão aumentada na célula hospedeira. Por exemplo, os nucleotídeos de uma modalidade do presente documento podem ser sintetizados com o uso de códons particulares por um hospedeiro para expressão aprimorada.[00149] Due to the degeneracy of the genetic code, more than one codon may encode the same amino acid sequence, multiple nucleic acid sequences may encode the same protein or polypeptide, wherein all of these DNA sequences are covered by an embodiment of the present document . When appropriate, nucleic acid sequences encoding CPP synthase and sclareol synthase can be optimized for increased expression in the host cell. For example, the nucleotides of an embodiment herein may be synthesized using particular codons by a host for enhanced expression.

[00150] Uma outra ferramenta importante para transformar células ou organismos hospedeiros adequados para executar o método de uma modalidade do presente documento in vivo é um vetor de expressão que compreende um ácido nucleico de acordo com qualquer modalidade de uma modalidade do presente documento. Tal vetor é, portanto, também fornecido no presente documento. Um vetor de expressão pode, por exemplo, compreender um ou mais dentre um ácido nucleico que codifica uma CPP sintase, um ácido nucleico que codifica uma esclareol sintase ou um ácido nucleico que codifica uma sintase de GGPP, conforme descrito no presente documento.[00150] Another important tool for transforming host cells or organisms suitable for carrying out the method of an embodiment of the present document in vivo is an expression vector comprising a nucleic acid according to any embodiment of an embodiment of the present document. Such a vector is therefore also provided in this document. An expression vector may, for example, comprise one or more of a nucleic acid encoding a CPP synthase, a nucleic acid encoding a sclareol synthase, or a nucleic acid encoding a GGPP synthase, as described herein.

[00151] As células e organismos hospedeiros não humanos recombinantes transformados para alojar pelo menos um ácido nucleico de uma modalidade do presente documento de modo que expresse ou superexpresse de modo heterólogo pelo menos um polipeptídeo de uma modalidade do presente documento são também ferramentas muito úteis para executar o método de uma modalidade do presente documento. Tais células e organismos hospedeiros não humanos são, portanto, também fornecidos no presente documento.[00151] Recombinant non-human host cells and organisms transformed to harbor at least one nucleic acid of an embodiment of the present document so that it heterologously expresses or overexpresses at least one polypeptide of an embodiment of the present document are also very useful tools for performing the method of an embodiment of this document. Such non-human host cells and organisms are therefore also provided herein.

[00152] Um ácido nucleico de acordo com qualquer uma das modalidades descritas acima pode ser usado para transformar as células e organismos hospedeiros não humanos, e o polipeptídeo expresso pode ser qualquer um dentre os polipeptídeos descritos acima.[00152] A nucleic acid according to any of the embodiments described above can be used to transform non-human host cells and organisms, and the expressed polypeptide can be any of the polypeptides described above.

[00153] Os organismos hospedeiros não humanos de uma modalidade do presente documento podem ser quaisquer organismos multicelulares ou unicelulares não humanos. Em uma modalidade particular, o organismo hospedeiro não humano é uma planta, um procarioto ou um fungo. Qualquer planta, procarioto ou fungo é adequado para ser transformado de acordo com os métodos fornecidos no presente documento. As plantas particularmente úteis são aquelas que produzem naturalmente altas quantidades de terpenos.[00153] The non-human host organisms of an embodiment of the present document can be any non-human multicellular or unicellular organisms. In a particular embodiment, the non-human host organism is a plant, a prokaryote or a fungus. Any plant, prokaryote or fungus is suitable for transformation according to the methods provided herein. Particularly useful plants are those that naturally produce high amounts of terpenes.

[00154] Em uma modalidade mais particular, o organismo hospedeiro não humano é um microrganismo. Qualquer microrganismo é adequado para ser usado no presente documento, mas, de acordo com uma modalidade ainda mais particular, o dito microrganismo é uma bactéria ou levedura. Mais particularmente, a dita bactéria é E. coli e a dita levedura é Saccharomyces cerevisiae.[00154] In a more particular embodiment, the non-human host organism is a microorganism. Any microorganism is suitable for use herein, but, according to an even more particular embodiment, said microorganism is a bacteria or yeast. More particularly, said bacteria is E. coli and said yeast is Saccharomyces cerevisiae.

[00155] Células eucarióticas maiores isoladas também podem ser transformadas, em vez de organismos completos. Por célula eucariótica superior entende-se aqui qualquer célula eucariótica não humana exceto células de levedura. As células eucarióticas maiores particulares são células vegetais ou células fúngicas.[00155] Isolated larger eukaryotic cells can also be transformed, rather than complete organisms. By higher eukaryotic cell is meant here any non-human eukaryotic cell except yeast cells. The particular larger eukaryotic cells are plant cells or fungal cells.

[00156] Uma variante pode também diferir do polipeptídeo de uma modalidade no presente documento por fixação de grupos de modificação que estão ligados de modo covalente ou não covalente à cadeia principal do polipeptídeo.[00156] A variant may also differ from the polypeptide of an embodiment herein by attaching modification groups that are covalently or non-covalently linked to the main chain of the polypeptide.

[00157] A variante também inclui um polipeptídeo que difere do polipeptídeo descrito no presente documento por sítios de glicosilação ligados em N ou ligados em O introduzidos e/ou uma adição de resíduos de cisteína. O versado na técnica reconhecerá como modificar uma sequência de aminoácidos e preservar a atividade biológica.[00157] The variant also includes a polypeptide that differs from the polypeptide described herein by introduced N-linked or O-linked glycosylation sites and/or an addition of cysteine residues. One skilled in the art will recognize how to modify an amino acid sequence and preserve biological activity.

[00158] As modalidades fornecidas no presente documento incluem, porém sem limitação, sequências de cDNA, DNA genômico e RNA.[00158] The modalities provided herein include, but are not limited to, cDNA, genomic DNA and RNA sequences.

[00159] Os genes, incluindo os polinucleotídeos de uma modalidade no presente documento, podem ser clonados com base nas informações de sequência de nucleotídeos disponíveis, tal como encontrados na listagem de sequências anexa, por métodos conhecidos na técnica. Os mesmos incluem, por exemplo, o projeto de iniciadores de DNA que representam as sequências de flanqueamento de tal gene do qual uma é gerada em orientações senso e que inicia a síntese do filamento senso e a outra é criada na forma complementar inversa e gera o filamento antissenso. DNA polimerases termoestáveis, tais como aquelas usadas em reação em cadeia de polimerase, são comumente usadas para executar tais experimentos. Alternativamente, as sequências de DNA que representam genes podem ser quimicamente sintetizadas e subsequentemente introduzidas em moléculas de vetor de DNA que podem ser multiplicadas, por exemplo, por bactérias compatíveis, tais como, por exemplo, E. coli.[00159] Genes, including polynucleotides of an embodiment herein, can be cloned based on available nucleotide sequence information, as found in the attached sequence listing, by methods known in the art. These include, for example, the design of DNA primers that represent the flanking sequences of such a gene, one of which is generated in sense orientations and which initiates synthesis of the sense strand and the other is created in inverse complementary form and generates the antisense filament. Thermostable DNA polymerases, such as those used in polymerase chain reactions, are commonly used to perform such experiments. Alternatively, DNA sequences representing genes can be chemically synthesized and subsequently introduced into DNA vector molecules that can be multiplied, for example, by compatible bacteria, such as, for example, E. coli.

[00160] São fornecidas no presente documento sequências de ácidos nucleicos obtidas por mutações da SEQ ID NO: 3 e SEQ ID NO: 6; em que tais mutações podem ser produzidas rotineiramente. Está claro para o versado na técnica que mutações, deleções, inserções e/ou substituições de um ou mais nucleotídeos podem ser introduzidas nessas sequências de DNA.[00160] Nucleic acid sequences obtained by mutations of SEQ ID NO: 3 and SEQ ID NO: 6 are provided in this document; in which such mutations can be routinely produced. It is clear to those skilled in the art that mutations, deletions, insertions and/or substitutions of one or more nucleotides can be introduced into these DNA sequences.

[00161] As sequências de ácidos nucleicos de uma modalidade no presente documento que codificam a CPP sintase e as proteínas de scalereol sintase podem ser inseridas em vetores de expressão e/ou estar contidas em genes quiméricos inseridos em vetores de expressão, para produzir CPP sintase e sintase de scaleol em uma célula hospedeira ou organismo hospedeiro. Os vetores para inserir transgenes no genoma de células hospedeiras são bem conhecidos na técnica e incluem plasmídeos, vírus, cosmídeos e cromossomos artificiais. Vetores binários ou de cointegração em que um gene quimérico é inserido também são usados para transformar células hospedeiras.[00161] The nucleic acid sequences of an embodiment herein that encode CPP synthase and scalereol synthase proteins may be inserted into expression vectors and/or be contained in chimeric genes inserted into expression vectors, to produce CPP synthase and scaleol synthase in a host cell or host organism. Vectors for inserting transgenes into the genome of host cells are well known in the art and include plasmids, viruses, cosmids and artificial chromosomes. Binary or cointegration vectors into which a chimeric gene is inserted are also used to transform host cells.

[00162] Uma modalidade fornecida no presente documento fornece vetores recombinantes de expressão que compreendem um ácido nucleico que codifica uma CPP sintase e uma scalereol sintase que, cada uma, separadamente, são operacionalmente ligadas às sequências de ácidos nucleicos associadas tais como, por exemplo, sequências promotoras.[00162] One embodiment provided herein provides recombinant expression vectors comprising a nucleic acid encoding a CPP synthase and a scalereol synthase that each separately are operably linked to associated nucleic acid sequences such as, e.g. promoter sequences.

[00163] Alternativamente, a sequência promotora pode já estar presente em um vetor de modo que a sequência de ácidos nucleicos que deve ser transcrita seja inserida no vetor a jusante da sequência promotora. Os vetores são tipicamente manipulados para ter uma origem de replicação, um sítio de clonagem múltiplo e um marcador selecionável.[00163] Alternatively, the promoter sequence may already be present in a vector so that the nucleic acid sequence that is to be transcribed is inserted into the vector downstream of the promoter sequence. Vectors are typically engineered to have an origin of replication, a multiple cloning site, and a selectable marker.

EXEMPLOSEXAMPLES Exemplo 1.Example 1. GENES DE DITERPENO SINTASE.DITERPENE SYNTHASE GENES.

[00164] Duas diterpeno sintases são necessárias para a conversão de geranilgeranil-difosfato (GGPP) em manool: uma diterpeno sintase do tipo I ou tipo II. Nesses exemplos, para a diterpeno sintase do tipo II, a difosfato de copalila sintase (CPP) Salvia miltiorrhiza (acesso NCBI no ABV57835.1) foi usada. Para expressão ideal em células E. coli, o uso de códon do cDNA foi otimizado, os primeiros 58 códons foram removidos e um códon de partida ATG foi adicionado. Para a diterpeno sintase do tipo I, a esclareol sintase de Salvia sclarea (SsScS) foi usada (acesso NCBI no AET21246.1, WO2009095366). O uso de códon do cDNA foi otimizado para expressão de E. coli (DNA 2.0, Menlo Park, CA, EUA 94025), os 50 primeiros códons N-terminal foram removidos. Cada um desses dois cDNAs foi sintetizado in vitro e clonado no plasmídeo pJ208 flanqueado com os sítios de reconhecimento de enzima de restrição Ndel e Kpnl (DNA 2.0, Menlo Park, CA 94025, EUA).[00164] Two diterpene synthases are necessary for the conversion of geranylgeranyl diphosphate (GGPP) to mannool: a type I or type II diterpene synthase. In these examples, for type II diterpene synthase, Salvia miltiorrhiza copalyl diphosphate synthase (CPP) (NCBI accession no. ABV57835.1) was used. For optimal expression in E. coli cells, cDNA codon usage was optimized, the first 58 codons were removed, and an ATG start codon was added. For type I diterpene synthase, sclareol synthase from Salvia sclarea (SsScS) was used (NCBI accession no AET21246.1, WO2009095366). The cDNA codon usage was optimized for E. coli expression (DNA 2.0, Menlo Park, CA, USA 94025), the first 50 N-terminal codons were removed. Each of these two cDNAs was synthesized in vitro and cloned into the pJ208 plasmid flanked with the NdeI and Kpnl restriction enzyme recognition sites (DNA 2.0, Menlo Park, CA 94025, USA).

Exemplo 2.Example 2. Plasmídeos de expressão.Expression plasmids.

[00165] A CPP sintase modificada (SmCPS2) e esclareol sintase (SsScS) que codifica cDNA foram digeridas com Ndel e Kpnl e ligadas no plasmídeo pETDuet-1 que fornece os plasmídeos de expressão pETDuet-SmCPS2 e pETDuet-1132opt, respectivamente.[00165] The modified CPP synthase (SmCPS2) and sclareol synthase (SsScS) encoding cDNA were digested with NdeI and Kpnl and ligated into the pETDuet-1 plasmid that provides the expression plasmids pETDuet-SmCPS2 and pETDuet-1132opt, respectively.

[00166] Um outro plasmídeo foi construído para coexpressão das enzimas SmCPS2 e SsScS juntamente com uma difofato de geranilgeranila (GGPP) sintase. Para a sintase de GGPP, o gene CrtE de Pantoea agglomerans (acesso NCBI M38424.1) que codifica uma sintase de GGPP (acesso NCBI número AAA24819.1) foi usado. O gene CrtE foi sintetizado com otimização de códon e adição dos sítios de reconhecimento de enzima de restrição de Ncol e BamHI nas extremidades 3' e 5' (DNA 2.0, Menlo Park, CA 94025, EUA) e ligado entre os sítios de Ncol e BamHI do plasmídeo pETDuet-1 para obter o plasmídeo pETDuet-CrtE. O SmCPS2 modificado que codifica cDNA foi digerido com Ndel e Kpnl e ligado no plasmídeo pETDuet-1-CrtE fornecendo, desse modo, o construto de pETDuet-CrtE-SmCPS2. O cDNA otimizado (Sa1132opt) que codifica o SsScS truncado foi, então, introduzido no plasmídeo pETDuet-CrtE-SmCPS2 com uso da técnica In-Fusion® (Clontech, Takara Bio Europe). Para essa clonagem, o pETDuet-1132opt foi usado como modelo em uma amplificação de PCR com uso do iniciador anterior SmCPS2- 1132Inf_F1 5'-CTGTTTGAGCCGGTCGCCTAAGGTACCAGAAGGAGATAAATAATGGCGAAAAT GAA GGAGAACTTTAAACG-3 ' e o iniciador reverso 1132-pET_Inf_R1 5'- GCAGCGGTTTCTTT ACCAGACTCGAGGTCAGAACACGAAGCTCTTCATGTCCTCT-3'. O produto de PCR foi ligado no plasmídeo pETDuet-CrtE-SmCPS2 digerido com as enzimas de restrição de Kpnl e Xhol e com uso do kit denominado In-Fusion® Dry-Down PCR Cloning Kit (Clontech, Takara Bio Europe), que fornece o novo plasmídeo pETDuet- CrtE-SmCPS2-SsScS. Nesse plasmídeo, o gene CrtE está mediante o controle do primeiro promotor T7 do plasmídeo pETDuet e a CPP sintase e esclareol sintase que codificam cDNAs são organizadas em um construto bicistrônico mediante o controle do segundo promotor T7.[00166] Another plasmid was constructed for coexpression of the enzymes SmCPS2 and SsScS together with a geranylgeranyl diphate (GGPP) synthase. For the GGPP synthase, the CrtE gene from Pantoea agglomerans (NCBI accession M38424.1) encoding a GGPP synthase (NCBI accession number AAA24819.1) was used. The CrtE gene was synthesized with codon optimization and addition of Ncol and BamHI restriction enzyme recognition sites at the 3' and 5' ends (DNA 2.0, Menlo Park, CA 94025, USA) and ligated between the Ncol and BamHI from plasmid pETDuet-1 to obtain plasmid pETDuet-CrtE. The modified SmCPS2 encoding cDNA was digested with NdeI and Kpnl and ligated into the pETDuet-1-CrtE plasmid, thereby providing the pETDuet-CrtE-SmCPS2 construct. The optimized cDNA (Sa1132opt) encoding the truncated SsScS was then introduced into the pETDuet-CrtE-SmCPS2 plasmid using the In-Fusion® technique (Clontech, Takara Bio Europe). For this cloning, pETDuet-1132opt was used as a template in a PCR amplification using the forward primer SmCPS2- 1132Inf_F1 5'-CTGTTTGAGCCGGTCGCCTAAGGTACCAGAAGGAGATAAATAATGGCGAAAAT GAA GGAGAACTTTAAACG-3' and the reverse primer 1132-pET_Inf_R1 5'- AGACTCGAGGTCAGAACACGAAGCTCTTCATGTCCTCT-3'. The PCR product was ligated into the pETDuet-CrtE-SmCPS2 plasmid digested with Kpnl and XhoI restriction enzymes and using the kit called In-Fusion® Dry-Down PCR Cloning Kit (Clontech, Takara Bio Europe), which provides the new plasmid pETDuet- CrtE-SmCPS2-SsScS. In this plasmid, the CrtE gene is under the control of the first T7 promoter of the pETDuet plasmid and the CPP synthase and sclareol synthase that encode cDNAs are organized in a bicistronic construct under the control of the second T7 promoter.

Exemplo 3.Example 3. Expressão heteróloga em E. coli e atividades enzimáticas.Heterologous expression in E. coli and enzymatic activities.

[00167] Os plasmídeos de expressão (pETDuet-SmCPS2 ou pETDuet-1132opt) foram usados em células B121(DE3) E. coli transformadas (Novagene, Madison, WI). Colônias únicas de células transformadas foram usadas para inocular 25 ml de meio LB. Após 5 a 6 horas de incubação a 37 °C, as culturas foram transferidas a um incubador a 20 °C e deixadas 1 hora para equilíbrio. A expressão da proteína foi, então, induzida pela adição de 0,1 mM de IPTG e a cultura foi incubada de um dia para o outro a 20 °C. No dia seguinte, as células foram coletadas por centrifugação, ressuspensas em 0,1 volume de 50 mM de MOPSO pH 7, 10% de glicerol, 1 mM de DTT e lisadas por sonicação. Os extratos foram apurados por centrifugação (30 min a 20.000 g), e os sobrenadantes contendo as proteínas solúveis foram usados para experimentos adicionais.[00167] Expression plasmids (pETDuet-SmCPS2 or pETDuet-1132opt) were used in transformed B121(DE3) E. coli cells (Novagene, Madison, WI). Single colonies of transformed cells were used to inoculate 25 ml of LB medium. After 5 to 6 hours of incubation at 37°C, the cultures were transferred to a 20°C incubator and allowed 1 hour to equilibrate. Protein expression was then induced by the addition of 0.1 mM IPTG and the culture was incubated overnight at 20°C. The next day, cells were collected by centrifugation, resuspended in 0.1 volume of 50 mM MOPSO pH 7, 10% glycerol, 1 mM DTT, and lysed by sonication. The extracts were cleared by centrifugation (30 min at 20,000 g), and the supernatants containing the soluble proteins were used for additional experiments.

Exemplo 4.Example 4. ENSAIOS DE ATIVIDADE DE DITERPENO SINTASE IN VITRO.DITERPENE SYNTHASE ACTIVITY TESTS IN VITRO.

[00168] Os ensaios enzimáticos foram realizados em tubos de vidro vedados com Teflon com uso de 50 a 100 μM de extrato de proteína em um volume final de 1 ml de 50 mM de MOPSO pH 7, 10% de glicerol suplementado com 20 mM de MgCl2 e 50 a 200 μM de difosfato de geranilgeranila purificado (GGPP) (preparado conforme descrito por Keller e Thompson, J. Chromatogr 645(1), 161 a 167, 1993). Os tubos foram incubados 5 a 48 horas a 30 °C e os produtos de enzima foram extraídos duas vezes com um volume de pentano. Após a concentração sob um fluxo de nitrogênio, os extratos foram analisados por GC-MS e comparados aos extratos de proteínas de controle (obtidas das células transformadas com o plasmídeo vazio). As análises de GC-MS foram realizadas em um sistema GC de série 6890 de Agilent equipado com uma coluna DB1 (30 m x 0,25 mm x 0,25 mm de espessura de filme; Agilent) e acoplado a um espectrômetro de massa de série 5975. O gás carreador foi hélio em um fluxo constante de 1 ml/min. A injeção estava em modo sem divisão com a temperatura de injetor definida a 260 °C e a temperatura do forno foi programada de 100 °C para 225 °C a 10 °C/min e para 280 °C a 30 °C/min. As identidades dos produtos foram confirmadas com base na concordância dos índices de retenção e espectros de massa dos padrões autênticos.[00168] Enzymatic assays were carried out in glass tubes sealed with Teflon using 50 to 100 μM of protein extract in a final volume of 1 ml of 50 mM MOPSO pH 7, 10% glycerol supplemented with 20 mM of MgCl2 and 50 to 200 μM purified geranylgeranyl diphosphate (GGPP) (prepared as described by Keller and Thompson, J. Chromatogr 645(1), 161 to 167, 1993). The tubes were incubated 5 to 48 hours at 30°C and the enzyme products were extracted twice with one volume of pentane. After concentration under a nitrogen flow, the extracts were analyzed by GC-MS and compared to control protein extracts (obtained from cells transformed with the empty plasmid). GC-MS analyzes were performed on an Agilent 6890 series GC system equipped with a DB1 column (30 m x 0.25 mm x 0.25 mm film thickness; Agilent) and coupled to a series mass spectrometer. 5975. The carrier gas was helium at a constant flow of 1 ml/min. The injection was in splitless mode with the injector temperature set at 260°C and the oven temperature was programmed from 100°C to 225°C at 10°C/min and to 280°C at 30°C/min. Product identities were confirmed based on agreement of retention indices and mass spectra of authentic standards.

[00169] Nessas condições e com a proteína recombinante das células E. coli transformadas com os plasmídeos pETDuet-SmCPS2 ou pETDuet- 1132opt (que expressam de modo heterólogo as enzimas SmCPS ou SsScS, respectivamente) nenhuma produção de moléculas de diterpeno foi detectada nos extratos de solvente (os diterpenos que contêm difosfato não são detectados nessas condições). Ensaios similares foram, então, realizados, mas combinando os 2 extratos de proteína que contêm os SmCPS e SsScS recombinantes em um único ensaio. Nesses ensaios, um produto principal foi formado e foi identificado como (+)-manool pela correspondência do espectro de massa e índice de retenção com padrões autênticos (Figura 2).[00169] Under these conditions and with the recombinant protein from E. coli cells transformed with the plasmids pETDuet-SmCPS2 or pETDuet-1132opt (which heterologously express the SmCPS or SsScS enzymes, respectively) no production of diterpene molecules was detected in the extracts of solvent (diterpenes containing diphosphate are not detected under these conditions). Similar assays were then performed, but combining the 2 protein extracts containing the recombinant SmCPS and SsScS in a single assay. In these assays, a major product was formed and was identified as (+)-manool by matching the mass spectrum and retention index with authentic standards (Figure 2).

Exemplo 5.Example 5. PRODUÇÃO DE MANOOL IN VIVO COM USO DE CÉLULAS E. COLI.PRODUCTION OF MANOOL IN VIVO USING E. COLI CELLS.

[00170] A produção in vivo de manool com uso de culturas de células inteiras foi avaliada com uso de células E. coli. Para aumentar o nível de agrupamento de difosfato de farnesila (FPP) endógeno, a produtividade em diterpeno das células, uma trajetória de mevalonato completa heteróloga que leva a FPP foi coexpressada nas mesmas células. As enzimas dessa trajetória foram expressadas com uso de um único plasmídeo que contém todos os genes organizados em dois operons mediante o controle de dois promotores. A construção desse plasmídeo de expressão é descrita na patente WO2013064411 ou em Schalk et al (2013) J. Am. Chem. Soc. 134, 18.900 a 18.903. Brevemente, um primeiro operon sintético que consiste em genes de acetoacetil-CoA tiolase (atoB) de E. coli, HMG-CoA sintase (mvaS) de Staphylococcus aureus, HMG-CoA redutase (mvaA) de Staphylococcus aureus e FPP sintase (ERG20) de Saccharomyces cerevisiae foi sintetizado in vitro (DNA2.0, Menlo Park, CA, EUA) e ligado no vetor de pACYCDuet-1 digerido Ncol- BamHl (Invitrogen) rendendo pACYC-29258. Um segundo operon que contém mevalonato quinase (MvaK1), uma fosfomevalonato quinase (MvaK2), uma mevalonato difosfato decarboxilase (MvaD) e uma isopentenil difosfato isomerase (idi) foi amplificado a partir do DNA genômico de Streptococcus pneumoniae (ATCC BAA-334) e ligado ao segundo sítio de multiclonagem de pACYC-29258 fornecendo o plasmídeo pACYC-29258-4506. Esse plasmídeo contém, desse modo, os genes que codificam todas as enzimas da trajetória biossintética levando da acetil- coenzima A para FPP.[00170] The in vivo production of manool using whole cell cultures was evaluated using E. coli cells. To increase the level of endogenous farnesyl diphosphate (FPP) clustering, the diterpene productivity of cells, a heterologous complete mevalonate pathway leading to FPP was coexpressed in the same cells. The enzymes in this trajectory were expressed using a single plasmid that contains all the genes organized in two operons under the control of two promoters. The construction of this expression plasmid is described in patent WO2013064411 or in Schalk et al (2013) J. Am. Chem. Soc. 134, 18,900 to 18,903. Briefly, a first synthetic operon consisting of acetoacetyl-CoA thiolase (atoB) genes from E. coli, HMG-CoA synthase (mvaS) from Staphylococcus aureus, HMG-CoA reductase (mvaA) from Staphylococcus aureus and FPP synthase (ERG20) from Saccharomyces cerevisiae was synthesized in vitro (DNA2.0, Menlo Park, CA, USA) and ligated into the Ncol-BamHI digested pACYCDuet-1 vector (Invitrogen) yielding pACYC-29258. A second operon containing mevalonate kinase (MvaK1), a phosphomevalonate kinase (MvaK2), a mevalonate diphosphate decarboxylase (MvaD) and an isopentenyl diphosphate isomerase (idi) was amplified from the genomic DNA of Streptococcus pneumoniae (ATCC BAA-334) and ligated to the second multicloning site of pACYC-29258 providing the plasmid pACYC-29258-4506. This plasmid thus contains the genes that encode all the enzymes of the biosynthetic pathway leading from acetyl coenzyme A to FPP.

[00171] As células E. coli de KRX (Promega) foram cotransformadas com o plasmídeo pACYC-29258-4506 e o plasmídeo pETDuet-CrtE-SmCPS2-SsScS. As células transformadas foram selecionadas em placas de LB-agarose de carbenicilina (50 μg/ml) e cloranfenicol (34 μg/ml). As colônias únicas foram usadas para inocular 5 ml de meio LB líquido suplementado com os mesmos antibióticos. As culturas foram incubadas de um dia para o outro a 37°C. No dia seguinte, 2 ml de meio TB suplementado com os mesmos antibióticos foram inoculados com 0,2 ml da cultura de um dia para o outro. Após 6 horas de incubação a 37 °C, a cultura foi resfriada até 28 °C e 0,1 mM de IPTG, 0,2% de ramnose e 1:10 volume de decano foram adicionados a cada tubo. As culturas foram incubadas por 48 horas a 28 °C. As culturas foram, então, extraídas duas vezes com 2 volumes de MTBE (Metil terc-butil éter), a fase orgânica foi concentrada para 500 μL e analisada por GC-MS conforme descrito acima no exemplo 4, exceto para a temperatura de forno que foi de 1 min mantida a 100 °C, seguido de u gradiente de temperatura de 10 °C/min a 220 °C e 20 °C/min e a 3.000 °C. Nessas condições de cultura, manool foi produzido como o único produto de diterpeno e com uma produtividade de 300 a 500 mg/L (Figura 3).[00171] KRX E. coli cells (Promega) were cotransformed with the pACYC-29258-4506 plasmid and the pETDuet-CrtE-SmCPS2-SsScS plasmid. Transformed cells were selected on carbenicillin (50 μg/ml) and chloramphenicol (34 μg/ml) LB-agarose plates. Single colonies were used to inoculate 5 ml of liquid LB medium supplemented with the same antibiotics. Cultures were incubated overnight at 37°C. The next day, 2 ml of TB medium supplemented with the same antibiotics were inoculated with 0.2 ml of the overnight culture. After 6 hours of incubation at 37°C, the culture was cooled to 28°C and 0.1 mM IPTG, 0.2% rhamnose, and 1:10 volume decane were added to each tube. Cultures were incubated for 48 hours at 28°C. The cultures were then extracted twice with 2 volumes of MTBE (Methyl tert-butyl ether), the organic phase was concentrated to 500 μL and analyzed by GC-MS as described above in example 4, except for the oven temperature which was maintained for 1 min at 100 °C, followed by a temperature gradient of 10 °C/min to 220 °C and 20 °C/min to 3,000 °C. Under these culture conditions, manool was produced as the only diterpene product and with a productivity of 300 to 500 mg/L (Figure 3).

Exemplo 6.Example 6. Produção de (+)-manool com uso de células recombinantes, purificação e análise de RMN.Production of (+)-manool using recombinant cells, purification and NMR analysis.

[00172] Um litro de cultura de E. coli foi preparado nas condições descritas no exemplo 5, exceto pelo fato de que a fase orgânica de decano foi substituída por 50 g/L de Amberlite XAD-4 para extração de fase sólida. O meio de cultura foi filtrado para recuperar a resina. A resina foi, então, lavada com 3 volumes de coluna de água, e eluÍda com uso de 3 volumes de coluna de MTBE. O produto foi, então, adicionalmente purificado por cromatografia flash em sílica gel com uso de uma fase móvel composta de heptano:MTBE 8:2 (v/v). A estrutura de manool foi conformada por 1H- e 13C-RMN. A reação óptica foi medida com o uso de um espectrômetro a Bruker Avance de 500 MHz. O valor de [a]D2o = +26,9° (0,3%, CHC ) confirmou a produção de (+)-manool.[00172] One liter of E. coli culture was prepared under the conditions described in example 5, except that the organic decane phase was replaced by 50 g/L of Amberlite XAD-4 for solid phase extraction. The culture medium was filtered to recover the resin. The resin was then washed with 3 column volumes of water, and eluted using 3 column volumes of MTBE. The product was then further purified by flash chromatography on silica gel using a mobile phase composed of heptane:MTBE 8:2 (v/v). The manool structure was conformed by 1H- and 13C-NMR. The optical reaction was measured using a 500 MHz Bruker Avance spectrometer. The value of [a]D2o = +26.9° (0.3%, CHC) confirmed the production of (+)-manool.

Exemplo 7.Example 7.

[00173] O manool obtido nos exemplos acima foi convertido em seus ésteres de acordo com a parte experimental a seguir (abaixo no presente documento como exemplo em seu acetato): [00173] The manool obtained in the examples above was converted into its esters according to the following experimental part (below in this document as an example in its acetate):

[00174] Após a literatura (G. Ohloff, Helv. Chim. Acta 41, 845 (1958)), 32,0 g (0,11mol) de (+)-Manool cristalino puro foram tratados por 20,0 g (0,25 mol) de cloreto de acetila em 100 ml de anilina de dimetila por 5 dias a temperatura ambiente. A mistura foi adicionalmente aquecida por 7 horas a 50° para alcançar 100% de conversão. Após o resfriamento, a mistura de reação foi diluída com éter, lavada sucessivamente com 10% de H2SO4, NaHC03 aquosa e água para neutralidade. Após secagem (Na2SO4) e concentração, o produto foi destilado (bulbo para bulbo, B.p. = 160°, 0,1 mbar) para gerar 20,01 g (79,4%) de acetato de Manool que foi usado sem purificação adicional.[00174] Following the literature (G. Ohloff, Helv. Chim. Acta 41, 845 (1958)), 32.0 g (0.11mol) of pure crystalline (+)-Manool were treated by 20.0 g (0 .25 mol) of acetyl chloride in 100 ml of dimethyl aniline for 5 days at room temperature. The mixture was additionally heated for 7 hours at 50° to achieve 100% conversion. After cooling, the reaction mixture was diluted with ether, washed successively with 10% H2SO4, aqueous NaHC03 and water to neutrality. After drying (Na2SO4) and concentration, the product was distilled (bulb to bulb, B.p. = 160°, 0.1 mbar) to generate 20.01 g (79.4%) of Manool acetate which was used without further purification.

[00175] MS: M+ 332 (0); m/e: 272 (27), 257 (83), 137 (62), 95 (90), 81 (100).[00175] MS: M+ 332 (0); m/e: 272 (27), 257 (83), 137 (62), 95 (90), 81 (100).

[00176] 1H-RMN (CDCl3): 0,67, 0,80, 0,87, 1,54 e 2,01 (5s, 3H cada um), 4,49 (s, 1H), 4,80 (s, 1H), 5,11 (m, 1 H), 5,13 (m, 1H), 5,95 (m, 1H).[00176] 1H-NMR (CDCl3): 0.67, 0.80, 0.87, 1.54 and 2.01 (5s, 3H each), 4.49 (s, 1H), 4.80 ( s, 1H), 5.11 (m, 1H), 5.13 (m, 1H), 5.95 (m, 1H).

[00177] 13C-RMN (CDCl3): 14,5 (q), 17,4 (t), 19,4 (t), 21,7 (q), 22,2 (q), 23,5 (q),24,2 (t), 33,5 (s), 33,6 (t), 38,3 (t), 39,0 (t), 39,3 (t), 39,8 (s), 42,2 (t), 55,6 (d), 57,2 (t), 83,4 (s), 106,4 (t), 1 13,0 (t), 142,0 (d), 148,6 (s), 169,9 (s).[00177] 13C-NMR (CDCl3): 14.5 (q), 17.4 (t), 19.4 (t), 21.7 (q), 22.2 (q), 23.5 (q ),24.2(t), 33.5(s), 33.6(t), 38.3(t), 39.0(t), 39.3(t), 39.8(s) , 42.2 (t), 55.6 (d), 57.2 (t), 83.4 (s), 106.4 (t), 1 13.0 (t), 142.0 (d) , 148.6 (s), 169.9 (s).

Exemplo 8.Example 8.

[00178] O acetato de manool obtido nos exemplos acima foi convertido em seus trienos de acordo com a seguinte parte experimental (no presente documento abaixo como o exemplo em seu Sclareno e (Z+E)-Biformeno): [00178] The manool acetate obtained in the examples above was converted into its trienes according to the following experimental part (in the present document below as the example in its Sclarene and (Z+E)-Biformene):

[00179] A uma solução de 0,4 g de acetato de Manool em 4 ml de ciclohexano a temperatura ambiente foi adicionado 0,029 g (0,05 eq.) de complexo BF3.AcOH. Após 15 minutos a temperatura ambiente, a reação foi arrefecida com NaHC03 aquoso e lavada com água para neutralidade. A análise de GC-MS mostrou apenas hidrocarbonetos que foram identificados como Sclareno, (Z) e (E)-biformeno. Nenhum acetato de Copalol foi detectado.[00179] To a solution of 0.4 g of Manool acetate in 4 ml of cyclohexane at room temperature was added 0.029 g (0.05 eq.) of BF3.AcOH complex. After 15 minutes at room temperature, the reaction was cooled with aqueous NaHC03 and washed with water to neutrality. GC-MS analysis showed only hydrocarbons that were identified as Sclarene, (Z) and (E)-biformene. No Copalol acetate was detected.

[00180] Um outro teste com mais catalisador (0,15 eq) gerou o mesmo resultado.[00180] Another test with more catalyst (0.15 eq) generated the same result.

[00181] • Sclareno: MS: M+ 272 (18); m/e: 257 (100), 149 (15), 105 (15).[00181] • Sclarene: MS: M+ 272 (18); m/e: 257 (100), 149 (15), 105 (15).

[00182] • (Z) e (E)-Biformeno (espectros idênticos): MS: M+ 272 (29); m e: 257 (100), 187 (27), 161 (33), 105 (37).[00182] • (Z) and (E)-Biformene (identical spectra): MS: M+ 272 (29); m e: 257 (100), 187 (27), 161 (33), 105 (37).

Exemplo 9.Example 9.

[00183] O manool obtido nos exemplos acima foi convertido em ésteres de copalila de acordo com a seguinte parte experimental (no presente documento abaixo como exemplo no acetato): [00183] The manool obtained in the examples above was converted into copalyl esters according to the following experimental part (in this document below as an example in acetate):

[00184] A uma solução de 0,474 g (0,826 mmol, 0,27 eq.) de BF3.AcOH em 100 ml de ciclohexano à temperatura ambiente foram adicionados 4,4 g de anidrido acético e 12,1 g de ácido acético. À temperatura ambiente, 10,0 g (33 mmol) de Manool cristalino puro em 15 ml de ciclohexano foram adicionados (exotérmico si.) e a temperatura foi mantida à temperatura ambiente com uso de um banho de água. Após 30 minutos de agitação à temperatura ambiente, um controle de GC não mostrou o material de partida. A mistura de reação foi arrefecida com 300 ml de NaHCO3 saturado aquoso e tratada como usual. A mistura bruta (9,9 g) foi purificada por cromatografia flash (SiO2, pentano/éter 95:5) e destilação de bulbo para bulbo (Eb.= 130°, 0,1 mbar) para gerar 4,34 g (37,1%) de uma mistura 27/73 de acetato de (Z) e (E)-Copalila. • acetato de (Z)-Copalila:[00184] To a solution of 0.474 g (0.826 mmol, 0.27 eq.) of BF3.AcOH in 100 ml of cyclohexane at room temperature were added 4.4 g of acetic anhydride and 12.1 g of acetic acid. At room temperature, 10.0 g (33 mmol) of pure crystalline Manool in 15 ml of cyclohexane were added (exothermic si.) and the temperature was maintained at room temperature using a water bath. After 30 minutes of stirring at room temperature, a GC control showed no starting material. The reaction mixture was cooled with 300 ml of saturated aqueous NaHCO3 and treated as usual. The crude mixture (9.9 g) was purified by flash chromatography (SiO2, pentane/ether 95:5) and bulb-to-bulb distillation (Eb.= 130°, 0.1 mbar) to yield 4.34 g (37 .1%) of a 27/73 mixture of (Z) and (E)-Copalyl acetate. • (Z)-Copalyl acetate:

[00185] MS: M+ 332 (0); m/e: 317 (2), 272 (35)=, 257 (100), 137 (48),95 (68), 81 (70).[00185] MS: M+ 332 (0); m/e: 317 (2), 272 (35)=, 257 (100), 137 (48),95 (68), 81 (70).

[00186] 1H-RMN (CDCl3): 0,67, 0,80, 0,87, 1,76 e 2,04 (5s, 3H cada um), 4,86 (s, 1H), 5,35 (t: J = 6Hz, 1H).• acetato de (E)-Copalila:[00186] 1H-NMR (CDCl3): 0.67, 0.80, 0.87, 1.76 and 2.04 (5s, 3H each), 4.86 (s, 1H), 5.35 ( t: J = 6Hz, 1H).• (E)-Copalyl acetate:

[00187] MS: M+ 332 (0); m/e: 317 (2), 272 (33)=, 257 (100), 137 (54),95 (67), 81 (74).[00187] MS: M+ 332 (0); m/e: 317 (2), 272 (33)=, 257 (100), 137 (54),95 (67), 81 (74).

[00188] 1 H-RMN (CDCl3): 0,68, 0,80, 0,87, 1,70 e 2,06 (5s, 3H cada um), 4,82 (s, 1H), 5,31 (t: J = 6Hz, 1H).[00188] 1 H-NMR (CDCl3): 0.68, 0.80, 0.87, 1.70 and 2.06 (5s, 3H each), 4.82 (s, 1H), 5.31 (t: J = 6Hz, 1H).

[00189] 13C-RMN (CDCl3): (Espectro registrado na mistura (Z/E), apenas sinais significativos são determinados): 61,4 (t), 106,2 (t), 117,9 (d), 143,1 (s), 148,6 (s), 171,1 (s).[00189] 13C-NMR (CDCl3): (Spectrum recorded in the mixture (Z/E), only significant signals are determined): 61.4 (t), 106.2 (t), 117.9 (d), 143 .1(s), 148.6(s), 171.1(s).

Exemplo 10.Example 10.

[00190] O acetato de copalila obtido nos exemplos acima foi convertido em Copalol de acordo com a seguinte parte experimental: [00190] The copalyl acetate obtained in the examples above was converted into Copalol according to the following experimental part:

[00191] O acetato de copalila (4,17 g, 12,5 mmol), péletes de KOH (3,35 g, 59,7 mmol), água (1,5 g) e EtOH (9,5 ml) foram misturados e agitados por 3 horas a 50°. Após a purificação usual, 3,7 g de (Z+E)-Copalol em bruto foram obtidos e purificados por cromatografia flash (SiO2, pentano/éter 7:2. Após a evaporação do solvente, uma destilação de bulbo para bulbo (Eb = 170°, 0,1 mbar) forneceu 3,25 g (92%) de uma mistura 27/73 de (Z) e (E)-Copalol. • (Z)-Copalol[00191] Copalyl acetate (4.17 g, 12.5 mmol), KOH pellets (3.35 g, 59.7 mmol), water (1.5 g) and EtOH (9.5 ml) were mixed and stirred for 3 hours at 50°. After the usual purification, 3.7 g of crude (Z+E)-Copalol were obtained and purified by flash chromatography (SiO2, pentane/ether 7:2. After evaporation of the solvent, a bulb-to-bulb distillation (Eb = 170°, 0.1 mbar) provided 3.25 g (92%) of a 27/73 mixture of (Z) and (E)-Copalol • (Z)-Copalol.

[00192] MS: M+290 (3); m/e: 275 (18), 272 (27), 257 (82), 137 (71), 95 (93), 81 (100), 69 (70).[00192] MS: M+290 (3); m/e: 275 (18), 272 (27), 257 (82), 137 (71), 95 (93), 81 (100), 69 (70).

[00193] 1 H-RMN (CDCl3): 0,67, 0,80, 0,87 e 1,74 (4s, 3H cada um); 4,06 (m, 2H), 4,55 (s, 1H), 4,86 (s, 1H), 5,42 (t: J = 6Hz, 1H).• (E)-Copalol[00193] 1 H-NMR (CDCl3): 0.67, 0.80, 0.87 and 1.74 (4s, 3H each); 4.06 (m, 2H), 4.55 (s, 1H), 4.86 (s, 1H), 5.42 (t: J = 6Hz, 1H).• (E)-Copalol

[00194] MS: M+290 (3); m/e: 275 (27), 272 (22), 257 (75), 137 (75), 95 (91), 81 (100), 69 (68).[00194] MS: M+290 (3); m/e: 275 (27), 272 (22), 257 (75), 137 (75), 95 (91), 81 (100), 69 (68).

[00195] 1H-RMN (CDCl3): 0,68, 0,80, 0,87 e 1,67 (4s, 3H cada um); 4,15 (m, 2H), 4,51 (s, 1H), 4,83 (s, 1H), 5,39 (t, J = 6Hz, 1H)[00195] 1H-NMR (CDCl3): 0.68, 0.80, 0.87 and 1.67 (4s, 3H each); 4.15 (m, 2H), 4.51 (s, 1H), 4.83 (s, 1H), 5.39 (t, J = 6Hz, 1H)

[00196] 13C-RMN (CDCl3): (Espectro registrado na mistura (Z/E), apenas sinais significativos são determinados): ): 59,4 (t), 106,2 (t), 123,0 (d), 140,6 (s), 148,6 (s).[00196] 13C-NMR (CDCl3): (Spectrum recorded in the mixture (Z/E), only significant signals are determined): 59.4 (t), 106.2 (t), 123.0 (d) , 140.6 (s), 148.6 (s).

[00197] As análises de RMN estão de acordo com os espectros publicados para compostos similares. Por exemplo, consulte S.Hasecawa, Y. Hirose, Phytochemistry 19 (11), 2479 (1980). Listagem de sequência. SEQ ID NO: 1 SmCPS, difosfato de copalila sintase de comprimento integral de S. miltiorrhiza [00197] NMR analyzes are in agreement with published spectra for similar compounds. For example, see S. Hasecawa, Y. Hirose, Phytochemistry 19 (11), 2479 (1980). Sequence listing. SEQ ID NO: 1 SmCPS, full-length copalyl diphosphate synthase from S. miltiorrhiza

Claims (5)

1. Método de produção de (+)-manool caracterizado pelo fato de que compreende: a. colocar o difosfato de geranilgeranila em contato com uma difosfato copalila sintase (CPP) para formar um difosfato de (9S, 10S)-copalila em que a CPP sintase compreende uma sequência de aminoácidos que tem 100% de identidade de sequência com SEQ ID NO: 1 ou SEQ ID NO:2; e b. colocar o difosfato de (9S, 10S)-copalila CPP em contato com a enzima esclareol sintase para formar (+)-manool; e c. opcionalmente isolar o (+)-manool.1. Method of production of (+)-manool characterized by the fact that it comprises: a. contacting geranylgeranyl diphosphate with a copalyl diphosphate synthase (CPP) to form a (9S, 10S)-copalyl diphosphate in which the CPP synthase comprises an amino acid sequence that has 100% sequence identity with SEQ ID NO: 1 or SEQ ID NO:2; and b. placing the (9S, 10S)-copalyl diphosphate CPP in contact with the sclareol synthase enzyme to form (+)-manool; and c. optionally isolate the (+)-manool. 2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a esclareol sintase compreende uma sequência de aminoácidos que tem 100% de identidade de sequência com SEQ ID NO:4 ou SEQ ID NO:5.2. Method according to claim 1, characterized by the fact that the sclareol synthase comprises an amino acid sequence that has 100% sequence identity with SEQ ID NO: 4 or SEQ ID NO: 5. 3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende adicionalmente processar o (+)- manool para originar um derivado de (+)-manool, usando-se uma síntese bioquímica ou química, ou uma combinação de ambas.3. Method according to claim 1, characterized by the fact that it further comprises processing the (+)-manool to give rise to a (+)-manool derivative, using a biochemical or chemical synthesis, or a combination of both . 4. Método, de acordo com a reivindicação 3, caracterizado pelo fato de que o derivado é um álcool, acetal, aldeído, ácido, éteres, cetona, lactona, acetato ou éster.4. Method according to claim 3, characterized in that the derivative is an alcohol, acetal, aldehyde, acid, ethers, ketone, lactone, acetate or ester. 5. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que o derivado é selecionado a partir do grupo que consiste em capalol, capalal, (+)- manoolóxi, Z-11, gama-ambrol e ambrox.5. Method according to claim 4, characterized in that the derivative is selected from the group consisting of capalol, capalal, (+)-mannooloxy, Z-11, gamma-ambrol and ambrox.
BR112017028183-0A 2015-06-30 2016-06-30 MANOOL PRODUCTION BR112017028183B1 (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562187236P 2015-06-30 2015-06-30
US62/187,236 2015-06-30
GB1601249.4 2016-01-22
GBGB1601249.4A GB201601249D0 (en) 2016-01-22 2016-01-22 Production of manool
PCT/EP2016/065448 WO2017001641A1 (en) 2015-06-30 2016-06-30 Production of manool

Publications (2)

Publication Number Publication Date
BR112017028183A2 BR112017028183A2 (en) 2018-08-28
BR112017028183B1 true BR112017028183B1 (en) 2024-03-19

Family

ID=

Similar Documents

Publication Publication Date Title
US10351880B2 (en) Drimenol synthases I
US20210010035A1 (en) Production of manool
US11773414B2 (en) Sesquiterpene synthases for production of drimenol and mixtures thereof
US10385363B2 (en) Drimenol synthases II
US10385361B2 (en) Production of manool
US10337031B2 (en) Production of fragrant compounds
US20200308612A1 (en) Vetiver
BR112017028183B1 (en) MANOOL PRODUCTION
CN118166046A (en) Novel enantiomer-kaurene hydroxylase and application thereof