BRPI0906166B1 - METHOD TO PRODUCE SCLAREOL - Google Patents

METHOD TO PRODUCE SCLAREOL Download PDF

Info

Publication number
BRPI0906166B1
BRPI0906166B1 BRPI0906166-5A BRPI0906166A BRPI0906166B1 BR PI0906166 B1 BRPI0906166 B1 BR PI0906166B1 BR PI0906166 A BRPI0906166 A BR PI0906166A BR PI0906166 B1 BRPI0906166 B1 BR PI0906166B1
Authority
BR
Brazil
Prior art keywords
seq
sclareol
polypeptide
nucleic acid
sequence
Prior art date
Application number
BRPI0906166-5A
Other languages
Portuguese (pt)
Inventor
Schalk Michel
Original Assignee
Firmenich Sa
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Firmenich Sa filed Critical Firmenich Sa
Priority claimed from PCT/EP2009/050816 external-priority patent/WO2009095366A1/en
Publication of BRPI0906166A2 publication Critical patent/BRPI0906166A2/en
Publication of BRPI0906166B1 publication Critical patent/BRPI0906166B1/en

Links

Abstract

MÉTODO PARA PRODUZIR ESCLAREOL. A presente invenção fornece um método de produção de esclareol, método esse compreendendo de contatar um polipeptídeo particular tendo uma atividade de síntese de esclareol com difosfato de labdenediol (LPP). Em particular, o referido método pode ser realizado in vitro ou in vivo para produzir esclareol, um composto muito útil nos campos de perfumaria e aromatizante. A presente invenção também fornece a sequência de aminoácido do polipeptídeo usado no método. Um ácido nucléico derivado da Salvia sclarea e que codifica o polipeptídeo da invenção, um vetor de expressão, contendo o referido ácido nucléico, bem como organismo não- humano ou célula trasnformada para abrigar o mesmo ácido nucléico, também são partes da presente invenção.METHOD FOR PRODUCING SCLAREOL. The present invention provides a method of producing sclareol, which method comprises contacting a particular polypeptide having a sclareol synthesizing activity with labdenediol diphosphate (LPP). In particular, said method can be carried out in vitro or in vivo to produce sclareol, a very useful compound in the fields of perfumery and flavoring. The present invention also provides the amino acid sequence of the polypeptide used in the method. A nucleic acid derived from Salvia sclarea and encoding the polypeptide of the invention, an expression vector, containing said nucleic acid, as well as a non-human organism or cell transformed to harbor the same nucleic acid, are also parts of the present invention.

Description

Campo técnicotechnical field

A presente invenção fornece um método de produção de esclareol, método esse compreendendo de contatar um polipeptídeo particular tendo uma atividade de síntese de esclareol com difosfato de labdenediol (LPP). Em particular, o referido método pode ser realizado in vitro ou in vivo para produzir esclareol, um composto muito útil nos campos de perfumaria e aromatizante. A presente invenção também fornece a sequência de aminoácido do polipeptídeo usado no método. Um ácido nucléico derivado da Salvia sclarea e que codifica o polipeptídeo da invenção, um vetor de expressão, contendo o referido ácido nucléico, bem como organismo não- humano ou uma célula transformada para abrigar o mesmo ácido nucléico, também são partes da presente invenção.The present invention provides a method of producing sclareol, which method comprises contacting a particular polypeptide having a sclareol synthesizing activity with labdenediol diphosphate (LPP). In particular, said method can be carried out in vitro or in vivo to produce sclareol, a very useful compound in the fields of perfumery and flavoring. The present invention also provides the amino acid sequence of the polypeptide used in the method. A nucleic acid derived from Salvia sclarea and encoding the polypeptide of the invention, an expression vector, containing said nucleic acid, as well as a non-human organism or a cell transformed to harbor the same nucleic acid, are also parts of the present invention.

Estado da técnicastate of the art

O esclareol é um membro da família dos terpenóides ou terpenos, compreendendo uma quantidade alta de produtos naturais. Os terpenos são encontrados em muitos organismos (microorganismos, animais e plantas). Esses compostos são constituídos de cinco unidades de carbono, chamadas unidades de isopreno e são classificados pela quantidade dessas unidades presentes em sua estrutura. Dessa forma, monoterpenos, sesquiterpenos e diterpenos são terpenos contendo 10, 15 e 20 átomos de carbono, respectivamente. Diterpenos, por exemplo, são amplamente encontrados no reino das plantas e mais de 2500 estruturas de diterpeno foram descritas (Connolly e Hill, Dicionário de terpenóides, 1991, Chapman & Hall, Londres). As moléculas de terpeno foram importantes durante milhares de anos devido a suas propriedades aromatizantes e de fragrância e seus efeitos cosméticos, medicinais e antimicrobianos. Extratos de planta obtidos por diferentes meios, como destilação a vapor ou extração de solvente são usados como fonte de terpenos. As moléculas de terpeno são, muitas vezes, usadas como tal, mas em alguns casos, reações químicas são usadas para transformar os terpenos em outras moléculas de alto valor.Sclareol is a member of the terpenoid or terpene family, comprising a high amount of natural products. Terpenes are found in many organisms (microorganisms, animals and plants). These compounds are made up of five carbon units, called isoprene units, and are classified by the amount of these units present in their structure. Thus, monoterpenes, sesquiterpenes and diterpenes are terpenes containing 10, 15 and 20 carbon atoms, respectively. Diterpenes, for example, are widely found in the plant kingdom and over 2500 diterpene structures have been described (Connolly and Hill, Dictionary of Terpenoids, 1991, Chapman & Hall, London). Terpene molecules have been important for thousands of years for their flavoring and fragrance properties and their cosmetic, medicinal and antimicrobial effects. Plant extracts obtained by different means such as steam distillation or solvent extraction are used as a source of terpenes. Terpene molecules are often used as such, but in some cases chemical reactions are used to transform terpenes into other high-value molecules.

A produção biossintética de terpenos envolve enzimas chamadas terpeno- sintases. Essas enzimas convertem um precursor em um ou mais produtos de terpeno. A maioria das vezes, o precursor é um precursor de terpeno acíclico e, em particular, muitas diterpeno-sintases catalisam a ciclização do precursor acíclico geranilgeranil pirofosfato. Todavia, em alguns casos especiais, terpeno-sintases catalisam a transformação de uma molécula já cíclica em um ou mais produtos de terpeno.The biosynthetic production of terpenes involves enzymes called terpene synthases. These enzymes convert a precursor into one or more terpene products. Most often, the precursor is an acyclic terpene precursor, and in particular, many diterpene synthases catalyze the cyclization of the acyclic precursor geranylgeranyl pyrophosphate. However, in some special cases, terpene synthases catalyze the transformation of an already cyclic molecule into one or more terpene products.

Dois tipos de mecanismos de ciclização ocorrem na natureza e são relacionados com dois tipos de diterpeno-sintases, que podem ser classificados em diterpeno-sintases de classe I e classe II (Wendt e Schulz, 1998, Estrutura. 6(2): 127- 33). Para alguns diterpenos, o mecanismo de ciclização é semelhante àquele dos monoterpenos e sesquiterpenos, já que é iniciado pela ionização da função de disfostato éster de GGPP, seguida pela reação da carbocation resultante com uma ligação dupla interna. As diterpeno-sintases que catalisam esse tipo de ciclização são diterpeno-sintases de classe I. O segundo modo de ciclização na biossíntese de diterpenos, catalisados por diterpeno-sintases de classe II, é iniciado pela protonação da ligação dupla terminal de GGPP e leva, após rearranjo interno e eliminação de próton, a um intermediário de diterpeno difosfato cíclico.Two types of cyclization mechanisms occur in nature and are related to two types of diterpene synthases, which can be classified into class I and class II diterpene synthases (Wendt and Schulz, 1998, Structure. 6(2): 127- 33). For some diterpenes, the cyclization mechanism is similar to that of monoterpenes and sesquiterpenes, as it is initiated by ionization of the disphosphate ester function of GGPP, followed by reaction of the resulting carbocation with an internal double bond. The diterpene synthases that catalyze this type of cyclization are class I diterpene synthases. The second mode of cyclization in diterpene biosynthesis, catalyzed by class II diterpene synthases, is initiated by protonation of the terminal double bond of GGPP and leads, after internal rearrangement and proton elimination, to a cyclic diterpene diphosphate intermediate.

Genes e cDNAs que codificam diterpeno-sintases de cada uma das duas classes foram clonados e as enzimas recombinantes caracterizadas. A disponibilidade de genes que codificam diferentes tipos de diterpeno-sintases fornece informações sobre as estruturas primárias das enzimas. Alguns motivos de aminoácido são conservados em diterpeno-sintases e são relacionados com a protonação ou a ionização dependente da ciclização. Um motivo DDxxD é encontrado em diversas diterpeno-sintases de classe I. O referido motivo provavelmente está envolvido na ligação e na ionização da metade do difosfato. Nas sintases de classe II, um motivo DxDD conservado é encontrado, no qual o segundo resíduo de aspartato está envolvido como doador de próton.Genes and cDNAs encoding diterpene synthases from each of the two classes were cloned and the recombinant enzymes characterized. The availability of genes encoding different types of diterpene synthases provides information about the primary structures of the enzymes. Some amino acid motifs are conserved in diterpene synthases and are related to cyclization-dependent protonation or ionization. A DDxxD motif is found in several class I diterpene synthases. Said motif is probably involved in the binding and ionization of the diphosphate moiety. In class II synthases, a conserved DxDD motif is found, in which the second aspartate residue is involved as a proton donor.

O esclareol é uma molécula de diterpeno que ocorre naturalmente, extensivamente usada como material primário para a síntese de moléculas de fragrância com notas de âmbar-gris. Essas sínteses foram desenvolvidas para fornecer uma alternativa para o âmbar-gris, uma substância cerácea, secretada pelos intestinos da cachalote. O âmbar-gris é altamente apreciado por seu odor prazeroso e foi historicamente usado como um componente de perfume. Devido a seu alto preço e a elevada demanda de âmbar-gris, e particularmente devido à proteção das espécies de baleia, a síntese química de constituintes e moléculas de âmbar-gris com caráter de âmbar-gris foram desenvolvidas. Entre essas moléculas, Ambrox® (marca registrada da Firmenich SA, Suíça) é o substituto mais amplamente apreciado para o Âmbar-gris. O material primário mais amplamente usado para a síntese de Ambrox® é o diterpeno-diol esclareol.Sclareol is a naturally occurring diterpene molecule, extensively used as a raw material for the synthesis of fragrance molecules with ambergris notes. These syntheses were developed to provide an alternative to ambergris, a waxy substance secreted by the intestines of the sperm whale. Ambergris is highly prized for its pleasant odor and was historically used as a perfume component. Due to its high price and high demand for ambergris, and particularly due to the protection of whale species, the chemical synthesis of ambergris constituents and molecules with an ambergris character has been developed. Among these molecules, Ambrox® (trademark of Firmenich SA, Switzerland) is the most widely appreciated substitute for Ambergris. The most widely used starting material for the synthesis of Ambrox® is the diterpene diol sclareol.

Geralmente, o preço e a disponibilidade de extratos naturais de planta são dependentes da abundância, do rendimento de óleo e da origem geográfica das plantas. Além disso, a disponibilidade e a qualidade de extratos naturais são muito mais dependentes do clima e de outras condições locais, que levam à variabilidade de ano a ano, tornando o uso desses componentes na perfumaria de alta qualidade muito difícil ou mesmo impossível alguns anos. Portanto, seria uma vantagem fornecer uma fonte de esclareol, que seja menos sujeito a flutuações na disponibilidade e na qualidade. A síntese química pareceria ser uma opção evidente para a preparação do esclareol. Entretanto, dada a sua estrutura altamente complexa, um processo sintético econômico para a preparação de esclareol ainda é difícil. Uma via bioquímica que leva à síntese de esclareol seria, portanto, de grande interesse.Generally, the price and availability of natural plant extracts are dependent on the abundance, oil yield and geographic origin of the plants. Furthermore, the availability and quality of natural extracts are much more dependent on climate and other local conditions, which lead to year-to-year variability, making the use of these components in high-quality perfumery very difficult or even impossible some years ago. Therefore, it would be an advantage to provide a source of sclareol that is less subject to fluctuations in availability and quality. Chemical synthesis would seem to be an obvious option for preparing sclareol. However, given its highly complex structure, an economical synthetic process for the preparation of sclareol is still difficult. A biochemical pathway leading to sclareol synthesis would therefore be of great interest.

A biossíntese de terpenos nas plantes e em outros organismos foi extensivamente estudada e não é muito detalhada no presente, mas referência é feita para Dewick, Nat. Prod. Rep., 2002, 19, 181-222, que revisa o estado da técnica das vias biossintéticas de terpeno.The biosynthesis of terpenes in plants and other organisms has been extensively studied and is not very detailed at present, but reference is made to Dewick, Nat. Product Rep., 2002, 19, 181-222, which reviews the prior art of terpene biosynthetic pathways.

Diversas diterpeno-sintases já foram identificadas. Em particular, US 7.238.514 divulga diversas diterpeno-sintases, os ácidos nucléicos que as codificam, bem como organismos unicelulares, transformados para expressar cada uma dessas sintases, juntamente com uma GGPP-sintase, dessa forma, produzindo diterpenos in vivo. Todavia, nenhum método para a produção biossintética de esclareol, usando um polipeptídeo, que possui uma atividade de síntese de esclareol, conforme fornecido no presente, é especificamente divulgado naquela patente. As sequências de aminoácido e nucleotídeo, divulgadas na patente, são muito diferentes das sequências da presente invenção. Entre as diterpeno-sintases, descritas naquele documento, as mais próximas aos polipeptídeos da presente invenção são um mRNA de Cucumis sativus para uma ent-caureno-sintase, criada por SEQ ID NO:389 na US 7.238.514 e um mRNA de Cucúrbita máxima para uma ent-caureno- sintase B, criada por SEQ ID NO:395 na US 7.238.514 e pelo número de acesso AAB39482.1. Esses polipeptídeos e o referida da invenção apenas compartilham 32% de identidade. Além disso, não há sugestão nesse documento de estado da técnica de que as diterpeno-sintases descritas sejam úteis para a produção de esclareol.Several diterpene synthases have already been identified. In particular, US 7,238,514 discloses various diterpene synthases, the nucleic acids which encode them, as well as unicellular organisms, transformed to express each of these synthases, along with a GGPP synthase, thereby producing diterpenes in vivo. However, no method for the biosynthetic production of sclareol, using a polypeptide, which has a sclareol synthesizing activity, as provided herein, is specifically disclosed in that patent. The amino acid and nucleotide sequences disclosed in the patent are very different from the sequences of the present invention. Among the diterpene synthases described in that document, the closest to the polypeptides of the present invention are an mRNA from Cucumis sativus for an ent-kaurene synthase, created by SEQ ID NO:389 in US 7,238,514 and an mRNA from Cucurbita maxima for an ent-kaurene synthase B, created by SEQ ID NO:395 in US 7,238,514 and accession number AAB39482.1. These polypeptides and the one referred to in the invention only share 32% of identity. Furthermore, there is no suggestion in this prior art document that the described diterpene synthases are useful for sclareol production.

Terpeno-sintases, que possuem uma certa porcentagem de identidade de sequência com as sequências da presente invenção, também foram encontradas nos bandos de dados de sequências. Todavia, a porcentagem de identificação entre as diterpeno-sintases conhecidas e os polipeptídeos da invenção é muito baixa. As sintases mais próximas às da invenção são uma terpenóide ciclase de função não definida (Número de acesso NCBI AAS98912) tendo 36% de identificação com o polipeptídeo da invenção, uma ent-caureno-sintase de Cucumis sativus (número de acesso BAB19275) tendo 32% de identificação com o polipeptídeo da invenção, uma ent-cassadieno-sintase de Oryza sativa (número de acesso ABH10734 e publicada em Xu, Wilderman, Morrone Xu, Roy, Margis-Pinheiro, Upadhyaya, Coates e Peters, Caracterização funcional da família genética semelhante à caureno-sintase do arroz, Fitoquímica 68(3), 2007, 312-326) tendo 32% de identificação com o polipeptídeo da invenção e uma ent-caureno-sintase de Oryza sativa (número de acesso AAQ72559 e publicada em Margis-Pinheiro, Zhou, Zhu, Dennis e Upadhyaya, Isolamento e caracterização de arroz marcado com DS (Oryza sativa L.) Mutante anão responsivo a GA, defeituoso em uma etapa inicial da via de biossíntese de giberelinas, Plant Cell Rep., 23(12), 2005, 819-833) tendo 32% de identificação com o polipeptídeo da invenção. A capacidade potencial de qualquer uma dessas sequências para catalisar a produção de esclareol nunca é mencionada no estado da arte.Terpene synthases, which have a certain percentage of sequence identity with the sequences of the present invention, were also found in the sequence data banks. However, the percentage of identification between the known diterpene synthases and the polypeptides of the invention is very low. Synthases closest to those of the invention are a terpenoid cyclase of undefined function (NCBI accession number AAS98912) having 36% identification with the polypeptide of the invention, an ent-kaurene synthase from Cucumis sativus (accession number BAB19275) having 32 % identification with the polypeptide of the invention, an ent-casadiene synthase from Oryza sativa (accession number ABH10734 and published in Xu, Wilderman, Morrone Xu, Roy, Margis-Pinheiro, Upadhyaya, Coates and Peters, Functional characterization of the genetic family similar to rice kaurene synthase, Fitoquímica 68(3), 2007, 312-326) having 32% identification with the polypeptide of the invention and an ent-kaurene synthase from Oryza sativa (accession number AAQ72559 and published in Margis- Pinheiro, Zhou, Zhu, Dennis and Upadhyaya, Isolation and characterization of DS-marked rice (Oryza sativa L.) GA-responsive dwarf mutant defective in an early step of the gibberellin biosynthesis pathway, Plant Cell Rep., 23(12) ), 2005, 819-833) having 32% identification with the polypeptide of the invention. The potential ability of any of these sequences to catalyze sclareol production is never mentioned in the state of the art.

Além da diferença entre as próprias sequências, também tem de ser salientado que a estrutura e as propriedades de ent-caureno e ent-cassadieno são muito diferentes daquelas do esclareol. Em particular, ent-caureno é um diterpeno tricíclio, que não contém nenhum grupo funcional de álcool, diferente do esclareol, que é um diol bicíclico. Além disso, ent-caureno, que é um precursor de um hormônio de planta regulador de crescimento, está fora de uso no campo da perfumaria e aromatização, considerando-se que o esclareol é de alto interesse nesses campos técnicos, conforme explicado acima.In addition to the difference between the sequences themselves, it also has to be pointed out that the structure and properties of ent-kaurene and ent-cassadiene are very different from those of sclareol. In particular, ent-kaurene is a tricyclic diterpene, which does not contain any alcohol functional groups, unlike sclareol, which is a bicyclic diol. Furthermore, ent-kaurene, which is a precursor of a plant growth-regulating hormone, is out of use in the field of perfumery and flavoring, considering that sclareol is of high interest in these technical fields, as explained above.

Um documento do estado da arte relaciona-se especificamente com uma esclareol-sintase (Banthorpe, Brown e Morris, Purificação parcial de farnesil pirofosfato: Drimenol ciclase e geranilgeranil pirofosfato: Esclareol ciclase, usando cultura celular como uma fonte de material, Fitoquímica 31, 1992, 3391-3395). Nessa referência, uma proteína parcialmente purificada de Nicotiana glutinosa é identificada como uma esclareol-sintase, mas nenhuma indicação é fornecida, com relação à sequência de aminoácido dessa proteína, a sequência de nucleotídeo do ácido nucléico que a codifica ou o uso dessa proteína em um método para a biossíntes de esclareol in vitro ou in vivo.A state of the art document specifically relates to a sclareol synthase (Banthorpe, Brown and Morris, Partial purification of farnesyl pyrophosphate: Drimenol cyclase and geranylgeranyl pyrophosphate: Sclareol cyclase, using cell culture as a source material, Phytochemistry 31, 1992 , 3391-3395). In this reference, a partially purified protein from Nicotiana glutinosa is identified as a sclareol synthase, but no indication is given, regarding the amino acid sequence of this protein, the nucleotide sequence of the nucleic acid that encodes it, or the use of this protein in a method for in vitro or in vivo sclareol biosynthesis.

Apesar de estudos extensos de ciclização de terpeno, o isolamento e a caracterização das enzimas ainda é difícil, particularmente nas plantas, devido a sua baixa abundância seus modelos de expressão muitas vezes transitórios e a complexidade de purificá-las a partir de misturas de resinas e compostos fenólicos nos tecidos, onde eles são expressados.Despite extensive studies of terpene cyclization, the isolation and characterization of enzymes is still difficult, particularly in plants, due to their low abundance, their often transient expression models and the complexity of purifying them from mixtures of resins and phenolic compounds in tissues where they are expressed.

É um objetivo da presente invenção fornecer métodos para criar o esclareol em uma maneira econômica, conforme indicado acima. Conformemente, a presente invenção tem o objetivo de produzir diterpenos ao mesmo tempo em que tem pouco resíduo, um processo eficiente de mais energia e recurso e ao mesmo tempo em que reduz a dependência de combustíveis fósseis. É um objetivo adicional fornecer enzimas capazes de sintetizar o esclareol, que e útil como componentes de perfumaria e/ou aroma. Abreviações Usadas bp par de base kb quilo base BSA albumina sérica bovina DNA ácido desoxirribonucléico cDNA DNA complementar dT deoxi timina dNTP deoxi nucleotídeo trifosfato DTT ditiotreitol GC cromatografia gasosa GGPP Geranilgeranil pirofosfato IPTG isopropil-D-tiogalactopiranosídeo LB caldo de lisogenia LPP labdenediol difosfato MOPSO ácido sulfônico 3-(N-morfolino)-2-hidroxipropano MS espectrômetro de massa ORF estrutura de leitura aberta PCR reação em cadeia da polimerase RMCE troca de cassete mediada por recombinase RT-PCR reação em cadeia da polimerase via transcrição reversa 3’-/5’-RACE amplificação rápida de 3’ e 5’ de extremidades de cDNA RNA ácido ribonucléico mRNA ácido ribonucléico mensageiro nt nucleotídeo RNase ribonuclease RuBisCO ribulose-1,5-bifosfato carboxilase SDS-PAGE eletroforese em gel de poliacrilamida - SDS SsLPPs Salvia sclarea labdenediol difosfato-sintase UTR Região Não TraduzidaIt is an object of the present invention to provide methods for creating sclareol in an economical manner, as indicated above. Accordingly, the present invention aims to produce diterpenes while having little residue, a more energy and resource efficient process and at the same time reducing dependency on fossil fuels. It is an additional objective to provide enzymes capable of synthesizing sclareol, which is useful as perfumery and/or aroma components. Abbreviations Used bp base pair kb kilo base BSA bovine serum albumin DNA deoxyribonucleic acid cDNA DNA complementary dT deoxy thymine dNTP deoxy nucleotide triphosphate DTT dithiothreitol GC gas chromatography GGPP Geranylgeranyl pyrophosphate IPTG isopropyl-D-thiogalactopyranoside LB lysogeny broth LPP labdenediol diphosphate MOPSO sulfonic acid 3-(N-morpholino)-2-hydroxypropane MS mass spectrometer ORF open reading frame PCR polymerase chain reaction RMCE recombinase-mediated cassette exchange RT-PCR polymerase chain reaction via reverse transcription 3'-/5' -RACE rapid amplification of 3' and 5' ends of cDNA RNA ribonucleic acid mRNA ribonucleic acid messenger nt nucleotide RNase ribonuclease RuBisCO ribulose-1,5-bisphosphate carboxylase SDS-PAGE polyacrylamide gel electrophoresis - SDS SsLPPs Salvia sclarea labdenediol diphosphate- syntheses UTR Untranslated Region

Descrição da invençãoDescription of the invention

A presente invenção fornece um método para produzir biossinteticamente esclareol de uma maneira econômica, confiável e reprodutível.The present invention provides a method for biosynthetically producing sclareol in an economical, reliable and reproducible manner.

Um objetivo da presente invenção é, portanto, um método de produção do esclareol compreendendo a) contato de labdenediol difosfato (LPP) com, no mínimo, um polipeptídeo tendo uma atividade de síntese de esclareol e compreendendo uma sequência de aminoácido, no mínimo, 50% idêntica à SEQ ID NO:1; e b) opcionalmente, isolamento do esclareol produzido na etapa a).An object of the present invention is therefore a method of producing sclareol comprising a) contacting labdenediol diphosphate (LPP) with at least one polypeptide having a sclareol synthesizing activity and comprising an amino acid sequence of at least 50 % identical to SEQ ID NO:1; and b) optionally isolating the sclareol produced in step a).

O método pode ser realizado in vitro, bem como in vivo, como será explicado em detalhes posteriormente.The method can be performed in vitro as well as in vivo, as will be explained in detail later.

Esclareol e LPP são definidos pela maneira de suas fórmulas, conforme representado na Figura 1.Sclareol and LPP are defined by the manner of their formulas, as depicted in Figure 1.

Como uma "esclareol-sintase" ou como um “polipeptídeo tendo uma atividade de síntese de esclareol”, referimo-nos aqui a um polipeptídeo capaz de catalisar a síntese de esclareol começando do (LPP). A capacidade de um polipeptídeo em catalisar a síntese de esclareol pode ser confirmada através da realização do ensaio enzimático, conforme detalhado nos Exemplos.As a "sclareol synthase" or as a "polypeptide having a sclareol synthesizing activity", we refer here to a polypeptide capable of catalyzing the synthesis of sclareol starting from (LPP). The ability of a polypeptide to catalyze sclareol synthesis can be confirmed by performing the enzymatic assay as detailed in the Examples.

De acordo com a presente invenção, polipeptídeos também devem incluir polipeptídeos truncados, considerando-se que eles mantem sua atividade de síntese de esclareol, conforme definido acima e que eles compartilham, no mínimo, a porcentagem definida de identificação com o fragmento correspondente de SEQ ID NO:1.In accordance with the present invention, polypeptides must also include truncated polypeptides, provided that they retain their sclareol synthesizing activity as defined above and that they share at least the defined percentage of identification with the corresponding fragment of SEQ ID NO:1.

De acordo com uma configuração preferida, o método de produção de esclareol compreende o contato de LPP com um polipeptídeo, tendo uma atividade de síntese de esclareol e compreendendo uma sequência de aminoácido, no mínimo, 55%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:1. De acordo com uma configuração mais preferida, o referido polipeptídeo compreende a sequência de aminoácido SEQ ID NO:1. Em uma configuração ainda mais preferida, o referido polipeptídeo consiste de SEQ ID NO:1.According to a preferred embodiment, the sclareol production method comprises contacting LPP with a polypeptide, having a sclareol synthesizing activity and comprising an amino acid sequence of at least 55%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and further more preferably at least 98% identical to SEQ ID NO:1. According to a more preferred embodiment, said polypeptide comprises the amino acid sequence SEQ ID NO:1. In an even more preferred embodiment, said polypeptide consists of SEQ ID NO:1.

De acordo com uma configuração preferida, a esclareol-sintase é um polipeptídeo truncado, compreendendo uma sequência de aminoácido, no mínimo, 50% idêntica a SEQ ID NQ:102. Preferivelmente, o polipeptídeo compreende uma sequência de aminoácido, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:96. De acordo com outra configuração preferida, o polipeptídeo compreende a sequência de aminoácido SEQ ID NO:96. De acordo com uma configuração mais preferida, o polipeptídeo consiste de SEQ ID NO:96.According to a preferred embodiment, the sclareol synthase is a truncated polypeptide, comprising an amino acid sequence at least 50% identical to SEQ ID NO:102. Preferably, the polypeptide comprises at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 70%, preferably at least 75%, preferably at least 75% amino acid sequence. at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95%, and even more preferably at least 98% identical to SEQ ID NO:96. In another preferred embodiment, the polypeptide comprises the amino acid sequence SEQ ID NO:96. In a more preferred embodiment, the polypeptide consists of SEQ ID NO:96.

A porcentagem de identificação entre duas sequências peptídicas ou nucleotídicas é uma função da quantidade de resíduos de aminoácidos ou ácidos nucléicos que são idênticos nas duas sequências, quando um alinhamento dessas duas sequências foi gerado. Resíduos idênticos são definidos como resíduos que são os mesmos nas duas sequências em uma dada posição do alinhamento. A porcentagem de identificação de sequência, conforme usada no presente, é calculada a partir do alinhamento favorável, pegando a quantidade de resíduos idênticos entre as duas sequências, dividindo-a pela quantidade total de resíduos na sequências mais curta e multiplicando por 100. O alinhamento favorável é o alinhamento no qual a porcentagem de identificação é a maior possível. Lacunas podem ser introduzidas em uma ou ambas as sequências em uma ou mais posições do alinhamento para obter o alinhamento favorável. Essas lacunas são, então, levadas em consideração como resíduos não-idênticos para o cálculo da porcentagem de identificação de sequência.The percentage of identification between two peptide or nucleotide sequences is a function of the amount of amino acid or nucleic acid residues that are identical in the two sequences when an alignment of these two sequences was generated. Identical residues are defined as residues that are the same in the two sequences at a given position in the alignment. The sequence identification percentage, as used herein, is calculated from the favorable alignment by taking the amount of identical residues between the two sequences, dividing it by the total amount of residues in the shorter sequence and multiplying by 100. The alignment favorable is the alignment in which the identification percentage is the highest possible. Gaps can be introduced into one or both sequences at one or more positions in the alignment to obtain favorable alignment. These gaps are then taken into account as non-identical residuals for the calculation of the sequence identification percentage.

O alinhamento para fins de determinação da porcentagem de identificação da sequência de aminoácido ou ácido nucléico pode ser atingido de várias maneiras, usando programas de computador e, por exemplo, programas de computador publicamente disponíveis na rede mundial. Preferivelmente, o programa BLAST (Tatiana et al, FEMS Microbiol Lett., 1999, 174:247-250, 1999) estabelecido para parâmetros padrão, disponível a partir do Centro Nacional de Informações de Biotecnologia (NCBI) em http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi, pode ser usado para obter um alinhamento favorável de sequências peptídicas ou nucleotídas e calcular a porcentagem de identificação de sequência.Alignment for purposes of determining percentage identification of the amino acid or nucleic acid sequence can be achieved in a number of ways, using computer programs and, for example, publicly available computer programs on the world wide web. Preferably, the BLAST program (Tatiana et al, FEMS Microbiol Lett., 1999, 174:247-250, 1999) set for default parameters, available from the National Center for Biotechnology Information (NCBI) at http://www. ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi, can be used to obtain a favorable alignment of peptide or nucleotide sequences and calculate the percentage of sequence identification.

O polipeptídeo que entrará em contato com LPP in vitro pode ser obtido por extração de qualquer organismo que o expresse, usando tecnologias de extração de proteína ou enzima padrão. Se o organismo hospedeiro for um organismo unicelular ou célula que libera o polipeptídeo da invenção no meio de cultura, o polipeptídeo pode simplesmente ser coletado do meio de cultura, por exemplo, por centrifugação, opcionalmente seguida por etapas de lavagem e ressuspensão em soluções tampão adequadas. Se o organismo ou a célula acumular o polipeptídeo em suas células, o polipeptídeo pode ser obtido por ruptura ou lise das células e, ainda, extração do polipeptídeo do lisado celular.The polypeptide that will come into contact with LPP in vitro can be obtained by extraction from any organism that expresses it, using standard enzyme or protein extraction technologies. If the host organism is a unicellular organism or cell that releases the polypeptide of the invention into the culture medium, the polypeptide can simply be collected from the culture medium, for example, by centrifugation, optionally followed by washing steps and resuspension in suitable buffer solutions. . If the organism or cell accumulates the polypeptide in its cells, the polypeptide can be obtained by disrupting or lysing the cells and further extracting the polypeptide from the cell lysate.

Os polipeptídeos, ou em uma forma isolada ou juntamente com outras proteínas, por exemplo, em um extrato de proteína crua, obtido de células ou microorganismos cultivados, podem, então, ser suspensos em uma solução tampão em pH favorável. Se adequado, sais, DTT, BSA e outros tipos de cofatores enzimáticos podem ser adicionados a fim de otimizar a atividade enzimática. Condições adequadas são descritas em mais detalhes nos Exemplos posteriormente.The polypeptides, either in an isolated form or together with other proteins, for example in a crude protein extract, obtained from cultured cells or microorganisms, can then be suspended in a buffer solution at a favorable pH. If appropriate, salts, DTT, BSA and other types of enzyme cofactors can be added in order to optimize enzyme activity. Suitable conditions are described in more detail in the Examples later.

LPP pode, então, ser adicionado à suspensão ou solução, que é, então, incubada em temperatura favorável, por exemplo, entre 15 e 40°C, preferivelmente entre 25 e 35°C, mais preferivelmente em 30°C. Após a incubação, o esclareol produzido pode ser isolado da solução incubada por procedimentos de isolamento padrão, como extração de solvente e destilação, opcionalmente após remoção dos polipeptídeos da solução.LPP can then be added to the suspension or solution, which is then incubated at a favorable temperature, for example between 15 and 40°C, preferably between 25 and 35°C, more preferably at 30°C. After incubation, the sclareol produced can be isolated from the incubated solution by standard isolation procedures such as solvent extraction and distillation, optionally after removing the polypeptides from the solution.

LPP pode ser obtido por contato de GGPP com uma LPP-sintase isolada. Exemplos 1 a 3 abaixo mostram um método para isolar uma LPP-sintase que codifica cDNA da Salvia sclarea, um método para a expressão heteróloga do referido cDNA em E. coli, um método para a purificação da LPP-sintase assim produzida e um método para a produção in vitro da LPP, usando a LPP-sintase isolada.LPP can be obtained by contacting GGPP with an isolated LPP synthase. Examples 1 to 3 below show a method for isolating an LPP synthase encoding Salvia sclarea cDNA, a method for heterologous expression of said cDNA in E. coli, a method for purifying the LPP synthase thus produced and a method for the in vitro production of LPP, using the isolated LPP-synthase.

De acordo com outra configuração preferida, o método de produção de esclareol é realizado in vivo. Nesse caso, a etapa a) do método descrito acima compreende o cultivo de um organismo ou célula não-humana, capaz de produzir LPP e transformado para expressar um polipeptídeo, tendo uma atividade de síntese de esclareol e compreendendo uma sequência de aminoácido, no mínimo, 70% idêntica a SEQ ID NO.1 sob condições que levam à produção do esclareol.According to another preferred embodiment, the sclareol production method is carried out in vivo. In that case, step a) of the method described above comprises culturing a non-human organism or cell, capable of producing LPP and transformed to express a polypeptide, having a sclareol synthesizing activity and comprising an amino acid sequence, at least , 70% identical to SEQ ID NO.1 under conditions leading to sclareol production.

De acordo com uma configuração mais preferida, o método ainda compreende, antes da etapa a), a transformação de um organismo ou célula não- humana, capaz de produzir LPP com, no mínimo, um ácido nucléico, que codifica um polipeptídeo, tendo uma atividade de síntese de esclareol e compreendendo uma sequência de aminoácido, no mínimo, 70% idêntica a SEQ ID NO:1, de maneira que o referido organismo expresse o referido polipeptídeo.According to a more preferred configuration, the method further comprises, before step a), the transformation of a non-human organism or cell, capable of producing LPP with at least one nucleic acid, which encodes a polypeptide, having a sclareol synthesis activity and comprising an amino acid sequence at least 70% identical to SEQ ID NO:1, such that said organism expresses said polypeptide.

De acordo com uma configuração preferida, o ácido nucléico usado para transformar o organismo ou célula hospedeira compreende uma sequência de nucleotídeo, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica a SEQ ID NO:2 ou ao complemento do mesmo. De acordo com outra configuração preferida, o ácido nucléico compreende a sequência de nucleotídeo SEQ ID NO:2 ou o complemento da mesma. De acordo com uma configuração mais preferida, o ácido nucléico consiste de SEQ ID NO:2 ou o complemento da mesma.According to a preferred embodiment, the nucleic acid used to transform the organism or host cell comprises a nucleotide sequence of at least 50%, preferably at least 55%, preferably at least 60%, preferably at least 60% 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 90% 95% and even more preferably at least 98% identical to SEQ ID NO:2 or the complement thereof. In another preferred embodiment, the nucleic acid comprises the nucleotide sequence SEQ ID NO:2 or the complement thereof. In a more preferred embodiment, the nucleic acid consists of SEQ ID NO:2 or the complement thereof.

De acordo com uma configuração preferida adicional, o ácido nucléico usado para transformar o organismo ou célula hospedeira compreende uma sequência de nucleotídeo, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:93 ou ao complemento da mesma. De acordo com outra configuração preferida, o ácido nucléico compreende a sequência de nucleotídeo SEQ ID NO:93 ou o complemento da mesma. De acordo com uma configuração mais preferida, o ácido nucléico consiste de SEQ ID NO:93 ou o complemento da mesma.According to a further preferred embodiment, the nucleic acid used to transform the organism or host cell comprises a nucleotide sequence of at least 50%, preferably at least 55%, preferably at least 60%, preferably at least 60% at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, most preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:93 or the complement thereof. In another preferred embodiment, the nucleic acid comprises the nucleotide sequence SEQ ID NO:93 or the complement thereof. In a more preferred embodiment, the nucleic acid consists of SEQ ID NO:93 or the complement thereof.

Essas configurações da invenção são particularmente vantajosas já que é possível realizar o método in vivo sem previamente isolar o polipeptídeo. A reação ocorre diretamente dentro do organismo ou da célula transformada para expressar o referido polipeptídeo.These embodiments of the invention are particularly advantageous since it is possible to carry out the method in vivo without previously isolating the polypeptide. The reaction takes place directly within the organism or cell transformed to express said polypeptide.

O organismo ou a célula é para “expressar” um polipeptídeo, considerando-se que o organismo ou a célula é transformado para hospedar um ácido nucléico, que codifica o referido polipeptídeo, esse ácido nucléico é transcrito ao mRNA e o polipeptídeo é encontrado no organismo ou na célula hospedeira. O termo “expressar” inclui “expressar heterologamente” e “super-expressar”, o último referindo-se aos níveis de mRNA, polipeptídeo e/ou atividade de enzima sobre e acima do que é medido em um organismo ou uma célula não-transformados. Uma descrição mais detalhada dos métodos adequados para transformar um organismo ou uma célula não-humana será descrita posteriormente na parte da especificação, que é dedicada a esses organismos ou células não-humanos, transformados como objetos específicos da presente invenção e nos Exemplos.The organism or cell is to "express" a polypeptide, provided that the organism or cell is transformed to host a nucleic acid, which encodes said polypeptide, this nucleic acid is transcribed to mRNA and the polypeptide is found in the organism or in the host cell. The term "express" includes "heterologously express" and "overexpress", the latter referring to levels of mRNA, polypeptide and/or enzyme activity over and above what is measured in a non-transformed organism or cell . A more detailed description of suitable methods for transforming a non-human organism or cell will be described later in the part of the specification, which is dedicated to such transformed non-human organisms or cells as specific objects of the present invention and in the Examples.

Um organismo ou célula particular destina-se a ser “capaz de produzir LPP”, quando este produz LPP naturalmente ou quando não produzir LPP naturalmente, mas produz GGPP (ou é transformado) e é transformado para expressar uma LPP- sintase, ou antes da transformação com um ácido nucléico, que codifica uma esclareol-sintase ou juntamente com o referido ácido nucléico. Organismos ou células transformados para produzir uma quantidade maior de LPP do que o organismo ou célula que ocorre naturalmente também são abrangidos pelos “organismos ou células capazes de produzir LPP”. De acordo com uma configuração preferida, o organismo acumula LPP naturalmente ou é transformado para acumular LPP.A particular organism or cell is intended to be "capable of producing LPP" when it naturally produces LPP or when it does not naturally produce LPP but produces GGPP (or is transformed) and is transformed to express an LPP synthase, or prior to the production of LPP. transformation with a nucleic acid encoding a sclareol synthase or together with said nucleic acid. Organisms or cells transformed to produce a greater amount of LPP than the naturally occurring organism or cell are also encompassed by "organisms or cells capable of producing LPP". In a preferred embodiment, the organism accumulates LPP naturally or is transformed to accumulate LPP.

Métodos para transformação de organismos, de maneira que eles expressem uma LPP-sintase, podem ser conhecidos na técnica para transformar um organismo hospedeiro. Esses métodos são expostos em mais detalhes posteriormente e um exemplo específico da expressão de uma LPP-sintase em E. coli é fornecido no Exemplo 2. Métodos para transformação de um organismo para produzir GGPP também são conhecidos na técnica. Esses métodos podem, por exemplo, ser encontrados em Huang, Roessner, Croteau e Scott, Engenharia de Escherichia coli para a síntese de taxadieno, um intermediário importante na biossíntese de taxol, Bioorg Med Chem., 9(9), 2001, 2237-2242.Methods for transforming organisms so that they express an LPP synthase may be known in the art for transforming a host organism. These methods are discussed in more detail later, and a specific example of expression of an LPP synthase in E. coli is provided in Example 2. Methods for transforming an organism to produce GGPP are also known in the art. Such methods can, for example, be found in Huang, Roessner, Croteau and Scott, Engineering Escherichia coli for the synthesis of taxadiene, an important intermediate in the biosynthesis of taxol, Bioorg Med Chem., 9(9), 2001, 2237- 2242.

Para realizar a invenção in vivo, o organismo ou a célula hospedeira é cultivada sob condições que levam à produção de esclareol. Conformemente, se o hospedeiro for uma planta transgênica, condições de crescimento favorável são fornecidas, como condições de luz, água e nutriente favoráveis, por exemplo. Se o hospedeiro for um organismo unicelular, condições que levam à produção de esclareol podem incluir a adição de cofatores adequados ao meio de cultura do hospedeiro. Além disso, um meio de cultura pode ser selecionada, de maneira a maximizar a síntese de esclareol. Condições de cultura favoráveis são descritas em uma maneira mais detalhada nos seguintes Exemplos.To carry out the invention in vivo, the organism or host cell is cultured under conditions that lead to the production of sclareol. Accordingly, if the host is a transgenic plant, favorable growth conditions are provided, such as favorable light, water and nutrient conditions, for example. If the host is a unicellular organism, conditions leading to sclareol production may include the addition of appropriate cofactors to the host's culture medium. In addition, a culture medium can be selected in order to maximize sclareol synthesis. Favorable culture conditions are described in more detail in the following Examples.

Organismos não-humanos adequados para realizar o método da invenção in vivo podem ser quaisquer organismos multicelulares ou unicelulares não-humanos. Em uma configuração preferida, o organismo não-humano, usado para realizar a invenção in vivo é uma planta, um procarionte ou um fungo.Non-human organisms suitable for carrying out the method of the invention in vivo can be any non-human multicellular or unicellular organisms. In a preferred embodiment, the non-human organism used to carry out the invention in vivo is a plant, prokaryote or fungus.

Qualquer planta, procarionte ou fungo pode ser usado para realizar o método da invenção in vivo. Particularmente, plantas úteis são aquelas que naturalmente produzem altas quantidades de terpenos. Em uma configuração mais preferida, a planta é selecionada da família das Solanaceae, Poaceae, Brassicaceae, Fabaceae, Malvaceae, Asteraceae ou Lamiaceae. Por exemplo, a planta é selecionada dos gêneros Nicotiana, Solanum, Sorghum, Arabidopsis, Brassica (rapé), Medicago (alfalfa), Gossypium (algodão), Artemisia, Salvia e Mentha. Preferivelmente, a planta pertence às espécies de Nicotiana tabacum.Any plant, prokaryote or fungus can be used to carry out the method of the invention in vivo. Particularly useful plants are those that naturally produce high amounts of terpenes. In a more preferred embodiment, the plant is selected from the family of Solanaceae, Poaceae, Brassicaceae, Fabaceae, Malvaceae, Asteraceae or Lamiaceae. For example, the plant is selected from the genera Nicotiana, Solanum, Sorghum, Arabidopsis, Brassica (snuff), Medicago (alfalfa), Gossypium (cotton), Artemisia, Salvia and Mentha. Preferably, the plant belongs to the species of Nicotiana tabacum.

Em uma configuração mais preferida, o organismo não-humano é um microorganismo. De acordo com uma configuração ainda mais preferida, o referido microorganismo é uma bactéria ou um fungo, preferivelmente o referido fungo é uma levedura. Mais preferivelmente, a referida bactéria é E. coli e a referida levedura é Saccharomyces cerevisiae.In a more preferred embodiment, the non-human organism is a microorganism. According to an even more preferred embodiment, said microorganism is a bacterium or a fungus, preferably said fungus is a yeast. More preferably, said bacteria is E. coli and said yeast is Saccharomyces cerevisiae.

A maioria desses organismos não produzem LPP naturalmente. Para serem adequados para realizar o método da invenção, esses organismos tem de ser transformados para produzir o referido precursor. Eles podem então ser transformados antes da modificação com o ácido nucléico, que codifica o polipeptídeo, tendo uma atividade de síntese de esclareol ou simultaneamente, conforme explicado acima.Most of these organisms do not naturally produce LPP. To be suitable for carrying out the method of the invention, these organisms have to be transformed to produce said precursor. They can then be transformed prior to modification with the nucleic acid, which encodes the polypeptide, having a sclareol synthesizing activity, or simultaneously, as explained above.

Células eucarióticas maiores isoladas podem também ser usadas, em vez de organismos completos, como hospedeiros para realizar o método da invenção in vivo. Células eucarióticas adequadas podem ser qualquer célula não-humana, mas são preferivelmente células de planta.Isolated larger eukaryotic cells can also be used, instead of whole organisms, as hosts to carry out the method of the invention in vivo. Suitable eukaryotic cells can be any non-human cell, but are preferably plant cells.

De acordo com outra configuração preferida, o polipeptídeo ou o ácido nucléico usado no método de qualquer uma das configurações acima é derivado da Salvia sclarea.According to another preferred embodiment, the polypeptide or nucleic acid used in the method of any of the above embodiments is derived from Salvia sclarea.

Uma ferramenta importante para realizar o método da invenção é o próprio polipeptídeo. Um polipeptídeo tendo uma atividade de síntese de esclareol e compreendendo uma sequência de aminoácido, no mínimo, 50% idêntica à SEQ ID NO:1 é, portanto, outro objeto da presente invenção.An important tool for carrying out the method of the invention is the polypeptide itself. A polypeptide having a sclareol synthesis activity and comprising an amino acid sequence at least 50% identical to SEQ ID NO:1 is therefore another object of the present invention.

De acordo com uma configuração preferida, a esclareol-sintase compreende uma sequência de aminoácido, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:1. De acordo com outra configuração preferida, o polipeptídeo compreende a sequência de aminoácido SEQ ID NO:1. De acordo com uma configuração mais preferida, o polipeptídeo consiste de SEQ ID NO:1.According to a preferred embodiment, the sclareol synthase comprises an amino acid sequence of at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 70% at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95%, and even more preferably at least 98% identical to SEQ ID NO:1. In another preferred embodiment, the polypeptide comprises the amino acid sequence SEQ ID NO:1. In a more preferred embodiment, the polypeptide consists of SEQ ID NO:1.

De acordo com outra configuração preferida da invenção, o polipeptídeo é derivado da Salvia sclarea.According to another preferred embodiment of the invention, the polypeptide is derived from Salvia sclarea.

Conforme usado no presente, os termos “esclareol-sintase” ou “polipeptídeo tendo uma atividade de síntese de esclareol” referem-se a um gênero de polipeptídeos ou fragmentos de peptídeo que inclui as sequências de aminoácidos aqui identificadas, bem como polipeptídeos truncados ou variantes, considerando-se que eles mantenham sua atividade de síntese de esclareol, conforme definido acima e que compartilhem, no mínimo, a porcentagem definida de identificação com o fragmento correspondente de SEQ ID NO:1.As used herein, the terms "sclareol synthase" or "polypeptide having a sclareol synthesizing activity" refer to a genus of polypeptides or peptide fragments that includes the amino acid sequences identified herein, as well as truncated polypeptides or variants , assuming that they retain their sclareol synthesis activity as defined above and that they share at least the defined percentage identification with the corresponding fragment of SEQ ID NO:1.

De acordo com uma configuração preferida, a esclareol-sintase compreende uma sequência de aminoácido, no mínimo, 50% idêntica a SEQ ID NO:96. Preferivelmente, a esclareol-sintase compreende uma sequência de aminoácido, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:96. De acordo com outra configuração preferida, o polipeptídeo compreende a sequência de aminoácido SEQ ID NO:96. De acordo com uma configuração mais preferida, o polipeptídeo consiste de SEQ ID NO:96.In a preferred embodiment, the sclareol synthase comprises an amino acid sequence at least 50% identical to SEQ ID NO:96. Preferably, the sclareol synthase comprises an amino acid sequence of at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:96. In another preferred embodiment, the polypeptide comprises the amino acid sequence SEQ ID NO:96. In a more preferred embodiment, the polypeptide consists of SEQ ID NO:96.

Exemplos de polipeptídeos variantes são proteínas que ocorrem naturalmente, que resultam de eventos de combinação de mRNA alternativos ou formam a divisão proteolítica dos polipeptídeos aqui descritos. Variações atribuíveis à proteólise incluem, por exemplo, diferenças nos terminais N ou C mediante a expressão em tipos diferentes de células hospedeiras, devido à remoção proteolítica de um ou mais aminoácidos terminais dos polipeptídeos da invenção. Polipeptídeos codificados por um ácido nucléico, obtido por mutação de um ácido nucléico da invenção, conforme descrito posteriormente, também são abrangidos pela invenção.Examples of variant polypeptides are naturally occurring proteins that result from alternative mRNA splicing events or form proteolytic cleavage of the polypeptides described herein. Variations attributable to proteolysis include, for example, differences at the N- or C-terminus upon expression in different types of host cells, due to proteolytic removal of one or more terminal amino acids from polypeptides of the invention. Polypeptides encoded by a nucleic acid, obtained by mutating a nucleic acid of the invention, as described later, are also encompassed by the invention.

O ácido nucléico que codifica o polipeptídeo tendo uma atividade de síntese de esclareol, conforme definido acima, é uma ferramenta necessária para modificar os organismos ou células não-humanos, propostos para serem usados quando o método for realizado in vivo. Um ácido nucléico que codifica um polipeptídeo, conforme definido em qualquer uma das configurações acima, é, portanto, outro objeto da invenção.The nucleic acid encoding the polypeptide having a sclareol synthesis activity, as defined above, is a necessary tool for modifying non-human organisms or cells, proposed to be used when the method is carried out in vivo. A nucleic acid encoding a polypeptide, as defined in any of the above configurations, is therefore another object of the invention.

De acordo com uma configuração preferida, o ácido nucléico compreende uma sequência de nucleotídeo, no mínimo, 50% idêntica à SEQ ID NO:2 ou ao complemento da mesma. De acordo com uma configuração mais preferida, o referido ácido nucléico compreende uma sequência de aminoácido, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:2 ou ao complemento da mesma. De acordo com uma configuração preferida, o ácido nucléico compreende uma sequência de nucleotídeo idêntica à SEQ ID NO:2 ou ao complemento da mesma. De acordo com uma configuração ainda mais preferida, o ácido nucléico consiste de SEQ ID NO:2 ou o complemento da mesma.In a preferred embodiment, the nucleic acid comprises a nucleotide sequence that is at least 50% identical to SEQ ID NO:2 or the complement thereof. According to a more preferred embodiment, said nucleic acid comprises an amino acid sequence of at least 55%, preferably at least 60%, preferably at least 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95% and even more preferably at least 98% identical to SEQ ID NO:2 or the complement thereof. In a preferred embodiment, the nucleic acid comprises a nucleotide sequence identical to SEQ ID NO:2 or the complement thereof. According to an even more preferred embodiment, the nucleic acid consists of SEQ ID NO:2 or the complement thereof.

De acordo com outra configuração preferida da invenção, o ácido nucléico é derivado da Salvia sclarea.According to another preferred embodiment of the invention, the nucleic acid is derived from Salvia sclarea.

O ácido nucléico da invenção pode ser definido como incluindo polímeros de desoxirribonucleotídeo ou ribonucleotídeo na forma com filamento simples ou duplo (DNA e/ou RNA). O termo “sequência de nucleotídeo” deve também ser compreendido como incluindo uma molécula de polinucleotídeo ou uma molécula de oligonucleotídeo na forma de um fragmento separado ou como um componente de um ácido nucléico maior. Ácidos nucléicos da invenção também incluem certas sequências de nucleotídeo isoladas, incluindo aquelas que estão substancialmente livres de conter material endógeno. O ácido nucléico da invenção pode ser truncado, considerando-se que este codifique um polipeptídeo abrangido pela presente invenção, conforme descrito acima. Ácidos nucléicos truncados particularmente úteis são os ácidos nucléicos, no mínimo, 70% idênticos à SEQ ID NO:93 ou ao complemento da mesma.The nucleic acid of the invention can be defined as including deoxyribonucleotide or ribonucleotide polymers in single or double stranded form (DNA and/or RNA). The term "nucleotide sequence" is also to be understood to include a polynucleotide molecule or an oligonucleotide molecule in the form of a separate fragment or as a component of a larger nucleic acid. Nucleic acids of the invention also include certain isolated nucleotide sequences, including those that are substantially free of containing endogenous material. The nucleic acid of the invention may be truncated, provided it encodes a polypeptide encompassed by the present invention, as described above. Particularly useful truncated nucleic acids are nucleic acids at least 70% identical to SEQ ID NO:93 or the complement thereof.

Os ácidos nucléicos obtidos por mutações de SEQ ID NO:2 ou o complemento da mesma também são abrangidos pela invenção, considerando-se que eles compartilhem, no mínimo, a porcentagem definida de identificação com o fragmento correspondente de SEQ ID NO:2 e que codifiquem polipeptídeos tendo uma atividade de síntese de esclareol, conforme definido acima. Mutações podem ser qualquer tipo de mutações desses ácidos nucléicos, como mutações de ponto, mutações de deleção, mutações de inserção e/ou mutações de troca de estrutura. Ácidos nucléicos variantes podem ser preparados a fim de adaptar sua sequência de nucleotídeo a um sistema de expressão específico. Por exemplo, os sistemas de expressão bacteriana são conhecidos por expressar mais eficazmente os polipeptídeos se os aminoácidos forem codificados por um códon preferido. Devido à degeneração do código genético, onde mais de um códon pode codificar o mesmo aminoácido, múltiplas sequências de DNA podem codificar o mesmo polipeptídeo, todas essas sequências de DNA sendo abrangidas na invenção.Nucleic acids obtained by mutations of SEQ ID NO:2 or the complement thereof are also covered by the invention, provided that they share, at least, the defined percentage of identification with the corresponding fragment of SEQ ID NO:2 and that encode polypeptides having a sclareol synthesizing activity as defined above. Mutations can be any type of mutations of these nucleic acids, such as point mutations, deletion mutations, insertion mutations and/or frameshift mutations. Variant nucleic acids can be prepared in order to adapt their nucleotide sequence to a specific expression system. For example, bacterial expression systems are known to more efficiently express polypeptides if the amino acids are encoded by a preferred codon. Due to the degeneracy of the genetic code, where more than one codon can encode the same amino acid, multiple DNA sequences can encode the same polypeptide, all of these DNA sequences being covered by the invention.

De acordo com uma configuração preferida adicional, o ácido nucléico é um ácido nucléico truncado, compreendendo uma sequência de nucleotídeo, no mínimo, 50%, preferivelmente, no mínimo, 55%, preferivelmente, no mínimo, 60%, preferivelmente, no mínimo, 65%, preferivelmente, no mínimo, 70%, preferivelmente, no mínimo, 75%, preferivelmente, no mínimo, 80%, preferivelmente, no mínimo, 85%, preferivelmente, no mínimo, 90%, mais preferivelmente, no mínimo, 95% e ainda mais preferivelmente, no mínimo, 98% idêntica à SEQ ID NO:93 ou ao complemento da mesma. De acordo com outra configuração preferida, o ácido nucléico compreende a sequência de nucleotídeo SEQ ID NO:93 ou o complemento da mesma. De acordo com uma configuração mais preferida, o ácido nucléico consiste de SEQ ID NO:93 ou o complemento da mesma.According to a further preferred embodiment, the nucleic acid is a truncated nucleic acid, comprising a nucleotide sequence at least 50%, preferably at least 55%, preferably at least 60%, preferably at least 60% 65%, preferably at least 70%, preferably at least 75%, preferably at least 80%, preferably at least 85%, preferably at least 90%, more preferably at least 95 % and even more preferably at least 98% identical to SEQ ID NO:93 or the complement thereof. In another preferred embodiment, the nucleic acid comprises the nucleotide sequence SEQ ID NO:93 or the complement thereof. In a more preferred embodiment, the nucleic acid consists of SEQ ID NO:93 or the complement thereof.

Geralmente falando, o ácido nucléico da invenção pode ser isolado, usando uma abordagem de sequenciamento passivamente paralelo, que é extensivamente desenvolvido nos Exemplos 5 e 6. A primeira etapa desse método é o sequenciamento global da biblioteca de cDNA. A biblioteca de cDNA é primeiramente fragmentada por nebulização. Os fragmentos são, então, amplificados por PCR e a reação de sequenciamento é realizada. Sequências curtas de 35 bases denominadas “leituras” são obtidas. As “leituras” são remontadas em sequências contíguas (“contigs”), usando um software com extensão mínima definida de superposição e porcentagem de configurações de homologia. As “leituras” e as “contigs” são, então, pesquisadas com relação à identificação de sequência com enzimas conhecidas do mesmo tipo. Com base nessas homologias, as “reads” e as “contigs” são selecionadas e usadas para sintetizar os primers a fim de realizar a amplificação de PCR da esclareol-sintase de extensão total.Generally speaking, the nucleic acid of the invention can be isolated using a passively parallel sequencing approach, which is extensively developed in Examples 5 and 6. The first step of this method is the overall sequencing of the cDNA library. The cDNA library is first fragmented by nebulization. The fragments are then amplified by PCR and the sequencing reaction is performed. Short sequences of 35 bases called “reads” are obtained. The “reads” are reassembled into contiguous sequences (“contigs”), using software with defined minimum extent of overlap and percentage of homology settings. The "reads" and "contigs" are then searched for sequence identification with known enzymes of the same type. Based on these homologies, reads and contigs are selected and used to synthesize primers in order to perform full length sclareol synthase PCR amplification.

Outra ferramenta importante para a transformação de organismos ou células hospedeiros adequados para realizar o método da invenção in vivo é um vetor de expressão, compreendendo, no mínimo, um ácido nucléico, de acordo com qualquer configuração da invenção. Esse vetor é, portanto, também um objeto da presente invenção.Another important tool for transforming organisms or host cells suitable for carrying out the method of the invention in vivo is an expression vector, comprising at least one nucleic acid, according to any embodiment of the invention. This vector is therefore also an object of the present invention.

Um ’’vetor da expressão”, conforme usado no presente, inclui qualquer vetor recombinante linear ou circular, incluindo, entre outros, vetores virais, bacteriófagos e plasmídeos. O perito é capaz de selecionar um vetor adequado, de acordo com o sistema de expressão. Em uma configuração, os vetores de expressão incluem o ácido nucléico da invenção, operavelmente ligado a, no mínimo, uma sequência regulatória, que controla a transcrição, a tradução, a iniciação e o término, como um promotor, operador ou uma sequência reforçadora transcricional ou um local de ligação ribossomal de mRNA e, opcionalmente, incluindo, no mínimo, um marcador de seleção. Sequências de nucleotídeo são “operavelmente ligadas” quando a sequência regulatória funcionalmente relaciona-se com o ácido nucléico da invenção.An ''expression vector'', as used herein, includes any linear or circular recombinant vector, including but not limited to viral, bacteriophage, and plasmid vectors. The expert is able to select a suitable vector according to the expression system. In one embodiment, expression vectors include the nucleic acid of the invention, operably linked to at least one regulatory sequence, which controls transcription, translation, initiation and termination, such as a promoter, operator, or transcriptional enhancer sequence or a ribosomal mRNA binding site, and optionally including, at a minimum, a selectable marker. Nucleotide sequences are "operably linked" when the regulatory sequence functionally relates to the nucleic acid of the invention.

Os vetores de expressão da presente invenção podem ser usados no método para preparação de um organismo e/ou célula hospedeira geneticamente transformada, em organismos e/ou células hospedeiras que abrigam os ácidos nucléicos da invenção e nos métodos de produção ou criação de polipeptídeos tendo uma atividade de síntese de esclareol, conforme divulgado mais abaixo.The expression vectors of the present invention can be used in the method for preparing a genetically transformed organism and/or host cell, in organisms and/or host cells that harbor the nucleic acids of the invention, and in methods of producing or creating polypeptides having a sclareol synthesis activity as disclosed further below.

Organismos e células não-humanos recombinantes, transformados para abrigar, no mínimo, um ácido nucléico da invenção, de modo que heterologamente expresse ou super-expresse, no mínimo, um polipeptídeo da invenção também são ferramentas muito úteis para realizar o método da invenção. Esses organismos e células não-humanos são, portanto, outro objeto da presente invenção.Recombinant non-human organisms and cells, transformed to harbor at least one nucleic acid of the invention so that they heterologously express or overexpress at least one polypeptide of the invention are also very useful tools for carrying out the method of the invention. These non-human organisms and cells are therefore another object of the present invention.

Organismos não-humanos da invenção podem ser quaisquer organismos multicelulares ou unicelulares não-humanos. Em uma configuração preferida, o organismo não-humano da invenção é uma planta, um procarionte ou um fungo. O referido organismo pode ser qualquer planta, procarionte ou fungo. Particularmente, plantas úteis são aquelas que naturalmente produzem altas quantidades de terpenos. Em uma configuração mais preferida, a planta é selecionada da família das Solanaceae, Poaceae, Brassicaceae, Fabaceae, Malvaceae, Asteraceae ou Lamiaceae. Por exemplo, a planta é selecionada dos gêneros Nicotiana, Solanum, Sorghum, Arabidopsis, Brassica (rapé), Medicago (alfalfa), Gossypium (algodão), Artemisia, Salvia e Mentha. Preferivelmente, a planta pertence às espécies de Nicotiana tabacum.Non-human organisms of the invention can be any non-human multicellular or unicellular organisms. In a preferred embodiment, the non-human organism of the invention is a plant, prokaryote or fungus. Said organism may be any plant, prokaryote or fungus. Particularly useful plants are those that naturally produce high amounts of terpenes. In a more preferred embodiment, the plant is selected from the family of Solanaceae, Poaceae, Brassicaceae, Fabaceae, Malvaceae, Asteraceae or Lamiaceae. For example, the plant is selected from the genera Nicotiana, Solanum, Sorghum, Arabidopsis, Brassica (snuff), Medicago (alfalfa), Gossypium (cotton), Artemisia, Salvia and Mentha. Preferably, the plant belongs to the species of Nicotiana tabacum.

Em uma configuração mais preferida, o organismo não-humano é um microorganismo. De acordo com uma configuração ainda mais preferida, o referido microorganismo é uma bactéria ou levedura e mais preferivelmente, a referida bactéria é E. coli e a referida levedura é Saccharomyces cerevisiae.In a more preferred embodiment, the non-human organism is a microorganism. According to an even more preferred embodiment, said microorganism is a bacterium or yeast and more preferably, said bacteria is E. coli and said yeast is Saccharomyces cerevisiae.

Células eurarióticas maiores isoladas podem também ser transformadas, em vez de organismos completos. Com as células eurarióticas maiores, queremos dizer aqui qualquer célula eucariótica não-humana, exceto as células de levedura. As células eucarióticas maiores preferidas são células de planta ou células fúngicas.Isolated larger euraryotic cells can also be transformed, rather than whole organisms. By larger eukaryotic cells, we mean here any non-human eukaryotic cell except yeast cells. Preferred larger eukaryotic cells are plant cells or fungal cells.

O termo “transformado” refere-se ao fato de que o hospedeiro estava sujeito à engenharia genética para abranger uma, duas ou mais cópias de quaisquer ácidos nucléicos da invenção. Preferivelmente, o termo “transformado” relaciona-se aos hospedeiros que expressam heterologamente os polipeptídeos da invenção, bem como os super-expressam. Conformemente, em uma configuração, a presente invenção fornece um organismo transformado, no qual o polipeptídeo da invenção é expressado em quantidade maior do que no mesmo organismo não transformado.The term "transformed" refers to the fact that the host has been genetically engineered to encompass one, two or more copies of any nucleic acids of the invention. Preferably, the term "transformed" relates to hosts that heterologously express the polypeptides of the invention, as well as overexpress them. Accordingly, in one embodiment, the present invention provides a transformed organism in which the polypeptide of the invention is expressed in greater amounts than in the same non-transformed organism.

Há diversos modelos conhecidos na técnica para a criação de organismos ou células hospedeiros transgênicos, como plantas, fungos, procariontes ou culturas de células de organismos eucarióticos maiores. Clonagem adequada e vetores de expressão para uso com hospedeiros celulares bacterianos, fúngicos, de levedura, de planta e mamíferos são descritos, por exemplo, em Pouwels et ai., Vetores de Clonagem: Um Manual Laboratorial, 1985, Elsevier, New York e Sambrook et ai., I Clonagem Molecular: Um Manual Laboratorial, 2a edição, 1989, Cold Spring Harbor Laboratory Press. Vetores de clonagem e de expressão para plantas e/ou células de plantas maiores, em particular, são disponíveis ao perito. Vide, por exemplo, Schardl etal. Gene 61: 1-11, 1987.There are several models known in the art for creating transgenic host organisms or cells, such as plants, fungi, prokaryotes, or cell cultures of larger eukaryotic organisms. Suitable cloning and expression vectors for use with bacterial, fungal, yeast, plant and mammalian cellular hosts are described, for example, in Pouwels et al., Cloning Vectors: A Laboratory Manual, 1985, Elsevier, New York and Sambrook et al., I Molecular Cloning: A Laboratory Manual, 2nd edition, 1989, Cold Spring Harbor Laboratory Press. Cloning and expression vectors for plants and/or larger plant cells, in particular, are available to the skilled person. See, for example, Schardl et al. Gene 61: 1-11, 1987.

Métodos de transformação de organismos ou células hospedeiros para abrigar ácidos nucléicos transgênicos, como aqueles da presente invenção, são familiares ao perito. Para a criação de plantas transgênicas, por exemplo, métodos atuais incluem: eletroporação de protoplastos de planta, transformação mediada por lipossomo, transformação mediada por agrobactéria, transformação mediada por 10 polietileno glicol, bombardeamento de partícula, microinjeção de células de planta e transformação usando vírus.Methods of transforming host organisms or cells to harbor transgenic nucleic acids, such as those of the present invention, are familiar to the skilled person. For the creation of transgenic plants, for example, current methods include: electroporation of plant protoplasts, liposome-mediated transformation, agrobacteria-mediated transformation, polyethylene glycol-mediated transformation, particle bombardment, microinjection of plant cells, and transformation using viruses. .

Em uma configuração, DNA transformado é integrado em um cromossomo de um organismo e/ou célula hospedeira não-humana, tal que resulte em um sistema recombinante estável. Qualquer método de integração cromossômica conhecido na 15 técnica pode ser usado na prática da invenção, incluindo, entre outros, troca de cassete mediado por recombinase (RMCE), inserção cromossômica viral de local específico, adenovirus e injeção pronuclear.In one embodiment, transformed DNA is integrated into a chromosome of a non-human host cell and/or organism such that a stable recombinant system results. Any method of chromosomal integration known in the art may be used in the practice of the invention, including but not limited to recombinase-mediated cassette switching (RMCE), site-specific viral chromosome insertion, adenovirus, and pronuclear injection.

A fim de realizar o método de produção de esclareol in vitro, conforme exposto acima, é muito vantajoso fornecer um método de criação de, no mínimo, um 20 polipeptídeo tendo uma atividade de síntese de esclareol. Portanto, a invenção fornece um método de produção de, no mínimo, um polipeptídeo tendo uma atividade de síntese de esclareol compreendendo a) o cultivo de organismo ou célula não-humanos, transformados com o vetor de expressão da invenção, de maneira que abrigue um ácido nucléico, de 25 acordo com a invenção e expresse ou supre expresse um polipeptídeo, codificado pelo referido ácido nucléico e tendo uma atividade de síntese de esclareol; b) o isolamento do polipeptídeo tendo uma atividade de síntese de esclareol do organismo ou célula não-humanos, cultivados na etapa a).In order to carry out the method of producing sclareol in vitro as set out above, it is very advantageous to provide a method of creating at least one polypeptide having a sclareol synthesizing activity. Therefore, the invention provides a method of producing at least one polypeptide having a sclareol synthesis activity comprising a) culturing a non-human organism or cell, transformed with the expression vector of the invention, in a way that harbors a nucleic acid, according to the invention and express or overexpress a polypeptide, encoded by said nucleic acid and having a sclareol synthesizing activity; b) isolating the polypeptide having a sclareol synthesizing activity from the cultured non-human organism or cell in step a).

De acordo com uma configuração preferida, o referido método ainda compreende, antes da etapa a), a transformação de um organismo ou célula hospedeiros, não-humanos com, no mínimo, um vetor de expressão da invenção, de maneira que abrigue, no mínimo, um ácido nucléico, de acordo com a invenção e expresse ou super-expresse, no mínimo, um polipeptídeo codificado pelo referido ácido nucléico.According to a preferred configuration, said method further comprises, before step a), the transformation of a non-human host organism or cell with at least one expression vector of the invention, in a way that it houses at least , a nucleic acid, according to the invention and expresses or overexpresses at least one polypeptide encoded by said nucleic acid.

A transformação e o cultivo do organismo ou célula não-humanos podem ser realizados conforme descrito acima para o método de produção de esclareol in vivo. A etapa b) pode ser realizada usando qualquer técnica bem conhecida na técnica para isolar um polipeptídeo particular de um organismo ou uma célula.Transformation and cultivation of the non-human organism or cell can be performed as described above for the in vivo sclareol production method. Step b) can be carried out using any technique well known in the art for isolating a particular polypeptide from an organism or a cell.

Uma “variante de polipeptídeo”, conforme referido ao presente, significa um polipeptídeo tendo uma atividade de síntese de esclareol e sendo substancialmente homólogo a um polipeptídeo nativo, mas tendo uma sequência de aminoácido diferente daquela codificada por qualquer uma das sequências de ácido nucléico da invenção devido a uma ou mais deleções, inserções ou substituições.A "polypeptide variant", as referred to herein, means a polypeptide having a sclareol synthesizing activity and being substantially homologous to a native polypeptide, but having an amino acid sequence different from that encoded by any of the nucleic acid sequences of the invention due to one or more deletions, insertions or substitutions.

Variantes podem abranger sequências conservativamente substituídas, significando que um dado resíduo de aminoácido é substituído por um resíduo tendo características físico-químicas semelhantes. Exemplos de substituições conservatives incluem substituição de um resíduo alifático por outro, como lie, Vai, Leu ou Ala por um outro, ou substituições de um resíduo polar por outro, como entre Lys e Arg; Glu e Asp; ou Gin e Asn. Vide Zubay, Bioquímica, Addison-Wesley Pub. Co., (1983). Os efeitos dessas substituições podem ser calculados usando matrizes de escore de substituição como uma PAM-120, PAM-200 e PAM-250, conforme discutido em Altschul, (J. Mol. Biol. 219:555-65, 1991). Outras substituições conservadoras, por exemplo, substituições de regiões inteiras tendo características de hidrofobicidade semelhantes, são bem conhecidas.Variants can encompass conservatively substituted sequences, meaning that a given amino acid residue is replaced with a residue having similar physicochemical characteristics. Examples of conservative substitutions include substituting one aliphatic residue for another, such as Lie, Val, Leu, or Ala for one another, or substitutions of one polar residue for another, such as between Lys and Arg; Glu and Asp; or Gin and Asn. See Zubay, Biochemistry, Addison-Wesley Pub. Co., (1983). The effects of these substitutions can be calculated using substitution score matrices such as PAM-120, PAM-200 and PAM-250, as discussed in Altschul, (J. Mol. Biol. 219:555-65, 1991). Other conservative substitutions, for example, substitutions of entire regions having similar hydrophobicity characteristics, are well known.

Variantes de peptídeo que ocorrem naturalmente também são abrangidos pela invenção. Exemplos dessas variantes são proteínas que resultam de eventos de combinação de mRNA alternativos ou da divisão proteolítica dos polipeptídeos aqui descritos. Variações atribuíveis à proteólise incluem, por exemplo, diferenças nos terminais N ou C mediante a expressão em tipos diferentes de células hospedeiras, devido à remoção proteolítica de um ou mais aminoácidos terminais dos polipeptídeos codificados pelas sequências da invenção.Naturally occurring peptide variants are also encompassed by the invention. Examples of such variants are proteins that result from alternative mRNA splicing events or proteolytic cleavage of the polypeptides described herein. Variations attributable to proteolysis include, for example, differences at the N- or C-terminus upon expression in different types of host cells, due to proteolytic removal of one or more terminal amino acids from the polypeptides encoded by the sequences of the invention.

Variantes dos polipeptídeos da invenção podem ser usadas para obter atividade enzimática elevada ou reduzida desejada, regioquímica ou estereoquímica modificada, ou utilização de substrato alterado ou distribuição de produto. Além disso, variantes podem ser preparadas para ter, no mínimo, uma propriedade modificada, por exemplo, uma afinidade elevada para o substrato, uma especificidade melhorada para a produção de um ou mais compostos desejados, uma distribuição de produto diferente, uma atividade enzimática diferente, um aumento da velocidade da reação enzimática, uma maior atividade ou estabilidade em um meio-ambiente específico (pH, temperatura, solvente, etc.) ou um nível de expressão melhorado em um sistema de expressão desejado. Um mutante direcionado por variante ou local pode ser criado por qualquer método conhecido na técnica. Conforme declarado acima, a invenção fornece polipeptídeos isolados e purificados, recombinantes e não-recombinantes, como a partir da Salvia sclarea. Variantes e derivados de polipeptídeos nativos podem ser obtidos por isolamento das variantes que ocorrem naturalmente ou da sequência de nucleotídeo de variantes, de outras linhagens ou espécies de planta ou as mesmas, ou artificialmente programando mutações de sequências de nucleotídeo que codificam esclareol-sintases naturais. Alterações da sequência de aminoácido nativo podem ser realizadas por qualquer um de diversos métodos convencionais.Variants of the polypeptides of the invention can be used to obtain desired elevated or reduced enzymatic activity, modified regiochemistry or stereochemistry, or altered substrate utilization or product delivery. In addition, variants can be prepared to have at least one modified property, for example, a higher affinity for the substrate, an improved specificity for the production of one or more desired compounds, a different product distribution, a different enzyme activity. , an increase in enzyme reaction rate, greater activity or stability in a specific environment (pH, temperature, solvent, etc.), or an improved expression level in a desired expression system. A variant or site targeted mutant can be created by any method known in the art. As stated above, the invention provides isolated and purified, recombinant and non-recombinant, polypeptides such as from Salvia sclarea. Variants and derivatives of native polypeptides can be obtained by isolating naturally occurring variants or nucleotide sequence variants, from other plant strains or species or the same, or by artificially programming mutations of nucleotide sequences encoding natural sclareol synthases. Alterations to the native amino acid sequence can be performed by any of a number of conventional methods.

Variantes de polipeptídeos, resultantes de uma fusão de sequências de peptídeo adicionais nas extremidades de terminal amino e carboxila dos polipeptídeos da invenção, podem ser usadas para aumentar a expressão dos polipeptídeos, ser úteis na purificação da proteína ou melhorar a atividade enzimática do polipeptídeo em um ambiente ou sistema de expressão desejado. Essas sequências adicionais de peptídeo podem ser peptídeos de sinal, por exemplo. Conformemente, a presente invenção abrange variantes dos polipeptídeos da invenção, como aqueles obtidos por fusão com outros oligo ou polipeptídeos e/ou aqueles que são ligados a peptídeos de sinal.Polypeptide variants, resulting from a fusion of additional peptide sequences at the amino- and carboxyl-terminal ends of the polypeptides of the invention, can be used to enhance expression of the polypeptides, be useful in purifying the protein, or improve the enzymatic activity of the polypeptide in a desired environment or system of expression. Such additional peptide sequences can be signal peptides, for example. Accordingly, the present invention encompasses variants of the polypeptides of the invention, such as those obtained by fusion with other oligo or polypeptides and/or those which are linked to signal peptides.

Portanto, em uma configuração, a presente invenção fornece um método para preparação de um polipeptídeo variante, tendo uma atividade de síntese de esclareol e abrangendo as etapas de: (a) seleção de um ácido nucléico de acordo com qualquer uma das configurações expostas acima; (b) modificação do ácido nucléico selecionado para obter, no mínimo, um ácido nucléico mutante; (c) transformação de células ou organismos unicelulares hospedeiros com a sequência de ácido nucléico mutante para expressar um polipeptídeo codificado pela sequência de ácido nucléico mutante; (d) avaliação do polipeptídeo com relação a, no mínimo, uma propriedade modificada; e, (e) opcionalmente, se o polipeptídeo não tiver atividade de síntese de esclareol variante desejada, repetir as etapas (a) a (d) do processo até um polipeptídeo com uma atividade de síntese de esclareol variante desejada ser obtido; (f) opcionalmente, se um polipeptídeo tendo uma atividade de síntese de esclareol variante desejada tiver sido identificado no etapa d), isolamento do ácido nucléico mutante correspondente obtido na etapa (c).Therefore, in one embodiment, the present invention provides a method for preparing a variant polypeptide having a sclareol synthesizing activity and comprising the steps of: (a) selecting a nucleic acid according to any of the embodiments set forth above; (b) modifying the selected nucleic acid to obtain at least one mutant nucleic acid; (c) transforming host cells or unicellular organisms with the mutant nucleic acid sequence to express a polypeptide encoded by the mutant nucleic acid sequence; (d) evaluating the polypeptide for at least one modified property; and, (e) optionally, if the polypeptide does not have the desired variant sclareol synthesis activity, repeating steps (a) to (d) of the process until a polypeptide having a desired variant sclareol synthesis activity is obtained; (f) optionally, if a polypeptide having a desired variant sclareol synthesis activity has been identified in step d), isolating the corresponding mutant nucleic acid obtained in step (c).

Na etapa (b), uma grande quantidade de sequências de ácido nucléico mutante pode ser criada, por exemplo, por mutagênese randômica, mutagênese específica de local ou reorganização de DNA. Os procedimentos detalhados de reorganização genéticos são encontrados em Stemmer, Reorganização de DNA por fragmentação randômica e remontagem: recombinação in vitro para evolução molecular. Proc Natl Acad Sei U S A., 1994, 91 (22): 10747-1075. Resumindo, Reorganização de DNA refere-se a um processo de recombinação randômica de sequências conhecidas in vitro, envolvendo, no mínimo, dois ácidos nucléicos selecionados para recombinação. Por exemplo, mutações podem ser introduzidas em locais particulares por síntese de oligonucleotídeos contendo uma sequência mutante, flanqueado por locais de restrição que permitem a ligação com fragmentos da sequência nativa. Após a ligação, a sequência reconstruída resultante codifica um análogo que possui a inserção de aminoácido desejada, substituição ou deteção. Alternativamente, procedimentos de mutagênese específicos de local, direcionados por oligonucleotídeo podem ser empregados para fornecer um gene alterado onde códons pré-determinados podem ser alterados por substituição, deleção ou inserção.In step (b), a large amount of mutant nucleic acid sequences can be created, for example, by random mutagenesis, site-specific mutagenesis or DNA shuffling. Detailed genetic reassortment procedures are found in Stemmer, Reassembly of DNA by Random Fragmentation and Reassembly: In Vitro Recombination for Molecular Evolution. Proc Natl Acad Sci USA, 1994, 91(22): 10747-1075. In short, DNA shuffling refers to a process of random recombination of known sequences in vitro, involving at least two nucleic acids selected for recombination. For example, mutations can be introduced at particular sites by synthesizing oligonucleotides containing a mutant sequence, flanked by restriction sites that allow ligation with fragments of the native sequence. After ligation, the resulting reconstructed sequence encodes an analog having the desired amino acid insertion, substitution or detection. Alternatively, site-specific, oligonucleotide-directed mutagenesis procedures can be employed to provide an altered gene where predetermined codons can be altered by substitution, deletion or insertion.

Conformemente, SEQ ID NO:2 ou 93 pode ser recombinada com qualquer outra diterpeno-sintase que codifica ácidos nucléicos, por exemplo, isolados de um organismo diferente de Salvia sclarea. Dessa forma, ácidos nucléicos mutantes podem ser obtidos e separados, os quais podem ser usados para transformar uma célula hospedeira, de acordo com procedimentos padrão, por exemplo, conforme divulgado nos presentes Exemplos.Accordingly, SEQ ID NO:2 or 93 can be recombined with any other diterpene synthase encoding nucleic acids, for example isolated from an organism other than Salvia sclarea. In this way, mutant nucleic acids can be obtained and separated, which can be used to transform a host cell, according to standard procedures, for example, as disclosed in the present Examples.

Na etapa (d), o polipeptídeo obtido na etapa (c) é avaliado com relação a, no mínimo, uma propriedade modificada, por exemplo, uma atividade enzimática modificada desejada. Exemplos de atividades enzimáticas desejadas, para as quais um polipeptídeo expressado pode ser avaliado, incluem atividade enzimática elevada ou reduzida, conforme medido pelo valor KM OU Vmax, regioquímica ou estereoquímica modificada e utilização de substrato alterado ou distribuição de produto. A avaliação da atividade enzimática pode ser realizada de acordo com os procedimentos familiares ao perito e aqueles divulgados nos presentes Exemplos.In step (d), the polypeptide obtained in step (c) is evaluated for at least one modified property, for example, a desired modified enzyme activity. Examples of desired enzyme activities for which an expressed polypeptide can be evaluated include increased or reduced enzyme activity as measured by the KM OR Vmax value, modified regiochemistry or stereochemistry, and altered substrate utilization or product delivery. The evaluation of enzymatic activity can be carried out according to procedures familiar to the person skilled in the art and those disclosed in the present Examples.

A etapa (e) prepara-se para repetição das etapas (a)-(d) do processo, que pode preferivelmente ser realizada em paralelo. Conformemente, através da criação de uma quantidade significativa de ácidos nucléicos mutantes, muitas células hospedeiras podem ser transformadas com diferentes ácidos nucléicos mutantes ao mesmo tempo, permitindo a avaliação subsequente de uma quantidade elevada de polipeptídeos. As chances de obtenção de um polipeptídeo variante desejado podem, dessa forma, ser elevadas a critério do perito.Step (e) prepares for repeating steps (a)-(d) of the process, which can preferably be carried out in parallel. Accordingly, by creating a significant amount of mutant nucleic acids, many host cells can be transformed with different mutant nucleic acids at the same time, allowing the subsequent evaluation of a high amount of polypeptides. The chances of obtaining a desired variant polypeptide can therefore be high at the discretion of the skilled person.

Em uma configuração, a presente invenção fornece um método para preparação de um ácido nucléico que codifica um polipeptídeo variante, tendo uma atividade de síntese de esclareol, o método abrangendo as etapas (a)-(e), divulgadas acima e ainda abrangendo a etapa de:In one embodiment, the present invention provides a method for preparing a nucleic acid encoding a variant polypeptide having a sclareol synthesizing activity, the method comprising steps (a)-(e), disclosed above and further comprising step in:

Todas as publicações mencionadas neste pedido são incorporadas por referência à divulgação e descrevem os métodos e/ou materiais em conexão com o que as publicações são citadas.All publications mentioned in this application are incorporated by reference into the disclosure and describe methods and/or materials in connection with which publications are cited.

Descrição dos desenhosDescription of drawings

Figura 1: Estruturas dos diversos compostos citados na descrição.Figure 1: Structures of the various compounds mentioned in the description.

Figura 2: Biossíntese putativa de esclareol a partir de LPP, que é catalisada pela SsTps1132 (SEQ ID NO:1).Figure 2: Putative biosynthesis of sclareol from LPP, which is catalyzed by SsTps1132 (SEQ ID NO:1).

Figura 3: Alinhamento das sequências de aminoácidos dos fragmentos tipo diterpeno-sintase de classe I com a sequência da estemodeno-sintase de Oriza sativa (No de acesso AAZ76733).Figure 3: Alignment of the amino acid sequences of class I diterpene synthase-like fragments with the sequence of Oriza sativa stemodeno synthase (Accession No. AAZ76733).

Figura 4: Alinhamento da sequência de aminoácido deduzido da SsTps1132 (SEQ ID NO:1) e SsTps1137 (SEQ ID NO:86) com sequências de aminoácido de diterpeno-sintases, selecionadas do banco de dados.Figure 4: Alignment of the deduced amino acid sequence of SsTps1132 (SEQ ID NO:1) and SsTps1137 (SEQ ID NO:86) with amino acid sequences of diterpene synthases selected from the database.

Figura 5: Alinhamento das sequências de aminoácidos de SsTps1132 (SEQ ID NO:1) e 1132-2-5 (SEQ ID NO:96), que foram heterologamente expressadas em E. coli.Figure 5: Alignment of the amino acid sequences of SsTps1132 (SEQ ID NO:1) and 1132-2-5 (SEQ ID NO:96), which were heterologously expressed in E. coli.

Figura 6: Análise de CG dos produtos obtidos após incubação das diferentes proteínas recombinantes 1132 com LPP. Extratos de proteína crua de E. coli expressando as proteínas SsTps1132 e 1132-2-5 recombinantes (SEQ ID NO:1 e 96) foram incubados com LPP em um volume final de 1mL de 50mM de MOPSO, pH 7, suplementado com 15mM de MgCI2 e 1mM de DTT.Figure 6: GC analysis of the products obtained after incubation of the different recombinant 1132 proteins with LPP. Crude protein extracts of E. coli expressing the recombinant SsTps1132 and 1132-2-5 proteins (SEQ ID NO:1 and 96) were incubated with LPP in a final volume of 1mL of 50mM MOPSO, pH 7, supplemented with 15mM of MgCl2 and 1mM DTT.

Figura 7: Análise de CG-MS dos produtos gerados de LPP pela proteína 1132-2-5 recombinante. (A) Cromatograma de íon total dos produtos obtidos da incubação de LPP com um extrato de proteína crua de E. coli, transformado com pET101-1132-2-5 (SEQ ID NO:93). (B) Espectro de massa do pico no tempo de retenção de 14,3. (C) Espectro de massa de um padrão de esclareol autêntico.Figure 7: CG-MS analysis of LPP generated products by recombinant 1132-2-5 protein. (A) Total ion chromatogram of the products obtained from the incubation of LPP with a crude protein extract of E. coli, transformed with pET101-1132-2-5 (SEQ ID NO:93). (B) Mass spectrum of the peak at retention time of 14.3. (C) Mass spectrum of an authentic sclareol standard.

Figura 8: Análise de CG dos produtos obtidos após coincubação de proteínas recombinantes SsTps1132 e 1132-2-5 (SEQ ID NO:1 e 96) com a proteína recombinante SsLPPs3 (SEQ ID NO:24) na presença de GGPP.Figure 8: GC analysis of products obtained after co-incubation of recombinant proteins SsTps1132 and 1132-2-5 (SEQ ID NO:1 and 96) with recombinant protein SsLPPs3 (SEQ ID NO:24) in the presence of GGPP.

Configurações específicas da invenção ou ExemplosInvention Specific Embodiments or Examples

A invenção agora será descrita em detalhes adicionais através dos seguintes Exemplos.The invention will now be described in further detail by way of the following Examples.

Exemplo 1Example 1 Isolamento de LPP-sintase, que codificam DNAs de Salvia sclarea por uma abordagem de PCR.Isolation of LPP-synthase, which encode Salvia sclarea DNAs by a PCR approach. A. Extração de materia de planta e RNA.A. Extraction of plant matter and RNA.

Botões florais em desenvolvimento da Salvia sclarea (1,5 a 2cm de extensão, 1-2 dias de idade) foram coletados nos campos de Bassins (Suíça) e diretamente congelados em nitrogênio líquido.Developing flower buds of Salvia sclarea (1.5 to 2 cm long, 1-2 days old) were collected from the fields of Bassins (Switzerland) and directly frozen in liquid nitrogen.

O RNA total foi extraído usando o Reagente de RNA de Planta Concert™ da Invitrogen (Carlsbad, CA) e o mRNA foi purificado por cromatografia de afinidade de oligodT-celulose, usando o Kit de isolamento de mRNA FasTrack® 2.0 (Invitrogen, Carlsbad, CA), de acordo com as instruções do fabricante. Uma biblioteca de cDNA foi construída usando o Kit de Amplificação de cDNA Marathon™ (Clontech, Mountain View, CA).Total RNA was extracted using Invitrogen Concert™ Plant RNA Reagent (Carlsbad, CA) and mRNA was purified by oligodT-cellulose affinity chromatography using the FasTrack® 2.0 mRNA Isolation Kit (Invitrogen, Carlsbad, CA) CA), according to the manufacturer's instructions. A cDNA library was constructed using the Marathon™ cDNA Amplification Kit (Clontech, Mountain View, CA).

B. Reações em Cadeia da Polimerase para amplificação de cDNAs de diterpeno-sintasesB. Polymerase Chain Reactions for amplification of diterpene synthase cDNAs

PCR foram realizadas usando o primer inverso DT3F (5- GAYRTNGAYGAYACNGCNATGG-3’ (SEQ ID NO:3)) e o primer reverso DT4R (5’- GTYTTNCCNAKCCANACRTCRYYT-3’ (SEQ ID NO:4)). A mistura da PCR continha 0,4μM de cada primer, 300μM de cada dNTPs, 5μL de tampão de polimerase de DNA 10X HotStarTaq® (Qiagen), 2μL de cDNA dissolvida em 100 vezes, 0,5μL de polimerase de DNA HotStarTaq® em um volume final de 50μL. As condições cíclicas foram: 35 ciclos de 45 seg a 94°C, 45 seg a 50°C e 2 min a 72°C; e 10 min a 72°C. Os tamanhos dos produtos de PCR foram avaliados em um gel de agarose a 1%. As fitas correspondentes ao tamanho esperado foram removidas do gel, purificadas usando o Kit de Extração de Gel QIAquick® (Qiagen) e clonadas no vetor pCR®2.1- TOPO, usando o Kit de clonagem TOPO TA (Invitrogen, Carlsbad, CA). Fragmentos de cDNAs inseridos estavam, então, sujeitos à seqüenciamento de DNA e a sequência foi comparada contra o banco de dados de proteína não-redundante GenBlank (NCBI), usando o algoritmo BLASTX (Altschul et al, J. Mol. Biol. 215, 403- 410, 1990). Uma sequência de 354 bp denominada FN23 (SEQ ID NO:5) foi obtida. Esse fragmento de DNA possuía o tamanho esperado e mostrou homologia de sequência para diterpeno-sintases.PCR were performed using the DT3F reverse primer (5-GAYRTNGAYGAYACNGCNATGG-3' (SEQ ID NO:3)) and the DT4R reverse primer (5'-GTYTTNCCNAKCCANACRTCRYYT-3' (SEQ ID NO:4)). The PCR mix contained 0.4μM of each primer, 300μM of each dNTPs, 5μL of 10X HotStarTaq® DNA polymerase buffer (Qiagen), 2μL of cDNA dissolved in 100 fold, 0.5μL of HotStarTaq® DNA polymerase in a final volume of 50μL. The cycling conditions were: 35 cycles of 45 sec at 94°C, 45 sec at 50°C and 2 min at 72°C; and 10 min at 72°C. Sizes of PCR products were evaluated on a 1% agarose gel. Strands corresponding to the expected size were excised from the gel, purified using the QIAquick® Gel Extraction Kit (Qiagen), and cloned into the pCR®2.1-TOPO vector using the TOPO TA Cloning Kit (Invitrogen, Carlsbad, CA). Inserted cDNAs fragments were then subjected to DNA sequencing and the sequence was compared against the GenBlank non-redundant protein database (NCBI) using the BLASTX algorithm (Altschul et al, J. Mol. Biol. 215, 403-410, 1990). A 354 bp sequence called FN23 (SEQ ID NO:5) was obtained. This DNA fragment had the expected size and showed sequence homology to diterpene synthases.

C. Isolamento de cDNA de extensão total por amplificação rápida por extremidades de cDNA (RACE).C. Isolation of full-length cDNA by rapid cDNA end-to-end amplification (RACE).

Oligonucleotídeos específicos para a sequência FN23 (SEQ ID NO:5) foram criados. FN23-F1 (3-GCACGGATACGACGTCGATCCAAATGTAC-5’ (SEQ ID NO:6)), FN23- F2 (3-GGGCTGCTCAACTAAGATTTCCAGGAG-5’ (SEQ ID NO:7)) e FN23-F3 (5’- GGGTGATATCCGACCACTTATTTGATGAG-5’ (SEQ ID NO:8)). Esses primers foram usados em RT-PCR em combinação com primers oligodT, estendidos com uma sequência adaptadora (5’-AATTCGGTACCCGGGATCC(T)I7-3’) (SEQ ID NO:9). A composição da mistura de reação de RT-PCR foi a seguinte: 10μl de tampão de RT-PCR 5X Qiagen OneStep, 400μM cada de dNTP, 400nM de cada primer, 2μl de Mistura Enzimática de RT-PCR Qiagn OneStep, 1μl de Inibidor de Ribonuclease RNasin® (Promega Co., Madisson, Wl) e 1250ng de RNA total em um volume final de 50ml. As condições do termociclador foram: 30 min a 50°C (transcrição reversa); 15 min a 95°C (ativação de polimerase de DNA); 35 ciclos de 45 seg a 94°C, 45 seg a 50°C e 90 seg a 72°C; e 10 min a 72°C. Um segundo ciclo de PCR foi realizado usando os produtos de RT-PCR como template com o primer adapterP (5’- AATTCGGTACCCGGGATCC-3’ (SEQ ID NO: 10)) em combinação com o mesmo ou primers específicos de FN23 abrigados. Essa abordagem de PCR forneceu um fragmento de cDNA 1271 bp (FN30 (SEQ ID NO: 11)) tendo uma sobreposição perfeita de 192 bp com o fragmento FN23 (SEQ ID NO:5) e contendo a extremidade 3', incluindo o códon de interrupção e a sequência sem codificação 3' do cDNA correspondente.Specific oligonucleotides for the FN23 sequence (SEQ ID NO:5) were created. FN23-F1 (3-GCACGGATACGACGTCGATCCAAATGTAC-5' (SEQ ID NO:6)), FN23-F2 (3-GGGCTGCTCAACTAAGATTTCCAGGAG-5' (SEQ ID NO:7)) and FN23-F3 (5'-GGGTGATATCCGACCACTTATTTGATGAG-5' ( SEQ ID NO:8)). These primers were used in RT-PCR in combination with oligodT primers, extended with an adapter sequence (5'-AATTCGGTACCCGGGATCC(T)I7-3') (SEQ ID NO:9). The composition of the RT-PCR reaction mixture was as follows: 10μl Qiagen OneStep 5X RT-PCR Buffer, 400μM each dNTP, 400nM each primer, 2μl Qiagen OneStep RT-PCR Enzyme Mixture, 1μl RNasin® Ribonuclease (Promega Co., Madison, WI) and 1250ng of total RNA in a final volume of 50ml. The thermocycler conditions were: 30 min at 50°C (reverse transcription); 15 min at 95°C (DNA polymerase activation); 35 cycles of 45 sec at 94°C, 45 sec at 50°C and 90 sec at 72°C; and 10 min at 72°C. A second round of PCR was performed using the RT-PCR products as a template with the primer adapterP (5'- AATTCGGTACCCGGGATCC-3' (SEQ ID NO: 10)) in combination with the same or FN23-specific primers harbored. This PCR approach yielded a 1271 bp cDNA fragment (FN30 (SEQ ID NO: 11)) having a perfect 192 bp overlap with the FN23 fragment (SEQ ID NO:5) and containing the 3' end, including the codon of interruption and the 3' uncoding sequence of the corresponding cDNA.

Para amplificação da extremidade 5’ do cDNA, oligonucleotídeos anti-sense, específicos para FN23 foram criados: FN23-R1 (5- CATGGCATCTTCAACCCCAGCTTTATCTCATC-3’ (SEQ ID NO: 12)), FN23-R2 (5- GTGGTCGGATATCACCCATCTTTCTTGAAGTCG-3’ (SEQ ID NO:13)), FN23-R3 (5-CATTGGAGATGCAGACTCGACCGATTGACC-3’ (SEQ ID NO: 14)). Esses primers foram usados para RACE de 5’, usando a biblioteca de cDNA de S. sclarea, após o protocolo de Kit de Amplificação de cDNA Marathon™ (Clontech, Mountain View, CA). As condições cíclicas térmicas foram as seguintes: 1 min a 94°C, 5 ciclos de 30 seg a 94°C e 4 min a 72°C, 5 ciclos de 30 seg a 94°C e 4 min a 70°C, 20 ciclos de 30 seg a 94°C e 4 min a 68°C. Essa RACE de 5’ forneceu um fragmento de cDNA 1449 bp (FN40 (SEQ ID NO:15) tendo uma sobreposição perfeita de 227 bp com FN23 (SEQ ID NO:5). Comparação com sequências de diterpeno-sintases conhecidas revelou que o fragmento FN40 (SEQ ID NO: 15) continha o códon de iniciação de tradução e uma região sem codificação de 87 bp. A montagem dos três fragmentos de cDNA (FN23, FN30 e FN40 (SEQ ID NO:5, 11 e 15) forneceu uma sequência de cDNA de extensão total (SaTpsl) de 2655 bp (SEQ ID NO: 16) com uma estrutura de leitura aberta de codificação de 2355 bp para uma proteína de resíduos 785 (SEQ ID NO: 17).For amplification of the 5' end of the cDNA, antisense oligonucleotides, specific for FN23 were created: FN23-R1 (5-CATGGCATCTTCAACCCCAGCTTTATCTCATC-3' (SEQ ID NO: 12)), FN23-R2 (5- GTGGTCGGATATCACCCATTCTTTCTTGAAGTCG-3' ( SEQ ID NO:13)), FN23-R3 (5-CATTGGAGATGCAGACTCGACCGATTGACC-3' (SEQ ID NO:14)). These primers were used for 5' RACE using the S. sclarea cDNA library following the Marathon™ cDNA Amplification Kit protocol (Clontech, Mountain View, CA). The thermal cycling conditions were as follows: 1 min at 94°C, 5 cycles of 30 sec at 94°C and 4 min at 72°C, 5 cycles of 30 sec at 94°C and 4 min at 70°C, 20 cycles of 30 sec at 94°C and 4 min at 68°C. This 5' RACE yielded a 1449 bp cDNA fragment (FN40 (SEQ ID NO:15) having a perfect 227 bp overlap with FN23 (SEQ ID NO:5). Comparison with known diterpene synthase sequences revealed that the fragment FN40 (SEQ ID NO: 15) contained the translation initiation codon and an 87 bp clear region. Assembly of the three cDNA fragments (FN23, FN30 and FN40 (SEQ ID NO: 5, 11 and 15) provided a full length cDNA sequence (SaTpsl) of 2655 bp (SEQ ID NO: 16) with an open reading frame of 2355 bp coding for a protein of residues 785 (SEQ ID NO: 17).

Exemplo 2Example 2 Expressão heteróloqa da LLP-sintase de S. sclarea na E. coíi.Heterologous expression of S. sclarea LLP synthase in E. coli.

O pETDuet-1 (Novagen, Madison, Wl), criado para expressão sob o controle de um promoter T7, foi usado para expressão em células de E. coli. Para construir o plasmídeo de expressão, a estrutura de leitura aberta de SaTps 1 (SEQ ID NO:16) foi amplificada por PCR da biblioteca de cDNA com os primers inverso e reverso SaTps-Nde (3 - TACTGACATATGACTTCTGTAAATTTGAGCAGAGCACC-5’ (SEQ ID NO: 18)) e SaTps-Kpn (3’- TTGGTACCTCATACAACCGGTCGAAAGAGTACTTTG-5’ (SEQ ID NO: 19)), criados para introduzir um local de Ndel imediatamente antes do códon de início e um local de Kpnl após o códon de interrupção. Já que a estrutura de leitura aberta com um local Ndel na posição de 1614 da estrutura de leitura aberta, essa amplificação foi realizada em duas etapas por PCR de extensão de sobreposição (Horton et al, Gene 77, 61-68, 1989), usando os primers SaTps-Nde (SEQ ID NO:18) e SaTps-Kpn (SEQ ID NO:19) em combinação com os primers Satps-mutlf (5- GTTGGAGTGGATCCACATGCAGGAATGGTAC-3’ (SEQ ID NO:20)) e Satps-mutlr (3’- GTACCATTCCTGCATCTGGATCCACTCCAAC-5’ (SEQ ID NO:21)), criados para remover o local Ndel sem alterar a sequência de aminoácido. O cDNA resultante foi primeiramente ligado no plasmídeo PCR2.1-Topo usando o Kit de Clonagem TOPO TA (Invitrogen, Carlsbad, CA) e as sequências das inserções foram verificadas antes da subclonagem como fragmento Ndel-Kpnl no vetor pETDuet-1.pETDuet-1 (Novagen, Madison, WI), engineered for expression under the control of a T7 promoter, was used for expression in E. coli cells. To construct the expression plasmid, the open reading frame of SaTps 1 (SEQ ID NO:16) was PCR amplified from the cDNA library with the reverse and reverse primers SaTps-Nde (3 - TACTGACATATGACTTCTGTAAATTTGAGCAGAGCACC-5' (SEQ ID NO : 18)) and SaTps-Kpn (3'-TTGGTACCTCATACAACCGGTCGAAAGAGTACTTTG-5' (SEQ ID NO: 19)), designed to introduce an NdeI site immediately before the start codon and a KpnI site after the stop codon. Since the open reading frame has an Ndel site at position 1614 of the open reading frame, this amplification was performed in two steps by overlap extension PCR (Horton et al, Gene 77, 61-68, 1989), using the SaTps-Nde (SEQ ID NO:18) and SaTps-Kpn (SEQ ID NO:19) primers in combination with the Satps-mutlf (5-GTTGGAGTGGATCCACATCCAGGAATGGTAC-3' (SEQ ID NO:20)) and Satps-mutlr primers (3'-GTACCATTCCTGCATCTGGATCCACTCCAAC-5' (SEQ ID NO:21)), designed to remove the Ndel site without changing the amino acid sequence. The resulting cDNA was first ligated into the PCR2.1-Topo plasmid using the TOPO TA Cloning Kit (Invitrogen, Carlsbad, CA) and the sequences of the inserts were verified prior to subcloning as an Ndel-KpnI fragment into the pETDuet-1 vector.

Análise da sequência de diversos clones obtidos por amplificação da biblioteca de cDNA com os primers específicos SaTpsl mostrou alguma variabilidade em diversas posições da sequência de cDNA. Sete posições foram identificadas, nas quais dois aminoácidos diferentes podem ser encontrados. Uma posição foi encontrada, onde inserção de um resíduo de serina ocorreu em alguns dos clones. Essas posições são listadas na tabela abaixo. Sequence analysis of several clones obtained by amplification of the cDNA library with the SaTpsl specific primers showed some variability at several positions in the cDNA sequence. Seven positions have been identified where two different amino acids can be found. A position was found where insertion of a serine residue occurred in some of the clones. These positions are listed in the table below.

Essas variações pareceram ocorrer em uma maneira randômica em onze clones diferentes seqüenciados, sugerindo que, no mínimo, duas isoformas relacionadas bem de perto de uma diterpeno-sintase estão presentes no genoma da S. sclarea e que a abordagem de amplificação de PCR levou à mistura das sequências. Dois clones, SsLPPs3 (SEQ ID NO:22) e SsLPPs9 (SEQ ID NO:23), representantes da variabilidade das sequências, foram selecionados para experimentos de expressão heteróloga e caracterização enzimática.These variations appeared to occur in a random fashion across eleven different sequenced clones, suggesting that at least two closely related isoforms of a diterpene synthase are present in the S. sclarea genome and that the PCR amplification approach led to the mixing. of the sequences. Two clones, SsLPPs3 (SEQ ID NO:22) and SsLPPs9 (SEQ ID NO:23), representing sequence variability, were selected for heterologous expression and enzyme characterization experiments.

Os plasmídeos pETDuet-SsLPPs3 e pETDuet-SsLPPs9 foram transferidos para células de E. Coli BI21 (DE3) (Novagen, Madison, Wl). Colônias simples de células transformadas foram usadas para inocular 5ml de meio LB. Após 5 a 6 horas de incubação a 37°C, as culturas foram transferidas para uma incubadora a 20°C e deixadas 1 hora para equilíbrio. A expressão da proteína foi, então, induzida pela adição de 1mM de IPTG e a cultura foi incubada durante a noite a 20°C. O dia seguinte, as células foram coletadas por centrifugação, suspensas novamente em volume a 0,1 de 50mM de MOPSO, pH 7, 10% de glicerol e lisados por sonicação. Os extratos foram limpos por centrifugação (30 min a 20.000g) e os sobrenadantes contendo as proteínas solúveis foram usados para experimentos adicionais. Os extratos de proteína crua de células transformadas de pETDuet-SsLPPs3 e pETDuet-SsLPPs9 foram analisados por SDS-PAGE e comparados com extratos de proteína, obtidos das células transformadas com o plasmídeo pETDuet vazio. As proteínas SsLPPs3 e SsLPPs9 recombinantes (SEQ ID NO:24 e 25) foram claramente detectadas e o peso molecular aparente estimada a 90 Kda, um valor em conformidade com o peso molecular calculado de 83 KDa.Plasmids pETDuet-SsLPPs3 and pETDuet-SsLPPs9 were transferred into E. coli BI21 (DE3) cells (Novagen, Madison, WI). Single colonies of transformed cells were used to inoculate 5ml of LB medium. After 5 to 6 hours of incubation at 37°C, the cultures were transferred to a 20°C incubator and allowed to equilibrate for 1 hour. Protein expression was then induced by the addition of 1mM IPTG and the culture was incubated overnight at 20°C. The following day, cells were collected by centrifugation, resuspended in 0.1 volume of 50mM MOPSO, pH 7, 10% glycerol and lysed by sonication. Extracts were cleared by centrifugation (30 min at 20,000g) and supernatants containing soluble proteins were used for further experiments. Crude protein extracts from pETDuet-SsLPPs3 and pETDuet-SsLPPs9 transformed cells were analyzed by SDS-PAGE and compared with protein extracts obtained from cells transformed with the empty pETDuet plasmid. Recombinant SsLPPs3 and SsLPPs9 proteins (SEQ ID NO:24 and 25) were clearly detected and the apparent molecular weight estimated at 90 KDa, a value in agreement with the calculated molecular weight of 83 KDa.

Exemplo 3Example 3 Purificação da LPP-sintase da Salvia sclarea e atividades enzimáticasPurification of Salvia sclarea LPP synthase and enzymatic activities

Os plasmídeos PCR2.1-Topo contendo o cDNA de SsLPPs3 e SsLPPs9 (SEQ ID NO:22 e 23) (Exemplo 2) foram digeridos com Ndel e Saci e as inserções foram ligadas no plasmídeo pET28a(+) (Novagen). Os plasmídeos de expressão resultantes (pET28-SsLPPs3 e pET28-SsLPPs9) contem os cDNAs com uma modificação da extremidade 5’, criados para expressar as proteínas com uma cauda de hexa-histidina de terminal N (His-cauda). A purificação foi realizada sob condições nativas usando o Sistema de Purificação ProBond™ (Invitrogen), seguindo o protocolo do fabricante, com exceção de que, para a eluição, imidazol foi substituído pela L-histidina para minimizar a inibição da enzima. Usando essa abordagem, as enzimas recombinantes SsLPPs3 e SsLPPs9 “His-cauda” (SEQ ID NO:97 e 98) poderiam ser purificadas para homogeneidade aparente.Plasmids PCR2.1-Topo containing the cDNA of SsLPPs3 and SsLPPs9 (SEQ ID NO:22 and 23) (Example 2) were digested with NdeI and SacI and the inserts were ligated into plasmid pET28a(+) (Novagen). The resulting expression plasmids (pET28-SsLPPs3 and pET28-SsLPPs9) contain the cDNAs with a 5'-end modification, created to express the proteins with an N-terminal hexahistidine tag (His-tail). Purification was performed under native conditions using the ProBond™ Purification System (Invitrogen), following the manufacturer's protocol, except that for the elution, imidazole was substituted for L-histidine to minimize enzyme inhibition. Using this approach, the recombinant enzymes SsLPPs3 and SsLPPs9 "His-tail" (SEQ ID NO:97 and 98) could be purified to apparent homogeneity.

As enzimas purificadas de afinidade foram incubadas 12 horas a 30°C com 200μM de GGPP e 1mM de DTT em MOPSO, pH 7, 10% de glicerol, 1mM de DTT. Nenhum produto de diterpeno foi observado ao extrair o meio de incubação com pentano e análise do extrato por CG ou CG-MS. O tratamento do mesmo extrato por fosfatase alcalina (Sigma, 6 unidades/ml), seguido por extração com pentano e análise de CG, mostrou a formação de labdenediol e demonstrou a formação enzimática de labdenediol-difosfato (LPP) como produto único da GGPP pela diterpeno-sintase recombinante.Affinity purified enzymes were incubated 12 hours at 30°C with 200μM GGPP and 1mM DTT in MOPSO, pH 7, 10% glycerol, 1mM DTT. No diterpene products were observed when extracting the incubation medium with pentane and analyzing the extract by GC or GC-MS. Treatment of the same extract by alkaline phosphatase (Sigma, 6 units/ml), followed by pentane extraction and GC analysis, showed the formation of labdenediol and demonstrated the enzymatic formation of labdenediol diphosphate (LPP) as the sole product of GGPP by recombinant diterpene synthase.

A análise de CG foi realizada em um sistema de CG Agilent Série 6890, equipado com um detector de ionização de chama, usando um diâmetro interno de 0,25mm por coluna capilar SPB-1 de 30mm (Supelco, Bellefonte, PA). O gás carregador foi He em um fluxo constante de 1,5mL/min. A temperatura inicial da estufa foi de 100°C (1 mim de suspensão), seguida por um gradiente de 10°C/min a 300°C. A análise de CG-MS foi realizada nas mesmas condições e os espectros foram registrados em um detector de massa Agilent 5975.GC analysis was performed on an Agilent Series 6890 GC system, equipped with a flame ionization detector, using a 0.25mm ID per 30mm SPB-1 capillary column (Supelco, Bellefonte, PA). The carrier gas was He at a constant flow rate of 1.5mL/min. The initial oven temperature was 100°C (1 min of suspension), followed by a gradient of 10°C/min to 300°C. GC-MS analysis was performed under the same conditions and spectra were recorded on an Agilent 5975 mass detector.

Exemplo 4Example 4 Abordagem de PCR para a clonagem de homologia de diterpeno-sintases de classe I (esclareol-sintase) de S, sclarea.PCR approach for homology cloning of class I diterpene synthases (sclareol synthase) from S, sclarea.

A clonagem e a caracterização de SsLPPs3 (SEQ ID NO:24) e SsLPPs9 (SEQ ID NO:25), nos Exemplos 1 a 3, sugerem que a biossíntese de esclareol na S. sclarea envolve duas proteínas, a SsLPPs e uma diterpeno-sintase de classe I, a esclareol- sintase, catalisando a conversão de LPP a esclareol.The cloning and characterization of SsLPPs3 (SEQ ID NO:24) and SsLPPs9 (SEQ ID NO:25) in Examples 1 to 3 suggest that sclareol biosynthesis in S. sclarea involves two proteins, SsLPPs and a diterpene- class I synthase, sclareol synthase, catalyzing the conversion of LPP to sclareol.

Uma abordagem de PCR foi usada em uma primeira tentativa para o isolamento das sequências de cDNA das diterpeno-sintases de classe I. Oligonucleotídeos foram criados, com base nas sequências convertidas em diterpeno-sintases de planta e especialmente em diterpeno-sintases que catalisam a ciclização de C2o-disfosfato ésteres através de um mecanismo de ionização. As sequênicas com números de acesso BAB19275, AAB39482, AAD30231, AAD34295, CAE05201, BAB12441, AAT49066, CAE05199, AAU05906, BAD17672, AAQ72565, AAL09965, AAK83563, AAS47691, AAS47690 e AAR13860 foram selecionadas dos bancos de dados públicos de sequência (http://www.ncbi.nlm.nih.gov). Todas essas sequências de proteína correspondem às diterpeno-sintases de classe I e contem o motivo DDxxD (onde x representa qualquer aminoácido), característico do mecanismo de ciclização dependente da ionização em terpeno-sintases. A partir do alinhamento dessas sequências, dois motivos conservados foram primeiramente selecionados na região do terminal N, usados para a criação dos oligonucleotídeos sense. YDT(A/S)WVA e (D/N)GSWG. Na sequência de aminoácido da SsLPPs (SEQ ID NO: 24 e 25, Exemplos 1 a 3), esses dois motivos também foram conservados, embora com algumas diferenças para o primeiro motivo (YDTAVIA). Dessa forma, a sequência de SsLPPs também foi levada em considerada para a criação dos oligonucleotídeos sense. A partir do primeiro motivo, três oligonucleotídeos foram criados para cobrir todas as variações de sequências: DiTpsTB_F1, 5’-TATGATACNGCNGTNATDGC- 3’ (SEQ ID NO:26); DiTpsTB_F2, 5’-TATGACACGGCAGTGATCGC-3’ (SEQ ID NO:27); DiTpsTB_F3, 3’-TATGACACGGCAKKGRTNGC-5’ (SEQ ID NO:28). A partir do seguindo motivo, dois oligonucleotídeos foram criados: DiTpsTB_F4, 5’- CAACTGGCTGATGGNTCNTGGGG-3’ (SEQ ID NO:29) ; DiTpsTB_F5, 5- CAACTGGCTGATGGCTCATGGGG-3’ (SEQ ID NQ:30). O motivo DDxxD, localizado na região do terminal C das proteínas e envolvido na ligação da metade do difosfato no local ativo, foi usado para criar dois oligonucleotídeos anti-sense. DiTpsTB_R1, 5’-GATCCTCCAACRTCRWARARRTCRTC-3’ (SEQ ID NO:31), DiTpsTB_R2, 5’-GATCCTCCACGTCGWAGAAGTCGTC-3’ (SEQ ID NO:32).A PCR approach was used in a first attempt to isolate the cDNA sequences of class I diterpene synthases. Oligonucleotides were created, based on the sequences converted in plant diterpene synthases and especially in diterpene synthases that catalyze the cyclization of C2o-diphosphate esters through an ionization mechanism. The sequences with accession numbers BAB19275, AAB39482, AAD30231, AAD34295, CAE05201, BAB12441, AAT49066, CAE05199, AAU05906, BAD17672, AAQ72565, AAL09965, AAK83563, AAS47691 , AAS47690 and AAR13860 were selected from public sequence databases (http:// /www.ncbi.nlm.nih.gov). All of these protein sequences correspond to class I diterpene synthases and contain the DDxxD motif (where x represents any amino acid), characteristic of the ionization-dependent cyclization mechanism in terpene synthases. From the alignment of these sequences, two conserved motifs were first selected in the N-terminal region, used for the creation of sense oligonucleotides. YDT(A/S)WVA and (D/N)GSWG. In the amino acid sequence of SsLPPs (SEQ ID NO: 24 and 25, Examples 1 to 3), these two motifs were also conserved, although with some differences for the first motif (YDTAVIA). Thus, the sequence of SsLPPs was also taken into account for the creation of sense oligonucleotides. From the first motif, three oligonucleotides were created to cover all sequence variations: DiTpsTB_F1, 5'-TATGATACNGCNGTNATDGC-3' (SEQ ID NO:26); DiTpsTB_F2, 5'-TATGACACGGCAGTGATGCC-3' (SEQ ID NO:27); DiTpsTB_F3, 3'-TATGACACGGCAKKGRTNGC-5' (SEQ ID NO:28). From the following motif, two oligonucleotides were created: DiTpsTB_F4, 5'-CAACTGGCTGATGGNTCNTGGGG-3' (SEQ ID NO:29); DiTpsTB_F5, 5-CAACTGGCTGATGGCTCATGGGG-3' (SEQ ID NO:30). The DDxxD motif, located in the C-terminal region of the proteins and involved in binding the diphosphate moiety at the active site, was used to create two antisense oligonucleotides. DiTpsTB_R1, 5'-GATCCTCCAACRTCRWARARRTCRTC-3' (SEQ ID NO:31), DiTpsTB_R2, 5'-GATCCCTCCACGTCGWAGAAGTCGTC-3' (SEQ ID NO:32).

Esses primers foram usados para amplificação de PCR de uma biblioteca de cDNA da Salvia sclarea (preparada conforme descrito no Exemplo 1). As PCRs foram realizadas usando a Mistura de Polimerase Advantage® 2 (Clontech). Cada mistura de PCR continha, no volume total de 50μL, 5μL de Tampão de PCR Advantage® 2, 200μM de dNTPs, 200nM de cada primer de oligonucleotideo, 5μL de cDNA diluído em 20 vezes, 1 μl_ de Mistura de Polimerase Advantage®. As seguintes condições foram usadas para as amplificações: 3 minutos de desnaturação a 94°C; 15 ciclos de 1 minuto de desnaturação a 94°C, 1 min de recozimento a 65°C para o primeiro ciclo e menos um grau para cada ciclo seguinte e extensão de 2 minutos a 72°C; 20 ciclos de 1 minuto de desnaturação a 94°C, 1 min de recozimento a 58°C e extensão de 2 minutos a 72°C; e finalmente extensão de 10 minutos a 72°C. PCRs diferentes foram realizadas com as possíveis combinações de oligonucleotídeos sense e anti-sense. As amplicons foram analisadas com relação aos tamanhos esperados e para homologia de sequência para diterpeno-sintases. Infelizmente, usando essa abordagem de PCR, nenhuma sequência relacionada com diterpeno pôde ser obtida.These primers were used for PCR amplification of a Salvia sclarea cDNA library (prepared as described in Example 1). PCRs were performed using Advantage® 2 Polymerase Mixture (Clontech). Each PCR mix contained, in a total volume of 50μL, 5μL of PCR Buffer Advantage® 2, 200μM of dNTPs, 200nM of each oligonucleotide primer, 5μL of cDNA diluted 20 times, 1 μl_ of Advantage Polymerase Mixture®. The following conditions were used for amplifications: 3 minutes of denaturation at 94°C; 15 cycles of 1 minute of denaturation at 94°C, 1 min of annealing at 65°C for the first cycle and minus one degree for each subsequent cycle and extension of 2 minutes at 72°C; 20 cycles of 1 minute of denaturation at 94°C, 1 min of annealing at 58°C and extension of 2 minutes at 72°C; and finally extension for 10 minutes at 72°C. Different PCRs were performed with possible combinations of sense and antisense oligonucleotides. The amplicons were analyzed for expected sizes and for sequence homology to diterpene synthases. Unfortunately, using this PCR approach, no diterpene-related sequence could be obtained.

Exemplo 5Example 5 Seqüenciamento massivamente paralelo de uma biblioteca de cDNA da flor S.sclarea.Massively parallel sequencing of a cDNA library from the S.sclarea flower.

Já que a abordagem de clonagem à base de homologia clássica não teve sucesso na clonagem de diterpeno-sintase de classe I da S. sclarea, asseguramos usar uma abordagem com base no seqüenciamento global da biblioteca de cDNA. Usamos a tecnologia de seqüenciamento paralelo massivo de pequenos fragmentos de DNA, desenvolvida pela Illumina (San Diego, Califórnia) para obter informações de sequência de todas as transcrições (transcriptoma) presentes nas flores Salvia sclarea. Essa técnica de seqüenciamento usa uma química de seqüenciamento com base no terminador reversível e os aparatos de Estação de Aglomerado e Seqüenciador de Genoma, desenvolvidos pela Solexa e Illumina (www.illumina.com).Since the classical homology-based cloning approach was unsuccessful in cloning class I diterpene synthase from S. sclarea, we assured to use an approach based on global sequencing of the cDNA library. We used the massively parallel sequencing technology of small DNA fragments, developed by Illumina (San Diego, California) to obtain sequence information of all transcripts (transcriptome) present in Salvia sclarea flowers. This sequencing technique uses reversible terminator-based sequencing chemistry and the Cluster Station and Genome Sequencer apparatus developed by Solexa and Illumina (www.illumina.com).

A tecnologia e os equipamentos foram preparados na Fastens SA (Genebra, Suíça) e a preparação das amostras de DNA e o sequenciamento foram realizados pela Fastens SA. Uma alíquota (1 μg) da biblioteca de cDNA, gerada das flores S. sclarea em desenvolvimento e usando o Kit de Amplificação de cDNA Marathon™ (Clontech, Mountain View, CA) (Exemplo 1), foi tratada usando o Kit de Preparação de Amostra Genômica (Illumina). Brevemente, o DNA é fragmentado por nebulização, as extremidades são reparadas para gerar extremidades firmes, adaptadores são ligados às extremidades dos fragmentos de DNA e os fragmentos de DNA modificados por adaptator são amplificados por PCR. Após controlar a qualidade da biblioteca por eletroforese por gel, a geração dos aglomerados de DNA sobre a célula de fluxo e a reação de sequenciamento é realizada nos equipamentos de Estação de Aglomerado e Seqüenciador de Genoma. Usando essa tecnologia, 1,9 milhão de curtas sequências (leituras) de 35 bases foram obtidas.Technology and equipment were prepared at Fastens SA (Geneva, Switzerland) and DNA sample preparation and sequencing were performed by Fastens SA. An aliquot (1 µg) of the cDNA library, generated from developing S. sclarea flowers and using the Marathon™ cDNA Amplification Kit (Clontech, Mountain View, CA) (Example 1), was treated using the Marathon™ cDNA Amplification Kit (Example 1). Genomic Sample (Illumina). Briefly, the DNA is fragmented by spraying, the ends are repaired to generate tight ends, adapters are ligated to the ends of the DNA fragments, and the adaptor-modified DNA fragments are amplified by PCR. After controlling the quality of the library by gel electrophoresis, the generation of DNA clusters on the flow cell and the sequencing reaction is carried out in the Cluster Station and Genome Sequencer equipment. Using this technology, 1.9 million short sequences (reads) of 35 bases were obtained.

O software Edena (Dr David Hernandez, Laboratório de Pesquisa Genômica, University of Geneva Hospitals, Genebra, Suíça) foi usado para remontar sequências contíguas. As cinco últimas bases foram primeiramente removidas de cada leitura devido às possíveis incorporações erradas, devido à baixa fidelidade nos últimos ciclos do procedimento de sequenciamento. Os parâmetros do software foram estabelecidos para permitir a extensão mínima de 15 bases para as sobreposições com identificação estrita (100%). As contigs (sequências contíguas) com uma extensão de, no mínimo, 50 bases foram retidas. Nessas condições, 2054 contigs de 50 a 1330 bases em extensão poderiam ser reconstituídas.Edena software (Dr David Hernandez, Genomic Research Laboratory, University of Geneva Hospitals, Geneva, Switzerland) was used to reassemble contiguous sequences. The last five bases were first removed from each read due to possible wrong incorporations due to low fidelity in the last cycles of the sequencing procedure. The software parameters were set to allow a minimum length of 15 bases for overlays with strict identification (100%). Contigs (contiguous sequences) with a length of at least 50 bases were retained. Under these conditions, 2054 contigs from 50 to 1330 bases in length could be reconstituted.

Para avaliar a qualidade da montagem, as contigs foram pesquisadas com relação à identificação de sequência com a sequência de DNA de SsLPPs, as diterpeno- sintases de classe II, primeiramente isoladas da biblioteca de cDNA de S. sclarea (SsLPPs3 (SEQ ID NO:22), Exemplo 2). Essa pesquisa foi realizada usando o método de BLASTn (Altschul et al, J. Mol. Biol. 215, 403-410, 1990). De forma surpreendente, apenas 3 contigs de extensões de 81, 73 e 52 bases foram encontradas e apenas quarenta leituras foram usadas pelo software Eland para gerar essas contigs. O alinhamento com a sequência de referência SsLPPs3 mostrou que as 3 contigs (SEQ ID NO:33 a 35) cobriram apenas 8,7% da sequência de extensão total, embora com uma identificação de 99%.To assess assembly quality, contigs were searched for sequence identification with the DNA sequence of SsLPPs, the class II diterpene synthases, first isolated from the S. sclarea cDNA library (SsLPPs3 (SEQ ID NO: 22), Example 2). This search was performed using the BLASTn method (Altschul et al, J. Mol. Biol. 215, 403-410, 1990). Surprisingly, only 3 contigs of lengths of 81, 73 and 52 bases were found and only forty reads were used by the Eland software to generate these contigs. Alignment with the SsLPPs3 reference sequence showed that the 3 contigs (SEQ ID NO:33 to 35) covered only 8.7% of the full-length sequence, albeit with a 99% identification.

Informações de sequência muito limitadas foram relatadas nos bancos de dados públicos para Salvia sclarea. A única sequência genética disponível do banco de dados NCBI (http://www.ncbi.nlm.nih.qov) foi a sequência da grande subunidade da ribulose-1,5-bifosfato carboxilase (RuBisCO) da Salvia sclarea (N2 de acesso NCBI Z37450). A pesquisa das contigs com relação à identificação de DNA com essa sequência de DNA de RuBisCO de S. sclarea (Pesquisa de BLASTn) forneceu duas contigs de 870 e 547 bases, respectivamente (SEQ ID NO:36 e 37). O alinhamento das duas contigs com a sequência de RuBisCO mostrou cobertura de 98%: apenas 27 bases (entre a posição 858 e 884) das 1420 bases não estavam presentes nas contigs. Além dessa cobertura quase completa, a identificação entre a sequência de referência e as contigs foi de 99,5%, representando uma diferença de apenas 7 nucleotídeos.Very limited sequence information has been reported in public databases for Salvia sclarea. The only genetic sequence available from the NCBI database (http://www.ncbi.nlm.nih.qov) was the large subunit sequence of ribulose-1,5-bisphosphate carboxylase (RuBisCO) from Salvia sclarea (Access No. NCBI Z37450). Searching the contigs for DNA identification with this S. sclarea RuBisCO DNA sequence (BLASTn Search) yielded two contigs of 870 and 547 bases, respectively (SEQ ID NO:36 and 37). Alignment of the two contigs with the RuBisCO sequence showed 98% coverage: only 27 bases (between position 858 and 884) out of the 1420 bases were not present in the contigs. In addition to this almost complete coverage, the identification between the reference sequence and the contigs was 99.5%, representing a difference of only 7 nucleotides.

Todas as leituras (dados não-montados) foram, então, pesquisadas com relação à identificação de sequência com a sequência de SsLPPs3 (SEQ ID NO:22). O software Eland (Illumina) foi usado para realizar essa pesquisa, permitindo um máximo de 2 divergências com a sequência de referência. Um total de 616 leituras foi recuperado. O alinhamento dos fragmentos selecionados com a sequência de referência revelou que a sequência de SsLPPs3 (SEQ ID NO:22) foi coberta na extensão total com uma cobertura levemente maior (mais leituras) em direção da extremidade 3’. A mesma manipulação com a sequência de RuBisCO mostrou que 1650 leituras foram obtidas para essa sequência. A cobertura da sequência de referência com as leituras foi muito maior para a RuBisCO do que para a SsLPPs3 (SEQ ID NO:22). Para SsLPPs3 (SEQ ID NO:22), diversas regiões pequenas sem cobertura e regiões com ambiguidade de sequência entre leituras foram encontradas. Essa cobertura incompleta impede a remontagem completa e é certamente a razão para a geração de apenas algumas contigs muito pequenas.All reads (unassembled data) were then queried for sequence identification with the SsLPPs3 sequence (SEQ ID NO:22). Eland software (Illumina) was used to perform this search, allowing a maximum of 2 divergences from the reference sequence. A total of 616 readings were retrieved. Alignment of the selected fragments with the reference sequence revealed that the SsLPPs3 sequence (SEQ ID NO:22) was covered in full length with slightly greater coverage (more reads) towards the 3' end. The same manipulation with the RuBisCO sequence showed that 1650 reads were obtained for this sequence. Coverage of the reference sequence with the reads was much greater for RuBisCO than for SsLPPs3 (SEQ ID NO:22). For SsLPPs3 (SEQ ID NO:22), several small gap regions and regions with sequence ambiguity between reads were found. This incomplete coverage prevents complete reassembly and is certainly the reason for generating only a few very small contigs.

A quantidade de leituras obtidas para um dado cDNA é proporcional à abundância de seu cDNA. Dessa forma, abundâncias relativas podem ser estimadas pela divisão da quantidade de leituras obtidas para os dados cDNAs por suas extensões totais. Realizando-se esse cálculo para a RuBisCO e SsLPPs3 (SEQ ID NO:22), forneceu- se valores de 1160 e 260 leituras/Kb, respectivamente, refletindo uma abundância maior de 4,5 do cDNA de RuBisCO, relativa aos cDNAs de SsLPPs. A RuBisCO é uma enzima envolvida no metabolismo primário de plantas e na catalisação da fixação do carbono no ciclo de Calvin. As abundâncias relativas maiores da RuBisCO refletem uma maior representação de genes, envolvidos nos metabolismos primários, em comparação com o gene envolvido no metabolismo secundário, como síntese de diterpeno. Análise de pesquisa de BLAST com as contigs mostrou que outras enzimas dos ciclos de Calvin (por exemplo, fosfoglicerato quinase, gliceraldeído 3-fosfato desidrogenase, triosefosfato isomerase) e metabolismo primário também foram abundantemente representados na biblioteca de cDNA usada no presente. Dessa forma, a codificação de cDNA das enzimas envolvidas no metabolismo secundário e, particularmente, na biossíntese de diterpeno foram em abundância muito baixa para obter uma cobertura suficiente e remontagem completa.The amount of reads obtained for a given cDNA is proportional to the abundance of its cDNA. Thus, relative abundances can be estimated by dividing the amount of reads obtained for the cDNAs data by their total lengths. Performing this calculation for RuBisCO and SsLPPs3 (SEQ ID NO:22), provided values of 1160 and 260 reads/Kb, respectively, reflecting an abundance greater than 4.5 of the RuBisCO cDNA relative to the SsLPPs cDNAs . RuBisCO is an enzyme involved in primary metabolism in plants and in catalyzing carbon fixation in the Calvin cycle. The higher relative abundances of RuBisCO reflect a greater representation of genes involved in primary metabolisms compared to the gene involved in secondary metabolism such as diterpene synthesis. BLAST search analysis with the contigs showed that other Calvin cycle enzymes (eg, phosphoglycerate kinase, glyceraldehyde 3-phosphate dehydrogenase, triosephosphate isomerase) and primary metabolism were also abundantly represented in the cDNA library used herein. Thus, the cDNA encoding of enzymes involved in secondary metabolism and particularly diterpene biosynthesis were in too low abundance to obtain sufficient coverage and complete reassembly.

Exemplo 6Example 6 Extração de sequências semelhantes a diterpeno-sintases de classe I a partir dos dados de seauenciamento.Extraction of class I diterpene synthase-like sequences from sequencing data.

O algoritmo de Blast (Altschul et al, J. Mol. Bioí. 215, 403-410, 1990) foi usado para pesquisar a homologia das sequências de aminoácido deduzidas com sequências de diterpeno-sintases de classe I.The Blast algorithm (Altschul et al, J. Mol. Biol. 215, 403-410, 1990) was used to search for homology of the deduced amino acid sequences with sequences of class I diterpene synthases.

Uma pesquisa de Blastx contra um banco de dados de proteína foi primeiramente realizada com as 2054 contigs. Essa pesquisa forneceu apenas uma contig (contig 1610, SEQ ID NO:38), apresentando homologia de sequência com diterpeno- sintases de classe I. A sequência de aminoácido deduzida dessa contig continha o motivo DDxxD, característico da ciclização iniciada por ionização de prenil- difosfatos.A Blastx search against a protein database was first performed on the 2054 contigs. This search yielded only one contig (contig 1610, SEQ ID NO:38), showing sequence homology with class I diterpene synthases. The deduced amino acid sequence of this contig contained the motif DDxxD, characteristic of cyclization initiated by prenyl ionization. diphosphates.

Uma fração dos dados brutos, representando aproximadamente 3x105 leituras foi, então, pesquisada com relação à homologia com diterpeno-sintases de classe I. As leituras foram pesquisadas usando o algoritmo de tBlastn com cinco sequências de aminoácido de diterpeno-sintase de classe I selecionados (números de acesso NCBI AAC39443, BAB19275, BAB12441, AAD34295, AAS98912). Essa pesquisa selecionou 462 leituras, que foram, então, processadas usando o programa CAP (Huang, Genomics 14(1), 18-25, 1992) para identificar sequências de sobreposição. Uma pequena porção das leituras poderia ser montada em curtas contigs de extensão máxima de 111 bases. Essas contigs, bem como as leituras isoladas remanescentes, foram usadas para pesquisa de Blastx contra um banco de dados de proteína para confirmar sua identificação com diterpeno-sintases de classe I. Finalmente, 5 fragmentos de DNA foram retidos (SEQ ID NO:39 a 43).A fraction of the raw data, representing approximately 3x105 reads, was then searched for homology with class I diterpene synthases. The reads were searched using the tBlastn algorithm with five selected class I diterpene synthase amino acid sequences ( NCBI accession numbers AAC39443, BAB19275, BAB12441, AAD34295, AAS98912). This search selected 462 reads, which were then processed using the CAP program (Huang, Genomics 14(1), 18-25, 1992) to identify overlapping sequences. A small portion of the reads could be assembled into short contigs of maximum length 111 bases. These contigs, as well as the remaining isolated reads, were used to search Blastx against a protein database to confirm its identification with class I diterpene synthases. Finally, 5 DNA fragments were retained (SEQ ID NO:39 to 43).

As sequências de aminoácido foram deduzidas dos fragmentos selecionados (SEQ ID NO:44 a 48) e foram alinhadas com sequências de diterpeno-sintases de referência, permitindo seu posicionamento relativo. A figura 3 mostra um alinhamento dessas sequências com uma sequência de diterpeno-sintase de extensão completa, a estemodeno-sintase da Oriza sativa (Morrone et al, 2006; Ns de acesso NCBI AAZ76733) coletado como referência.The amino acid sequences were deduced from the selected fragments (SEQ ID NO: 44 to 48) and were aligned with reference diterpene synthase sequences, allowing their relative positioning. Figure 3 shows an alignment of these sequences with a full-length diterpene synthase sequence, the Oriza sativa estemodeno synthase (Morrone et al, 2006; NCBI Accession Nos AAZ76733) collected as a reference.

Exemplo 7Example 7 Amplificação por PCR de cDNAs de diterpeno-sintases de classe I de extensão completa.PCR amplification of full-length class I diterpene synthase cDNAs.

Um conjunto de oligonucleotídeos inverso e reverso foi deduzido das sequências de DNA relacionadas com diterpeno-sintases, selecionadas do sequenciamento da biblioteca de cDNA de S. sclarea (Exemplo 6). Esses primers foram usados em combinação com primers adaptadores de cDNA em amplificações por PCR do tipo 375’ RACE. As amplificações foram realizadas usando a biblioteca de cDNA de S. sclarea, preparada conforme descrito acima no Exemplo 1, seguindo o protocolo do Kit de Amplificação de cDNA Marathon™ (Clontech, Mountain View, CA). As condições cíclicas térmicas foram as seguintes: 1 min a 94°C, 5 ciclos de 30 seg a 94°C e 4 min a 72°C, 5 ciclos de 30 seg a 94°C e 4 min a 70°C, 20 ciclos de 30 seg a 94°C e 4 min a 68°C.A set of reverse and reverse oligonucleotides was deduced from DNA sequences related to diterpene synthases selected from sequencing the S. sclarea cDNA library (Example 6). These primers were used in combination with cDNA adapter primers in 375' RACE PCR amplifications. Amplifications were performed using the S. sclarea cDNA library, prepared as described above in Example 1, following the Marathon™ cDNA Amplification Kit protocol (Clontech, Mountain View, CA). The thermal cycling conditions were as follows: 1 min at 94°C, 5 cycles of 30 sec at 94°C and 4 min at 72°C, 5 cycles of 30 sec at 94°C and 4 min at 70°C, 20 cycles of 30 sec at 94°C and 4 min at 68°C.

Usando o primer Cont250-Fwd (SEQ ID NO:49), uma sequência de DNA de 547 bp (1130Cont250, SEQ ID NO:81) foi obtida. Análise da sequência revelou que esta correspondeu à extremidade 5’ de um cDNA de diterpeno-sintase e conteve 348 bp da região de codificação. Com o primer Cont147_fw1 (SEQ ID NO:51) e Cont147_fw2 (SEQ ID NO:52), obtivemos uma sequência de 1473 bp (1132Cont147, SEQ ID NO:82), contendo a extremidade 3’ e 1293 bp da região de codificação de urn cDNA de diterpeno-sintase. O primer Cont224_fw (SEQ ID NO:57) forneceu urn fragmento de DNA de 207 bp (1137Cont224, SEQ ID NO:83), codificando os 43 aminoácidos de terminal C de uma diterpeno-sintase com uma sequência distinta do 1132Cont147 (SEQ ID NO:82). Os primers Cont147_revl (SEQ ID NO:53) e Cont147_rev2 (SEQ ID NO:54) permitiram a amplificação de um fragmento de DNA de 464 bp (1134Cont147, SEQ ID NO:84). O aminoácido deduzido mostrou homologia com diterpeno-sintases, mas alinhamento com outras sequências de diterpeno-sintases sugeriu que 200 a 300 códons ainda estavam faltando para atingir a extremidade 5’. Todas as sequências obtidas por essa série de amplificação diferiram significativa mente das sequências de SsLPPs previamente isoladas (SEQ ID NO:22 e 23). PCR com os outros primers deduzidos das sequências de DNA relacionadas com diterpeno-sintases (primers cont224-rev (SEQ ID NO:58), cont250- rev (SEQ ID NQ:50), cont33-fw1 (SEQ ID NO:55) e cont33-rev (SEQ ID NO:56)) não forneceu sequências relacionadas com diterpeno-sintase.Using the Cont250-Fwd primer (SEQ ID NO:49), a 547 bp DNA sequence (1130Cont250, SEQ ID NO:81) was obtained. Sequence analysis revealed that it corresponded to the 5' end of a diterpene synthase cDNA and contained 348 bp of coding region. With the primer Cont147_fw1 (SEQ ID NO:51) and Cont147_fw2 (SEQ ID NO:52), we obtained a 1473 bp sequence (1132Cont147, SEQ ID NO:82), containing the 3' end and 1293 bp of the coding region of a diterpene synthase cDNA. The primer Cont224_fw (SEQ ID NO:57) provided a 207 bp DNA fragment (1137Cont224, SEQ ID NO:83), encoding the C-terminal 43 amino acids of a diterpene synthase with a sequence distinct from 1132Cont147 (SEQ ID NO :82). The primers Cont147_revl (SEQ ID NO:53) and Cont147_rev2 (SEQ ID NO:54) allowed the amplification of a 464 bp DNA fragment (1134Cont147, SEQ ID NO:84). The deduced amino acid showed homology with diterpene synthases, but alignment with other diterpene synthase sequences suggested that 200 to 300 codons were still missing to reach the 5' end. All sequences obtained by this round of amplification differed significantly from sequences from previously isolated SsLPPs (SEQ ID NO:22 and 23). PCR with the other primers deduced from the DNA sequences related to diterpene synthases (primers cont224-rev (SEQ ID NO:58), cont250-rev (SEQ ID NQ:50), cont33-fw1 (SEQ ID NO:55) and cont33-rev (SEQ ID NO:56)) did not provide sequences related to diterpene synthase.

Da única sequência contendo uma região de iniciação de tradução óbvia de uma diterpeno-sintase (1130Cont250, SEQ ID NO:81), oligonucleotídeos sense foram deduzidos da região não traduzida 5’ (UTR) (1130-fwl (SEQ ID NO:59) e 1130-fw2 (SEQ ID NO:60) e da extremidade 5’ da estrutura de leitura aberta (ORF) (1130-fw3, SEQ ID NO:61). Das duas sequências contendo a região de códon de interrupção de duas diterpeno-sintases distintas (1132Cont147 (SEQ ID NO:82) e 1137Cont224 (SEQ ID NO:83)), primers sense reversos foram deduzidos da 3’ UTR (1132-rev1 (SEQ ID NO:65) e 1137-rev1 (SEQ ID NO:62)) ou da extremidade 3’ da estrutura de leitura aberta (1132-rev2 (SEQ ID NO:64) e 1137-rev2 (SEQ ID NO:63)). PCR foram realizadas com diferentes combinações desses primers inverso e reverso. A combinação dos primers deduzidos da sequência 1130Cont250 (SEQ ID NO:81) com os primers deduzidos da sequência 1137Cont224 (SEQ ID NO:83) produziu um fragmento de 2388 bp (SEQ ID NO:85), que codifica uma proteína de 795 5 aminoácidos (SsTps1137, SEQ ID NO:86)). Comparação com sequências publicadas mostrou homologias com diterpeno-sintases de classe I e particularmente ent-caureno-sintases B. A homologia mais alta foi com uma proteína não caracterizada da Vitis vinifera (Ns de acesso NCBI CAO64942, identificação de 59%), uma ent-caureno-sintase da Cucumis sativus (Ns de acesso NCBI BAB19275, 10 identificação de 54%), uma ent-caureno-sintase da Lactuca sativa (Ns de acesso NCBI BAB12441, identificação de 54%). A sequência de aminoácido SsTps1137 (SEQ ID NO:86) conteve um motivo DDFFD típico de terpeno-sintases dependentes da ionização (classe I) e não conteve o motivo de classe II característico.From the only sequence containing an obvious translation initiation region of a diterpene synthase (1130Cont250, SEQ ID NO:81), sense oligonucleotides were deduced from the 5' untranslated region (UTR) (1130-fwl (SEQ ID NO:59) and 1130-fw2 (SEQ ID NO:60) and the 5' end of the open reading frame (ORF) (1130-fw3, SEQ ID NO:61). distinct synthases (1132Cont147 (SEQ ID NO:82) and 1137Cont224 (SEQ ID NO:83)), reverse sense primers were deduced from the 3' UTR (1132-rev1 (SEQ ID NO:65) and 1137-rev1 (SEQ ID NO: :62)) or the 3' end of the open reading frame (1132-rev2 (SEQ ID NO:64) and 1137-rev2 (SEQ ID NO:63)).PCRs were performed with different combinations of these reverse and reverse primers. Combining primers deduced from sequence 1130Cont250 (SEQ ID NO:81) with primers deduced from sequence 1137Cont224 (SEQ ID NO:83) produced a 2388 bp fragment (SEQ ID NO:85), which encodes a protein of 795 5 amino acids (SsTps1137, SEQ ID NO:86)). Comparison with published sequences showed homologies with class I diterpene synthases and particularly ent-kaurene synthases B. The highest homology was with an uncharacterized protein from Vitis vinifera (NCBI Accession No. CAO64942, 59% ID), an ent -kaureen synthase from Cucumis sativus (NCBI Accession Nos BAB19275, 54% ID), an ent-kaurene synthase from Lactuca sativa (NCBI Accession Nos BAB12441, 54% ID). The amino acid sequence SsTps1137 (SEQ ID NO:86) contained a DDFFD motif typical of ionization-dependent terpene synthases (class I) and did not contain the characteristic class II motif.

A combinação dos mesmos primers inversos com os primers reversos deduzidos da 15 1132Cont147 (SEQ ID NO:82) não permitiu a amplificação de nenhum fragmento, confirmando que essas duas sequências não surgiram do mesmo cDNA. Uma abordagem de 5’RACE foi, então, usada para identificar a extremidade 5' da ORF, correspondente à sequência 1132Cont147 (SEQ ID NO:82). Usando os primers 1132_race1 (SEQ ID NO:67) e 1132_race2 (SEQ ID NO:68), uma sequência de 536 20 bp (1132RACE, SEQ ID NO:87) foi obtida, a qual tinha sobreposição de 41 bases com o fragmento 1132Cont147 (SEQ ID NO:82). Esse produto de RACE foi idêntico à sequência 1134Cont147 previamente obtida (SEQ ID NO:84) e nenhuma extensão na extremidade 5’ foi observada. Conforme observado previamente, essa sequência teve homologia com diterpeno-sintases, mas pareceu mais curta em, no mínimo, 200 25 códons do que todas as outras sequências de diterpeno-sintases publicadas.The combination of the same reverse primers with the reverse primers deduced from 15 1132Cont147 (SEQ ID NO:82) did not allow the amplification of any fragment, confirming that these two sequences did not arise from the same cDNA. A 5'RACE approach was then used to identify the 5' end of the ORF, corresponding to sequence 1132Cont147 (SEQ ID NO:82). Using primers 1132_race1 (SEQ ID NO:67) and 1132_race2 (SEQ ID NO:68), a 20 bp 536 sequence (1132RACE, SEQ ID NO:87) was obtained, which overlapped by 41 bases with the 1132Cont147 fragment (SEQ ID NO:82). This RACE product was identical to the previously obtained sequence 1134Cont147 (SEQ ID NO:84) and no extension at the 5' end was observed. As previously noted, this sequence had homology to diterpene synthases, but appeared shorter by at least 200 25 codons than all other published diterpene synthase sequences.

Experimentos de 5’RACE foram realizados, a fim de tentar estender a sequência em direção da extremidade 5’ da sequência 1132Cont147 (SEQ ID NO:82) e identificar a verdadeira códon de iniciação de tradução. Diversos conjuntos de oligonucleotídeos (1132_race3 a 1132_race9, SEQ ID NO:69 a 75) foram criados, mas nenhuma informação de sequência adicional foi obtida. Isso nos levou a supor que um do códon ATG na sequência 1134Cont147 (SEQ ID NO:84) foi realmente o códon de iniciação do gene de diterpeno-sintase correspondente. A sequência nucleotídica dessa diterpeno-sintase putativa (denominada SsTps1132, SEQ ID NO:2) foi reconstituída das sequências 1132Cont147 (SEQ ID NO:82) e 1132RACE (SEQ ID NO:87). Pegando o primeiro ATG, a ORF de 1728 bp da SsTps1132 (SEQ ID NO:2) codificou para uma proteína de 575 aminoácidos (SEQ ID NO:1). Essa proteína conteve o motivo dependente de ionização (DDFFD) e homologia compartilhada, mas relativamente, baixo, com as diterpeno-sintases publicadas; a sequência mais próxima sendo uma terpeno-sintase de Nicotiana tabacum (Ns de acesso NCBI AAS98912), identificação de 37%.5'RACE experiments were performed in order to try to extend the sequence towards the 5' end of the 1132Cont147 sequence (SEQ ID NO:82) and to identify the true translation initiation codon. Several sets of oligonucleotides (1132_race3 to 1132_race9, SEQ ID NO:69 to 75) were created, but no further sequence information was obtained. This led us to assume that one of the ATG codons in sequence 1134Cont147 (SEQ ID NO:84) was actually the start codon of the corresponding diterpene synthase gene. The nucleotide sequence of this putative diterpene synthase (named SsTps1132, SEQ ID NO:2) was reconstructed from sequences 1132Cont147 (SEQ ID NO:82) and 1132RACE (SEQ ID NO:87). Taking the first ATG, the 1728 bp ORF of SsTps1132 (SEQ ID NO:2) encoded a protein of 575 amino acids (SEQ ID NO:1). This protein contained the ionization-dependent motif (DDFFD) and shared, but relatively low, homology with the published diterpene synthases; the closest sequence being a terpene synthase from Nicotiana tabacum (NCBI Accession No. AAS98912), 37% identification.

De forma surpreendente, a identificação entre as proteínas SsTps1137 (SEQ ID NO:86) e SsTps1132 (SEQ ID NO:1) foi apenas de 30% e essas sequências compartilharam apenas 21 a 23% de identificação com a SsLPPs de classe II, primeiramente isolada da S. sclarea (SEQ ID NO;24 e 25, Exemplos 1-3). Um alinhamento dessas duas proteínas com sequências de diterpeno-sintases selecionadas é apresentada na figura 4. O alinhamento mostra que a SsTps1132 (SEQ ID NO:1) é truncada na extremidade do terminal N em 150 a 240 aminoácidos, em comparação com outras diterpeno-sintases. O método de ChloroP (Emanuelsson et al, Protein Science 8, 978-984, 1999; http://www.cbs.dtu.dk/services/ChloroP/) foi usado para prever a presença de um peptídeo de trânsito de cloroplasto em cada sequência protéica. Para SsTps1137 (SEQ ID NO:86) e SsTps1132 (SEQ ID NO:1), peptídeos de trânsito de cloroplasto de 22 e 51 aminoácidos, respectivamente, foram previstos, sustentando uma localização de cloroplasto de ambas as proteínas.Surprisingly, the identification between SsTps1137 (SEQ ID NO:86) and SsTps1132 (SEQ ID NO:1) proteins was only 30% and these sequences shared only 21 to 23% identification with class II SsLPPs, primarily isolated from S. sclarea (SEQ ID NO;24 and 25, Examples 1-3). An alignment of these two proteins with selected diterpene synthase sequences is shown in Figure 4. The alignment shows that SsTps1132 (SEQ ID NO:1) is truncated at the N-terminal end by 150 to 240 amino acids compared to other diterpene synthases. synthases. The ChloroP method (Emanuelsson et al, Protein Science 8, 978-984, 1999; http://www.cbs.dtu.dk/services/ChloroP/) was used to predict the presence of a chloroplast transit peptide in each protein sequence. For SsTps1137 (SEQ ID NO:86) and SsTps1132 (SEQ ID NO:1), chloroplast transit peptides of 22 and 51 amino acids, respectively, were predicted, supporting a chloroplast localization of both proteins.

A pesquisa de todas as leituras para sequências idênticas às sequências de DNA de 5 SsTps1137 (SEQ ID NO:85) e SsTps1132 (SEQ ID NO:2) forneceu apenas 24 leituras para SsTps1137 e 425 leituras para SsTps1132. Essa diferença na quantidade de leituras, geradas de cada transcrição, reflete uma diferença significativa nos níveis de expressão. Com base na quantidade relativa de leituras, obtidas para cada transcrição, pode-se estimar que o nível de expressão de 10 SsTps1132 (220 leituras/Kb) foi semelhante ao nível de expressão de SsLPPs (260 leituras/Kb) e que a SsTps1137 foi expressada em um nível muito menos (10 leituras/Kb). Com a hipótese de que etapas catalisadoras de enzimas na mesma via metabólica são geralmente expressadas em um nível semelhante, pode-se especular que a SsTps1132 (SEQ ID NO:1) em vez da SsTps1137 (SEQ ID NO:86) 15 está envolvida na mesma via metabólica que a SsLPPs.Searching all reads for sequences identical to the DNA sequences of 5 SsTps1137 (SEQ ID NO:85) and SsTps1132 (SEQ ID NO:2) yielded only 24 reads for SsTps1137 and 425 reads for SsTps1132. This difference in the amount of reads generated from each transcript reflects a significant difference in expression levels. Based on the relative amount of reads obtained for each transcript, it can be estimated that the expression level of 10 SsTps1132 (220 reads/Kb) was similar to the expression level of SsLPPs (260 reads/Kb) and that SsTps1137 was expressed at a much lower level (10 reads/Kb). With the hypothesis that enzyme catalytic steps in the same metabolic pathway are generally expressed at a similar level, one can speculate that SsTps1132 (SEQ ID NO:1) rather than SsTps1137 (SEQ ID NO:86) 15 is involved in the same metabolic pathway as SsLPPs.

As contigs geradas com o software Edena (Exemplo 5) foram pesquisadas para sequências de DNA, idênticas às sequências dessas duas novas diterpeno-sintases de classe I putativas. Para SsTps1137 (SEQ ID NO:85), nenhuma contig foi encontrada em conformidade com o baixo nível de expressão presumido dessa 20 enzima. Para SsTps1132 (SEQ ID NO:2), 4 contigs foram encontradas. A contig previamente identificada 1610 (SEQ ID NO:38) e três contigs adicionais (de extensão de 53 a 96 bp) (SEQ ID NO:88 a 90), não previamente identificadas como fragmento de uma diterpeno-sintase. A pesquisa de Blastx com essas três sequências não mostrou homologia com sequências de proteína conhecidas. A falha 25 em descobrir homologia para essas contigs é devido às extensões curtas desses fragmentos e à baixa homologia de SsTps1132 (SEQ ID NO:1) com as diterpeno- sintases presentes nos bancos de dados.Contigs generated with the Edena software (Example 5) were searched for DNA sequences identical to the sequences of these two new putative class I diterpene synthases. For SsTps1137 (SEQ ID NO:85), no contig was found consistent with the presumed low level of expression of this enzyme. For SsTps1132 (SEQ ID NO:2), 4 contigs were found. The previously identified contig 1610 (SEQ ID NO:38) and three additional contigs (53 to 96 bp in length) (SEQ ID NO:88 to 90), not previously identified as a fragment of a diterpene synthase. Blastx search of these three sequences showed no homology to known protein sequences. The failure 25 to discover homology for these contigs is due to the short lengths of these fragments and the low homology of SsTps1132 (SEQ ID NO:1) with the diterpene synthases present in the databases.

A observação de uma deleção de terminal N de SsTps1132 (SEQ ID NO:1) em comparação com outras diterpeno-sintases também explica posteriormente a razão de a abordagem de PCR primeiramente empregada não ter tido sucesso. Na verdade, os primers inversos foram criados a partir de regiões conservadas, presentes nos primeiros 150 aminoácidos de diterpeno-sintases, uma região ausente na SsTps1132 (SEQ ID NO:1). A sequência SsTps1137 (SEQ ID NO:86) contém os motivos conservados, usados para criar os primers e as sequências de DNA correspondentes são complementares às sequências de primer. Presumivelmente, a amplificação de SsTps1137 (SEQ ID NO:85) não teve sucesso na abordagem de PCR devido à baixa abundância dessa transcrição.The observation of an N-terminal deletion of SsTps1132 (SEQ ID NO:1) compared to other diterpene synthases also further explains why the PCR approach first employed was unsuccessful. In fact, the reverse primers were created from conserved regions present in the first 150 amino acids of diterpene synthases, a region absent in SsTps1132 (SEQ ID NO:1). The SsTps1137 sequence (SEQ ID NO:86) contains the conserved motifs used to create the primers and the corresponding DNA sequences are complementary to the primer sequences. Presumably, the amplification of SsTps1137 (SEQ ID NO:85) was unsuccessful in the PCR approach due to the low abundance of this transcript.

Exemplo 8Example 8 Expressão heteróloqa das diterpeno-sintases de classe I de S. sclarea na E. coli.Heterologous expression of S. sclarea class I diterpene synthases in E. coli.

Para determinar uma atividade enzimática para SsTps1137 (SEQ ID NO:86) e SsTps1132 (SEQ ID NO:1), as proteínas recombinantes foram expressadas na E. coli. Os cDNAs de extensão total foram inseridos no vetor pET101/D-TOPQ, usando o Kit de Expressão TOPO Direcional Champion pET101.To determine an enzymatic activity for SsTps1137 (SEQ ID NO:86) and SsTps1132 (SEQ ID NO:1), recombinant proteins were expressed in E. coli. The full-length cDNAs were inserted into the pET101/D-TOPQ vector using the pET101 Champion Directional TOPO Expression Kit.

Para cada enzima, duas construções foram preparadas: uma para expressar a proteína de extensão total e uma para expressar uma proteína truncada, com base na predição do peptídeo de trânsito de cloroplasto. As estruturas de leitura aberta de SsTps1137 (SEQ ID NO:85) e SsTps1132 (SEQ ID NO:2) de extensão total foram amplificadas da biblioteca de cDNA, usando os pares de primer 1137-início (SEQ ID NO:78) com 1137-interrupção (SEQ ID NO:80) e 1132-início1 (Seq ID No 76) com 1132-interrupção (SEQ ID NO:66), respectivamente. Os primers 1137_início2 (SEQ ID NO:79) e 1137_interrupção (SEQ ID NO:80) foram usados para amplificar uma versão truncada de 72 bp de SsTps1137, criada para expressar a proteína com 24 aminoácidos deletados na extremidade do terminal N. Da mesma maneira, os primers 1132_inicio2 (SEQ ID NO:77) e 1132_interrupção (SEQ ID NO:66) foram usados para amplificar uma versão truncada de SsTps1132, criada para expressar a proteína com uma deleção de 50 aminoácidos no terminal N. Todas as amplificações de cDNA para expressão das construções de expressão foram realizadas usando a polimerase de DNA Pfu (Promega), em um volume final de 50μl, contendo 5μg de tampão 10X de polimerase de DNA Pfu, 200μM cada de dNTP, 0,4μM cada de primer inverso e reverso, 2,9 unidades de polimerase de DNA Pfu e 5μl de cDNA 100 vezes diluído (preparado conforme descrito no presente no Exemplo 1 usando o Kit de Amplificação de cDNA Marathon™ (Clontech)). As condições cíclicas térmicas foram as seguintes: 1,5 min a 95°C; 30 ciclos de 45 seg a 95°C, 30 seg a 58°C e 5 min a 72°C; e 10 min a 72°C.For each enzyme, two constructs were prepared: one to express the full-length protein and one to express a truncated protein, based on the chloroplast transit peptide prediction. The full-length SsTps1137 (SEQ ID NO:85) and SsTps1132 (SEQ ID NO:2) open reading frames were amplified from the cDNA library using primer pairs 1137-start (SEQ ID NO:78) with 1137 -interrupt (SEQ ID NO:80) and 1132-start1 (Seq ID No 76) with 1132-interrupt (SEQ ID NO:66), respectively. Primers 1137_start2 (SEQ ID NO:79) and 1137_stop (SEQ ID NO:80) were used to amplify a truncated 72 bp version of SsTps1137, created to express the protein with 24 amino acids deleted at the N-terminal end. , primers 1132_start2 (SEQ ID NO:77) and 1132_stop (SEQ ID NO:66) were used to amplify a truncated version of SsTps1132, created to express the protein with a 50 amino acid deletion at the N-terminus. All cDNA amplifications expression constructs were performed using Pfu DNA polymerase (Promega), in a final volume of 50μl, containing 5μg of 10X Pfu DNA polymerase buffer, 200μM each of dNTP, 0.4μM each of reverse and reverse primer , 2.9 units of Pfu DNA polymerase and 5μl of 100-fold diluted cDNA (prepared as described herein in Example 1 using the Marathon™ cDNA Amplification Kit (Clontech)). Thermal cycling conditions were as follows: 1.5 min at 95°C; 30 cycles of 45 sec at 95°C, 30 sec at 58°C and 5 min at 72°C; and 10 min at 72°C.

Após a ligação no vetor pET101, diversos clones foram selecionados para cada construção e foram sequenciados para assegurar que nenhuma mutação tenha sido introduzida durante a amplificação de PCR. Para SsTps1137, as duas construções 1137-B12 (SEQ ID NO:91) e 1137-2-B12 (SEQ ID NO:92) foram selecionadas, contendo o cDNA de SsTps1137, respectivamente, com e sem o sinal de peptídeo (sequências de polipeptídeos correspondentes são SEQ ID NO:94 e 95). Para SsTps1132, duas construções foram selecionadas: uma com a sequência completa de SsTps1132 (SEQ ID NO:2) e uma construção sem sinal de peptídeo (1132-2-5, SEQ ID NO:93). O alinhamento das duas sequências de aminoácido (SEQ ID NO:1 e 96) deduzidas dessas construções é mostrado na figura 5.After ligation into the pET101 vector, several clones were selected for each construct and sequenced to ensure that no mutations were introduced during PCR amplification. For SsTps1137, the two constructs 1137-B12 (SEQ ID NO:91) and 1137-2-B12 (SEQ ID NO:92) were selected, containing the SsTps1137 cDNA, respectively, with and without the signal peptide (sequences of corresponding polypeptides are SEQ ID NO:94 and 95). For SsTps1132, two constructs were selected: one with the complete sequence of SsTps1132 (SEQ ID NO:2) and one construct without signal peptide (1132-2-5, SEQ ID NO:93). The alignment of the two amino acid sequences (SEQ ID NO:1 and 96) deduced from these constructs is shown in figure 5.

Os plasmídeos pET101-1137-B12, pET101-1137-2-B12, pET101-SsTps1132 e pET101-1132-2-5 foram transferidos para células de E. Coli BI21 (DE3) (Novagen, Madison, Wl). Colônias simples de células transformadas foram usadas para inocular 5ml de meio LB. Após 5 a 6 horas de incubação a 37°C, as culturas foram transferidas para uma incubadora a 20°C e deixadas 1 hora para equilíbrio. A expressão da proteína foi, então, induzida pela adição de 1mM de IPTG e a cultura foi incubada durante a noite a 20°C. O dia seguinte, as células foram coletadas por centrifugação, suspensas novamente em volume a 0,1 de 50mM de MOPSO, pH 7, 10% de glicerol e lisados por sonicação. Os extratos foram limpos por centrifugação (30 min a 20.000g) e os sobrenadantes contendo as proteínas solúveis foram usados para experimentos adicionais. Os extratos de proteína crua foram analisados por SDS-PAGE e comparados com extratos de proteína, obtidos das células transformadas com o plasmídeo pET101 vazio.Plasmids pET101-1137-B12, pET101-1137-2-B12, pET101-SsTps1132 and pET101-1132-2-5 were transferred into E. coli B121 (DE3) cells (Novagen, Madison, WI). Single colonies of transformed cells were used to inoculate 5ml of LB medium. After 5 to 6 hours of incubation at 37°C, the cultures were transferred to a 20°C incubator and allowed to equilibrate for 1 hour. Protein expression was then induced by the addition of 1mM IPTG and the culture was incubated overnight at 20°C. The following day, cells were collected by centrifugation, resuspended in 0.1 volume of 50mM MOPSO, pH 7, 10% glycerol and lysed by sonication. Extracts were cleared by centrifugation (30 min at 20,000g) and supernatants containing soluble proteins were used for further experiments. Crude protein extracts were analyzed by SDS-PAGE and compared with protein extracts obtained from cells transformed with empty pET101 plasmid.

Exemplo 9Example 9 Atividade enzimática das diterpeno-sintases de classe I recombinantes de S. sclarea na E. coli.Enzyme activity of recombinant class I diterpene synthases from S. sclarea in E. coli.

Os extratos de proteína crua de E. coli, contendo as proteínas recombinantes e preparados conforme descrito no Exemplo 8 foram usados para a caracterização das atividades enzimáticas. Os ensaios enzimáticos foram realizados conforme descrito no Exemplo 3. Todos os ensaios foram realizados em 50mM de MOPSO, pH 7, 10% de glicerol, 1mM de DTT.Crude E. coli protein extracts, containing the recombinant proteins and prepared as described in Example 8, were used for the characterization of enzyme activities. Enzymatic assays were performed as described in Example 3. All assays were performed in 50mM MOPSO, pH 7, 10% glycerol, 1mM DTT.

As atividades enzimáticas foram primeiramente avaliadas usando um substrato de GGPP ou LPP, o produto de SsLPPs (SEQ ID NO:22) e o intermediário presumido na biossíntese de esclareol (Exemplos 1 a 3). GGPP foi sintetizado conforme descrito por Keller e Thompson (J. Chromatogr 645(1), 1993, 161-167) e LPP foi preparado enzimaticamente conforme descrito no Exemplo 3. Os ensaios foram realizados na presença de 10 a 100pM de substrato, 15mM de MgCI2 e 0,1 a 0,5mg de proteína crua em um volume total de 1mL. Os tubos foram incubados 4 a 12 horas a 30°C e extraídos duas vezes com um volume de pentano. Após concentração sob um fluxo de nitrogênio, os extratos foram analisados por CG e CG-MS (usando as condições descritas no Exemplo 3) e comparados com extratos do ensaio com proteínas de controle (obtidas de células transformadas com o plasmídeo vazio). Com GGPP como substrato, nenhuma atividade foi observada com qualquer uma das proteínas recombinantes (dados não mostrados). Com LPP como substrato, nenhuma atividade foi observada com os extratos de proteínas, contendo proteínas recombinantes SsTps1137, mas com SsTps1132, atividade foi observada com ambas SsTps1132 e 1132-2-5 (SEQ ID NO:1 e 96) (Figura 6). As enzimas também foram ativas na ausência de MgCI2 e os mesmos perfis de produto foram observados com uma atividade geral aproximadamente a mesma. A identificação do produto foi confirmada pela concordância dos tempos de retenção (Figura 6) e comparação do espectro de massa com o espectro de um padrão autêntico (Figura 7). Em todos os ensaios, um pico único de esclareol foi observado sem traço de produto adicional.Enzymatic activities were first evaluated using a GGPP or LPP substrate, the product of SsLPPs (SEQ ID NO:22) and the presumed intermediate in sclareol biosynthesis (Examples 1 to 3). GGPP was synthesized as described by Keller and Thompson (J. Chromatogr 645(1), 1993, 161-167) and LPP was prepared enzymatically as described in Example 3. Assays were performed in the presence of 10 to 100pM substrate, 15mM MgCI2 and 0.1 to 0.5mg of crude protein in a total volume of 1mL. Tubes were incubated 4 to 12 hours at 30°C and extracted twice with one volume of pentane. After concentration under nitrogen flow, the extracts were analyzed by GC and GC-MS (using the conditions described in Example 3) and compared with extracts from the control protein assay (obtained from cells transformed with the empty plasmid). With GGPP as substrate, no activity was observed with any of the recombinant proteins (data not shown). With LPP as a substrate, no activity was observed with the protein extracts containing SsTps1137 recombinant proteins, but with SsTps1132, activity was observed with both SsTps1132 and 1132-2-5 (SEQ ID NO:1 and 96) (Figure 6). The enzymes were also active in the absence of MgCl2 and the same product profiles were observed with approximately the same overall activity. Product identification was confirmed by matching retention times (Figure 6) and comparing the mass spectrum with the spectrum of an authentic standard (Figure 7). In all assays, a single sclareol peak was observed with no trace of additional product.

Ensaios foram, então, realizados com coincubação das diterpeno-sintases de classe II (SsLPPs3, SEQ ID NO:24; Exemplos 1-3) e as diterpeno-sintases de classe I (1132 series, SEQ ID NO:1 e 96). Ensaios foram realizados em 50mM de MOPSO, pH 7, 10% de glicerol, 1mM de DTT, 50pM de GGPP, com 1mM de MgCI2 e na presença de 50μL dos extratos de proteína crua da E. coli, expressando as diferentes construções. Dessa forma, ensaios na presença de 50μL de extratos de proteína crua contendo a enzima recombinante SsLPPs3 (SEQ ID NO:24) e 50μL de extratos contendo SsTps1132 (SEQ ID NO:1) ou 1132-2-5 (SEQ ID NO:96) foram avaliados com relação à produção de produtos de diterpeno. A figura 8 mostra os perfis de CG de extratos dessas incubações na presença de MgCI2. O esclareol foi produzido com ambas as construções de 1132 (SEQ ID NO: 1 e 96) (Figura 8), um resultado consistente com o ensaio descrito acima com LPP como substrato. Nenhuma diferença significativa foi observada ao omitir MgCI2 das incubações (dados não mostrados).Assays were then performed with co-incubation of class II diterpene synthases (SsLPPs3, SEQ ID NO:24; Examples 1-3) and class I diterpene synthases (1132 series, SEQ ID NO:1 and 96). Assays were performed in 50mM MOPSO, pH 7, 10% glycerol, 1mM DTT, 50pM GGPP, with 1mM MgCl2 and in the presence of 50μL of E. coli crude protein extracts, expressing the different constructs. Thus, assays in the presence of 50μL of crude protein extracts containing the recombinant enzyme SsLPPs3 (SEQ ID NO:24) and 50μL of extracts containing SsTps1132 (SEQ ID NO:1) or 1132-2-5 (SEQ ID NO:96 ) were evaluated for the production of diterpene products. Figure 8 shows the GC profiles of extracts from these incubations in the presence of MgCl2. Sclareol was produced with both 1132 constructs (SEQ ID NO: 1 and 96) (Figure 8), a result consistent with the assay described above with LPP as substrate. No significant difference was observed when omitting MgCl2 from incubations (data not shown).

Concluindo, a SsTps1132 (SEQ ID NO:2) codifica a esclareol-sintase (SEQ ID NO:1) e catalisa a conversão de LPP para esclareol.In conclusion, SsTps1132 (SEQ ID NO:2) encodes sclareol synthase (SEQ ID NO:1) and catalyzes the conversion of LPP to sclareol.

Claims (12)

1. MÉTODO PARA PRODUÇÃO DE ESCLAREOL, caracterizado por compreender a) contato com labdenediol difosfato (LPP) com um polipeptídio recombinante possuindo uma atividade de síntese de esclareol e compreendendo uma sequência de aminoácido como estabelecido na SEQ ID NO: 1 ou SEQ ID NO: 96; e b) opcionalmente, isolar o esclareol produzido no passo a).1. METHOD FOR PRODUCING SCLAREOL, characterized by comprising a) contacting labdenediol diphosphate (LPP) with a recombinant polypeptide having a sclareol synthesis activity and comprising an amino acid sequence as set out in SEQ ID NO: 1 or SEQ ID NO: 1. 96; and b) optionally isolating the sclareol produced in step a). 2. MÉTODO, de acordo com a reivindicação 1, caracterizado pela etapa a) ou b) ser realizada através do cultivo de um microrganismo capaz de produzir LPP e transformada para expressar o referido polipeptídio recombinante sob condições que conduzem à produção de esclareol.2. METHOD, according to claim 1, characterized by step a) or b) being carried out through the cultivation of a microorganism capable of producing LPP and transformed to express the said recombinant polypeptide under conditions that lead to the production of sclareol. 3. MÉTODO, de acordo com a reivindicação 2, caracterizado por compreendendo ainda, antes do passo de cultivo, transformar o microrganismo capaz de produzir LPP com um ácido nucleico recombinante codificando o referido polipeptídio recombinante, de modo que o referido organismo expresse o referido polipeptídio.3. METHOD, according to claim 2, characterized by further comprising, before the cultivation step, transforming the microorganism capable of producing LPP with a recombinant nucleic acid encoding said recombinant polypeptide, so that said organism expresses said polypeptide . 4. MÉTODO, de acordo com a reivindicação 2 ou 3, caracterizado pelo referido microorganismo ser um procariota ou um fungo.4. METHOD, according to claim 2 or 3, characterized in that said microorganism is a prokaryote or a fungus. 5. MÉTODO, de acordo com a reivindicação 2 ou 3, caracterizado pelo referido microorganismo ser uma bactéria ou levedura.5. METHOD, according to claim 2 or 3, characterized in that said microorganism is a bacterium or yeast. 6. MÉTODO, de acordo com a reivindicação 5, caracterizado pelas referidas bactérias serem E. coli e a referida levedura ser Saccharomyces cerevisiae.6. METHOD, according to claim 5, characterized in that said bacteria are E. coli and said yeast is Saccharomyces cerevisiae. 7. VECTOR DE EXPRESSÃO, caracterizado por compreendendo a) um ácido nucleico codificando um polipeptídio possuindo uma atividade de síntese de esclareol e compreendendo uma sequência de aminoácidos como apresentada na SEQ ID NO: 1, e b) pelo menos uma sequência reguladora operativamente ligada ao referido ácido nucleico, cuja sequência reguladora controla a transcrição, iniciação ou terminação da tradução, tal como um promotor da transcrição, operador ou potenciador ou um local de ligação ao ribossoma de ARNm e, c) opcionalmente, pelo menos um marcador de seleção.7. EXPRESSION VECTOR, characterized by comprising a) a nucleic acid encoding a polypeptide having a sclareol synthesis activity and comprising an amino acid sequence as shown in SEQ ID NO: 1, and b) at least one regulatory sequence operably linked to said nucleic acid, the regulatory sequence of which controls transcription, translation initiation or termination, such as a transcription promoter, operator or enhancer, or an mRNA ribosome binding site, and, c) optionally, at least one selectable marker. 8. VECTOR DE EXPRESSÃO, de acordo com a reivindicação 7, caracterizado por estar na forma de um vetor viral, um bacteriófago ou um plasmídeo.8. EXPRESSION VECTOR, according to claim 7, characterized in that it is in the form of a viral vector, a bacteriophage or a plasmid. 9. MICROORGANISMO TRANSFORMADO, a) com o vetor de expressão da reivindicação 7 ou 8, ou b) abrigar um ácido nucleico codificando um polipeptídio possuindo uma atividade de síntese de esclareol e compreendendo uma sequência de aminoácidos como apresentada na SEQ ID NO: 1 ou SEQ ID NO: 96, ou c) abrigar um ácido nucleico como estabelecido na SEQ ID NO: 2 ou SEQ ID NO: 93; caracterizado pelo microorganismo expressar ou sobre-expressar heterologamente o referido polipeptídio possuindo uma atividade de síntese de esclareol e em que o microorganismo uma bactéria ou levedura.9. TRANSFORMED MICROORGANISM, a) with the expression vector of claim 7 or 8, or b) harboring a nucleic acid encoding a polypeptide having a sclareol synthesis activity and comprising an amino acid sequence as shown in SEQ ID NO: 1 or SEQ ID NO: 96, or c) harboring a nucleic acid as set forth in SEQ ID NO: 2 or SEQ ID NO: 93; characterized in that the microorganism heterologously expresses or overexpresses said polypeptide having a sclareol synthesizing activity and wherein the microorganism is a bacterium or yeast. 10. MICROORGANISMO, de acordo com a reivindicação 9, caracterizado pelas referidas bactérias serem E. coli e a referida levedura ser Saccharomyces cerevisiae.10. MICROORGANISM, according to claim 9, characterized in that said bacteria are E. coli and said yeast is Saccharomyces cerevisiae. 11. MÉTODO PARA PRODUZIR PELO MENOS UM POLIPEPTÍDEO RECOMBINANTE TENDO UMA ATIVIDADE DE SCLAREOL SINTASE, caracterizado por compreender: a) cultivar o microorganismo da reivindicação 9 ou 10, de modo que expresse ou sobreexpresse o referido polipéptido possuindo uma atividade de síntese de esclareol; b) isolar o polipeptídio que tem uma atividade de síntese de esclareol do microrganismo cultivado no passo a).11. METHOD FOR PRODUCING AT LEAST ONE RECOMBINANT POLYPEPTIDE HAVING SCLAREOL SYNTASE ACTIVITY, characterized in that it comprises: a) cultivating the microorganism of claim 9 or 10, so that it expresses or overexpresses said polypeptide having a sclareol synthesis activity; b) isolating the polypeptide having a sclareol synthesizing activity from the cultured microorganism in step a). 12. MÉTODO, de acordo com a reivindicação 11, caracterizado por compreender ainda, antes da etapa a), transformar um microorganismo com a) o vetor de expressão da reivindicação 7 ou 8, ou b) um ácido nucleico que codifica um polipeptídio possuindo uma atividade de síntese de esclareol e compreendendo uma sequência de aminoácidos tal como estabelecido na SEQ ID NO: 1, ou c) um ácido nucleico como estabelecido na SEQ ID NO: 2, para que o microrganismo expresse ou sobreexpresse o referido polipeptídio possuindo uma atividade de síntese de esclareol.12. METHOD, according to claim 11, characterized in that it further comprises, before step a), transforming a microorganism with a) the expression vector of claim 7 or 8, or b) a nucleic acid encoding a polypeptide having a sclareol synthesis activity and comprising an amino acid sequence as set out in SEQ ID NO: 1, or c) a nucleic acid as set out in SEQ ID NO: 2, in order for the microorganism to express or overexpress said polypeptide having a sclareol synthesis activity. sclareol synthesis.
BRPI0906166-5A 2008-01-29 2009-01-26 METHOD TO PRODUCE SCLAREOL BRPI0906166B1 (en)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
EP08101075.3 2008-01-29
EP08101075 2008-01-29
EP08102661.9 2008-03-17
EP08102661 2008-03-17
EP08102811 2008-03-20
EP08102811.0 2008-03-20
PCT/EP2009/050816 WO2009095366A1 (en) 2008-01-29 2009-01-26 Method for producing sclareol

Publications (2)

Publication Number Publication Date
BRPI0906166A2 BRPI0906166A2 (en) 2015-07-21
BRPI0906166B1 true BRPI0906166B1 (en) 2023-06-06

Family

ID=

Similar Documents

Publication Publication Date Title
US9267155B2 (en) Method for producing sclareol
US8586328B2 (en) Method for producing sclareol
ES2410906T3 (en) Alfa-santaleno production procedure
ES2453192T3 (en) Beta-Santalene production procedure
US9714440B2 (en) Method for producing patchoulol and 7-epi-α-selinene
US20120021475A1 (en) Method for producing (+)-zizaene
WO2009044336A2 (en) Method for producing diterpenes
BRPI0906166B1 (en) METHOD TO PRODUCE SCLAREOL
BR112017021401B1 (en) PRODUCTION OF FRAGRANT COMPOUNDS
BRPI0906468B1 (en) METHOD TO PRODUCE SCLAREOL
AU2017202313B2 (en) Method for producing beta-santalene
ES2792041T3 (en) Sesquiterpene production procedure
BRPI0913671B1 (en) METHOD FOR PRODUCING ALPHA-SANTALENE