PT2970934T

PT2970934T - Polipèptidos de valenceno sintase, moléculas de ácido nucleico que os codificam e suas utilizações

Info

Publication number: PT2970934T
Application number: PT147188247T
Authority: PT
Inventors: Saran Dayal; Eunyoung Park Grace
Original assignee: Inc Evolva
Priority date: 2013-03-14
Filing date: 2014-03-11
Publication date: 2017-11-21
Also published as: EP3085778A1; HUE035866T2; WO2014150599A1; ES2647828T3; DK2970934T3; EP2970934A1; EP2970934B1; US20150007368A1; EP3085778B1; PL2970934T3; ES2891377T3; US10000749B2

Description

DESCRIÇÃO

POLIPÈPTIDOS DE VALENCENO SINTASE, MOLÉCULAS DE ÁCIDO NUCLEICO QUE OS CODIFICAM E SUAS UTILIZAÇÕES

CAMPO DA INVENÇÃO São fornecidos polipéptidos de valenceno sintase, moléculas de ácido nucleico que codificam as valenceno sintase, células hospedeiras que contêm os ácidos nucleicos e métodos para a produção de produtos cuja produção é catalisada pelos polipéptidos. Também são fornecidos métodos para a produção de valenceno e nootkatona.

ANTECEDENTES

Valenceno e nootkatone são sesquiterpenos que ocorrem em óleos essenciais, como óleos cítricos, incluindo laranja e toranja. 0 Valenceno é produzido por ciclização do pirofosfato de terpeno acíclico, precursor de difosfato de farnesilo (FPP), e a oxidação do valenceno resulta na formação de nootkatona. Valenceno e nootkatona são ambos utilizados na indústria de perfumes e sabor.

Valenceno originalmente foi extraído da casca da laranja de Valência e a nootkatona é extraída das cascas de toranja ou produzida pela oxidação do valenceno extraído. Embora tenham sido tentadas abordagens químicas para gerar valenceno e nootkatona, as estruturas altamente complexas destes compostos tornaram estes processos sintéticos economicamente inviáveis para a sua preparação em grandes quantidades. 0 Valenceno tem sido produzido em células hospedeiras catalisadas pelo ácido nucleico que codifica uma valenceno sintase de citrino (ver, por exemplo, Patente US N° 7 442 785). São procuradas formas de melhorar a produção e meios alternativos de produção para a produção de valenceno e outros terpenos.

Assim, entre os objetos aqui descritos, está o fornecimento de polipéptidos de valenceno sintase e métodos para a produção de produtos de terpeno cuja produção é catalisada pelos polipéptidos. US2012 / 246767 descreve polipéptidos de valenceno sintase modificados e métodos de utilização de polipéptidos de valenceno sintase modificados. Ela também descreve métodos para produzir terpeno sintases modificadas. 0 número de sequência GU987104.1, que pode ser recuperado do banco de dados on-line EMBLE, relaciona-se com o mRNA de Eleutherococcus trifoliatus alpha-copaene sintase (Cop), cds completos. Divulga uma molécula linear de mRNA com um comprimento de sequência de 1948.

SUMÁRIO São fornecidos valenceno sintase de Eryngium (EgVSs).São providenciados e isolados polipéptidos de valenceno sintase de Eryngium, que têm uma sequência de aminoácidos que tem pelo menos 90% de identidade de sequência com o polipéptido de valenceno sintase cuja sequência é apresentada na SEQ ID NO: 1 ou com um seu fragmento catalit icamente ativo. A sintase exemplificativa de Eryngium glacial, possui a sequência de aminoácidos apresentada na SEQ ID NO: 1. As valenceno sintase proporcionadas aqui catalisam a produção de valenceno e outros produtos a partir de um precursor de pirofosfato de terpeno acíclico, tal como, mas não se limitando a, difosfato de farnesil. A produção pode ser efetuada in vitro, contactando a sintase isolada com um precursor de pirofosfato de terpeno acíclico, ou in vivo numa célula hospedeira adequada que codifica a sintase. Células hospedeiras adequadas produzem ou são modificadas para produzir um precursor de pirofosfato acíclico. Se as células são de origem humana, elas são células isoladas ou cultivadas ou estão numa cultura celular. As células, tais como células de levedura, particularmente células que expressam um precursor de pirofosfato de terpeno acíclico, que expressam o EgVS produzem quantidades muito elevadas de valenceno em comparação com as mesmas células que expressam a valenceno sintase cítrica (Citrus sinensis) (CVS) e as suas variantes que são otimizadas e / ou modificadas para expressar altos níveis de valenceno. Além disso, é proporcionado um polipéptido de valenceno sintase que é um fragmento cataliticamente ativo do péptido de valenceno sintase isolado da presente invenção, em que o fragmento cataliticamente ativo catalisa a formação de valenceno a partir de um precursor de terpeno de pirofosfato acíclico.

Também são fornecidas moléculas de ácido nucleico que codificam qualquer uma das valenceno sintase aqui providenciadas. As moléculas de ácido nucleico incluem moléculas isoladas de ácido nucleico e também cADN. Por exemplo, as moléculas de ácido nucleico aqui proporcionadas são aquelas que codificam a sequência de aminoácidos apresentada na SEQ ID NO: 1, e também qualquer uma que codifique uma sequência de aminoácidos que tenha pelo menos 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência com um polipéptido de valenceno sintase cuja sequência é apresentada em SEQ ID NO: 1 ou um fragmento cataliticamente ativo do mesmo, em que o polipéptido codificado catalisa a produção de valenceno a partir de um precursor de pirofosfato de terpeno acíclico. Por exemplo, a molécula de ácido nucleico isolada é selecionada entre as moléculas de ácido nucleico que contêm: (a) a sequência de ácidos nucleicos estabelecidos na SEQ ID NO: 2; (b) uma sequência de ácidos nucleicos com pelo menos 85% de identidade de sequência com uma sequência de ácidos nucleicos estabelecidos na SEQ ID NO: 2 e codificando um polipéptido de valenceno sintase com pelo menos 90% de identidade de sequência com o polipéptido de SEQ ID NO: 1; e (c) degenerados de (a) e (b) . Também são fornecidos os polipéptidos isolados e fragmentos cataliticamente ativos codificados pelas moléculas de ácido nucleico aqui proporcionado. Os polipéptidos codificados podem ser produzidos por expressão em qualquer célula hospedeira, incluindo células eucarióticas e procarióticas, tais como células de mamífero, células de levedura e células bacterianas. Nos exemplos em que a célula hospedeira é uma célula de mamífero que é uma célula humana, a célula é uma célula isolada ou uma célula em cultura, tal como numa cultura celular.

Também são providenciados vetores que contêm as moléculas de ácido nucleico aqui proporcionadas. Os vetores incluem vetores procarióticos e eucarióticos, incluindo vetores virais e vetores de leveduras, tais como vetores de Saccharomyces.

Também são fornecidas células que contêm as moléculas de ácido nucleico que codificam um EgVS. As células incluem células procarióticas e células eucarióticas, incluindo, mas não se limitando a células de bactérias, leveduras, insetos, plantas e mamíferos. Nos exemplos em que a célula hospedeira é uma célula de mamífero que é uma célula humana, a célula é uma célula isolada ou uma célula cultivada. Nalguns exemplos, o ácido nucleico é heterólogo para a célula. As células de levedura aqui providenciadas incluem, mas não estão limitadas a, células do género Saccharomyces e do género Pichia. As células bacterianas aqui providenciadas incluem células de Escherichia coli. As células vegetais aqui providenciadas incluem protoplastos. As células podem produzir o precursor acíclico, como o difosfato de farnesilo, naturalmente, ou podem ser modificadas para produzir ou produzir mais do que uma célula não modificada. Entre as células aqui proporcionadas estão aquelas que codificam um polipéptido de valenceno sintase, em que: a célula hospedeira produz um precursor de terpeno de pirofosfato acíclico; o polipéptido de valenceno sintase é heterólogo para o hospedeiro; e o valenceno sintase catalisa a produção de valenceno a partir do percursor de pirofosfato de terpeno acíclico, tal como o difosfato de farnesilo. Também são providenciadas plantas transgênicas que codificam os polipéptidos de valenceno sintase aqui proporcionados. Eles podem incluir ácido nucleico que codifica o polipéptido de valenceno sintase ou um vetor adequado que o codifica. Exemplos de plantas transgênicas incluem plantas de tabaco.

Fornecidos aqui são métodos para produzir um polipéptido de valenceno sintase. Os métodos incluem as etapas de introdução de uma molécula de ácido nucleico que codifica os polipéptidos de valenceno sintase, ou seus fragmentos cataliticamente ativos, aqui fornecidos ou um vetor que codifica o polipéptido de valenceno sintase, ou seus fragmentos cataliticamente ativos, numa célula, por exemplo, por transfecção ou transformação; cultivando a célula in vitro ou in vivo sob condições adequadas para a expressão do polipéptido de valenceno sintase ou um seu fragmento cataliticamente ativo; e, opcionalmente, isolando o polipéptido de valenceno sintase. As células para utilização nos métodos incluem células hospedeiras eucarióticas e procarióticas, incluindo, mas não se limitando a, células de bactérias, leveduras, insetos, plantas e mamíferos. As células de levedura para uso nos métodos incluem, mas não estão limitadas a, células do género Saccharomyces e células do género Pichia.

Também são fornecidos métodos para a produção de valenceno. Os métodos envolvem o contacto de um precursor de pirofosfato de terpeno aciclico com um polipéptido de valenceno sintase ou um seu fragmento cataliticamente ativo, aqui proporcionado, in vitro ou in vivo, sob condições adequadas para a formação de valenceno a partir do precursor de terpeno de pirofosfato aciclico, tal como difosfato de farnesilo. Em alguns exemplos, o valenceno é isolado ou purificado. Nos métodos fornecidos, o passo de contacto do precursor de pirofosfato de terpeno aciclico com o polipéptido de valenceno sintase ou seu fragmento cataliticamente ativo pode ser efetuado in vitro ou in vivo numa célula hospedeira adequada aqui proporcionada. Quando efetuado in vivo, os ácidos nucleicos ou vetores podem ser introduzidos nas células como aqui descrito, de modo que o polipéptido de valenceno sintase codificado ou seu fragmento catalítico seja heterólogo às células e as células são cultivadas sob as condições em que a valenceno sintase codificada é expressa. As células para utilização em tais métodos podem ser modificadas para produzir o precursor aciclico ou para produzir mais do precursor aciclico do que as células não modificadas. Exemplos de células e métodos para selecionar tais células incluem os descritos nas Patentes dos EUA emitidas Nos 8.609.371 ( Pub. EUA No. 2010-0151555) e 8.481.286 ( Pub. EUA No. 2010-0151519) . O valenceno pode ser convertido em nootkatona, por oxidação, que pode ser realizada por métodos conhecidos, incluindo métodos biossintéticos e químicos.

Assim, também aqui são providenciados métodos de produção de nootkatona. Tais métodos envolvem a produção de valenceno utilizando as etapas estabelecidas em qualquer dos métodos aqui proporcionados para a produção de valenceno; isolando o produto valenceno; oxidando o valenceno para produzir nootkatona; e isolando a nootkatona. 0 valenceno pode ser oxidado quimicamente ou biosintéticamente.

Em qualquer um dos métodos proporcionados, qualquer método conhecido dos peritos na arte pode ser utilizado para isolar valenceno e / ou nootkatona, bem como quaisquer outros produtos da reação (ões), incluindo aristoloceno, que é o composto do pico 2 na Figura 3A. Tais métodos de isolamento incluem, mas não estão limitados a, extração com um solvente orgânico e / ou cromatografia em coluna.

BREVE DESCRIÇÃO DAS FIGURAS FIGURA 1 é o esquema de reação para a produção de valenceno e nootkatona. As valenceno sintases são as terpeno ciclases da classe 1 ou as sintases que convertem o difosfato de farnesil (FPP) no valenceno sesquiterpeno. 0 Valenceno pode então ser oxidado para formar nootkatona. FIGURAS 2A—B. A Figura 2A descreve o cromatograma de gás do extrato de óleo vegetal de Eryngium glaciale. Valenceno (pico 1) é detetado em 10,18 minutos. A Figura 2B representa o espectro de massa do pico a 10,18 minutos, o que corresponde ao valenceno. FIGURAS 3A-B. A Figura 3A representa o cromatograma de gás de uma estirpe de levedura exemplificativa designada como estirpe ALX7-95 transformada com um gene que codifica a valenceno sintase da Eryngium glaciale.

Valenceno (pico 1) é observado aos 12,46 minutos. Um composto adicional (designado Pico 2) é observado aos 12,37 minutos. A Figura 3B representa o espectro de massa do pico a 12,46, o gue corresponde ao valenceno. FIGURAS 4A-G representam alinhamentos exemplificativos de valenceno sintase de Eryngium glaciale (EGVS) com outras valenceno sintase. Um significa gue os resíduos ou nucleótidos nessa coluna são idênticos em todas as sequências do alinhamento, um significa que as substituições conservadas foram observadas e um significa que as substituições semi-conservadas são observadas. Por exemplo, a Figura 4A representa o alinhamento da valenceno sintase de Eryngium glaciale estabelecido na SEQ ID NO: 1 com valenceno sintase do Citrus sinensis (CVS) estabelecido na SEQ ID NO: 14. A Figura 4B representa o alinhamento da valenceno sintase de Eryngium glaciale apresentada na SEQ ID NO: 1 com a valenceno sintase Citrus x paradisi (CVS) estabelecido na SEQ ID NO: 15. A Figura 4C representa o alinhamento da valenceno sintase de Eryngium glaciale apresentada na SEQ ID NO: 1 com a valenceno sintase da Vitis vinifera (VVS) estabelecida na SEQ ID NO: 16. A Figura 4D representa o alinhamento da valenceno sintase de Eryngium glaciale estabelecida na SEQ ID NO: 1 com valenceno sintase da Chamaecyparis nootkatensis (CNVS) estabelecida na SEQ ID NO: 17. A Figura 4E representa o alinhamento da valenceno sintase da Eryngium glaciale estabelecido na SEQ ID NO: 1 com uma CVS valenceno sintase modificada designada por V277 (descrita na Publicação dos EUA co pendente com o número de série 2012-0246767), cuja sequência é apresentada na SEQ ID NO: 31. A Figura 4F representa o alinhamento da valenceno sintase de Eryngium glaciale apresentada na SEQ ID NO: 1 com valenceno sintase da Chamaecyparis nootkatensis (CNVS) estabelecida na SEQ ID NO: 29. A Figura 4G representa o alinhamento da valenceno sintase de Eryngium glaciale apresentada na SEQ ID NO: 1 com valenceno sintase da Perilla frutescens (PFVS) estabelecida na SEQ ID NO: 38.

As FIGURAS 5A-J representam alinhamentos exemplificativos de valenceno sintase de Eryngium glaciale (EGVS) com outras terpeno sintases. Um significa que os resíduos ou nucleótidos nessa coluna são idênticos em todas as sequências no alinhamento, um " : " significa que as substituições conservadas foram observadas e uma significa que as substituições semi-conservadas são observadas. Por exemplo, a Figura 5A representa o alinhamento da valenceno sintase de Eryngium glaciale apresentada na SEQ ID NO: 1 com a alfa-copaeno sintase da Eleutherococcus trifoliatus (ETACS) estabelecido na SEQ ID NO: 18. A Figura 5B representa o alinhamento da valenceno sintase de Eryngium glaciale estabelecida na SEQ ID NO: 1 com germacrene-D sintase da Actinídea deliciosa (ADGDS) estabelecida na SEQ ID NO: 19. A Figura 5C representa o alinhamento da valenceno sintase de Eryngium glaciale apresentada na SEQ ID NO: 1 com (-)-germacreno-D sintase da Vitis vinifera (VDGS) estabelecida na SEQ ID NO: 20. A Figura 5D descreve o alinhamento da valenceno sintase de Eryngium glaciale estabelecida na SEQ ID NO: 1 com sesquiterpeno sintase de Santalum murrayanum (SMSS) estabelecido na SEQ ID NO: 21. A Figura 5E representa o alinhamento da valenceno sintase de Eryngium glaciale estabelecida na SEQ ID NO: 1 com ( + )-delta-cadineno sintase da Ricinus communis (RCDCS) estabelecido na SEQ ID NO: 22. A Figura 5F representa o alinhamento da valenceno sintase de Eryngium glaciale estabelecida na SEQ ID NO: 1 com delta-cadineno sintase da Citrus x paradisi (CDCS) estabelecido na SEQ ID NO: 23. A Figura 5G representa o alinhamento da valenceno sintase de Eryngium glaciale estabelecida na SEQ ID NO: 1 com 5-epi-aristoloceno sintase da Nicotiana tabacum (TEAS) estabelecido na SEQ ID NO: 24. A Figura 5H representa o alinhamento da valenceno sintase de Eryngium glaciale estabelecida na SEQ ID NO: 1 com premnaspirodieno sintase da Hyascyamus muticus(HPS) estabelecido na SEQ ID NO: 25. A Figura 51 representa um alinhamento da valenceno sintase de Eryngium glaciale apresentada na SEQ ID NO: 1 com germacrene D sintase da Citrus hystrix estabelecida na SEQ ID NO: 45. A Figura 5J representa um alinhamento de V277 estabelecido na SEQ ID NO: 31 e valenceno sintase de citrus estabelecido na SEQ ID NO: 14 A Figura 6 mostra os parâmetros cinéticos da enzima no estado estacionário para a valenceno sintase de E. glaciale (EgVS), cuja sequência apresentada na SEQ ID NO: 1 (à esquerda) e a valenceno sintase V277 (rotulada CVS), cuja sequência é estabelecida na SEQ ID NO: 31 (à direita); FPP = difosfato de farnesilo. A Figura 7 demonstra que o valenceno produzido em leveduras catalisadas por EVS é significativamente maior que o produzido em leveduras catalisadas pelo CVS . DESCRIÇÃO DETALHADA Resumo A. Definições B. Visão geral 1. Estrutura do Valenceno e utilizações 2. Nootkatona 3. Valenceno sintase a. Estrutura b. Atividades 4. Ensaios para detetar a atividade enzimática de polipéptidos de valenceno sintase C. Moléculas de ácido nucleico que codificam a valenceno sintase de Eryngium glaciale e polipéptidos codificados 1. Isolamento de ácido nucleico que codifica valenceno sintases a. Produção de ácido nucleico modificado 2. Vetores e células para expressão de polipéptidos de valenceno sintase 3. Sistemas de expressão a. Células procarióticas b. Células de levedura c. Plantas e células vegetais d. Insetos e células de insetos e. Células de mamiferos 4. Purificação D. Polipéptidos de Valenceno sintase 1. Polipéptidos de Valenceno sintase de Eryngium glaciale 2. Modificações de polipéptidos de valenceno sintase de Eryngium glaciale a. Polipéptidos truncados b. Polipéptidos com atividades ou propriedades alteradas c. Permutas de domínio d. Variantes adicionais e. Proteínas de Fusão E. Métodos para a produção de terpenos e métodos para a deteção de tais produtos e da atividade de polipéptidos de valenceno sintase 1. Produção de terpenos catalisados por valenceno sintase de Eryngium glaciale a. Células exemplificativas b. Cultura de células c. Isolamento e avaliação de produtos 2. Produção de Nootkatona F. Exemplos

A. DEFINIÇÕES A menos que definido de outro modo, todos os termos técnicos e científicos aqui utilizados têm o mesmo siqnificado que é vulgarmente entendido por um perito na arte à qual a invenção (ões) pertence.

No caso de haver uma pluralidade de definições para os termos aqui empregues, prevalecem as que estão nesta seção. Quando a referência é feita para um URL ou outro identificador ou endereço, entende-se que tais identificadores podem mudar e informações especificas na internet podem ir e vir, mas informações equivalentes podem ser encontradas pesquisando na internet. A referência a isso evidencia a disponibilidade e divulgação pública dessas informações.

Tal como aqui utilizado, um precursor de terpeno de pirofosfato aciclico é qualquer composto de pirofosfato aciclico que é um precursor da produção de pelo menos um terpeno, incluindo, mas não se limitando a, pirofosfato de farnesilo (FPP), geranil-pirofosfato (GPP) e geranilgeranilo -pirofosfato (GGPP). Os precursores de pirofosfato de terpeno aciclico são, portanto, substratos para terpeno sintases.

Tal como aqui utilizado, um terpeno é um hidrocarboneto insaturado com base na unidade de isopreno (CsHs) , e tendo a fórmula geral CsxHsx, tais como C10H16. A referência a um terpeno inclui terpenos aciclicos, monociclicos e policiclicos. Os terpenos incluem, mas não estão limitados a, monoterpenos, que contêm 10 átomos de carbono; sesquiterpenos, que contêm 15 átomos de carbono; diterenos, que contêm 20 átomos de carbono, e triterpenos, que contêm 30 átomos de carbono. A referência a um terpeno também inclui estereoisómeros do terpeno.

Tal como aqui utilizado, um terpeno-sintase é um polipéptido capaz de catalisar a formação de um ou mais terpenos a partir de um precursor de pirofosfato de terpeno aciclico, por exemplo, FPP, GPP ou GGPP.

Tal como aqui utilizado, valenceno é um sesquiterpeno tendo a seguinte estrutura:

A referência ao valenceno inclui a referência a qualquer isómero do mesmo, incluindo, mas não se limitando a (+) - valenceno.

Tal como aqui utilizado, nootkatona é um sesquiterpeno tendo a seguinte estrutura:

A referência a nootkatona inclui a referência a qualquer isómero do mesmo.

Tal como aqui utilizado, uma "valenceno sintase" ou "polipéptido de valenceno sintase" é um polipéptido capaz de catalisar a formação de valenceno a partir de um precursor de terpeno de pirofosfato aciclico, tal como o difosfato de farnesilo (FPP). Incluídos entre os polipéptidos de valenceno sintase aqui descritos são quaisquer uns que tenham maior que ou maior que cerca de 63%, 65%, 70%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82 % 83% 84% 85% 86% 87% 88% 89% 90% 91% 92% 93% 94% 95% 96% 97% 98% 99% de identidade de sequência com a valenceno sintase apresentada na SEQ ID NO: 1, quando alinhada ao longo do seu comprimento completo, ou um seu fragmento cataliticamente ativo. Estes polipéptidos catalisam a produção de valenceno como o único produto ou um entre uma mistura de produtos formada a partir da reação de um precursor de terpeno de pirofosfato aciclico com uma valenceno sintase. Normalmente, o valenceno é o produto mais prevalente ou está entre vários produtos prevalentes. Por exemplo, a quantidade de valenceno produzido a partir da reação de uma valenceno sintase com um precursor de terpeno de pirofosfato aciclico é normalmente pelo menos igual ou pelo menos cerca de 1%, 5%, 10%, 20%, 30%, 40%, 50% 60%, 70%, 80%, 90% ou mais da quantidade total de terpeno produzido na reação. Nalguns casos, o valenceno é o produto de terpeno predominante (ou seja, presente em maiores quantidades do que qualquer outro terpeno simples produzido a partir da reação de um precursor de terpeno de pirofosfato aciclico com uma valenceno sintase). A referência a uma valenceno sintase inclui qualquer polipéptido que catalise a produção de valenceno, incluindo, mas não se limitando a, um polipéptido produzido de forma recombinante, um polipéptido produzido sinteticamente e um polipéptido de valenceno sintase extraído ou isolado a partir de células e matéria vegetal a partir da qual o valenceno foi isolado, incluindo, mas não se limitando a, espécies do cardo como aqui proporcionado. Outros exemplos de polipéptidos de valenceno sintase incluem os isolados de citrinos, flores de videira (por exemplo, Vitis vinifera L. cv. Gewurztraminer e Vitis vinifera L. cv. Cabernet Sauvignon (ver Lucker et ai., (2004) Fotoquímica 65 (19): 2649 -2659 e Martin et ai., (2009) Proc. Natl. Acad. Sei, USA 106: 7245-7250) e perila (shiso verde). Valenceno sintases de Citrus (CVS), incluem, mas não estão limitadas a, valenceno sintase de Citrus sinensis (laranja doce) (SEQ ID NOS: 14 e 34) e Citrus x paradisi (Toranja) (SEQ ID NOS: 15, 26 e 27) . Outros exemplos de polipéptidos de valenceno sintase incluem valenceno sintase isolada de flores de videira, incluindo Vitis vinifera L. cv. Gewurztraminer e Vitis vinifera L. cv. Cabernet Sauvignon (SEQ ID NOS: 16 e 28), valenceno sintases isoladas de Chamaecyparis nootkatensis pendula (SEQ ID NO: 17 e 29) e valenceno sintase de Perilla frutescens (SEQ ID NO: 38). A referência à valenceno sintase inclui valenceno sintase de qualquer gênero ou espécie e inclui variantes alélicas ou de espécies, variantes codificadas por variantes de splicing e outras variantes das mesmas, incluindo polipéptidos que possuem pelo menos, ou pelo menos cerca de 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% ou mais de identidade de sequência para a valenceno sintase estabelecida na SEQ ID NO: 1. A valenceno sintase também inclui fragmentos da mesma que retém a atividade da valenceno sintase.

Tal como aqui utilizado, os fragmentos cataliticamente ativos dos polipéptidos de valenceno sintase são polipéptidos de sintase truncados que retém a capacidade de catalisar a formação de valenceno a partir de um precursor de pirofosfato de terpeno aciclico. Um especialista na técnica prontamente pode identificar um fragmento de uma sintase que retém a atividade catalítica testando-a com qualquer ensaio adequado, tal como qualquer um aqui descrito, e detetando a formação de valenceno a partir do precursor.

Tal como aqui utilizado, a "atividade de valenceno sintase" (também referida aqui como atividade catalítica) refere-se à capacidade de catalisar a formação de valenceno a partir de um precursor de pirofosfato de terpeno aciclico, tal como difosfato de farnesilo (FPP). Os métodos para avaliar a formação de valenceno a partir da reação de uma sintase com um precursor de pirofosfato de terpeno aciclico, tais como FPP, são bem conhecidos na técnica e aqui descritos. Por exemplo, a sintase pode ser expressa numa célula hospedeira, tal como uma célula de levedura, que também produz FPP. A produção de valenceno pode então ser avaliada e quantificada utilizando, por exemplo, cromatografia gasosa espectrometria de massa (GC-MS) (ver exemplos abaixo) . Considera-se que uma sintase exibe atividade de valenceno sintase ou a capacidade de catalisar a formação de valenceno a partir de um precursor de pirofosfato de terpeno aciclico tal como FPP se a quantidade de valenceno produzido a partir da reação for pelo menos ou pelo menos cerca de 1%, 5%, 10 %, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% ou mais da quantidade total de terpenos produzidos na reação.

Tal como aqui utilizado, "aumento da atividade catalítica" com referência à atividade de uma valenceno sintase significa que a capacidade de catalisar a formação de valenceno a partir de um precursor de terpeno de pirofosfato acíclico, tal como difosfato de farnesilo (FPP) , é aumentada, resultando assim numa formação aumentada de valenceno. Para os propósitos aqui apresentados, uma valenceno sintase exibe aumento da atividade catalítica se a quantidade de valenceno produzido a partir de FPP pela valenceno sintase modificada for de 10% a 500%, 10% a 250%, 50% a 250%, 100% a 500% ou seja 100% a 250% maior do que a quantidade de valenceno produzido a partir de FPP pela valenceno sintase estabelecida na SEQ ID NO: 1, tal como 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 110%, 120%, 130%, 140%, 150%, 160%, 170%, 180%, 190%, 200%, 250%, 300%, 350%, 400%., 500% ou mais, maior do que a quantidade de valenceno produzido a partir de FPP pela valenceno sintase estabelecida na SEQ ID NO: 1. Por exemplo, uma valenceno sintase exibe uma atividade catalítica aumentada se a quantidade de valenceno produzido a partir de FPP pela valenceno sintase modificada for, pelo menos, ou pelo menos cerca de 110%, 115%, 120%, 125%, 130%, 135%, 140% 145% 150% 160% 170% 180% 200% 250% 300% 350% 400% 500% 1500% 2000% 3000% 4000% 5000% da quantidade de valenceno produzido a partir de FPP por valenceno sintase de tipo selvagem estabelecido na SEQ ID NO: 1 nas mesmas condições.

Tal como aqui utilizado, "tipo selvagem" ou "nativo" com referência à valenceno sintase refere-se a um polipéptido de valenceno sintase codificado por um gene de valenceno sintase nativo ou de ocorrência natural, incluindo variantes alélicas, que está presente num organismo, incluindo uma planta, na natureza. A referência à valenceno sintase de tipo selvagem sem referência a uma espécie destina-se a abranger gualguer espécie de valenceno sintase de tipo selvagem. As sequências de aminoácidos de valenceno sintase exemplificativas são apresentadas na SEQ ID NO: 1 (isolada a partir de Eryngium glaciale) , SEQ ID NO: 14 (isolado de Citrus sinensis cv. Valência, Citrus sinensis cv. Cara Cara e Citrus x paradisi) , SEQ ID NO: 34 (isolado de Citrus sinensis cv. Valência), SEQ ID NO: 27 (isolado de Citrus x paradisi), SEQ ID NO: 26 (isolado de Citrus x paradisi), SEQ ID NOS: 16 e 28 (isolado de Vitis vinifera) , SEQ ID NO: 29 (isolado de Chamaecyparis nootkatensis pendula) e SEQ ID NO: 38 (isolado de Perilla frutescens).

Tal como aqui utilizado, variantes de espécies refere-se a variantes de polipéptidos entre espécies diferentes.

Tal como aqui utilizado, variantes alélicas refere-se a variações em proteínas codificadas entre os membros da mesma espécie.

Tal como aqui utilizado, uma variante de splicing refere-se a uma variante produzida por processamento diferencial de um ADN genómico transcrito primariamente, de que resulta mais do que um tipo de ARNm.

Tal como aqui utilizado, "polipéptido de valenceno sintase modificado" refere-se a um polipéptido de valenceno sintase que tem uma ou mais diferenças de aminoácidos em comparação com um polipéptido de valenceno sintase de tipo selvagem ou não modificado. A uma ou mais diferenças de aminoácidos podem ser mutações de aminoácidos tais como uma ou mais alterações de aminoácidos (substituições), inserções ou deleções, ou podem ser inserções ou deleções de domínios inteiros, e quaisquer combinações dos mesmos. Normalmente, um polipéptido de valenceno sintase modificado tem uma ou mais modificações na sequência primária em comparação com um polipéptido de valenceno sintase de tipo selvagem ou não modificado. Por exemplo, um polipéptido de valenceno sintase modificado aqui proporcionado pode ter pelo menos 1, 5, 10, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 90, 95, 100, 105, 110, 115, 120, 125, 130, 135 ou mais diferenças de aminoácidos em comparação com um polipéptido de valenceno sintase não modificado. Qualquer modificação é contemplada desde que o polipéptido resultante exiba pelo menos uma atividade de valenceno sintase associada a um polipéptido de valenceno sintase de tipo selvagem, tal como, por exemplo, atividade catalítica, a capacidade de se ligar ao FPP e / ou a capacidade de catalisar a formação de valenceno a partir de FPP.

Tal como aqui utilizado, a referência a um polipéptido de valenceno sintase modificado produzindo valenceno a partir de FPP numa quantidade que é maior que a quantidade de valenceno produzido a partir de FPP por uma valenceno sintase de referência, tal como uma valenceno sintase de tipo selvagem, indica que a valenceno sintase modificada produz pelo menos ou cerca de 10% mais de valenceno a partir FPP do que, aquilo que a valenceno sintase de referência produz. Por exemplo, um polipéptido de valenceno sintase modificado pode produzir pelo menos, ou pelo menos, cerca de 10%, 11%, 12%, 13%, 14%, 15%, 20%, 30%, 40%, 50%, 60% 70%, 80%, 90%, 100%, 110%, 120%, 130%, 140%, 150%, 160%, 170%, 180%, 190%, 200%, 250%, 300%, 350% 400%, 500%, 600%, 700%, 800%, 900%, 1000%, 2000%, 5000% ou mais de valenceno a partir de FPP em comparação com a quantidade de valenceno produzido a partir de FPP por uma valenceno sintase de referência. A quantidade de valenceno produzido a partir de FPP por uma valenceno sintase pode ser avaliada por qualquer método conhecido na técnica. Ao comparar a quantidade de valenceno produzido a partir de FPP por duas valenceno sintases, sendo uma valenceno sintase modificada e uma valenceno sintase de referencia, tal como uma valenceno sintase de tipo selvaqem, entende-se que o ensaio é realizado nas mesmas condições para cada sintase . Num exemplo, a quantidade de valenceno produzido a partir de FPP por duas valenceno sintases, sendo uma valenceno sintase modificada e uma valenceno sintase de referência, é avaliada pela expressão da valenceno sintase modificada e de valenceno sintase de referência separadamente numa célula de levedura da mesma espécie (em que a expressão é do mesmo vetor de expressão) que também produz FPP e a cultura das células está sob as mesmas condições, de modo que o valenceno é produzido. A quantidade de valenceno produzido na cultura celular que expressa a valenceno sintase modificada é comparada com a quantidade de valenceno produzido na cultura celular que expressa a valenceno sintase de referência, utilizando métodos de quantificação bem conhecidos na técnica, tais como GC-MS.

Tal como aqui utilizado, os resíduos correspondentes referem-se a resíduos que ocorrem em locus alinhados. Os polipéptidos relacionados ou variantes estão alinhados por qualquer método conhecido dos especialistas na técnica. Tais métodos normalmente maximizam as correspondências e incluem métodos como o uso de alinhamentos manuais e utilização de inúmeros programas de alinhamento disponíveis (por exemplo, BLASTP) e outros conhecidos dos especialistas na técnica. Ao alinhar as sequências de polipéptidos, um especialista na técnica pode identificar resíduos correspondentes, usando resíduos de aminoácidos conservados e idênticos como guias. As posições correspondentes também podem ser baseadas em alinhamentos estruturais, por exemplo, usando alinhamentos da estrutura proteica simulados por computador. Por exemplo, como mostrado na Figura 4A, Asp315 de valenceno sintase de E. glaciale estabelecida na SEQ ID NO: 1 corresponde a Asp301 de valenceno sintase de C. sinensis apresentada na SEQ ID NO: 14.

Tal como agui utilizado, domínio ou região (normalmente uma sequência de três ou mais, geralmente 5 ou 7 ou mais aminoácidos) refere-se a uma porção de uma molécula, tal como uma proteína ou os ácidos nucleicos que a codificam, que é estruturalmente e / ou funcionalmente distinta de outras porções da molécula e é identificável. Uma proteína pode ter um, ou mais de um, domínios distintos. Por exemplo, um domínio pode ser identificado, definido ou distinguido por homologia da sequência nele contido com membros da família relacionados, como outras terpeno sintases. Um domínio pode ser uma sequência linear de aminoácidos ou uma sequência não linear de aminoácidos. Muitos polipéptidos contêm uma pluralidade de domínios. Tais domínios são conhecidos, e podem ser identificados pelos especialistas na técnica. Para exemplificação aqui, são proporcionadas definições, mas entende-se que está bem dentro da habilidade de um perito na técnica reconhecer domínios específicos pelo nome. Se necessário, um software apropriado pode ser empregue para identificar domínios. Por exemplo, como discutido acima, os domínios correspondentes em diferentes terpeno sintases podem ser identificados por alinhamentos de sequência, como utilizando ferramentas e algoritmos bem conhecidos na técnica (por exemplo, BLASTP).

Tal como aqui utilizado, um domínio funcional refere-se às porções de um polipéptido que são reconhecidas em virtude de uma atividade funcional, tal como atividade catalítica. Um domínio funcional pode ser distinguido pela sua função, tal como pela atividade catalítica, ou pela capacidade de interagir com uma biomolécula, tal como a ligação ao substrato ou a ligação a um metal. Nalguns exemplos, um domínio pode exibir independentemente uma função ou propriedade biológica de modo que o domínio independentemente, ou fundido com outra molécula, possa desempenhar uma atividade, como, por exemplo, atividade catalítica ou ligação ao substrato.

Tal como aqui utilizado, um domínio estrutural refere-se àquelas porções de uma cadeia de polipéptido que podem formar uma estrutura dobrada, independentemente, dentro de uma proteína constituída por um ou mais motivos estruturais.

Tal como aqui utilizado, "heterólogo" com respeito a um aminoácido ou sequência de ácido nucleico refere-se a porções de uma sequência que não está presente no polipéptido nativo ou codificada pelo polinucleótido nativo. Por exemplo, uma porção de aminoácidos de um polipéptido, tal como um domínio ou região ou porção do mesmo, é heteróloga para uma valenceno sintase se tais aminoácidos não estiverem presentes numa valenceno sintase nativa ou de tipo selvagem (por exemplo, como o conjunto na SEQ ID NO: 1), ou codificado pelo polinucleótido que codifica uma valenceno sintase nativa ou de tipo selvagem.Os polipéptidos que contêm tais aminoácidos heterólogos ou polinucleótidos que os codificam são referidos como "polipéptidos quiméricos" ou "polinucleótidos quiméricos", respetivamente.

Tal como aqui utilizado, a frase "uma propriedade da terpeno-sintase modificada é melhorada em comparação com a primeira terpeno sintase" refere-se a uma alteração desejável numa propriedade de uma terpeno sintase modificada em comparação com uma terpeno sintase que não contém a (s) modificação (ões) . Normalmente, a propriedade ou as propriedades são melhoradas de tal modo que a quantidade de um terpeno desejado produzido a partir da reação de um substrato com a terpeno sintase modificada é aumentada em comparação com a quantidade do terpeno desejado produzido a partir da reação de um substrato com uma terpeno sintase que não é tão modificada. Exemplos de propriedades que podem ser melhoradas numa terpeno sintase modificada incluem, por exemplo, produção de terpeno, atividade catalítica, distribuição de produtos; especificidade do substrato; regiosselectividade e estereosselectividade. Uma ou mais das propriedades podem ser avaliadas usando métodos bem conhecidos na técnica para determinar se a propriedade foi melhorada (ou seja, foi alterada para ser mais vantajosa para a produção de um terpeno ou terpenos desejados).

Tal como aqui utilizado, a produção de terpeno (também referido como rendimento de terpeno) refere-se à quantidade (em peso ou peso / volume) de terpeno produzido a partir da reação de um precursor de terpeno de pirofosfato acíclico com uma terpeno sintase. A referência à produção total de terpeno refere-se à quantidade total de todos os terpenos produzidos a partir da reação, enquanto a referência à produção específica de terpeno refere-se à quantidade de um terpeno específico (por exemplo, valenceno), produzido a partir da reação.

Tal como aqui utilizado, uma produção de terpeno melhorada refere-se a um aumento na quantidade total de terpeno (ou seja, a melhoria da produção total de terpeno) ou um aumento na quantidade especifica de terpeno (isto é, uma melhor produção de terpeno especifico) produzido a partir da reação de um precursor de pirofosfato de terpeno aciclico com uma terpeno sintase modificada em comparação com a quantidade produzida a partir da reação do mesmo precursor de terpeno de pirofosfato aciclico com uma terpeno sintase que não é tão modificada. A quantidade de terpeno (total ou especifico) produzida a partir da reação de um precursor de pirofosfato de terpeno aciclico com uma terpeno sintase modificada pode ser aumentada em pelo menos ou pelo menos cerca de 5%, 10%, 15%, 20%, 30%, 40 %, 50%, 60%, 70%, 80%, 90%, 100% ou mais em comparação com a quantidade de terpeno produzido a partir da reação do mesmo precursor de terpeno de pirofosfato aciclico nas mesmas condições com uma terpeno sintase que não é tão modificada.

Tal como aqui utilizado, a especificidade de substrato refere-se á preferência de uma valenceno sintase para um substrato alvo em vez de um outro, tal como um precursor pirofosfato de terpeno aciclico (por ex. de farnesilo pirofosfato (FPP), geranil-pirofosfato (GPP), ou geranilgeranilo-pirofosfato (GGPP)) sobre outro. A especificidade do substrato pode ser avaliada usando métodos bem conhecidos na técnica, como aqueles que calculam kcat/ Km. Por exemplo, a especificidade do substrato pode ser avaliada comparando a relação KCat/Km, a qual é uma medida de eficiência catalítica, da enzima contra vários substratos (por exemplo, GPP, FPP, GGPP).

Tal como aqui utilizado, a especificidade alterada refere-se a uma alteração na especificidade do substrato de um polipéptido de terpeno sintase modificado (tal como um polipéptido de valenceno sintase modificado) em comparação com uma terpeno sintase que não é tão modificada (tal como, por exemplo, um valenceno sintase de tipo selvagem). A especificidade (por exemplo, kcat/ Km) de um polipéptido de terpeno sintase modificado para um substrato, tal como FPP, GPP ou GGPP, pode ser alterada pelo menos ou pelo menos cerca de 10%, 15%, 20%, 30% , 40%, 50%, 60%, 70%, 80%, 90%, 100% ou mais em comparação com a especificidade de uma valenceno sintase inicial para o mesmo substrato.

Tal como aqui utilizado, a especificidade de substrato melhorada refere-se a uma mudança ou alteração na especificidade do substrato a uma especificidade mais desejada. Por exemplo, a especificidade de substrato melhorada pode incluir um aumento na especificidade do substrato de um polipéptido de terpeno sintase modificado para um substrato desejado, tal como FPP, GPP ou GGPP. A especificidade (por exemplo, kcat/ Km) de um polipéptido de terpeno sintase modificado para um substrato, tal como FPP, GPP ou GGPP, pode ser aumentada pelo menos em, ou pelo menos cerca de 10%, 15%, 20%, 30% , 40%, 50%, 60%, 70%, 80%, 90%, 100% ou mais em comparação com a especificidade de uma terpeno sintase que não é tão modificada.

Tal como aqui utilizado, a "distribuição de produto" refere-se às quantidades relativas de terpenos diferentes produzidos a partir da reação entre um precursor de pirofosfato de terpeno aciclico, tal como FPP, e uma terpeno sintase, incluindo os polipéptidos de valenceno sintase modificados aqui proporcionados. A quantidade de terpeno produzido pode ser representada como uma percentagem dos produtos totais produzidos pela terpeno sintase. Por exemplo, a distribuição do produto resultante da reação de FPP com uma valenceno sintase pode ser 90% (peso / volume) de valenceno e 10% (peso / volume) de β-elemeno. Os métodos para avaliar o tipo e a quantidade de um terpeno numa solução são bem conhecidos na técnica e aqui descritos e incluem, por exemplo, cromatografia gasosa - espectrometria de massa (GC-MS) (ver Exemplos abaixo).

Tal como aqui utilizado, uma distribuição de produtos alterada refere-se a uma alteração na quantidade relativa de terpenos individuais produzidos a partir da reação entre um precursor de pirofosfato de terpeno acíclico, tal como FPP e uma terpeno sintase, tal como valenceno sintase. Normalmente, a alteração é avaliada determinando a quantidade relativa de terpenos individuais produzidos a partir do precursor de terpeno de pirofosfato acíclico usando uma primeira sintase (por exemplo, sintase de tipo selvagem) e depois comparando-a com a quantidade relativa de terpenos individuais produzidos usando uma segunda sintase (por exemplo, uma sintase modificada). Considera-se que uma distribuição de produto alterada ocorre se a quantidade relativa de um ou mais terpenos for aumentada ou diminuída pelo menos em ou pelo menos cerca de 0,5%, 1%, 2%, 3%, 4%, 5%, 6%. 7% 8% 9% 10% 15% 20% 25% 30% 35% 40% 50% 60% 70% 80% ou mais.

Tal como aqui utilizado, um produto de distribuição melhorada refere-se a uma mudança na distribuição do produto para uma que é mais desejável, isto é, contém quantidades relativas mais desejáveis de terpenos. Por exemplo, uma distribuição melhorada de produto pode conter uma quantidade aumentada de um terpeno desejado e uma quantidade diminuída de um terpeno que não é desejado. A quantidade de terpeno desejado numa distribuição melhorada de produção pode ser aumentada pelo menos em ou pelo menos cerca de 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9% , 10%, 15%, 20%, 25%, 30%, 35%, 40%, 50%, 60%, 70%, 80% ou mais. A quantidade de um terpeno que não é desejado numa distribuição melhorada de produção pode ser diminuída pelo menos em ou pelo menos cerca de 0,5%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8 %, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 50%, 60%, 70%, 80% ou mais.

Tal como aqui utilizado, os ácidos nucleicos ou as moléculas de ácido nucleico incluem ADN, ARN e seus análogos, incluindo ácidos nucleicos peptídicos (PNA) e suas misturas. Os ácidos nucleicos podem ser de cadeia simples ou dupla. Quando se refere a sondas ou iniciadores, que são rotulados opcionalmente, tal como com um marcador detetável, tal como um marcador fluorescente ou radio marcável, são contempladas moléculas de cadeia simples. Tais moléculas são tipicamente de um comprimento tal que o seu alvo é estatisticamente único ou de baixo número de cópias (normalmente inferior a 5, geralmente inferior a 3) para sondar ou iniciar uma biblioteca. Geralmente, uma sonda ou iniciador contém pelo menos 14, 16 ou 30 nucleótidos contíguos de sequência complementares ou idênticos a um gene de interesse. Sondas e iniciadores podem ter 10, 20, 30, 50, 100 ou mais ácidos nucleicos longos.

Tal como aqui utilizado, o termo polinucleótido significa um polímero de cadeia simples ou dupla de desoxirribonucleótidos ou bases de ribonucleótidos lidas a partir da extremidade 5' para a 3'. Os polinucleótidos incluem ARN e ADN, e podem ser isolados a partir de fontes naturais, sintetizados in vitro, ou preparado a partir de uma combinação de moléculas naturais e sintéticas. O comprimento de uma molécula polinucleótídica é dado aqui em termos de nucleótidos (abreviado "nt") ou pares de bases (abreviado "bp"). O termo nucleotídeo é usado para moléculas de cadeia simples e dupla, onde o contexto o permite. Quando o termo é aplicado a moléculas de cadeia dupla, é usado para indicar o comprimento total e será entendido como sendo equivalente ao termo pares de bases. Será reconhecido pelos especialistas na técnica que as duas cadeias de um polinucleótido de cadeia dupla podem diferir ligeiramente de comprimento e que as suas extremidades podem ser escalonadas; assim, todos os nucleótidos dentro de uma molécula polinucleotídica de cadeia dupla podem não ser emparelhados. Essas extremidades desemparelhadas, em geral, não excederão 20 nucleótidos de comprimento.

Tal como aqui utilizado, o ácido nucleico heterólogo é o ácido nucleico que normalmente não é produzido in vivo pela célula na qual é expresso ou é produzido pela célula, mas está num locus diferente ou expresso de forma diferente ou medeia ou codifica mediadores que alteram a expressão do ácido nucleico endógeno, como o ADN, afetando a transcrição, tradução ou outros processos bioquímicos reguláveis. O ácido nucleico heterólogo geralmente não é endógeno para a célula em que é introduzido, mas foi obtido a partir de outra célula ou preparado de forma sintética. O ácido nucleico heterólogo pode ser endógeno, mas é ácido nucleico que é expresso a partir de um locus diferente ou alterado na sua expressão. Geralmente, embora não necessariamente, esse ácido nucleico codifica ARN e proteínas que normalmente não são produzidas pela célula ou da mesma maneira na célula em que é expresso. O ácido nucleico heterólogo, como o ADN, também pode ser referido como ácido nucleico estranho, como ADN. Assim, o ácido nucleico heterólogo ou o ácido nucleico estranho inclui uma molécula de ácido nucleico não presente na orientação ou posição exata como a molécula de ácido nucleico da contrapartida, como o ADN, que é encontrado num genoma. Também pode referir-se a uma molécula de ácido nucleico de outro organismo ou espécie (ou seja, exógena).

Qualquer ácido nucleico, tal como ADN, que um perito na técnica iria reconhecer, ou considerar como heterólogo ou estranho à célula na qual o ácido nucleico é expresso são aqui englobados pelo ácido nucleico heterólogo; 0 ácido nucleico heterólogo inclui ácido nucleico adicionado exogenamente que também é expresso endogenamente. Exemplos de ácido nucleico heterólogo incluem, mas não estão limitados a, ácido nucleico que codifica proteínas marcadoras rastreáveis, tais como uma proteína que confere resistência ao fármaco, ácido nucleico que codifica substâncias terapeuticamente eficazes, tais como agentes anticancerígenos, enzimas e hormônios, e ácido nucleico, como ADN, que codifica outros tipos de proteínas, como anticorpos. Os anticorpos que são codificados por ácido nucleico heterólogo podem ser segregados ou expressos na superfície da célula na qual o ácido nucleico heterólogo foi introduzido.

Tal como aqui utilizado, um péptido refere-se a um polipéptido que tem de 2 a 40 aminoácidos de comprimento.

Tal como aqui utilizado, os aminoácidos que ocorrem nas várias sequências de aminoácidos aqui proporcionadas são identificados de acordo com as suas abreviaturas conhecidas, de três letras ou de uma letra (Tabela 1) . Os nucleótidos que ocorrem nos vários fragmentos de ácido nucleico são designados com as designações padrão de uma única letra usadas rotineiramente na técnica.

Tal como aqui utilizado, um "aminoácido" é um composto orgânico contendo um grupo amino e um grupo ácido carboxílico. Um polipéptido contém dois ou mais aminoácidos. Para os propósitos aqui descritos, os aminoácidos incluem os vinte aminoácidos que ocorrem naturalmente, aminoácidos não naturais e análogos de aminoácidos (isto é, aminoácidos em que o carbono-α tem uma cadeia lateral).

De acordo com a nomenclatura de polipéptidos convencional descrita em J. Biol. Chem., 243: 3557-3559 (1968), e adotada 37 CFR §§ 1.821-1.822, as abreviaturas para os resíduos de aminoácidos são apresentadas na Tabela 1:

Tabela 1- Tabela de correspoênela

leant!nuaçãο}

Todas as sequências de resíduos de aminoácidos aqui representadas por fórmulas têm uma orientação da esquerda para a direita na direção convencional do terminal amino para o terminal carboxilo. Além disso, a frase "resíduo de aminoácido" é amplamente definida para incluir os aminoácidos listados na Tabela de Correspondência (Tabela 1) e aminoácidos modificados e incomuns, como os referidos em 37 CFR §§ 1.821-1.822.

Além disso, um traço no inicio ou fim de uma sequência de resíduos de aminoácido indica uma ligação peptídica a uma outra sequência de um ou mais resíduos de aminoácidos, a um grupo amino-terminal tal como NH2 ou a um grupo carboxilo terminal como COOH.

Tal como aqui utilizado, "aminoácidos naturais" referem-se aos 20 L-aminoácidos que ocorrem em polipéptidos.

Tal como aqui utilizado, "aminoácido não natural" refere-se a um composto orgânico contendo um grupo amino e um grupo ácido carboxílico que não é um dos aminoácidos de ocorrência natural listados na Tabela 1. Os aminoácidos que não ocorrem naturalmente incluem, por exemplo, aminoácidos ou análogos de aminoácidos diferentes dos 20 aminoácidos que ocorrem naturalmente e incluem, mas não estão limitados a, estereoisómeros D dos aminoácidos. Exemplos de aminoácidos não naturais são conhecidos dos especialistas na técnica e podem ser incluídos em qualquer dos polipéptidos de valenceno sintase modificados aqui proporcionados.

Tal como aqui utilizado, a modificação refere-se à modificação de uma sequência de aminoácidos de um polipéptido ou a uma sequência de nucleótidos numa molécula de ácido nucleico e inclui deleções, inserções e substituições de aminoácidos e nucleótidos, respetivamente. Para os propósitos aqui descritos, podem ser feitas substituições (ou alterações) de aminoácidos, deleções e / ou inserções em qualquer das valenceno sintase aqui proporcionadas. As modificações podem ser feitas fazendo substituições conservativas de aminoácidos e também substituições de aminoácidos não conservativas. Por exemplo, podem ser feitas substituições de aminoácidos que desejavelmente ou vantajosamente alteram as propriedades da valenceno sintase. Por exemplo, as substituições de aminoácidos podem ser feitas na valenceno sintase de tal modo que a valenceno sintase modificada resultante pode produzir mais valenceno de FPP em comparação com uma valenceno sintase não modificada.

As substituições ou alterações de aminoácidos contempladas incluem substituições conservativas, incluindo, mas não se limitando ás estabelecidas na Tabela 2. As substituições conservativas adequadas de aminoácidos são conhecidas pelos especialistas na técnica e podem ser feitas geralmente sem alterar a conformação ou a atividade do polipéptido. Os especialistas desta técnica reconhecem que, em geral, as substituições únicas de aminoácidos em regiões não essenciais de um polipéptido não alteram substancialmente a atividade biológica (ver, por exemplo, Watson et ai. Biologia Molecular do Gene, 4a edição, 1987, The Benjamin / Cummings Pub. co., p.224 ). As substituições conservativas de aminoácidos são feitas, por exemplo, de acordo com as apresentadas na Tabela 2 como se segue:

Tabela 2

:

Outras substituições conservadoras também são permitidas e podem ser determinadas de forma empírica ou de acordo com substituições conservativas conhecidas. Os efeitos de tais substituições podem ser calculados utilizando matrizes de substituição como PAM120, PAM-200 e PAM-250 como apresentado em Altschul (J. Mol. Biol. 219:555-565 (1991)).

Tal como aqui utilizado, "sequência primária" refere-se à sequência de resíduos de aminoácidos num polipéptido.

Tal como aqui utilizado, a "semelhança" entre duas proteínas ou ácidos nucleicos refere-se à relação entre a sequência de aminoácidos das proteínas ou as sequências nucleotídicas dos ácidos nucleicos. A semelhança pode ser baseada no grau de identidade e / ou homologia das sequências de resíduos e dos resíduos nele contidos. Os métodos para avaliar o grau de semelhança entre proteínas ou ácidos nucleicos são conhecidos dos especialistas na técnica. Por exemplo, num método de avaliação da semelhança de sequência, duas sequências de aminoácidos ou nucleótidos estão alinhadas de uma maneira que produz um nível máximo de identidade entre as sequências. "Identidade" refere-se à extensão em que as sequências de aminoácidos ou nucleotídeos são iguais. 0 alinhamento das sequências de aminoácidos e, até certo ponto, das sequências de nucleotídeos, também pode levar em consideração diferenças conservativas e / ou substituições frequentes em aminoácidos (ou nucleotídeos). As diferenças conservativas são aquelas que preservam as propriedades físico-químicas dos resíduos envolvidos. Os alinhamentos podem ser globais (alinhamento das sequências comparadas em todo o comprimento das sequências e incluindo todos os resíduos) ou locais (o alinhamento de uma porção das sequências que inclui apenas a região ou regiões mais semelhantes) .

Tal como aqui utilizado, os termos "homologia" e "identidade" são utilizados para descrever parentesco no meio e entre os polipéptidos (ou que codifica para moléculas de ácido nucleico). Identidade refere-se a sequências idênticas; A homologia pode incluir mudanças conservativas em aminoácidos. Em geral, para identificar as posições correspondentes, as sequências de aminoácidos estão alinhadas de modo que a combinação de ordem mais elevada seja obtida (ver, por exemplo: Computational Molecular Biology, Lesk, A.M., ed., Oxford University Press, New York, 1988; Biocomputing: Informatics and Genome Projects, Smith, D.W., ed., Academic Press, New York, 1993; Computer Analysis of Sequence Data, Part I, Griffin, A.M., and Griffin, H.G., eds., Humana Press, New Jersey, 1994; Sequence Analysis in Molecular Biology, von Heinje, G., Academic Press, 1987; e Sequence Analysis Primer, Gribskov, M. and Devereux, J., eds., M Stockton Press, New York, 1991; Carrillo et al. (1988) SIAM J Applied Math 48:1073).

Tal como aqui utilizado, a "identidade de sequência" refere-se ao número de aminoácidos ou bases nucleotidicas idênticas ou semelhantes numa comparação entre um polipéptido ou polinucleótido teste e um polipéptido ou polinucleótido de referência. A identidade da sequência pode ser determinada pelo alinhamento das sequências do ácido nucleico ou proteína para identificar regiões de similaridade ou identidade. Para fins aqui contidos, a identidade de sequência é geralmente determinada pelo alinhamento para identificar resíduos idênticos. O alinhamento pode ser local ou global, mas, para fins aqui contidos, é geralmente um alinhamento global onde o comprimento total de cada sequência é comparado. Correspondências, desajustes e lacunas podem ser identificados entre as sequências comparadas. As lacunas são aminoácidos nulos ou nucleótidos inseridos entre os resíduos das sequências alinhadas de modo que os caracteres idênticos ou similares estejam alinhados. Geralmente, pode haver lacunas internas e terminais. A identidade de sequência pode ser determinada levando em consideração lacunas com o número de resíduos idênticos / comprimento da sequência mais baixa x 100. Ao usar penalidades para lacunas, a identidade de sequência pode ser determinada sem penalidade para lacunas finais (por exemplo, as lacunas terminais não são penalizadas). Alternativamente, a identidade de sequência pode ser determinada sem ter em conta lacunas como o número de posições idênticas / comprimento da sequência alinhada total x 100.

Tal como aqui utilizado, um "alinhamento global" é um alinhamento que alinha duas sequências do início ao fim, alinhando cada letra em cada sequência apenas uma vez . Um alinhamento é produzido, independentemente se existe ou não uma similaridade ou identidade entre as sequências. Por exemplo, 50% de identidade de sequência baseada no "alinhamento global" significa que, num alinhamento da sequência completa de duas sequências comparadas cada uma com 100 nucleótidos de comprimento, 50% dos resíduos são os mesmos. Entende-se que o alinhamento global também pode ser usado na determinação da identidade de sequência mesmo quando o comprimento das sequências alinhadas não é o mesmo. As diferenças nas extremidades terminais das sequências serão levadas em consideração na determinação da identidade de sequência, a menos que a "falta de penalidade para lacunas finais" seja selecionada. Geralmente, um alinhamento global é utilizado em sequências que compartilham semelhanças significativas sobre a maior parte de seu comprimento. Exemplos de algoritmos para realizar o alinhamento global incluem o algoritmo Needleman-Wunsch (Needleman et al.J. Mol. Biol. 48: 443 (1970) . Exemplo de programas para realizar o alinhamento global estão disponíveis publicamente e incluem a Ferramenta de Alinhamento de Sequência Global disponível no site da National Center for Biotechnology Information (NCBI) (ncbi.nlm.nih.gov/) e o programa disponível no deepc2.psi.iastate. edu / aat / align / align .html.

Tal como aqui utilizado, um "alinhamento local" é urn alinhamento que alinha duas sequências, mas alinha apenas as porções das sequências que compartilham semelhança ou identidade. Portanto, um alinhamento local determina se subsegmentos de uma sequência estão presentes noutra sequência. Se não houver semelhança, nenhum alinhamento será feito. Os algoritmos de alinhamento local incluem o algoritmo BLAST ou Smith-Waterman ( Adv. Appl. Math. 2: 482 (1981)). Por exemplo, 50% de identidade de sequência baseada no "alinhamento local" significa que, num alinhamento da sequência completa de duas sequências comparadas de qualquer comprimento, uma região de similaridade ou identidade de 100 nucleótidos de comprimento possui 50% dos resíduos que são o mesmo na região de similaridade ou identidade.

Para os propósitos aqui contidos, a identidade de sequência pode ser determinada por programas de algoritmo de alinhamento padrão usados com penalidades de lacunas padrão estabelecidas por cada fornecedor. Os parâmetros padrão para o programa GAP podem incluir: (1) uma matriz de comparação unária (contendo um valor de 1 para identidades e 0 para não-identidades) e a matriz de comparação ponderada de Gribskov et ai. Nucl. Acids Res. 14: 6745 (1986), conforme descrito por Schwartz e Dayhoff, eds., Atlas of Protein Sequence and Structure, National Biomedical Research Foundation, pp. 353-358 (1979); (2) uma penalidade de 3,0 por cada intervalo e uma penalidade adicional de 0,10 por cada símbolo em cada intervalo; e (3) nenhuma penalidade por lacunas finais. Se qualquer duas moléculas de ácido nucleico têm sequências de nucleótidos ou dois polipéptidos têm sequências de aminoácidos que são pelo menos 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% "idênticos" ou outras variações semelhantes que representem uma percentagem de identidade, podem ser determinadas usando algoritmos de computador conhecidos com base no alinhamento local ou global (ver por exemplo, wikipedia.org/wiki/Sequence_alignment_software, fornece links para dezenas de bancos de dados e programas de alinhamento conhecidos e publicamente disponíveis). Geralmente, para fins aqui apresentados, a identidade de sequência é determinada usando algoritmos de computador com base no alinhamento global, como a ferramenta Needleman-Wunsch Global Sequence Alignment, disponível no NCBI / BLAST (blast.ncbi.nlm.nih.gov/Blast.cgi?CMD = Web & Page_TYPE = BlastHome); LALign (William Pearson implementing the Huang and Miller algorithm (Adv. Appl. Math. (1991) 12: 337-357)); e programa de Xiaoqui Huang disponível em deepc2.psi.iastate.edu/aat/align/align.html. Geralmente, ao comparar sequências de nucleótidos, é aqui utilizado um alinhamento com penalidade para lacunas finais. O alinhamento local também pode ser usado quando as sequências que estão sendo comparadas são substancialmente do mesmo comprimento.

Portanto, tal como aqui utilizado, o termo "identidade" representa uma comparação ou alinhamento entre um teste e um polipéptido ou polinucleótido de referência. Num exemplo não limitativo, "pelo menos 90% idêntico a" refere-se a percentagem de identidades de 90 a 100% em relação ao polipéptido ou polinucleótido de referência. A identidade a um nível de 90% ou mais é indicativa do fato de que, assumindo, para fins exemplificativos, que comparando um polipéptido ou polinucleótido teste e um polipéptido ou polinucleótido de referência com um comprimento de 100 aminoácidos ou nucleótidos, não são mais de 10% (ou seja, 10 de 100) de aminoácidos ou nucleótidos no polipéptido ou polinucleótido de teste que diferem daqueles do polipéptido de referência. Comparações semelhantes podem ser feitas entre um teste e polinucleótidos de referência. Tais diferenças podem ser representadas como mutações pontuais distribuídas aleatoriamente em todo o comprimento de uma sequência de aminoácidos ou podem ser agrupadas numa ou mais localizações de comprimento variável até o máximo permitido, por exemplo, diferença de 10/100 aminoácidos (aproximadamente 90% identidade). As diferenças também podem ser devidas a deleções ou truncamentos de resíduos de aminoácidos. As diferenças são definidas como substituições, inserções ou deleções de ácido nucleico ou aminoácidos. Dependendo do comprimento das sequências comparadas, ao nível de homologias ou identidades acima de cerca de 85 a 90%, o resultado pode ser independente do programa e dos parâmetros de lacunas definidos; tais altos níveis de identidade podem ser avaliados facilmente, muitas vezes sem depender de software.

Tal como aqui utilizado, entende-se também que os termos "substancialmente idênticos" ou "semelhante" variam de acordo com o contexto como entendido pelos peritos na arte relevante, mas que os peritos podem distingui-los.

Tal como aqui utilizado, uma sequência alinhada refere-se ao uso de homologia (similaridade e / ou identidade) para alinhar posições correspondentes numa sequência de nucleótidos ou aminoácidos. Normalmente, duas ou mais sequências que estão relacionadas por 50% ou mais de identidade estão alinhadas. Um conjunto alinhado de sequências refere-se a 2 ou mais sequências que estão alinhadas nas posições correspondentes e podem incluir sequências de alinhamento derivadas de ARNs, tais como ESTs e outros cADNs, alinhados com a sequência de ADN qenómico.

Tal como aqui utilizado, um polipéptido ou proteína isolado ou purificado ou uma sua porção biologicamente ativa está substancialmente isento de material celular ou outras proteínas contaminantes a partir da célula de tecido a partir da qual a proteína é derivada ou substancialmente isenta de precursores químicos ou outros produtos químicos quando sintetizada quimicamente. As preparações podem ser determinadas como sendo substancialmente livres se elas parecerem livres de impurezas facilmente detetáveis, conforme determinado por métodos padrão de análise, tais como cromatografia em camada fina (TLC), eletroforese em gel e cromatografia líquida de alta performance (HPLC), usada pelos especialistas na arte para avaliar tal pureza ou se estão suficientemente puras de modo que uma purificação adicional não altere de forma detetável as propriedades físicas e químicas, tais como atividades proteolíticas e biológicas, da substância. Os métodos para a purificação dos compostos para produzir compostos substancialmente quimicamente puros são conhecidos dos especialistas na técnica. Um composto substancialmente quimicamente puro, no entanto, pode ser uma mistura de estereoisómeros. Em tais casos, uma purificação adicional pode aumentar a atividade específica do composto. 0 termo substancialmente livre de material celular inclui preparações de valenceno sintase e produtos de terpeno em que a valenceno sintase ou produto de terpeno é separado dos componentes celulares das células a partir das quais é isolado ou produzido. Numa forma de realização, o termo substancialmente livre de material celular inclui preparações de valenceno sintase ou produtos de terpeno com menos de cerca de 30%, 20%, 10%, 5% ou menos (por peso seco) de proteínas não valenceno sintase ou produtos de terpeno, incluindo o meio de cultura de células.

Tal como aqui utilizado, a produção por métodos recombinantes, utilizando métodos de ADN recombinante refere-se à utilização dos métodos bem conhecidos da biologia molecular para a expressão de proteínas codificadas por ADN clonado.

Tal como aqui utilizado, o vetor (ou plasmídeo) refere-se a elementos de ADN discretos que são utilizados para introduzir ácido nucleico heterólogo em células para a sua expressão ou replicação. Normalmente os vetores permanecem episómicos, mas podem ser projetados para efetuar a integração de um gene ou porção do mesmo num cromossoma do genoma. Também são contemplados vetores que são cromossomas artificiais, como cromossomas artificiais bacterianos, cromossomas artificiais de fermento e cromossomas artificiais de mamíferos. A seleção e uso de tais veículos são bem conhecidos dos especialistas na técnica.

Tal como aqui utilizado, a expressão refere-se ao processo pelo qual o ácido nucleico é transcrito em ARNm e traduzido para péptidos, polipéptidos ou proteínas. Se o ácido nucleico for derivado de ADN genómico, a expressão pode, se uma célula ou organismo hospedeiro eucariótico apropriado for selecionado, incluir o processamento, como o splicing do ARNm.

Tal como aqui utilizado, um vetor de expressão inclui vetores capazes de expressar ADN que está operacionalmente ligado a sequências reguladoras, tais como regiões promotoras, que são capazes de efetuar a expressão de tais fragmentos de ADN. Tais segmentos adicionais podem incluir sequências promotoras e terminais, e opcionalmente podem incluir uma ou mais origens de replicação, um ou mais marcadores selecionáveis, um intensificador, um sinal de poliadenilação e semelhantes. Os vetores de expressão são geralmente derivados de ADN plasmídico ou virai, ou podem conter elementos de ambos. Assim, um vetor de expressão refere-se a uma construção de ADN ou ARN recombinante, tal como um plasmideo, um fago, virus recombinante ou outro vetor que, após a introdução numa célula hospedeira apropriada, resulta na expressão do ADN clonado. Os vetores de expressão apropriados são bem conhecidos dos especialistas na técnica e incluem aqueles que são replicáveis em células eucarióticas e / ou células procarióticas e aqueles que permanecem episómicos ou aqueles que se integram no genoma da célula hospedeira.

Tal como aqui utilizado, o vetor também inclui "vetores de virus" ou "vetores virais". Os vetores virais são virus manipulados que estão operativamente ligados a genes exógenos para transferir (como veículos ou transporte) os genes exógenos para as células.

Tal como aqui utilizado, um adenovirus refere-se a qualquer um do grupo de vírus contendo ADN que causam conjuntivite e de infeções do trato respiratório superior em humanos.

Tal como aqui utilizado, o ADN nu refere-se ao ADN isento de histonas que pode ser utilizado para vacinas e terapia genética. 0 ADN nu é o material genético que é passado de célula para célula durante um processo de transferência de genes chamado transformação ou transfecção. Na transformação ou transfecção, o ADN purificado ou nu que é absorvido pela célula recetora dará à célula recetora uma nova característica ou fenótipo.

Tal como aqui utilizado, operável ou operativamente ligado quando se refere a segmentos de ADN significa que os segmentos estão dispostos de modo que funcionam em conjunto para os fins previstos, por ex. a transcrição inicia-se no promotor e prossegue através do segmento codificante até ao terminal.

Tal como aqui utilizado, uma "proteína quimérica" ou "proteína de fusão" refere-se a um polipéptido ligado de forma operacional a um polipéptido diferente. Uma proteína quimérica ou de fusão aqui proporcionada pode incluir um ou mais polipéptidos de valenceno sintase, ou uma sua porção, e um ou mais de outros polipéptidos para qualquer um ou mais sinal de controlo de transcrição / tradução, sequências de sinal, uma etiqueta para localização, uma etiqueta para purificação, parte de um domínio de uma imunoglobulina G e / ou um agente de direcionamento. Um polipéptido quimérico de valenceno sintase também inclui aqueles que têm seus domínios endógenos ou regiões do polipéptido trocadas com outro polipéptido. Estas proteínas quiméricas ou de fusão incluem as produzidas por meios recombinantes como proteínas de fusão, aquelas produzidas por meios químicos, tais como por acoplamento químico, através, por exemplo, de acoplamento a grupos sulfidrilo e aqueles produzidos por qualquer outro método pelo qual pelo menos um polipéptido (isto é, valenceno sintase), ou uma sua porção, está ligada, direta ou indiretamente, através de uma (s) ligação (s) a outro polipéptido.

Tal como aqui utilizado, dizer que um polipéptido "consiste essencialmente" numa determinada sequência de aminoácidos, significa que apenas essa determinada porção, ou um seu fragmento, do comprimento total do polipéptido está presente. 0 polipéptido opcionalmente e, em geral, irá incluir aminoácidos adicionais de outra fonte ou pode ser inserido noutro polipéptido.

Tal como aqui utilizado, as formas singulares "um", "uma", "o" e "a" incluem referencias plurais, a menos que o contexto dite claramente o contrário. Assim, por exemplo, a referência a um polipéptido, que compreende "uma substituição de aminoácidos" inclui polipéptidos com uma ou com uma pluralidade de substituições de aminoácidos.

Tal como aqui utilizado, os intervalos e quantidades podem ser expressas como "cerca" de um valor ou intervalo particular. Cerca também inclui o valor exato. Por isso, "cerca de 5%" significa "cerca de 5%" e também "5%".

Tal como aqui utilizado, "opcional" ou "opcionalmente" significa que o evento ou circunstância subsequentemente descrita ocorre ou não, e que a descrição inclui instâncias em que o referido evento ou circunstância ocorre e instâncias onde não. Por exemplo, um passo opcional de isolar valenceno significa que o valenceno é isolado ou não está isolado.

Tal como aqui utilizado, as abreviaturas para quaisquer grupos protetores, aminoácidos e outros compostos, estão, a não ser que indicado de outra forma, de acordo com o seu uso comum, abreviaturas reconhecidas, ou de acordo com a Nomenclatura Bioquímica da Comissão IUPAC-IUB (ver, (1972) Biochem. 11:1726).

B. VISÃO GERAL São aqui proporcionadas valenceno sintases de Eryngium glaciale, e variantes e seus fragmentos cataliticamente ativos, que catalisam a produção de terpenos a partir de um precursor de pirofosfato de terpeno aciclico. Os terpenos incluem valenceno e opcionalmente outros sesquiterpenos. Tais valenceno sintase catalisam a produção biossintética de valenceno a partir de um precursor de pirofosfato aciclico, tal como pirofosfato de farnesilo. Também são proporcionados aqui métodos para a produção de valenceno e outros sesquiterpenos a partir de tal precursor, tais como, mas não limitado a, pirofosfato de farnesilo. Também são proporcionados aqui métodos para a produção de nootkatona a partir do valenceno resultante e do precursor aciclico, tal como pirofosfato de farnesilo. 0 valenceno sintase de Eryngium glaciale (EgVSs) fornecida providencia a produção de produtos valiosos de terpeno, incluindo valenceno, em quantidades comercialmente úteis e de forma económica e eficiente em termos de energia. Em particular, os EgVSs catalisam a produção de niveis muito elevados de valenceno em comparação com outras valenceno sintase, incluindo CVS. 1. Estrutura do Valenceno e sua utilização 0 valenceno (1,2,3,5,6,7,8,8a-octa-hidro-7-isopropenil-1,8a-dimetil-naftaleno; (1) é um sesquiterpeno encontrado em óleos de citrinos, tais como laranja e toranja. Até à data, o valenceno foi identificado em várias plantas, incluindo citrinos (Citrus sp.), Flores de videira (Vitis vinifera), aipo (Apium graveolens), mangueira (Mangífera indica), azeitonas (Olea europea) e coral. 0 Valenceno é usado como aromatizante / fragrância de laranja em perfumes, bebidas e gomas de mascar e é usado como material de partida para a produção de nootkatona.

0 valenceno é gerado em plantas pela terpeno sintase valenceno sintase, que catalisa a reação do pirofosfato de farnesilo precursor do pirofosfato de terpeno acíclico (FPP) em valenceno (ver Figura 1). ~ 2. Nootkatona A nootkatona (4,4a, 5,6, 7, 8-hexa-hidro-6-isopropenil-4,4-a-dimetil-2(3H)-naftalenona; (2), é um sesquiterpenoide encontrado no óleo de toranja que fornece o aroma dominante da toranja. Normalmente, a nootkatona é isolada por extração a partir da toranja. A nootkatona também foi identificada em várias outras plantas, incluindo, por exemplo, cedros amarelos do Alasca (Cupressus nootkatensis), erva de vetiver (Chrysopogon zizanioides) e Alpinia oxyphylla Miquel.

A nootkatona é um produto oxidado de valenceno. 0 valenceno pode sofrer hidroxilação regioselectiva para formar 2-hidroxi valenceno, que é depois oxidado para formar nootkatona (como descrito em mais detalhes na Seção E abaixo). A nootkatona é valorizada pelo seu sabor e aroma a toranja e é amplamente utilizada nas indústrias de perfumaria e aromatização. Além disso, a nootkatona demonstrou ser um repelente e inseticida eficaz contra carrapatos e mosquitos. 3. Valenceno sintases

As valenceno sintases são as terpeno-ciclases da classe 1 ou as terpeno-sintases, as isoprenóides sintase ou as ciclases terpenoides, que convertem o difosfato de farnesilo em valenceno sesquiterpeno. Até à data, as valenceno sintase foram isoladas de citrinos, flores de videira e perila (shiso verde). A valenceno sintase cítrica (CVS) foi identificada no flavedo (casca exterior) de Citrus sinensis (laranja doce, laranja de Valência) (SEQ ID NOS: 14 e 34) e Citrus x paradisi (toranja) (SEQ ID NOS: 15, 26 e 27) (ver, Chappell (2004) Trends Plant Sci., 9: 266, Sharon-Asa et al. , (2003) The Plant Journal 36: 664-674; AF411120 e as Patentes dos EUA Nos. 7.273.735; 7.442.785; 7.790.426; e Pedido PCT internacional No. W02005021705 e W02003025193) . Foi descrita uma variante de valenceno sintase contendo substituições de aminoácidos A5171 / 1518V ( Eyal, E. Tese de mestrado, Departamento de Ciências das Plantas, Weizmann Institute of Science, Rehovot, Israel, Janeiro de 2001, estabelecido na SEQ ID NO: 37). Uma variedade de valenceno sintases cítricas modificadas foi descrita no pedido de Patente dos EUA No.2012-0246767. As valenceno sintase também foram identificadas e isoladas de flores de videira, incluindo Vitis vinifera L. cv. Gewúrztraminer e Vitis vinifera L. cv. Cabernet Sauvignon (ver Lucker et al. (2004) Photochemistry 65 (19): 2649-2659 e Martin et al., (2009) Proc. Natl. Acad. Sci, USA 106: 7245-7250) (SEQ ID NOS: 16 e 28). As valenceno sintases também foram isoladas de Chamaecyparis nootkatensis pendula (ver, por exemplo, pedido PCT internacional Nos. W02 011074954 e W02012177129 ; SEQ ID NOS: 17 e 29). A sintase de EgVS aqui proporcionada é aqui apresentada para catalisar a produção de níveis elevados de valenceno em comparação com outras valenceno sintases, incluindo outras cujas sequências foram modificadas para produzir níveis aumentados de valenceno. a. Estrutura

Terpeno ciclases da classe 1 de plantas incluem um grupo diverso de terpeno-sintases monoméricas que partilham uma arquitetura helicoidal alfa comum denominada classe 1 terpenóide ciclase dobrada (ver, por exemplo, Christianson, DW, (2008) Curr Opin Chem Biol 12 (2): 141-150 e Bohlmann et al., (1998) Proc. Natl.Acad. Sei. USA 95:4126-4133). Embora exista uma semelhança de sequência geral relativamente pequena, as terpeno ciclases de plantas da classe 1 possuem estruturas homólogas e alguns motivos e / ou resíduos altamente conservados. No seu local catalítico, cada terpeno ciclase fornece um modelo que se liga o substrato isoprenóide flexível com uma orientação e conformação tal que, após a ciclização, é formada uma ligação intramolecular específica carbono-carbono. Assim, a estrutura do local catalítico de cada enzima determina os monoterpenos cíclicos, diterpenos e sesquiterpenos resultantes. O raios X das estruturas cristalinas de 5-epi-aristoloceno sintase do tabaco e de pentaleneno sintetase revelaram que as terpeno ciclases de classe 1 de plantas são composta por hélices alfa interligadas por curtas e curvas e voltas de conexão (ver, por exemplo, Starks et al. , (1997) Science 277: 1815-1820 e Lesburg et al., (1997) Science 277: 1820-1824). Estas enzimas contêm dois domínios estruturais distintos, um domínio N-terminal, cuja estrutura se assemelha a núcleos catalíticos de glicosil hidrólases, mas cuja função permanece em grande parte desconhecida e um domínio catalítico C-terminal. 0 domínio catalítico contém dois motivos de ligação de metal conservados, ou seja, regiões ricas em aspartato, gue são responsáveis pela atividade catalítica enzimática. 0 site catalítico contém uma grande cavidade central formada principalmente por hélices alfa antiparalelas com as duas regiões ricas em aspartato localizadas em paredes opostas. As regiões ricas em aspartato medeiam a ligação de substrato difosfatos através da ponte de iões Mg2+. A ligação subsequente do substrato induz mudanças conformacionais de tal modo que a região N-terminal forma uma tampa sobre o núcleo catalítico que fecha o local ativo ao solvente, estabilizando assim os intermediários de carbocátion reativos.

As hélices alfa preservadas C, D, F, G e H compõem o site catalítico ou ativo das terpeno sintases de plantas da classe 1. 0 site ativo é uma bolsa hidrofóbica revestida por resíduos aromáticos para acomodar a cadeia de olefina do substrato. Os resíduos aromáticos estabilizam os intermediários de carbocátion através de interações n-catião. Uma região 1 rica em aspartato está localizada na Helix D e é caracterizada pela sequência conservada DDxxD (SEQ ID NO: 35), que também funciona para ligar Mg2+ (ver, por exemplo, Starks et ai., (1997), Science 277: 1815-1820). Uma segunda região conservada de ligação a metal está localizada na Helix H e é caracterizada pela sequência conservada [N / D] xxx [S / T] xxxE (SEQ ID NO: 36), também denominada "motivo NSE / DTE, ". Estes dois motivos de ligação conservada a metal coordenam a ligação de três iões de Mg2+ ao difosfato de isoprenóide. A valenceno sintase de Eryngium glaciale, aqui proporcionada, contém um domínio N-terminal (aa 1-280 de SEQ ID NO: 1) e um domínio catalítico C-terminal (aa 281-565 de SEQ ID NO: 1). Dentro do domínio catalítico C-terminal é o sítio de ligação conservada de metal que contém as regiões 1 e 2 ricas em aspartato. Com base no alinhamento com valenceno sintases conhecidas, como a valenceno sintase cítrica, a região 1 rica em aspartato, contendo o motivo DDxxD conservado, corresponde aos aminoácidos D315, D316, T317, Y318 e D319 da SEQ ID NO: 1. Asp315 e Asp319 ligam as porções de difosfato de FPP através da coordenação com Mg2+. A região 2 rica em aspartato, contendo o motivo NSE / DTE, corresponde aos aminoácidos D461, D462, 1463, G464, G465, H466, E467, F468 e E469 da SEQ ID NO: 1. Esta região liga um ião adicional de Mg2+ através de aminoácidos Asp461, Gly465 e Glu469. b. Atividades A valenceno sintase catalisa a formação de valenceno a partir de precursores de pirofosfato acíclicos, tais como o pirofosfato ubíquo intermediário do difosfato de farnesilo (FPP), que é produzido como parte da via biossintética do isoprenóide dependente do mevalonato em fungos e animais e a via biossintética do isoprenóide não dependente do mevalonato em bactérias e plantas superiores. Os produtos de terpenos adicionais que podem ser produzidos por valenceno sintase a partir de precursores de pirofosfato de terpeno acíclico tais como, FPP incluem, mas não estão limitados a, germacreno A, beta-elemeno (beta-elemeno é formado por decomposição espontânea de germacreno A) , β-selineno, i-selineno, 7-epi-a-selineno e um composto adicional, aristoloceno, (ver, p. ex., Pico 2 na Figura 3).

De um modo geral, terpeno ciclases de plantas da classe 1, tais como a valenceno sintase , são ciclases dependentes de metais que convertem difosfatos isoprenóides lineares totalmente trans, tais como difosfato de geranilo, difosfato de farnesilo e difosfato de geranilo-geranilo, em monoterpenos cíclicos, diterpenos e sesquiterpenos . As reações de ciclização prosseguem através da alquilação electrofílica em que novas ligações simples carbono-carbono são formadas através da reação de um altamente reativo carbocátion alílico deficiente de eletrões e de uma ligação dupla carbono-carbono rica em eletrões.

As terpeno sintases contêm iões metálicos divalentes, normalmente iões Mg2+ ou, por vezes, Mn2+, no centro ativo da enzima que são necessários para a catálise enzimática. Mais especificamente, são necessários para o abandono do pirofosfato. Geralmente, as enzimas contêm dois motivos conservados de ligação de metal que alinham o local catalítico, incluindo o motivo DDxxD rico em aspartato (SEQ ID NO: 35) que coordena a ligação de dois iões Mg2+ e o motivo NSE / DTE (SEQ ID NO: 36) que coordena um terceiro ião Mg2+ (ver Starks et al., (1997), Science 277: 1815-1820 e Lesburg et al., (1997), Science 277: 1820-1824). As regiões ricas em aspartato do sítio catalítico ativo medeiam a ligação de difosfatos de prenilo via pontes de iões Mg2+. Ligação de (Mg2+) 3-PPi induz mudanças conformacionais de tal modo que a região N-terminal forma uma tampa sobre o núcleo catalítico e, portanto, estabiliza o local ativo numa conformação fechada que é livre de solvente em massa. A perda de pirofosfato (PPi) do substrato ligado a enzima resulta num carbocátion alílico altamente reativo que ataca electrofilicamente uma dupla ligação intramolecular mais abaixo da cadeia de terpeno para efetuar o fechamento do anel. 0 anião PPi aceita ligações de hidrogénio a partir de resíduos básicos conservados quando ligado na conformação de sintase fechada e uma bolsa hidrofóbica alinhada por resíduos aromáticos cria a cadeia lateral de prenilo e provavelmente molda a reação de ciclização, aplicando conformações particulares de substrato e estabilizando carbocátions através de interações de empilhamento-π ( Noel et al., (2010) ACS Chemical Biology 5 (4): 377-392 ). 4 Ensaios para detetar a atividade enzimática de polipéptidos de valenceno sintase

Um especialista na técnica está familiarizado com métodos e ensaios para detetar a atividade enzimática de polipéptidos de valenceno sintase. Os polipéptidos de valenceno sintase podem ser sobre-expressos e purificados como descrito na Seção C abaixo. Normalmente, a atividade de uma valenceno sintase é determinada pela incubação de uma valenceno sintase com um precursor de terpeno de pirofosfato acíclico, tal como pirofosfato de farnesilo (FPP), e identificação, medição e / ou quantificação do valenceno e outros produtos de reação.

Por exemplo, a atividade da valenceno sintase pode ser determinada in vitro por incubação de uma valenceno sintase com um precursor de pirofosfato de terpeno acíclico, tal como FPP, e identificação dos produtos da reação. Os produtos de reação, incluindo as proporções dos produtos, podem ser determinados por qualquer método conhecido dos especialistas na técnica, incluindo cromatografia gasosa - espectrometria de massa (GC-MS), GC-FID, cromatografia líquida-espectrometria de massa (LC-MS), comparação com padrões conhecidos e ressonância magnética nuclear de protões e carbono (RMN).

Alternativamente, a atividade de valenceno sintase pode ser determinada in vivo por expressão de uma valenceno sintase numa estirpe de levedura que produz um precursor de terpeno de pirofosfato acíclico, tal como FPP, pelo que a expressão da valenceno sintase resulta na produção de valenceno e compostos adicionais / produtos de reação ou subprodutos. 0 valenceno e os compostos adicionais podem ser purificados a partir do meio de cultura celular, por exemplo, por extração com um solvente orgânico, pelo que o valenceno e outros produtos ficaram na fase aquosa, como descrito no Exemplo 4, e os produtos da reação podem ser identificados e quantificados como descrito acima. Exemplos de células de levedura para expressão de valenceno sintase e métodos para a geração de células de levedura modificadas que produzem um precursor de terpeno de pirofosfato acíclico são descritas com maior detalhe na Seção E abaixo. A cinética da produção de valenceno pode ser determinada por métodos padrão, tais como através de ensaios de sintase em que substratos isoprenóides radioativos, tais como 3H FPP ou 14C FPP, são empregues com concentrações variáveis de sintase. Os produtos da reação são extraídos para uma camada orgânica e a radioatividade é medida usando um contador de cintilação líquida. As constantes cinéticas são determinadas a partir dos ajustes diretos da equação de Michaelis-Menton aos dados.

C. MOLÉCULAS DE ÁCIDO NUCLEICO CODIFICANDO A SINTASE DE VALENCENO DE ERYNGIUM GLACIALE (EGVS) E POLIPETIDOS CODIFICADOS São aqui fornecidas moléculas de ácido nucleico que codificam um polipéptido de valenceno sintase, incluindo moléculas de cADN. Também são aqui proporcionados polipéptidos de valenceno sintase e seus fragmentos cataliticamente ativos, codificados pelas moléculas de ácido nucleico aqui proporcionadas. As valenceno sintases codificadas por moléculas de ácido nucleico proporcionadas aqui catalisam a formação de valenceno a partir de qualquer precursor de pirofosfato de terpeno aciclico adequado, incluindo pirofosfato de farnesilo (FPP), pirofosfato de geranilo (GPP) e pirofosfato de geranilgeranilo (GGPP). 0 interesse aqui é a produção de valenceno a partir de FPP. Em alguns exemplos, as moléculas de ácido nucleico aqui proporcionadas que codificam os polipéptidos da valenceno sintase são as mesmas que estão isoladas do cardo Eryngium glaciale. Noutros exemplos, as moléculas de ácido nucleico e os polipéptidos de valenceno sintase codificados aqui proporcionados são variantes dos isolados do cardo Eryngium glaciale.

Por exemplo, proporcionado aqui é uma molécula de ácido nucleico que tem uma sequência de nucleótidos apresentada na SEQ ID NO: 2, e seus degenerados, que codificam um polipéptido de valenceno sintase possuindo uma sequência de aminoácidos apresentada na SEQ ID NO: 1. Também são proporcionadas aqui moléculas de ácido nucleico com pelo menos 85% de identidade de sequência com a sequência de nucleótidos estabelecida na SEQ ID NO: 2 que codificam um polipéptido de valenceno sintase. Por exemplo, as moléculas de ácido nucleico aqui proporcionadas podem exibir pelo menos, ou cerca de pelo menos, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 95%, 95% 96%, 97%, 98% ou 99% ou mais de identidade de sequência com uma sequência de nucleótidos estabelecida na SEQ ID NO: 2, desde que os polipéptidos de valenceno sintase codificados exibam atividade valenceno sintase (isto é, a capacidade de catalisar a formação de valenceno). A identidade percentual pode ser determinada por um especialista na técnica usando programas de alinhamento padrão. Também são aqui proporcionadas sequências degeneradas da sequência de nucleótidos estabelecida na SEQ ID NO: 2, codificando uma valenceno sintase com uma sequência de aminoácidos apresentada na SEQ ID NO: 1. Nalguns exemplos, as moléculas de ácido nucleico que codificam os polipéptidos de valenceno sintase são isoladas do cardo Eryngium glaciale. Noutros exemplos, as moléculas de ácido nucleico e os polipéptidos de valenceno sintase codificados são variantes dos isolados do cardo Eryngium glaciale.

Também são aqui proporcionadas moléculas de ácido nucleico que codificam um polipéptido de valenceno sintase modificado aqui proporcionado. As modificações podem ser feitas em qualquer região de um gene que codifica a valenceno sintase, desde que o polipéptido de valenceno sintase modificado codificado resultante pelo menos retenha a atividade da valenceno sintase (isto é a capacidade de catalisar a formação de valenceno a partir de um precursor de terpeno de pirofosfato aciclico, normalmente FPP) . As modificações podem incluir a otimização de codões dos ácidos nucleicos e / ou mudanças que resultam numa única modificação de aminoácido no polipéptido de valenceno sintase codificado, tais como alterações de aminoácidos únicas (substituições), inserções ou deleções, ou modificações de múltiplos aminoácidos, tais como múltiplas substituições, inserções ou deleções de aminoácidos, incluindo trocas de regiões ou domínios do polipéptido. A expressão das moléculas de ácido nucleico aqui proporcionadas num hospedeiro adequado, por exemplo, uma célula bacteriana ou de levedura, resulta na expressão de valenceno sintase. Tais células podem ser usadas para produzir a valenceno sintase e / ou para realizar reações in vivo para produzir valenceno. Por exemplo, o valenceno pode ser gerado numa célula de levedura a partir de FPP, particularmente uma célula de levedura que sobre produz o FPP do precursor de terpeno de pirofosfato aciclico.

Em exemplos particulares, as moléculas de ácido nucleico aqui proporcionadas podem ser otimizadas, por exemplo, para aumentar os níveis de expressão da sequência codificada. 0 uso particular do codão é dependente do organismo hospedeiro no qual o polipéptido modificado é expresso. Um especialista na técnica está familiarizado com os melhores codões para a expressão em bactérias ou leveduras, incluindo, por exemplo, E. coli ou Saccharomyces cerevisiae. Por exemplo, as informações de uso do codão estão disponíveis no Banco de Dados de Utilização do Codão disponível em kazusa. or .jp. codon (ver Richmond (2000) Genome Biology, 1: 241 para uma descrição do banco de dados) . Ver também, Forsburg (2004) Yeast, 10: 1045-1047; Brown et ai. (1991) Nucleic Acids Research, 19: 4298; Sharp et ai. (1988) Nucleic Acids Research, 12: 8207-8211; Sharp et ai. (1991) Yeast, 657-678. Em alguns exemplos, as moléculas de ácido nucleico aqui proporcionadas que codificam um polipéptido de valenceno sintase são codões otimizados para expressão em bactérias ou leveduras. Em exemplos particulares, as moléculas de ácido nucleico proporcionadas aqui codificando uma valenceno sintase são codões otimizados para expressão com base no uso de codões em Saccharomyces cerevisiae.

Também são proporcionados aqui os polipéptidos de valenceno sintase codificados por qualquer das moléculas de ácido nucleico aqui proporcionadas. Os polipéptidos de valenceno sintase e os seus fragmentos ativos codificados pelas moléculas de ácido nucleico aqui proporcionadas podem ser obtidos por métodos bem conhecidos na técnica para geração e expressão de proteínas recombinantes. Tais polipéptidos de valenceno sintase podem ser utilizados para produzir valenceno a partir de um precursor de pirofosfato de terpeno acíclico adequado, tal como FPP, na célula hospedeira a partir da qual a sintase é expressa ou in vitro após a purificação da sintase. Qualquer método conhecido dos especialistas na técnica para a identificação de ácidos nucleicos que codificam genes desejados pode ser usado para obter o ácido nucleico que codifica uma terpeno sintase, tal como uma valenceno sintase. Por exemplo, o ácido nucleico que codifica os polipéptidos de valenceno sintase pode ser obtido utilizando métodos bem conhecidos a partir de uma planta, tal como cardo. Os polipéptidos de valenceno modificados podem então ser manipulados usando qualquer método conhecido na técnica para a introdução de mutações em polipéptidos de valenceno sintase de tipo não modificado ou selvagem, incluindo qualquer método aqui descrito, tal como mutagénese aleatória do ácido nucleico codificador por PCR propensa a erro, dirigida ao local mutagénese, PCR de sobreposição ou outros métodos recombinantes. Os ácidos nucleicos que codificam os polipéptidos podem então ser introduzidos numa célula hospedeira para serem expressos heterologicamente. 1. Isolamento de ácido nucleico que codifica valenceno sintase

Os ácidos nucleicos que codificam as sintases de valenceno podem ser clonados ou isolados usando quaisquer métodos disponíveis conhecidos na especialidade para a clonagem e isolamento de moléculas de ácido nucleico. Tais métodos incluem amplificação por PCR de ácidos nucleicos e rastreio de arquivos, incluindo o rastreio de hibridação de ácido nucleico. Nalguns exemplos, métodos para amplificação de ácidos nucleicos podem ser utilizados para isolar moléculas de ácido nucleico que codificam um polipéptido de valenceno sintase, incluindo, por exemplo, métodos de reação em cadeia da polimerase (PCR). Um material contendo ácido nucleico pode ser usado como um material de partida a partir do qual uma molécula de ácido nucleico que codifica valenceno sintase pode ser isolada. Os arquivos de ácidos nucleicos podem ser usados como fonte de material de partida. Os primers são projetados para amplificar uma molécula codificadora de valenceno sintase. As moléculas aqui contidas podem ser usadas como modelos para iniciadores ou hibridação ou comparação. A fim de isolar o ácido nucleico aqui fornecida, o ADN e o ARNm de preparações a partir de cardo (Eryngium sp.), neste exemplo Eryngium glaciale, que foram preparados e selecionados com iniciadores baseados noutras valenceno sintases foram empregues para triagem. Por exemplo, os iniciadores foram concebidos com base em sequências de ácido nucleico conhecidas que codificam uma terpeno sintase, tal como uma valenceno sintase, germacreno D sintase e vetispiradieno (premnaspirodieno) sintase, incluindo aqueles cujas sequências são apresentadas nas SEQ ID NOS: 39-44. As moléculas de ácido nucleico geradas pela amplificação podem ser sequenciadas e aquelas que codificam um polipéptido de valenceno sintase identificadas.

As sequências nucleotidicas adicionais podem ser unidas a uma molécula de ácido nucleico que codifica a valenceno sintase, incluindo sequências de ligação que contêm sitios de endonuclease de restrição com a finalidade de clonar o gene sintético num vetor, por exemplo, um vetor de expressão de proteína ou um vetor concebido para a amplificação das proteínas nucleares codificando as sequências de ADN. Além disso, sequências de nucleótidos adicionais que especificam elementos de ADN funcionais podem ser operativamente liqadas a uma molécula de ácido nucleico que codifica valenceno sintase. Além disso, o ácido nucleico que codifica outras porções ou domínios também pode ser incluído de modo que a sintase resultante seja uma proteína de fusão. Por exemplo, ácidos nucleicos que codificam outras enzimas, tais como FPP sintase, ou etiquetas de purificação de proteínas, como His ou Flaq. a. Preparação de ácido nucleico modificado 0 ácido nucleico que codifica uma valenceno sintase modificada (descrito mais detalhadamente na Seção D abaixo) pode ser preparado ou gerado usando qualquer método conhecido na técnica para efetuar modificações, particularmente inserções, deleções e substituições de aminoácidos. Os métodos para a modificação de moléculas de ácido nucleico incluem mutagénese padrão racional e / ou aleatória de moléculas de ácido nucleico codificantes (usando por exemplo, PCR propensa a erro, mutagénese aleatória de saturação dirigida pelo local, embaralhamento do ADN ou mutagénese racional dirigida ao site, tais como, por exemplo, kits de mutagénese (por exemplo, QuikChange disponível de Stratagene) , ou métodos de síntese em fase sólida) . Além disso, as técnicas de rotina de ADN recombinante podem ser utilizadas para gerar ácidos nucleicos que codificam polipéptidos que contêm aminoácidos heterólogos. Por exemplo, o ácido nucleico que codifica polipéptidos quiméricos ou polipéptidos contendo sequência de aminoácidos heterólogos pode ser gerado usando um método de PCR em duas etapas e / ou utilizando enzimas de restrição e metodologias de clonagem para a subclonagem de rotina dos componentes do polipéptido quimérico desejado.

Uma vez geradas, as moléculas de ácido nucleico podem ser expressas em células para gerar polipéptidos de valenceno sintase modificados usando gualguer método conhecido na técnica. Os polipéptidos de valenceno sintase modificados podem então ser avaliados por triagem de uma propriedade ou atividade desejada, por exemplo, para a capacidade de produzir um valenceno a partir de um substrato adeguado, por exemplo, FPP, como descrito na Secção E. Em exemplos particulares, as valenceno sintases modificadas com propriedades desejadas são geradas por mutação e selecionadas para uma propriedade de acordo com os exemplos agui apresentados. Normalmente, os polipéptidos de valenceno sintase modificados produzem valenceno a partir de FPP. 2. Vetores e células para expressão de polipéptidos de valenceno sintase

Para a expressão recombinante de um ou mais dos polipéptidos valenceno sintase codificados pelos ácidos nucleicos agui proporcionados, o ácido nucleico contendo a totalidade ou uma porção da seguência de nucleótido gue codifica a sintase pode ser inserido num vetor de expressão apropriado, isto é, um vetor que contém os elementos necessários para a transcrição e tradução da sequência de codificação da proteína inserida. Dependendo do sistema de expressão utilizado, os sinais transcricionais e de tradução necessários também podem ser fornecidos pelo promotor nativo para um gene de valenceno sintase e / ou suas regiões flanqueadoras. Assim, também são proporcionados aqui vetores que contêm ácido nucleico que codifica qualquer polipéptido de valenceno sintase aqui proporcionado. Os vetores exemplificativos incluem pALX.63-71 estabelecido na SEQ ID NO: 33 e descrito no Exemplo 4 abaixo.

As células, incluindo células procarióticas e eucarióticas, contendo os vetores também são fornecidas. Tais células incluem células bacterianas, células de levedura, células de fungos, Arquea, células vegetais, células de insetos e células animais. Em exemplos particulares, as células são leveduras, como Saccharomyces cerevisiae, que expressam um precursor de pirofosfato de terpeno acíclico, como FPP. As células são usadas para produzir uma valenceno sintase, crescendo as células acima descritas sob condições em que a valenceno sintase codificada é expressa pela célula. Em alguns casos, a sintase expressa é purificada. Noutros casos, a valenceno sintase expressa converte FPP num ou mais sesquiterpenos (por exemplo, valenceno) na célula hospedeira.

Qualquer método conhecido dos especialistas na técnica para a inserção de fragmentos de ADN num vetor pode ser utilizado para construir vetores de expressão que contenham um gene quimérico que contenha sinais de controlo de transcrição / tradução convencionais e sequências codificadoras de proteínas apropriadas. Esses métodos podem incluir ADN recombinantes in vitro e técnicas sintéticas e recombinantes in vivo (recombinação genética). A expressão de sequências de ácido nucleico que codificam um polipéptido de valenceno sintase, ou domínios, derivados, fragmentos ou homólogos dos mesmos, pode ser regulada por uma segunda sequência de ácido nucleico de modo que os genes ou seus fragmentos sejam expressos num hospedeiro transformado com a molécula de ADN recombinante (s) ). Por exemplo, a expressão das proteínas pode ser controlada por qualquer promotor / potenciador conhecido na técnica. Numa forma de realização específica, o promotor não é nativo dos genes que codificam uma proteína valenceno sintase. Os promotores que podem ser utilizados incluem, mas não estão limitados a promotores procarióticos, leveduras, mamíferos e plantas. 0 tipo de promotor depende do sistema de expressão usado, descrito em mais detalhes abaixo.

Numa forma de realização específica, é usado um vetor que contém um promotor operacionalmente ligado a ácidos nucleicos que codificam um polipéptido valenceno sintase, ou um domínio, fragmento, derivado ou seu homologo, uma ou mais origens de replicação e, opcionalmente, um ou mais marcadores selecionáveis (por exemplo, um gene de resistência a antibióticos). São descritos vetores e sistemas para expressão de polipéptidos de valenceno sintase. 3. Sistemas de expressão

Polipéptidos de valenceno sintase (modificado e não modificado) pode ser produzido por quaisquer métodos conhecidos na arte para a produção de proteínas, incluindo in vitro e em métodos in vivo, tais como, por exemplo, a introdução de moléculas de ácido nucleico que codificam a valenceno sintase numa célula hospedeira ou planta hospedeira para produção ou expressão in vivo a partir de moléculas de ácido nucleico que codificam a valenceno sintase in vitro. Os polipéptidos de valenceno sintase podem ser expressos em qualquer organismo adequado para produzir as quantidades e formas necessárias de um polipéptido sintase. Os hospedeiros de expressão incluem organismos procarióticos e eucariotas tais como E. coli, leveduras, plantas, células de insetos, células de mamíferos, incluindo linhas celulares humanas e animais transgênicos. Os hospedeiros de expressão podem diferir nos seus níveis de produção de proteína, bem como nos tipos de modificações pós-tradução que estão presentes nas proteínas expressas. A escolha do hospedeiro de expressão pode ser feita com base nesses e outros fatores, tais como considerações regulatórias e de segurança, custos de produção e a necessidade e métodos de purificação. A expressão em hospedeiros eucarióticos pode incluir expressão em células de levedura tais como as do género Saccharomyces (por exemplo Saccharomyces cerevisiae) e do género Pichia (por exemplo, Pichia pastoris), células de inseto tais como células de Drosophila e células de lepidóptero, plantas e células de plantas tais como citrinos, tabaco, milho, arroz, algas e lemna. As células eucarióticas para expressão também incluem linhas de células de mamíferos tais como células de ovário de hamster chinês (CHO) ou células de rim de hamster bebé (BHK) . Os hospedeiros de expressão eucariótica também incluem produção em animais transgênicos, por exemplo, incluindo produção em soro, leite e ovos.

Muitos vetores de expressão estão disponíveis e são conhecidos dos especialistas na técnica para a expressão de uma terpeno sintase, como a valenceno sintase. Um vetor de expressão exemplar é pALX31-108.2, estabelecido na SEQ ID NO: 32, e descrito aqui noutro lugar. A escolha do vetor de expressão é influenciada pela escolha do sistema de expressão do hospedeiro. Esta seleção está bem dentro do nível de habilidade do especialista na técnica. Em geral, os vetores de expressão podem incluir promotores transcricionais e, opcionalmente, intensificadores, sinais de tradução e sinais de transcrição e de tradução terminais. Os vetores de expressão que são usados para transformação estável possuem normalmente um marcador selecionável que permite a seleção e manutenção das células transformadas. Em alguns casos, uma origem de replicação pode ser usada para amplificar o número de cópias dos vetores nas células.

Os métodos de produção de polipéptidos de terpeno sintase, incluindo polipéptidos de valenceno sintase, podem incluir a co expressão de um precursor de terpeno de pirofosfato aciclico, tal como FPP, na célula hospedeira. Em alguns casos, a célula hospedeira expressa naturalmente o FPP. Essa célula pode ser modificada para expressar maiores quantidades de FPP (ver por exemplo Patente dos EUA Nos. 6 531 303, 6 689 593, 7 838 279 e 7 842 497) . Noutros casos, uma célula hospedeira que não produz naturalmente FPP é modificada geneticamente para produzir FPP. a. Células procarióticas

Os procariotas, em especial E. coli, fornecem um sistema para produzir grandes quantidades de polipéptidos de valenceno sintase aqui proporcionados. Transformação de E. coli é uma técnica simples e rápida bem conhecida dos especialistas na técnica. Exemplos de vetores de expressão para transformação de células de E. coli incluem, por exemplo, os vetores de expressão de pGEM, os vetores de expressão de pQE e os vetores de expressão de pET (ver a Patente EUA N 0 4 952 496, disponível de Novagen, Madison, WI; ver também a literatura publicada por Novagen descrevendo o sistema). Tais plasmídeos incluem pET 11a, que contém o promotor T71ac, o terminador T7, o operador lac de E. coli indutível e o gene repressor lac; pET 12a-c, que contém o promotor T7, o terminador T7 e o sinal de secreção ompT de E. coli; e pET 15b e pET19b (Novagen, Madison, WI), que contêm uma sequência líder His-Tag ™ para utilização na purificação com uma coluna de Ni e um local de clivagem de trombina que permite a clivagem após a purificação sobre a coluna, a região promotora de T7-lac e o terminador T7.

Os vetores de expressão para E. coli podem conter promotores induzíveis que são úteis para induzir altos niveis de expressão da proteína e para expressar proteínas que exibem alguma toxicidade para as células hospedeiras. Exemplos de promotores procarióticos incluem, por exemplo, o promotor da β-lactamase (Jay et ai., (1981) Proc. Natl. Acad. Sei. USA 78: 5543) e o promotor tac DeBoer et al., (1983) Proc. Natl. Acad. Sei. EUA 80: 21-25); veja também "Useful Proteins from Recombinant Bacteria": em Scientific American 242: 74-94 (1980)). Exemplos de promotores induzíveis incluem ο promotor lac, o promotor trp, o promotor híbrido tac, os promotores de ARN T7 e SP6 e o promotor ÀPl regulado por temperatura.

Polipéptidos de valenceno sintase aqui proporcionados podem ser expressos no ambiente citoplasmática de E. coli. O citoplasma é um meio de redução e, para algumas moléculas, isso pode resultar na formação de corpos de inclusão insolúveis. Os agentes redutores tais como ditiotreitol e β-mercaptoetanol e desnaturantes ( por exemplo, como guanidina-HCl e ureia) podem ser utilizados para resolubilizar as proteínas. Uma abordagem alternativa é a expressão de valenceno sintase no espaço peri plásmico das bactérias, que proporcionam um ambiente oxidativo e as isomerases dissulfureto e tipo chaperonina levando à produção de proteína solúvel. Normalmente, uma sequência líder é fundida com a proteína a ser expressa que direciona a proteína para o peri plasma. O líder é então removido por péptidases de sinal dentro do peri plasma. Exemplos de sequências líderes peri plasmáticas-alvo incluem o pelB líder do gene da pectato liase e o líder derivado do gene da fosfatase alcalina. Em alguns casos, a expressão peri plasmática permite a dispersão da proteína expressa no meio de cultura. A secreção de proteínas permite purificação rápida e simples do sobrenadante da cultura. As proteínas que não são segregadas podem ser obtidas a partir do peri plasma pela lise osmótica. Semelhante à expressão citoplasmática, em alguns casos, as proteínas podem se tornar insolúveis e podem ser utilizados desnaturantes e agentes redutores para facilitar a solubilização e o redobragem. A temperatura de indução e crescimento também pode influenciar níveis de expressão e solubilidade. Normalmente, são utilizadas temperaturas entre 25°C e 37°C. As mutações também podem ser usadas para aumentar a solubilidade das proteínas expressas. Normalmente, as bactérias produzem proteínas aglicosiladas. b. Células de levedura

Os sistemas de levedura, tais como, mas não limitados aqueles do género Saccharomyces (por exemplo Saccharomyces cerevisiae), Schizosaccharomyces pombe, Yarrowia lipolytica, Kluyveromyces lactis e Pichia pastoris pode ser usado para expressar os polipéptidos de valenceno sintase aqui proporcionados. Os sistemas de expressão de levedura também podem ser usados para produzir terpenos, por exemplo, valenceno, cujas reações são catalisadas pelas sintases (por exemplo, valenceno sintase) . A levedura pode ser transformada com vetores de repetição episomal ou por integração cromossômica estável por recombinação homóloga. Em alguns exemplos, os promotores induzíveis são usados para regular a expressão genica. Exemplos de sequências promotoras para a expressão de polipéptidos de valenceno sintase em leveduras incluem, entre outros, promotores para metalotionina, 3-fosfoglicerato quinase (Hitzeman et al. (1980) J. Biol. Chem. 255: 2073) ou outras enzimas glicolíticas (Hess et al. (1968) J. Adv. Enzyme Reg. 7: 149; e Holland et al. (1978) Biochem. 17: 4900), tais como enolase, gliceraldeído fosfato desidrogenase, hexoquinase, piruvato descarboxilase, fosfatofructoquinase, glucose fosfato isomerase, 3-fosfoglicerato mutase, piruvato quinase, triosefosfato isomerase, fosfoglucose isomerase e glucoquinase.

Outros vetores e promotores adequados para utilização em expressão de leveduras estão ainda descritos em Hitzeman, EPA-73657 ou em Fleer et al. (1991) Gene, 107: 285-195 ; e van den Berg et al. (1990) Bio / Technology, 8: 135-139. Outra alternativa inclui, mas não se limita ao promotor de ADH2 repressível à glicose descrito por Russell et al. (J. Biol. Chem. 258: 2674, 1982 ) e Beier et al. (Nature 300: 724, 1982), ou um promotor ADH1 modificado. Vetores de transporte replicáveis em leveduras e E. coli podem ser construídos, por exemplo, inserindo sequências de ADN a partir de pBR322 para seleção e replicação na E. coli (gene Ampr e origem da replicação) nos vetores de levedura acima descritos.

Os vetores de expressão de levedura podem incluir um marcador selecionável como LEU2, TRP1, HIS3 e URA3 para seleção e manutenção do ADN transformado. Os vetores exemplificativos incluem pALX31-108.2, descrito aqui noutro lugar, que contém um marcador URA3. As proteínas expressas na levedura são muitas vezes solúveis e a co expressão com chaperoninas, como Bip e proteína dissulfureto isomerase, pode melhorar os níveis de expressão e a solubilidade. Adicionalmente, as proteínas expressas em leveduras podem ser dirigidas para a secreção utilizando fusões de péptidos de sinal de secreção, tais como o sinal de secreção de fator alfa do tipo amadurecimento de levedura a partir de Saccharomyces cerevisiae e fusões com proteínas da superfície celular da levedura, como o recetor de adesão Aga2p ou a glucoamilase de Arxula adeninivorians. Um site de clivagem da protéase (por exemplo, a protéase Kex-2) pode ser arranjada para remover as sequências fundidas dos polipéptidos à medida que saem da via de secreção. A levedura expressa naturalmente as proteínas necessárias, incluindo FPP sintase (gene ERG20, que pode produzir FPP) para a via biossintética do isoprenóide dependente do mevalonato. Assim, a expressão das terpeno sintases, incluindo os polipéptidos de valenceno sintase aqui proporcionados, nas células de levedura pode resultar na produção de sesquiterpenos, tais como valenceno a partir de FPP. Exemplos de células de levedura para a expressão de polipéptidos de valenceno sintase incluem levedura modificada para expressar níveis aumentados de FPP. Por exemplo, as células de levedura podem ser modificadas para produzir menos esqualeno sintase ou produzir esqualeno sintase menos ativa (por exemplo, mutantes erg9, ver por exemplo as Patentes dos EUA Nos. 6531303 e 6689593 e a Pat. Publ. dos EUA Nos. 2010-0151519 e 2010-0151555) . Isto resulta em acumulação de FPP na célula hospedeira em níveis superiores em comparação com células de levedura de tipo selvagem, o que, por sua vez, pode resultar em rendimentos aumentados de sesquiterpenos (por exemplo, valenceno).

Num outro exemplo, as células de levedura podem ser modificadas para produzir mais FPP sintase por introdução de um gene de sintase de FPP, tais como FPPS a partir de A. annua (ver, por exemplo, Brodelius et al.(2002) Eur. J. Biochem. 269: 3570-3579), FPP de N. crassa e FPS1 e FPS2 de A. thaliana. Nalguns exemplos, o gene FPP nativo numa tal levedura pode ser excluído. Outras modificações que permitem o aumento da produção de FPP em leveduras incluem, por exemplo, mas não estão limitadas a modificações que aumentam a produção de acetil CoA, inativam genes que codificam enzimas que utilizam FPP e GPP como substrato e sobre-expressam as HMG-CoA redutases, como descrito na Patente dos EUA No. 7,842,497. Exemplos de células de levedura modificadas incluem, mas não estão limitadas a, cepas modificadas de Saccharomyces cerevisiae CALI5-1 (ura3, leu2, his3, trpl, Δ erg9 :: HIS3, HMG2cat / TRP1 :: rDNA, dppl, sue), ALX7-95 ( Ura3, his3, trpl, Aerg9 :: HIS3, HMG2cat/TRPl :: rDNA, dppl sue), ALX11-30 (ura3, trpl, erg9def25, HMG2cat/ TRP1 : : rDNA, dppl, sue), que são conhecidas e descritas numa ou mais de Patente dos EUA Nos. 6 531 303, 6 689 593, 7 838 279, 7 842 497, e Pedidos de Patente dos EUA Nos 2004-0249219 e 2011-0189717. c. Plantas e células vegetais

As células de plantas e de plantas transgénicas podem ser utilizadas para a expressão de polipéptidos de valenceno sintase aqui proporcionados. As construções de expressão são normalmente transferidas para plantas que usam transferência direta de ADN, como o bombardeamento de microprojéteis e a transferência mediada por PEG para protoplastos e com transformação mediada por agrobacterium. Os vetores de expressão podem incluir sequências de promotores e potenciadores, elementos de terminação da transcrição e elementos de controle de tradução. Os vetores de expressão e as técnicas de transformação geralmente são divididos entre hospedeiros de dicotiledóneas, como Arabidopsis e tabaco, e hospedeiros de monocotiledóneas, como o milho e o arroz. Exemplos de promotores de plantas utilizados para expressão incluem o promotor do virus do mosaico da couve-flor, o promotor da nopalina sintase, o promotor de ribose bis fosfato carboxilase e os promotores de ubiquitina e UBQ3. Os marcadores selecionáveis, como a higromicina, a fosfomanose isomerase e a neomicina fosfotransferase são frequentemente usados para facilitar a seleção e manutenção de células transformadas. As células de plantas transformadas podem ser mantidas em cultura como células, agregados (tecido de calo) ou regeneradas em plantas inteiras. As células de plantas transgênicas também podem incluir algas projetadas para produzir proteínas (ver, por exemplo, Mayfield et al. (2003) Proc Natl Acad Sei USA 100: 438-442) . As plantas transformadas incluem, por exemplo, plantas selecionadas dos gêneros Nicotiana, Solanum, Sorghum, Arabidopsis, Medicago (alfafa), Gossypium (algodão) e Brassica (colza). Em alguns exemplos, a planta pertence às espécies de Nicotiana tabacum, e é transformado com vetores que sobre-expressam valenceno sintase e difosfato de farnesilo sintase, tal como descrito na Patente dos EUA Publicadas No. 2009-0123984 e No. 7, 906, 710. d. Insetos e células de insetos

Os insetos e células de inseto, particularmente um sistema de expressão de baculovírus, podem ser utilizados para expressar polipéptidos de valenceno sintase aqui proporcionados (ver, por exemplo, Muneta et al. (2003) J. Vet. Med. Sei. 65 (2) : 219-223) . As células de insetos e larvas de insetos, incluindo a expressão na hemolinfa, expressam altos níveis de proteína e são capazes da maioria das modificações pós-tradução usadas pelos eucariotas superiores. Os baculovírus têm uma gama restritiva de hospedeiro que melhora a segurança e reduz as preocupações com a regulação da expressão eucariótica. Normalmente, os vetores de expressão utilizam um promotor tal como o promotor de poliedrina do baculovírus para a expressão de alto nível. Os sistemas de baculovírus comumente utilizados incluem baculovírus tais como vírus da poliedrose nuclear de Autographa californica (AcNPV) e o vírus da poliedrose nuclear de Bombyx mori (BmNPV) e uma linhagem de células de insetos como o Sf9 derivado de Spodoptera frugiperda, Pseudaletia unipuncta (A7S) e Danaus plexippus (DpNl). Para a expressão de alto nivel, a sequência de nucleótidos da molécula a ser expressa é fundida imediatamente a jusante do codão de iniciação de poliedrina do vírus. Os sinais de secreção de mamíferos são processados com precisão em células de insetos e podem ser utilizados para secretar a proteína expressada no meio de cultura. Além disso, as linhas celulares da Pseudaletia unipuncta (A7S) e Danaus plexippus (DpNl) produzem proteínas com padrões de glicosilação semelhantes aos sistemas celulares de mamíferos.

Um sistema de expressão alternativo em células de insetos é o uso de células estáveis transformadas. As linhas celulares, como as células Schnieder 2 (S2) e células Kc (drosophilia melanogaster) e células C7 (Aedes albopictus), podem ser usadas para expressão. 0 promotor de metalotionina da Drosophilia pode ser utilizado para induzir altos níveis de expressão na presença de indução de metais pesados como cádmio ou cobre. Os vetores de expressão são normalmente mantidos pela utilização de marcadores selecionáveis tais como neomicina e higromicina. e. Células de mamíferos

Os sistemas de expressão de mamíferos podem ser utilizados para expressar os polipéptidos de valenceno sintase aqui proporcionados e também podem ser utilizados para produzir valenceno e outros terpenos cuja formação é catalisada pelas valenceno sintase. As construções de expressões podem ser transferidas para células de mamífero por métodos convencionais, incluindo, mas não se limitando a, infeção virai tal como adenovirus ou por transferência direta de ADN tais como lipossomas, fosfato de cálcio, DEAE-dextrano e por meios físicos tais como electroporação e microinjeção. Os vetores de expressão para células de mamíferos incluem normalmente um local de cap. de mRNA, uma caixa de TATA, uma sequência de iniciação de tradução (sequência de consenso de Kozak) e elementos de poliadenilação. Tais vetores incluem frequentemente potenciadores do promotor da transcrição para expressão de alto nível, por exemplo o promotor-potenciador de SV40, o promotor do citomegalovírus humano (CMV), ou a repetição terminal longa do promotor do vírus do sarcoma de Rous (RSV). Estes promotores-intensificadores são ativos em muitos tipos de células. Os promotores de tecido e células e as regiões intensificadoras também podem ser utilizados para a expressão. Exemplos de regiões promotoras / potenciadoras incluem, mas não estão limitadas a, genes tais como elastase I, insulina, imunoglobulina, vírus do tumor mamário de ratinho, albumina, alfa-fetoproteína, alfa 1-antitripsina, beta-globina, proteína básica de mielina, cadeia leve 2 da miosina e controle do gene da hormona de liberação gonadotrópica. Os marcadores selecionáveis podem ser usados para selecionar e manter células com a construção de expressão. Exemplos de genes marcadores selecionáveis incluem, mas não estão limitados a, fosfotransferase de higromicina B, adenosina deaminase, xantina-guanina fosforibosil transferase, aminoglicosido fosfotransferase, dihidrofolato redutase e timidina quinase. A fusão com moléculas de sinalização na superfície celular como TCR-ξ e FcsRI-γ pode direcionar a expressão das proteínas num estado ativo na superfície celular.

Muitas linhas celulares estão disponíveis para expressão de mamíferos, incluindo células de ratinhos, ratos, humanos, macacos e galinhas e hamster. Linhas celulares exemplificativas incluem, mas não estão limitadas a, ΒΗΚ (isto é, células BHK-21), 293-F, CHO, CHO Express (CHOX; Excellgene), Balb / 3T3, HeLa, MT2, rato NSO (não secretoras) e outras linhas celulares de mieloma, de hibridoma e hetero-hibridoma, linfócitos, fibroblastos, Células Sp2 / 0, COS, NIH3T3, HEK293, 293S, 293T, 2B8 e HKB. As linhas celulares também estão disponíveis adaptadas a meios livres de soro que facilitam a purificação de proteínas segregadas a partir dos meios de cultura das células. Um desses exemplos é a linha celular EBNA-1 livre de soro (Pham et al. (2003) Biotechnol. Bioeng. 84:332-42). 4. Purificação

Os métodos para a purificação de polipéptidos de valenceno sintase de células hospedeiras dependem das células hospedeiras e sistemas de expressão escolhidos. Para moléculas segregadas, as proteínas são geralmente purificadas dos meios de cultura após a remoção das células. Para a expressão intracelular, as células podem ser lisadas e as proteínas são purificadas a partir do extrato. Quando organismos transgénicos, tais como plantas e animais transgénicos, são utilizados para expressão, os tecidos ou órgãos podem ser utilizados como material de partida para produzir um extrato celular lisado. Além disso, a produção animal transgênica pode incluir a produção de polipéptidos em leite ou ovos, que podem ser coletados e, se necessário, as proteínas podem ser extraídas e purificadas adicionalmente usando métodos padrão na técnica.

As valenceno sintase podem ser purificadas utilizando métodos padrão de purificação de proteínas conhecidas na técnica, incluindo mas não se limitando a, SDS-PAGE, cromatografia de fração e exclusão de tamanho, precipitação de sulfato de amónio, cromatografia de quelato e cromatografia de troca iónica. As construções de expressão também podem ser projetadas para adicionar uma etiqueta de afinidade, como um epítopo myc, fusão GST ou His6 e purificado por afinidade com anticorpo myc, resina de glutationa e Ni-resina, respetivamente, para uma proteína. A pureza pode ser avaliada por qualquer método conhecido na técnica, incluindo eletroforese em gel e técnicas de coloração e espectrofotometria. D. Polipéptidos de Valenceno sintase São aqui fornecidos polipéptidos de valenceno sintase. Nalguns exemplos, os polipéptidos de valenceno sintase são codificados por ácidos nucleicos isolados do cardo Eryngium glaciale. Noutros exemplos, os polipéptidos de valenceno sintase são variantes ou fragmentos cataliticamente ativos daqueles codificados por ácidos nucleicos isolados do cardo Eryngium glaciale. Os polipéptidos de valenceno sintase proporcionados aqui catalisam a formação de valenceno a partir de um precursor adequado, tal como um precursor de terpeno de pirofosfato acíclico, por exemplo pirofosfato de farnesilo (FPP).

Também são proporcionados aqui polipéptidos de valenceno sintase modificados. As modificações aqui contempladas incluem, por exemplo, alterações ou substituições de aminoácidos, adições ou deleções, truncações ou suas combinações. As modificações podem ser feitas em qualquer região de uma valenceno sintase desde que o polipéptido modificado da valenceno sintase resultante, pelo menos, retenha a atividade de valenceno sintase (isto é a capacidade de catalisar a formação de valenceno sintase a partir de um precursor de pirofosfato de terpeno acíclico, normalmente FPP). Os polipéptidos de valenceno sintase aqui proporcionados podem conter outras modificações, por exemplo, modificações não na sequência primária do polipéptido, incluindo, por exemplo, modificações pós-tradução.

Também são aqui proporcionados fragmentos cataliticamente ativos dos polipéptidos de valenceno sintase. Por exemplo, são proporcionados aqui fragmentos ativos do polipéptido de valenceno sintase possuindo uma sequência de aminoácidos apresentada na SEQ ID NO: 1. Os fragmentos ativos mantêm a capacidade de catalisar a formação de valenceno a partir do precursor de terpeno de pirofosfato acíclico, tal como o pirofosfato de farnesilo (FPP). Em exemplos particulares, os polipéptidos de valenceno sintase são truncados no terminal N ou C, como descrito em mais detalhe abaixo. Em alguns exemplos, os fragmentos ativos de polipéptidos de valenceno sintase são modificados como aqui descrito. Tais fragmentos retêm uma ou mais propriedades de um polipéptido de valenceno sintase de comprimento total. Normalmente, os fragmentos ativos exibem a atividade da valenceno sintase (isto é, catalisam a formação de valenceno).

Os polipéptidos de valenceno sintase aqui proporcionados podem ser gerados por qualquer método conhecido do especialista na técnica. Nalguns exemplos, os polipéptidos de valenceno sintase aqui proporcionados são produzidos sinteticamente, tais como a utilização de síntese de péptidos de fase solida ou de fase de solução. Normalmente, os polipéptidos de valenceno sintase aqui proporcionados são expressos numa célula hospedeira a partir de um ácido nucleico que codifica o polipéptido de valenceno sintase, tal como descrito na Secção C acima. Um exemplo de uma célula hospedeira para a expressão de um polipéptido de valenceno sintase é uma célula de levedura, por exemplo, uma célula de S. cerevisiae.

Os polipéptidos de valenceno sintase aqui proporcionados podem ser utilizados para catalisar a produção de valenceno. Normalmente, os polipéptidos de valenceno sintase aqui proporcionados catalisam a formação de valenceno a partir de FPP. As reações podem ser realizadas in vivo, tal como numa célula hospedeira na qual foi introduzido um ácido nucleico que codifica o polipéptido de valenceno sintase (como descrito na Secção C acima). Pelo menos um dos polipéptidos, por exemplo, o polipéptido de valenceno sintase, será heterólogo para o hospedeiro. As reações também podem ser realizadas in vitro por contacto com o polipéptido de valenceno sintase com o substrato adequado, por exemplo, difosfato de farnesilo, em condições apropriadas para a geração de valenceno. 1. Polipéptidos de valenceno sintase de Eryngium glaciale É aqui fornecido um polipéptido de valenceno sintase possuindo uma sequência de aminoácidos apresentada na SEQ ID NO: 1. Também aqui divulgados são polipéptidos de valenceno sintase que exibem pelo menos 50% de identidade de sequência de aminoácidos para um polipéptido de valenceno sintase estabelecido na SEQ ID NO: 1. Por exemplo, os polipéptidos de valenceno sintase apresentados podem apresentar pelo menos, ou pelo menos cerca de 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%. 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% ou 99% de identidade de sequência de aminoácidos com um polipéptido de valenceno sintase estabelecido na SEQ ID NO: 1, desde que o polipéptido de valenceno sintase resultante mantenha pelo menos a atividade de valenceno sintase isto é, a capacidade de catalisar a formação de valenceno a partir de um precursor de pirofosfato de terpeno aciclico, normalmente FPP) . A identidade percentual pode ser determinada por um especialista na técnica usando programas de alinhamento padrão. De acordo com a presente invenção, o polipéptido de valenceno sintase tem pelo menos 90% de identidade de sequência para o polipéptido estabelecido na SEQ ID NO: 1. 2. Modificações de Polipéptidos Valenceno sintase de Eryngium glaciale

Fornecido aqui são polipéptidos modificados de valenceno sintase de Eryngium glaciale. Também são proporcionadas aqui moléculas de ácido nucleico que codificam qualquer dos polipéptidos modificados de valenceno sintase aqui proporcionados. As modificações podem ser feitas em qualquer região providenciada de uma valenceno sintase, desde que o polipéptido modificado de valenceno sintase resultante, pelo menos, retenha a atividade da valenceno sintase (isto é, a capacidade de catalisar a formação de valenceno a partir de um precursor de pirofosfato de terpeno aciclico, normalmente FPP) .

As modificações podem ser uma única modificação de aminoácidos, tais como alterações únicas de aminoácidos (substituições), inserções ou deleções, ou modificações de múltiplos aminoácidos, tais como substituições de múltiplos aminoácidos, inserções ou deleções. Em alguns exemplos, domínios ou regiões inteiras ou parciais, tais como qualquer domínio ou região aqui descrito abaixo, são trocados com domínios ou regiões correspondentes ou porções dele de outra terpeno sintase. Exemplos de modificações são substituições de aminoácidos, incluindo substituições de aminoácidos únicas ou múltiplas. Normalmente, a modificação é uma substituição de aminoácidos, que pode ser uma substituição conservativa, tal como estabelecido na Tabela 2, ou uma substituição não conservativa. Por exemplo, os polipéptidos de valenceno sintase modificados aqui proporcionados podem conter pelo menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 90, 95, 100, 105, 110, 115, 120 ou mais posições modificadas em comparação com o polipéptido de valenceno sintase não contendo a modificação.

As modificações aqui descritas podem estar em qualquer polipéptido de valenceno sintase. Normalmente, as modificações são feitas num polipéptido de valenceno sintase aqui proporcionado. Por exemplo, as modificações aqui descritas podem estar num polipéptido de valenceno sintase conforme estabelecido em SEQ ID NO: 1 ou em qualquer variante deste, incluindo qualquer que tenha pelo menos 90%, 91%, 92%, 93%, 94%, 95 %, 96%, 97%, 98% ou 99% de identidade de sequência para um polipéptido de valenceno sintase estabelecido na SEQ ID NO: 1.

Em particular, os polipéptidos de valenceno sintase modificados aqui proporcionados contêm alterações ou substituições de aminoácidos, adições ou deleções, truncamentos ou suas combinações com referência ao polipéptido de valenceno sintase estabelecido na SEQ ID NO: 1. É dentro do nivel da especialidade na técnica fazer modificações em polipéptidos de valenceno sintase, tais como qualquer estabelecida na SEQ ID NO: 1 ou qualquer variante do mesmo. Exemplos de métodos para gerar polipéptidos de valenceno sintase modificados são fornecidos na Seção C.l.a. acima. Está dentro do nível da especialidade na técnica gerar uma valenceno sintase contendo qualquer uma ou mais das mutações descritas e testar cada uma para a atividade da valenceno sintase como aqui descrito.

Além disso, em alguns exemplos, aqui proporcionados são fragmentos ativos modificados de polipéptidos de valenceno sintase que contêm qualquer das modificações aqui proporcionadas. Tais fragmentos retêm uma ou mais propriedades de uma valenceno sintase. Normalmente, os fragmentos ativos modificados exibem atividade de valenceno sintase (isto é, a capacidade de catalisar a formação de valenceno a partir de um precursor de pirofosfato de terpeno acíclico, por exemplo, FPP).

As modificações num polipéptido de valenceno sintase também podem ser feitas num polipéptido de valenceno que também contenha outras modificações, incluindo modificações na sequência primária e modificações não na sequência primária do polipéptido. Por exemplo, a modificação aqui descrita pode estar num polipéptido de valenceno sintase que é um polipéptido de fusão ou polipéptido quimérico, incluindo híbridos de diferentes polipéptidos de valenceno sintase ou diferentes polipéptidos de terpeno sintase (por exemplo, contêm um ou mais domínios ou regiões de outra terpeno sintase) e também num polipéptidos de valenceno sintase sintéticos preparados de forma recombinante ou sintetizada ou construídos por outros métodos conhecidos na técnica com base na sequência de polipéptidos conhecida.

Para manter a atividade da valenceno sintase, normalmente as modificações não são feitas nas posições que são necessárias para a atividade da valenceno sintase, isto é, no sitio ativo do motivo DDxxD (SEQ ID NO: 35), ou motivo NSE / DTE (SEQ ID NO: 36). Por exemplo, geralmente não são feitas modificações numa posição correspondente à posição D315, D316 ou D319 ou numa posição correspondente à posição D461, G465 ou E469, com referência a uma sequência de aminoácidos estabelecida na SEQ ID NO: 1 .

Os polipéptidos de valenceno sintase modificados podem conter uma ou mais substituições de aminoácidos, em qualquer combinação, com ou sem modificações adicionais. Geralmente, as modificações múltiplas aqui proporcionadas podem ser combinadas por um especialista na técnica desde que o polipéptido modificado mantenha a capacidade de catalisar a formação de valenceno e / ou outros terpenos a partir de qualquer precursor de terpeno de pirofosfato aciclico adequado, incluindo, mas não se limitando a FPP, GPP e GGPP. Normalmente, os polipéptidos de valenceno modificados catalisam a formação de valenceno a partir de FPP. Em alguns exemplos, o polipéptido de valenceno sintase modificado resultante exibe produção de valenceno semelhante ou aumentada a partir de FPP em comparação com o polipéptido de valenceno sintase não modificado. Em alguns casos, o polipéptido de valenceno sintase modificado resultante apresenta uma diminuição da produção de valenceno a partir de FPP em comparação com o polipéptido de valenceno sintase não modificado.

Também são proporcionadas aqui moléculas de ácido nucleico que codificam qualquer dos polipéptidos modificados de valenceno sintase aqui proporcionados. Em exemplos particulares, a sequência de ácido nucleico pode ser otimizada por um codão otimizado, por exemplo, para aumentar os niveis de expressão da sequência codificada. Num exemplo, as sequências de ácido nucleico que codificam os polipéptidos modificados de valenceno sintase aqui proporcionados são otimizadas por codões com base no uso de codões em S. cerevisiae.

Os polipéptidos modificados e as moléculas de ácido nucleico que codificam aqui proporcionadas podem ser produzidas por técnicas padrão de ADN recombinante conhecidas por um especialista na técnica. Pode ser utilizado qualquer método conhecido na técnica para efetuar a mutação de qualquer um ou mais aminoácidos numa proteína alvo. Exemplos de métodos são fornecidos na Seção C acima. Nalguns exemplos, os polipéptidos de valenceno sintase modificados são produzidos sinteticamente, tal como na utilização de síntese de péptidos em fase sólida ou fase de soluções. a. Polipéptidos truncados

Também são aqui proporcionados polipéptidos de valenceno sintase truncados. Os polipéptidos de valenceno sintase truncados podem ser truncados no terminal N ou no terminal C, desde que os polipéptidos de valenceno sintase truncados retenham a atividade catalítica de uma valenceno sintase. Normalmente, os polipéptidos de valenceno sintase truncados exibem a atividade da valenceno sintase (isto é, a capacidade de catalisar a formação de valenceno a partir de um precursor de terpeno de pirofosfato acíclico, tal como FPP) . Nalguns exemplos, os polipéptidos de valenceno sintase aqui proporcionados são truncados no terminal N. Noutros exemplos, os polipéptidos de valenceno sintase aqui proporcionados são truncados no terminal C. Ainda noutros exemplos, os polipéptidos de valenceno sintase aqui proporcionados são truncados no terminal N e no terminal C.

Nalguns exemplos, os polipéptidos de valenceno sintase são truncados no terminal N, no terminal C ou nas duas extremidades de um polipéptido de valenceno sintase aqui proporcionado, tal como truncamento de uma sequência de aminoácidos apresentada na SEQ ID NO: 1. Noutros exemplos, qualquer uma das valenceno sintase modificadas aqui contidas é truncada. Nalguns exemplos, os polipéptidos de valenceno sintase são truncados no seu terminal N. Por exemplo, qualquer polipéptido de valenceno sintase aqui proporcionado pode ser truncado no, ou pelo menos no 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16 17, 18, 19 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75 ou mais resíduos de aminoácidos no terminal N, desde que o polipéptido de valenceno sintase mantenha a atividade da valenceno sintase.

Noutros exemplos, qualquer polipéptido de valenceno sintase aqui proporcionado pode ser truncado em, ou em cerca de ou pelo menos em 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 15, 16, 17, 18, 19 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75 ou mais resíduos de aminoácidos no terminal C, desde que o polipéptido de valenceno sintase mantenha a atividade da valenceno sintase. b. Polipéptidos com atividades ou propriedades alteradas

Os polipéptidos de valenceno sintase modificados aqui proporcionados também podem exibir alterações em atividades e / ou propriedades. A valenceno sintase modificada pode apresentar, por exemplo, um aumento da atividade catalítica, aumento do substrato (por ex.FPP) de ligação, estabilidade aumentada, o aumento da expressão na célula hospedeira e / ou a distribuição do produto alterada (isto é, quantidades relativas alteradas e / ou tipos de terpenos) em comparação com um polipéptido de valenceno sintase de tipo selvagem. Tais atividades e propriedades alteradas podem resultar num aumento da produção de valenceno a partir do pirofosfato de farnesilo. Normalmente, a distribuição do produto de terpenos produzido por uma valenceno sintase de tipo selvagem inclui valenceno, bem como uma série de outros produtos de terpeno(por ex., subproduto terpeno ou produtos deles derivados), incluindo, por exemplo, β-selineno, τ -selineno, eremofilona, 7-epi-a-selineno, germacreno A, β-elemeno e aristoloceno (pico 2 na Figura 3A).

Nalguns exemplos, os polipéptidos de valenceno sintase modificados podem catalisar a formação de outros terpenos diferentes do valenceno a partir de qualquer substrato adequado, como, por exemplo, FPP, GPP ou GGPP. Por exemplo, as valenceno sintase modificadas podem produzir um ou mais monoterpenos, sesquiterpenos ou diterpenos diferentes do valenceno. Normalmente, os polipéptidos de valenceno sintase modificados produzem mais valenceno do que qualquer outro terpeno. Isso pode resultar num aumento da produção de nootkatona. As modificações que resultam no aumento da produção de valenceno a partir de FPP podem ser identificadas usando os ensaios aqui descritos e bem conhecidos na técnica, permitindo assim a identificação de polipéptidos de valenceno sintase modificados com capacidade melhorada para produzir valenceno a partir de FPP. c. Permutas de domínio São aqui providenciados polipéptidos de valenceno sintase modificados que são polipéptidos quiméricos contendo uma permuta (deleção e inserção) por deleção de resíduos de aminoácidos de um ou mais dos domínios ou regiões do mesmo ou suas porções e inserção de uma sequência heteróloga de aminoácidos. Nalguns exemplos, a sequência heteróloga é uma sequência aleatória de aminoácidos. Noutros exemplos, a sequência heteróloga é uma sequência contígua de aminoácidos para o domínio ou região ou porção correspondente da mesma noutro polipéptido de terpeno sintase. A sequência heteróloga que é substituída ou inserida geralmente inclui pelo menos 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40 ou mais aminoácidos. Nos exemplos em que a sequência heteróloga é de um domínio correspondente ou uma sua porção de outra terpeno sintase, a sequência heteróloga geralmente inclui pelo menos 50%, 60%, 70%, 80%, 90%, 95% ou mais de aminoácidos contíguos de um domínio ou região ou porção. Num tal exemplo, os resíduos adjacentes ao domínio ou região ou porção heteróloga correspondente também podem ser incluídos num polipéptido de valenceno sintase modificado aqui proporcionado.

Num exemplo de permuta de mutações aqui proporcionados, pelo menos um domínio ou região ou porção do mesmo de um polipéptido de valenceno sintase é substituído por uma sequência contígua de aminoácidos para o domínio ou região ou porções correspondentes de outro polipéptido de terpeno sintase. Nalguns exemplos, 2, 3, 4, 5, 6, 7, 8, 9, 10 ou mais domínios ou regiões ou porções do mesmo são substituídos por sequências contíguas de aminoácidos para o domínio ou região ou porções correspondentes de outro polipéptido de terpeno sintase.

Qualquer domínio ou região ou sua porção de um polipéptido de valenceno sintase pode ser substituído por uma sequência heteróloga de aminoácidos, tal como uma sequência heteróloga do domínio ou região correspondente de outro terpeno. Um domínio ou região pode ser um domínio estrutural ou um domínio funcional. Um especialista na técnica está familiarizado com domínios ou regiões em terpeno sintases. Os domínios funcionais incluem, por exemplo, o domínio N-terminal e o domínio catalítico C-terminal ou uma sua porção. Um domínio estrutural pode incluir toda ou parte de um loop, loop não estruturado ou domínio alfa helicoidal.

Um especialista na técnica está familiarizado com várias sintases de terpeno e pode identificar domínios ou regiões correspondentes ou porções dos seus aminoácidos. Por exemplo, exemplos de domínios e regiões de valenceno sintase cítrica são descritos no Pedido de Patente dos EUA No. 2012-0246767. Exemplos de terpeno sintase incluem, por exemplo, sesquiterpeno sintase. Em exemplos particulares aqui apresentados, as mutações por permuta do domínio de polipéptido de valenceno sintase modificado aqui proporcionadas possuem sequências heterólogas a partir de um domínio ou região correspondente ou uma sua porção de um polipéptido de terpeno sintase que é uma valenceno sintase de Citrus sp. (SEQ ID NOS: 14-15, 26-27, 34 ou 37), valenceno sintase de V. vinifera (SEQ ID NOS: 16 ou 28), valenceno sintase de P. frutescens (SEQ ID NO: 38) ou uma valenceno sintase de C. nootkatensis (SEQ ID NOS: 17 ou 29).

Normalmente, as valenceno sintase modificadas resultantes exibem atividade de valenceno sintase e a capacidade de produzir valenceno a partir FPP. Por exemplo, os polipéptidos de valenceno sintase modificados exibem 50% a 5000%, tais como 50% a 120%, 100% a 500% ou 110% a 250% da produção de valenceno a partir de FPP em comparação com o polipéptido de valenceno sintase não contendo a modificação (por exemplo, a substituição de aminoácidos ou troca de resíduos de aminoácidos de um domínio ou região) e / ou comparado ao polipéptido de valenceno sintase de tipo selvagem estabelecido na SEQ ID NO: 1. Normalmente, os polipéptidos de valenceno sintase modificados exibem uma produção de valenceno aumentada a partir de FPP em comparação com o polipéptido de valenceno sintase não contendo a modificação, tal como quando comparado com a valenceno sintase de tipo selvagem apresentada na SEQ ID NO: 1.

Por exemplo, os polipéptidos de valenceno sintase modificados podem produzir valenceno a partir de FPP numa quantidade que é pelo menos ou cerca de 101%, 102%, 103%, 104%, 105%, 106%, 107%, 108%, 109%, 110 %, 115%, 120%, 125%, 130%, 135%, 140%, 145%, 150%, 160%, 170%, 180%, 200%, 250%, 300%, 350%, 400%, 500%, 1500%, 2000%, 3000%, 4000%, 5000% da quantidade de valenceno produzido a partir de FPP por valenceno sintase de tipo selvagem que não contém a modificação nas mesmas condições. Por exemplo, a produção de valenceno é aumentada pelo menos 1,2 vezes, 1,5 vezes, 2 vezes, 3 vezes, 4 vezes, 5 vezes, 6 vezes, 7 vezes, 8 vezes, 9 vezes, 10 vezes, 11 vezes, 12 vezes, 13 vezes, 14 vezes, 15 vezes, 16 vezes, 17 vezes, 18 vezes, 19 vezes, 20 vezes ou mais.

Noutros exemplos, os polipéptidos de valenceno sintase modificados exibem uma diminuição da produção de valenceno a partir de FPP em comparação com o polipéptido de valenceno sintase que não contém a modificação, tal como comparado com a valenceno sintase de tipo selvagem estabelecido na SEQ ID NO: 1. Por exemplo, os polipéptidos de valenceno sintase modificados podem produzir valenceno a partir de FPP numa quantidade que é no máximo ou cerca de 99%, 98%, 97%, 96%, 95%, 94%, 93%, 92%, 91%, 90 %, 85%, 80%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10% ou menos da quantidade de valenceno produzido a partir de FPP por valenceno sintase de tipo selvagem, que não contém a modificação, nas mesmas condições. Por exemplo, a produção de valenceno é diminuída de tal forma que a produção de FPP por uma valenceno sintase de tipo selvagem não contendo a modificação nas mesmas condições é pelo menos 1,2 vezes, 1,5 vezes, 2 vezes, 3 vezes, 4 vezes, 5 vezes, 6 vezes, 7 vezes, 8 vezes, 9 vezes, 10 vezes, 11 vezes, 12 vezes, 13 vezes, 14 vezes, 15 vezes, 16 vezes, 17- dobra, 18 vezes, 19 vezes, 20 vezes ou mais, maior que a quantidade de valenceno produzido a partir de FPP pelo polipéptido de valenceno sintase modificado.

Todos os métodos conhecidos na arte para gerar poliptidos quiméricos podem ser utilizados para substituir a totalidade ou uma porção contígua de um domínio ou de uma primeira terpeno-sintase com a totalidade ou uma porção contígua do domínio correspondente de uma segunda sintase (ver, Patente dos EUA Nos 5 824774, 6072045, 7186881 e 8,106,260 e Patente dos EUA Pub. No. 2 011-0081703) . Além disso, métodos de mistura de genes podem ser empregues para gerar polipéptidos quiméricos e / ou polipéptidos com permutas de domínio ou região.

Por exemplo, domínios ou regiões correspondentes de quaisquer duas terpeno sintases podem ser trocados através de qualquer método recombinante adequado conhecido na especialidade, ou por síntese in vitro. Um exemplo de um método recombinante é um método de PCR de duas etapas que se sobrepõem, tal como aqui descrito. Em tais métodos, podem ser empregues iniciadores que introduzem mutações numa pluralidade de posições de codão nos ácidos nucleicos que codificam o seu domínio ou porção alvo na primeira terpeno sintase, em que as mutações em conjunto formam a região heteróloga (isto é, a região correspondente da segunda terpeno sintase). Alternativamente, por exemplo, os aminoácidos randomizados podem ser usados para substituir domínios ou regiões específicas. Entende-se que erros de iniciadores, erros de PCR e / ou outros erros nos métodos de clonagem ou recombinação podem resultar em erros tais que a região ou domínio alterado ou substituído resultante não exiba uma sequência de aminoácidos que seja idêntica à região correspondente da segunda terpeno sintase.

Num método exemplar baseado em PCR, a PCR da primeira etapa usa (i) um iniciador a jusante que recobre a jusante da região que está sendo substituída por um iniciador mutagénico que inclui aproximadamente quinze nucleótidos (ou um número efetivo para efetuar o recobrimento, como 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 20, 25 nucleótidos ou mais) da sequência homóloga em cada lado do domínio ou região a ser trocada ou aleatoriamente flanqueando a região a ser importada para o gene alvo e (ii) um iniciador a montante que recobre a montante da região que está sendo substituído em conjunto com um iniciador mutagénico de cadeia oposta que também inclui aproximadamente quinze nucleótidos (ou um número efetivo para efetuar o recobrimento, como 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 20, 25 nucleótidos ou mais) de sequência homóloga em cada lado do domínio ou região a ser trocada ou aleatoriamente flanqueando a região a ser importada para o gene alvo. Se uma substituição em que um domínio ou região de um primeiro gene de terpeno sintase é substituído pelo domínio ou região correspondente de uma segunda terpeno sintase está a ser realizada, os nucleótidos nos iniciadores mutagénicos entre as regiões flanqueadoras da primeira terpeno sintase contêm codões para a região correspondente da segunda terpeno sintase. Nos casos em que os aminoácidos num domínio ou região devem ser randomizados, os nucleótidos dos iniciadores mutagénicos entre as regiões flanqueadoras da primeira terpeno-sintase contêm nucleotídeos aleatórios. Uma PCR sobreposta é então realizada para unir os dois fragmentos, usando o oligo a montante e a jusante. 0 produto de PCR resultante pode então ser clonado em qualquer vetor adequado para expressão da terpeno sintase modificada.

Além disso, qualquer um dos polipéptidos de valenceno sintase modificados contendo mutações de permuta aqui descritas podem conter uma ou mais substituições de aminoácidos. d. Variantes adicionais

Os polipéptidos de valenceno sintase aqui proporcionados podem ser modificados por qualquer método conhecido por um especialista na técnica para gerar variantes de proteínas, incluindo, mas não se limitando a, mistura de genes ou de ADN, PCR com exclusão de erro, PCR de sobreposição ou outros métodos recombinantes. Num exemplo, as moléculas de ácido nucleico que codificam qualquer polipéptido de valenceno sintase ou qualquer variante de polipéptido de valenceno sintase aqui proporcionados podem ser modificadas por mistura de genes. 0 embaralhamento dos genes envolve um ou mais ciclos de fragmentação e remodelação aleatórias de pelo menos duas sequências de nucleotídeos, seguidas de triagem para selecionar sequências de nucleótidos que codificam polipéptidos com as propriedades desejadas. A recombinação pode ser realizada in vitro (ver Stemmer et ai. (1994) Proc Natl Acad Sei USA 91: 10747-10751; Stemmer et al. (1994)

Nature 370: 389-391; Cramieri et al. (1998) Nature 391: 288-291; Patente dos EUA Nos. 5605793,5811238, 5830721, 5834252 e 5837458) ou in vivo (ver, Pat Internacional. Pub. No. WO199707205). As moléculas de ácido nucleico que codificam os polipéptidos podem então ser introduzidas numa célula hospedeira e serem expressas de forma heteróloga e testadas quanto à sua atividade de valenceno sintase por qualquer método descrito na secção E abaixo. e. Proteínas de Fusão

Os polipéptidos de valenceno sintase também podem ser utilizados ou expressos como proteínas de fusão. Por exemplo, uma fusão pode ser gerada para conferir funcionalidade adicional a um polipéptido. Exemplos de proteínas de fusão incluem, mas não estão limitadas a, fusões de uma sequência de sinal, uma etiqueta tal como para localização, por ex. um etiqueta his6 ou myc, ou uma etiqueta para purificação, por exemplo, uma fusão GST, fusão GFP ou CBP, e uma sequência para direcionar a secreção de proteínas e / ou a associação da membrana. Noutros exemplos, uma sesquiterpeno sintase, tal como um polipéptido de valenceno sintase aqui proporcionado, pode ser fundida com FPP sintase (ver, por exemplo, Brodelius et al. (2002) Eur. J. Biochem. 269:3570-3579) . São também proporcionadas proteínas de fusão contendo um polipéptido de valenceno sintase e um ou mais de outros polipéptidos. A ligação de um polipéptido de valenceno sintase com outro polipéptido pode ser efetuada direta ou indiretamente através de um ligante. Num exemplo, a ligação pode ser por ligação química, tal como através de agentes heterobifuncionais ou ligações tiol ou outras ligações desse tipo. A fusão também pode ser efetuada por meios recombinantes. A fusão de uma terpeno sintase, tal como um polipéptido de valenceno sintase, com outro polipéptido pode ser para o terminal N ou C do polipéptido de valenceno sintase.

Uma proteína de fusão pode ser produzida por técnicas recombinantes padrão. Por exemplo, os fragmentos de ADN que codificam as diferentes sequências polipeptídicas podem ser ligados em conjunto na estrutura de acordo com as técnicas convencionais, por exemplo, empregando terminais de extremidade romba ou de extremidade assentada para ligação, digestão com enzimas de restrição para proporcionar terminais apropriados, com fins coesivos, conforme apropriado, tratamento com fosfatase alcalina para evitar junções indesejáveis e ligação enzimática. Noutra concretização, o gene de fusão pode ser sintetizado por técnicas convencionais, incluindo sintetizadores automáticos de ADN. Alternativamente, a amplificação por PCR de fragmentos de genes pode ser realizada utilizando iniciadores âncoras que originam saliências complementares entre dois fragmentos de genes consecutivos que podem subsequentemente ser recobertos e reamplifiçados para gerar uma sequência de genes quiméricos (ver, por exemplo, Ausubel et al. (eds.) Current Protocols in Molecular Biology, John Wiley & Sons, 1992). Além disso, muitos vetores de expressão que já codificam uma fração de fusão estão comercialmente disponíveis (por exemplo, um polipéptido GST). Por exemplo, um ácido nucleico que codifica o polipéptido de valenceno sintase pode ser clonado num tal vetor de expressão de tal modo que a porção de fusão esteja ligada na estrutura à proteína da valenceno sintase. A valenceno sintase e a unidade de fusão podem ser ligadas diretamente, sem um ligante, ou, alternativamente, ligadas indiretamente em conjunto com um ligante.

E. MÉTODOS PARA PRODUZIR TERPENOS E MÉTODOS PARA DETECTAR TAIS PRODUTOS E ATIVIDADE DOS POLIPEPTIDOS DE VALENCENO SINTASE

As valenceno sintases aqui proporcionados podem ser utilizadas para, e avaliadas pela sua capacidade para produzir terpenos, tais como monoterpenos, sesquiterpenos e diterpenos, a partir de qualquer precursor de pirofosfato de terpeno aciclico adequado, incluindo, mas não se limitando a, difosfato de geranilo (GPP), difosfato de farnesilo (FPP) ou difosfato de geranilgeranilo (GGPP). Normalmente, os polipéptidos de valenceno sintase aqui proporcionados catalisam a formação do valenceno de sesquiterpeno a partir de FPP. Os polipéptidos de valenceno sintase aqui proporcionados também catalisam a formação de um composto adicional, aristoloceno, (designado pico 2, ver Figura 3A) a partir de FPP.

Qualquer método conhecido por um especialista na técnica pode ser usado para produzir terpenos, incluindo valenceno, com as valenceno sintase aqui providenciadas. A capacidade das valenceno sintases aqui proporcionadas para catalisar a formação de valenceno ou outros terpenos de FPP pode ser avaliada utilizando estes métodos. Nalguns exemplos, a quantidade de terpeno, como o valenceno, produzido a partir de FPP utilizando as valenceno sintases aqui proporcionadas, é comparada com a quantidade de terpeno, como o valenceno, produzido a partir do mesmo substrato utilizando uma valenceno sintase diferente, tal como uma valenceno sintase de uma espécie diferente, por exemplo, uma valenceno sintase cítrica ou qualquer outra valenceno sintase conhecida por um especialista na técnica.

Outras atividades e propriedades das valenceno sintase, tais como os polipéptidos de valenceno sintase aqui proporcionados, também podem ser avaliadas utilizando métodos e ensaios bem conhecidos na técnica. Além de avaliar a atividade das valenceno sintase e a sua capacidade de catalisar a formação de terpenos, a cinética da reação, regioquimica ou estereoquimica modificada, utilização do substrato alterada e / ou a distribuição de produtos alterada (isto é, a quantidade alterada dos diferentes terpenos produzidos a partir de FPP ou outro substrato) em comparação com as valenceno sintase pode ser avaliada utilizando métodos bem conhecidos na técnica. Por exemplo, o tipo e a quantidade de vários terpenos produzidos a partir de FPP, GPP ou GGPP pelos polipéptidos de valenceno sintase aqui proporcionados podem ser avaliados por métodos de cromatografia gasosa (por exemplo, GC-MS), tais como os descritos abaixo e no Exemplo 4. Em alguns exemplos, o perfil de terpenos produzidos pelos polipéptidos de valenceno sintase de FPP inclui, mas não está limitado a, valenceno, β-elemeno e aristoloceno (pico 2). Também produzidos pelas células hospedeiras são os álcoois terpenos aciclicos nerolidol e farnesol. São fornecidos a seguir métodos para a produção de terpenos, incluindo valenceno e nootkatona, a partir de FPP utilizando as valenceno sintases aqui proporcionadas. 1. Produção de terpenos catalisada por valenceno sintase de Eryngium glaciale

Os polipéptidos de valenceno sintase modificados podem ser utilizados para catalisar a formação de valenceno e outros terpenos a partir de um precursor de terpeno de pirofosfato aciclico, tal como FPP. Em alguns exemplos, as valenceno sintase aqui proporcionadas são expressas em células que produzem ou sobreproduzem FPP, de modo que o valenceno é produzido pela via descrita acima. Noutros exemplos, as valenceno sintases aqui proporcionadas são expressas e purificadas a partir de qualquer célula hospedeira adequada, tal como descrito na Secção C. As sintases purificadas são então combinadas in vitro com FPP para produzir valenceno.

Nalguns exemplos, a valenceno sintase aqui fornecida é sobre-expressa e purificada como descrito na Seção C acima. A valenceno sintase é então incubada com o substrato de difosfato de farnesilo e o valenceno é produzido. 0 pH da solução que contém FPP e valenceno sintase pode afetar a quantidade de valenceno produzido (ver por exemplo Patente dos EUA Pub. No. 2010-0216186) . Um solvente orgânico é adicionado para dividir o valenceno na fase orgânica para análise. A produção de valenceno e a quantificação da quantidade de produto são então determinadas utilizando qualquer método aqui proporcionado, tal como cromatografia gasosa (por exemplo, GC-MS) utilizando um padrão interno. Alternativamente, a valenceno sintase é expressa em células hospedeiras que também produzem FPP, resultando na produção de valenceno. O valenceno pode então ser extraído do meio de cultura de células com um solvente orgânico e subsequentemente isolado e purificado por qualquer método conhecido, tal como cromatografia em coluna ou HPLC, e a quantidade e a pureza do valenceno recuperado são avaliadas. Nalguns exemplos, o valenceno é convertido por oxidação em nootkatona antes ou depois da purificação. a. Exemplos de células O valenceno pode ser produzido por expressão de um polipéptido de valenceno sintase aqui proporcionada numa linha de células que produz FPP, como parte da via de biossíntese de isoprenóides dependente de mevalonato (por ex. Fungos, incluindo células de leveduras e células animais) ou a via de biossintese de isoprenóides independente de mevalonato (por ex. as bactérias e plantas superiores).Em exemplos particulares, o valenceno é produzido pela expressão de um polipéptido de valenceno sintase proporcionado aqui numa linha celular que foi modificada para sobreproduzir FPP. Exemplos de tais células são células de levedura modificadas. Por exemplo, células de levedura que foram modificadas para produzir menos esqualeno sintase ou esqualeno sintase menos ativa (por exemplo, mutantes erg9, ver, por exemplo, as Patentes dos EUA Nos. 6531303 e 6689593 e a Patente dos EUA Pub. Nos. 2010-0151519 e 2010-0151555) são úteis nos métodos aqui fornecidos para produzir valenceno. A atividade de esqualeno sintase reduzida resulta na acumulação de FPP na célula hospedeira em níveis mais elevados em comparação com células de levedura de tipo selvagem, o que, por sua vez, pode resultar em rendimentos aumentados de produção de valenceno. Exemplos de células de levedura modificadas incluem, mas não estão limitadas a, Estirpes de Saccharomyces cerevisiae modificadas CALI5-1 (ura3, leu2, his3, trpl, Aerg9 :: HIS3, HMG2cat /TRP1 :: rADN, dppl), ALX7-95 (ursa3, his3, trpl, Aerg9 :: HIS3, HMG2cat / TRP1: : rADN, dppl, sue), ALX11-30 (ura3, trpl, erg9def25, HMG2cat /TRP1 :: rADN, dppl, sue) e aqueles descritos nas Patentes dos Estados Unidos Nos. 6531303 e 6689593 e no Pedido de Patente dos EUA publicado Nos. 2004-0249219, 2010-0151519 e 2010-0151555. A estirpe CALI5-1 de Saccharomyces cerevisiae é um derivado de SW23B # 74 (descrito nas Patentes dos Estados Unidos Nos. 6.531.303 e 6.689.593, e Takahashi et al. (2007) (Biotechnol Bioeng. 97 (1): 170-181), que foi derivado da estirpe de tipo selvagem ATCC 28383 (MATa). O CALI5-1 foi gerado para ter uma diminuição da atividade da fosfatase DPP1 (ver por exemplo Pedido dos EUA Publicado No. 2004-0249219) . A estirpe de Saccharomyces cerevisiae CALI5-1 contém, entre outras mutações, uma mutação erg9 (o alelo Aerg9: HIS3), bem como uma mutação que suporta o aumento da captação de esterol aeróbico (sue). Também contém aproximadamente 8 cópias do gene HMG2 truncado. A forma truncada de HMG2 é conduzida pelo promotor GPD e, portanto, não está mais sob uma regulação apertada, permitindo um aumento no fluxo de carbono para FPP. Também contém uma deleção no gene que codifica a enzima fosfatase de diacilglicerol pirofosfato (DGPP) (dppl), que limita a desfosforilação do FPP. ALX7-95 e ALX11-30.1 são derivados de CALI5-1. ALX7-95 foi derivado do CALI5-1 corrigindo a deficiência de Aleu2 do CALI5-1 com um gene LEU2 funcional de modo que não é necessário que a leucina seja suplementada para os meios (por exemplo, ver US2010 / 0151519).ALX11-30 foi construído a partir de CAL5-1 em várias etapas, descritas no Exemplo 4, abaixo. b. Cultura de células

Em métodos exemplificativos, uma valenceno sintase fornecida aqui é expressa numa linha celular hospedeira que foi modificada para produzir mais difosfato de farnesilo, pelo que, após a expressão da valenceno sintase, o difosfato de farnesilo é convertido em valenceno. A célula hospedeira é cultivada utilizando qualquer método adequado bem conhecido na técnica. Em alguns exemplos, como para o rastreio de alto rendimento de células que expressam várias valenceno sintase, as células que expressam a valenceno sintase são cultivadas em poços individuais de uma placa de 96 poços (ver, por exemplo, o Exemplo 4, abaixo). Noutros exemplos em que a célula hospedeira é levedura, a célula que expressa os polipéptidos de valenceno sintase e FPP é cultivada usando métodos de fermentação tais como os descritos nos Exemplos abaixo (ver, por exemplo, o Exemplo 5).

Uma variedade de metodologias de fermentação pode ser utilizada para a produção de valenceno a partir de células de levedura que expressam os polipéptidos de valenceno sintase aqui proporcionados. Por exemplo, a produção em larga escala pode ser efetuada por fermentação em lote ou continua. Uma fermentação em lote clássica é um sistema fechado onde a composição do meio é ajustada no inicio da fermentação e não está sujeita a alterações artificiais durante a fermentação. Assim, no inicio da fermentação, o meio é inoculado com o microrganismo ou microrganismos desejados e a fermentação é permitida sem adição de mais nutrientes. Normalmente, a concentração da fonte de carbono na fermentação em lotes é limitada, e fatores como o pH e a concentração de oxigénio são controlados. Nos sistemas de lote, as composições de metabolitos e biomassa do sistema mudam constantemente até ao momento em que a fermentação é interrompida. Dentro das culturas em lote, as células normalmente modulam através de uma fase de atraso estático para uma fase de alto crescimento logarítmico e, finalmente, para uma fase estacionária onde a taxa de crescimento é diminuída ou interrompida. Se não forem tratadas, as células na fase estacionária acabarão por morrer.

Uma variação no sistema de lote padrão é o sistema Fed-Batch, que é semelhante a um sistema de lote típico, com a exceção de que os nutrientes são adicionados à medida que a fermentação avança. Os sistemas Fed-Batch são úteis quando a repressão catabolica tende a inibir o metabolismo das células e onde é desejável ter quantidades limitantes de substrato no meio. Além disso, a capacidade de fornecer nutrientes geralmente resultará em maiores densidades celulares nos processos de fermentação Fed-Batch em comparação com os processos de fermentação em lotes. Fatores como o pH, o oxigénio dissolvido, as concentrações de nutrientes e a pressão parcial dos gases residuais, como o CO2 são geralmente medidos e controlados nas fermentações Fed-Batch. A produção de valenceno também pode ser realizada com fermentação continua. A fermentação continua é um sistema aberto onde um meio de fermentação definido é adicionado continuamente a um biorreator e uma quantidade igual de meio condicionado é removida simultaneamente para processamento. Este sistema geralmente mantém as culturas com uma densidade constantemente alta, onde as células estão primariamente na sua fase de crescimento logarítmico. A fermentação contínua permite a modulação de qualquer número de fatores que afetam o crescimento celular ou a concentração do produto final. Por exemplo, um método manterá um nutriente limitante como a fonte de carbono ou o nível de azoto a uma taxa fixa e permitirá que todos os outros parâmetros se moderem. Noutros sistemas, uma série de fatores que afetam o crescimento podem ser alterados continuamente, enquanto a concentração celular, medida pela turbidez do meio, é mantida constante. Os sistemas contínuos visam manter condições de crescimento estacionário e, portanto, a perda de células devido à remoção do meio deve ser equilibrada em relação à taxa de crescimento celular na fermentação. Os métodos de modulação de nutrientes e fatores de crescimento para processos de fermentação contínua, bem como técnicas para maximizar a taxa de formação do produto são bem conhecidos na técnica. Seguindo a cultura celular, o meio de cultura de células pode então ser recolhido para obter o valenceno produzido.

Num método exemplar, as células hospedeiras que expressam os polipéptidos de valenceno sintase (por exemplo as estirpes de Saccharomyces cerevisiae CALI5-1, ALX7-95 ou ALX11-30) são cultivadas num tanque de fermentação de 3L a 28°C, a pH 4,5 durante aproximadamente 132 horas, mantendo a glicose entre 0 e 1 g / L. Após a fermentação, adiciona-se sulfato de sódio a uma concentração final de 10-15%. O óleo de soja também é adicionado e agitado, e o óleo que contém o valenceno (e outros terpenos) é recuperado por centrifugação. c. Isolamento e avaliação de produtos O valenceno produzido utilizando os métodos acima com os polipéptidos de valenceno sintase aqui proporcionados pode ser isolado e avaliado por qualquer método conhecido na técnica. Num exemplo, o meio de cultura celular é extraído com um solvente orgânico para dividir o valenceno e qualquer outro terpeno produzido na camada orgânica. A produção de valenceno pode ser avaliada e / ou o valenceno isolado de outros produtos utilizando qualquer método conhecido na técnica, como, por exemplo, cromatografia gasosa. Por exemplo, a camada orgânica pode ser analisada por cromatografia gasosa utilizando cedreno e hexadecano como padrões internos. Este método é exemplificado nos Exemplos 3 e 4 abaixo. A quantidade de valenceno produzida pode ser determinada por qualquer técnica cromatográfica padrão conhecida útil para separar e analisar compostos orgânicos. Por exemplo, a produção de valenceno pode ser avaliada por qualquer técnica cromatográfica conhecida, útil para a deteção e quantificação de hidrocarbonetos, tais como valenceno e outros terpenos, incluindo, mas não se limitando a, cromatografia gasosa acoplada a espectrometria de massa (GC-MS), cromatografia gasosa utilizando um detetor de ionização de chama (GC-FID), capilaridade GC-MS, cromatografia liquida de alta performance (HPLC) e cromatografia em coluna. Normalmente, estas técnicas são realizadas na presença de padrões internos conhecidos, por exemplo, cedreno ou hexadecano, que são utilizados para quantificar a quantidade de terpeno produzido.

Por exemplo, os terpenos, incluindo os sesquiterpenos, tal como o valenceno, podem ser identificados por comparação dos tempos de retenção e dos espectros de massa com os padrões autênticos em cromatografia gasosa com deteção de espectrometria de massa. Padrões típicos incluem, mas não estão limitados a, cedreno e hexadecano. Noutros exemplos, a quantificação pode ser conseguida através de cromatografia gasosa com deteção de ionização de chama com base em curvas de calibração com quantidades conhecidas de padrões autênticos e normalização para a área de pico de um padrão interno. Estas técnicas cromatográficas permitem a identificação de qualquer terpeno presente na camada orgânica, incluindo, por exemplo, outros terpenos produzidos pela valenceno sintase modificada, incluindo, por exemplo, β-elemeno e aristoloceno (pico 2) e outros compostos produzidos pelas células, incluindo nerolidol e farnesol (ver, por exemplo, o Exemplo 4).

Em alguns exemplos, a cinética de produção de valenceno pode ser determinada por ensaios de sintase em que substratos isoprenóides radioativos, tais como 3H FPP 14C FPP, são utilizados com diferentes concentrações de sintase. Os produtos são extraídos para uma camada orgânica e a radioatividade é medida usando um contador de cintilação liquida. As constantes cinéticas são determinadas a partir dos ajustes diretos da equação de Michaelis-Menton aos dados. 2. Produção de Nootkatona A nootkatona, que é o aroma dominante da toranja, é um produto oxidado do valenceno. As valenceno sintase aqui proporcionadas catalisam a produção de valenceno, que então pode ser oxidado para a nootkatona. 0 valenceno pode sofrer hidroxilação regioselectiva para formar 2-hidroxi valenceno, que é ainda oxidado para formar nootkatona. A oxidação do valenceno pode ser realizada através de meios químicos ou biossintéticos (ver por exemplo a Patente dos EUA N 0 5 847 226, Eur. Pat. No. EP1083233; Girhard et ai., (2009) Microb. Cell. Fact. 8:36; Fraatz et ai., (2009) Appl Microbiol Biotechnol. 83(1):35-41; Furusawa et ai. (2005) Chem Pharm. Buli. 53:1513-1514; Salvador et ai., (2002) Green Chemistry, 4, 352-356) . A oxidação bioquímica pode ser realizada por uma lacase, hidroxilase ou outra enzima oxidativa. Em alguns exemplos, o valenceno é convertido em nootkatona utilizando trióxido de crómio ou um catalisador de crómio (III) imobilizado com fosfato de sílica (como descrito, por exemplo, em Patente dos EUA Pub. No. 2012-0246767). A formação de nootkatone pode ser confirmada e / ou quantificada por qualquer das técnicas cromatográficas aqui descritas.

F. EXEMPLOS

Os exemplos seguintes são incluídos apenas para fins ilustrativos e não se destinam a limitar o âmbito da invenção. Os exemplos que se encontram fora do âmbito das reivindicações são fornecidos apenas para fins informativos.

Exemplo 1

Extração e identificação de Valenceno de Eryngium glaciale

Para confirmar que Eryngium glaciale produz valenceno, os extratos de folhas de Eryngium glaciale foram testados quanto à presença de valenceno. Folhas e galhos de Eryngium glaciale foram comprados na estufa alpina Wrightman (Ontário, Canadá). Várias folhas foram dissecadas e submersas em acetato de etilo por vários dias. 0 óleo vegetal em acetato de etilo foi posteriormente analisado por cromatografia gasosa - espectrometria de massa (GC-MS). A análise GC-MS foi realizada com o PerkinElmer AutoSystem XL equipado com o espectrômetro de massa TurboMass ™. A cromatografia de gás do extrato de óleo da planta é mostrado na Figura 2A. 0

Valenceno foi detetado em torno de 10,18 minutos (Pico 1) e foi o pico principal. O espectro de massa do pico a 10,18 minutos (valenceno) é mostrado na Figura 2B.

Exemplo 2

Identificação da valenceno sintase que codificada pelo ácido nucleico de Eryngium glaciale A valenceno sintase de Eryngium glaciale foi identificada por sequenciação do transcriptoma total de Eryngium glaciale utilizando a pirosequenção de alto rendimento de 454 (Roche Diagnostics, Branford, CT) e a procura de homologia com terpeno sintase conhecidas.

Purificação de ARN 0 ARN foi isolado a partir de um grama de material vegetal, congelado em nitrogénio liquido e subsequentemente moido em pó usando almofariz e pilão. A amostra em pó foi descongelada em 10 mL de reagente TRIzol® (Invitrogen Corp., Carlsbad, CA) para extrair ARN do tecido, seguindo as instruções do fabricante com pequenas modificações. A amostra em pó e a mistura TRIzol® foi centrifugada a 13 000 rpm durante 10 minutos a 4°C para remover os restos celulares. O sobrenadante foi transferido para novos tubos, adicionou-se clorofórmio: álcool isoamilico (24:1) e a amostra foi submetida a vórtex. Após outra centrifugação, foram adicionados dois volumes de isopropanol e a mistura foi incubada durante 10 minutos à temperatura ambiente. O ARN foi precipitado por centrifugação a 13 000 rpm durante 10 minutos a 4°C. O ARN precipitado foi lavado uma vez com 75% de etanol e ressuspenso em 20 pL de água sem ARNase. O ARN foi tratado adicionalmente com ADNse I (New England Biolabs, Ipswich, MA) para remover o ADN e posteriormente foi purificado e concentrado usando o kit de limpeza de ARN Qiagen MinElute (Qiagen, Hilden, Alemanha).

Sequenciamento do transcriptoma total O transcriptoma total de Eryngium glaciale foi sequenciado usando pirosequenciamento 454. O RNA total extraído foi submetido ao Centro de Tecnologia Genética Avançada (AGTC) na Universidade de Kentucky (Reino Unido) para análise de sequenciação de transcriptoma. O conjunto de um total de 5512221 leituras geraram 15717 contigs, com um tamanho médio de 847 pares de bases. O banco de dados resultante foi pesquisado por BLAST contra as sequências de várias terpeno sintases conhecidas. Essas sintases incluíram: valenceno sintase da Perilla frutescens var. frutescens (SEQ ID NO: 39; No. de Acesso GenBank AY917195.1); valenceno sintase de Citrus sinensis (SEQ ID NO: 40; GenBank Accession No. AF441124.1); vetispiradieno (ou premnaspirodieno) sintase de Hyoscyamus muticus (SEQ ID NO: 41; GenBank Accession No. U20188.1); germacrene D sintase de Citrus hystrix (ácido nucleico estabelecido na SEQ ID NO: 42; GenBank Accession No. HQ652871.1; proteína apresentada na SEQ ID NO: 45); e valenceno sintase de Chamaecyparis nootkatensis (SEQ ID NO: 44). A homologia entre estas variou de cerca de 35 a 50% de identidade ao nível de nucleotideos. 0 banco de dados BLAST gerado foi pesquisado usando as cinco sequências. Foram identificadas cinco sequências parciais diferentes que codificam as terpeno sintases candidatas a partir do banco de dados gerado para buscas BLAST. Após a amplificação (descrito no Exemplo 3 para o gene que codifica a sintase ativa), foram produzidas moléculas de ADN que codificam cada um dos cinco genes possíveis. Um gene, descrito no Exemplo 3, codificou uma sintase ativa que catalisa a produção de valenceno.

Exemplo 3

Isolamento de um gene codificador de Valenceno Sintase de Eryngium glaciale

Com base na sequência contig selecionada (SEQ ID NO: 4), os iniciadores para a amplificação dos fragmentos RACE 3 'e 5' foram concebidos de tal modo que havia uma sobreposição de cerca de 150 pb entre os fragmentos RACE de 5 ' e 3' . A síntese de ADN complementar (cADN) e a PCR foram realizadas conforme descrito nos protocolos do kit (kit de amplificação de cADN SMARTer ™ RACE (Clontech, Mountain View, CA, EUA)) com algumas modificações nas condições de PCR. Os fragmentos de PCR RACE 5 ' e 3' foram clonados no vetor TOPO-TA (Invitrogen, San Diego) e cada produto de amplificação foi sequenciado.

As seguintes condições de PCR foram utilizadas para amplificar os fragmentos RACE 3' e 5' a 94°C desnaturação inicial durante 2 minutos, 10 ciclos de 94°C durante 30 segundos, emparelhamento a 61°C durante 45 segundos, extensão por 1 minuto 20 segundos a 72°C , seguido de 25 ciclos a 94°C durante 30 segundos, 55 °C recobertura por 40 segundos, extensão a 72°C por 1 minuto e 20 segundos. Os iniciadores utilizados para amplificar o gene que codifica a valenceno sintase ativa são apresentados na Tabela 3 abaixo e incluíram o iniciador direto 63-l-2-Fwd2 (SEQ ID NO: 5) e o iniciador inverso 63-l-2-Rev2 (SEQ ID No: 6). O iniciador aninhado direto 63-l-2-NestFwd2 (SEQ ID NO: 7) e o iniciador aninhado inverso 63-l-2-NestRev2 (SEQ ID NO: 8) foram utilizados para aumentar a especificidade dos produtos de amplificação na PCR.

A sequência de nucleótidos de comprimento completo do gene, designado EGVS e posteriormente confirmado para codificar uma valenceno sintase (ver Exemplo 3 abaixo), é apresentada na SEQ ID NO: 2 e a sequência de aminoácidos codificada está apresentada na SEQ ID NO: 1.

Exemplo 4

Clonagem de EGVS no vetor de expressão pAlx31-108.2 0 gene EGVS de comprimento total isolado foi clonado no vetor de expressão pAlx31-108.2 (SEQ ID NO: 32). 0 gene EGVS foi amplificado usando dois conjuntos de iniciadores (ver Tabela 4 abaixo) para remover o local de restrição Kpnl na posição 964 da sequência de codificação incluindo o iniciador direto 63-52-EG2FwdPart1 (SEQ ID NO: 9) e o iniciador reverso 63-52 -EG2RevPartl (SEQ ID NO: 10); e o iniciador direto 63-52-EG2FwdPart2 (SEQ ID NO: 11) e o iniciador inverso 63-52-EG2RevPart2 (SEQ ID NO: 12) .

Um site de restrição Kpnl começando na posição 964 da sequência de codificação foi removido, pois os sites Kpnl e Xbal são frequentemente usados para clonar genes no vetor de expressão pAlx31-108.2. O site Kpnl foi alterado sem afetar a sequência de aminoácidos de EGVS, substituindo o C na posição 969 do gene EGVS de tipo selvagem com um A, alterando assim o codão ACC (codificação para treonina) para um ACA (codificação para treonina) (sequência de nucleótidos apresentada na SEQ ID NO: 3) . O vetor de expressão EGVS final, designado pAlx63-71 (SEQ ID NO: 33), foi construído usando a Master Mix de Gibson Assembly ™ (New England Biolabs) com produtos de PCR amplificados utilizando os iniciadores 63-52-EG2FwdPart1, 63-52-EG2RevPartl, 63 -52- EG2FwdPart2 e 63-52-EG2RevPart2 (ver Tabela 4 acima).

Exemplo 5

Expressão de EGVS em leveduras e rastreio de alto rendimento de células que expressam Valenceno 0 vetor de expressão pAlx63-71 que codifica o EGVS foi transformado em estirpes de Saccharomyces cerevisiae ALX7-95 modificadas (URA3, HIS3, TRPl, Aerg9 :: HIS3, HMG2cat / TRP1 :: ADNr, dppl, sue) e ALX11-30 (ura3, trpl, erg9def25, HMG2cat / TRP1 :: rADN, dppl, sue) para expressão de valenceno sintase e produção de valenceno utilizando um ensaio de rastreio de alto rendimento. A. Geração de estirpes modificadas de Saccharomyces cerevisiae ALX7-95 e ALX7-95

Como mencionado acima, ALX7-95 e ALX11-30 foram derivados a partir de Saccharomyces cerevisiae estirpe CALI5-1, que é uma estirpe conhecida e divulgada, (ver, por exemplo, Pedido de Patente dos EUA publicado No. 2012-0246767) . A estirpe CALI5-1 é um derivado da estirpe designada SW23B # 74 (descrita, por exemplo, nas Patentes dos EUA Nos. 6.531.303 e 6.689.593; Veja, também Takahashi et ai. (2007) Biotechnol Bioeng. 97 (1): 170-181), que é derivado da estirpe de tipo selvagem MATa, depositada sob o número de acesso ATCC 28383.0 CALI5-1 gerou uma diminuição da atividade da fosfatase DPP1 (ver, por exemplo, Patente dos EUA Pub. No. 2004-0249219). A estirpe CALI5-1 de Saccharomyces cerevisiae contém, entre outras mutações, uma mutação erg9 (o alelo Aerg9 :: HIS3), bem como uma mutação que suporta o aumento da captação de esterol aeróbico (sue). Também contém aproximadamente 8 cópias do gene HMG2 truncado. A forma truncada de HMG2 é conduzida pelo promotor GPD e, portanto, não está mais sob uma regulação apertada, permitindo um aumento no fluxo de carbono para FPP. Também contém uma deleção no gene que codifica a enzima fosfatase de diacilglicerol pirofosfato (DGPP) (dppl), que limita a desfosforilação do FPP. ALX7-95 foi gerado a partir de CALI5-1 por correção da deficiência de Aleu2 da CALI5-1 com um gene LEU2 funcional de modo que a suplementação de leucina não seja necessária (ver por exemplo, US2010 / 0151519). ALX11-30 foi construído a partir de CALI5-1 em várias etapas a partir de uma estirpe denominada ALX7-175.1 como descrito na Patente dos EUA. Pub. No. 2010-0151519.

Resumidamente, ALX7-175.1 foi produzido da seguinte forma. ALX7-95 HPS foi obtido por transformação de um plasmideo contendo o premnaspirodieno sintase de Hyoscyamus muticus (HPS) na estirpe ALX7-95.0 plasmideo YEp-HPS foi obtido por clonagem do gene para HPS em Yep-GW-URA para dar YEp-HPS-ura (YEp-HPS). Em seguida, realizou-se uma reação de PCR propensa a erro do gene ERG9 e o ADN resultante foi transformado em ALX7-95 que abrigava YEpHPS. Os transformantes foram semeados em meio YP sem ergosterol e testados para a produção de premnaspirodieno. Aqueles que produziram altos níveis de premnaspirodieno foram aproveitados. Uma estirpe, ALX7-168.25 [ura3, trpl, his3, erg9def25, HMG2cat/TRPl :: rADN, dppl, sue, YEpHPS] foi transformada com um fragmento de PCR do gene HIS3 completo para criar um gene HIS3 funcional. Os transformantes que foram isolados foram capazes de crescer na ausência de histidina no meio. A partir desta transformação, ALX7-175.1 foi isolado [ura3, trpl, erg9def25, HMG2cat/TRPl :: rADN, dppl, sue YEpHPS]. Finalmente, o plasmideo YEpHPS foi removido por crescimento de várias gerações de ALX7-175.1 em YPD (extrato de levedura 10 g / L, peptona 20 g / L, glicose 20 g / L ) e as células foram cultivadas em placas de YPD. Foram identificadas colónias que não conseguiram crescer em meio SD sem uracilo (0,67% de base de azoto de levedura Bacto sem aminoácidos, 2% de glicose, 0,14% de meio de retirada sintético de levedura sem uracilo). Esta estirpe foi designada ALX11-30. B. Triagem de alto rendimento para a produção de valenceno

Foram analisadas oito colónias de cada transformação do vetor pALx63-71 em ALX7-95 e ALX11-30 para produção de sesquiterpeno em placas de microtitulação de poço profundo. Os transformantes foram rastreados para a produção de valenceno por análise de microcultura usando 96 placas de poço profundo. Os transformantes individuais foram inoculados em poços individuais em placas de microtitulação de 96 poços preenchidas com 200 pL de meio sintético definido (SD: 0,67% de base de azoto de levedura Bacto sem aminoácidos, 2% de glicose e 0,14% de suplemento de meio de retirada sintético de levedura sem histidina, leucina, triptofano ou uracilo) para as estirpes ALX11-30 e meio sintético definido com ergosterol (SDE: 0,67% base de azoto de levedura de Bacto sem aminoácidos, 2% de glicose, 0,14% de meio sintético de retirada de levedura suplementado sem histidina, leucina, triptofano ou uracilo e 40 mg / L de ergosterol) para as estirpes ALX7-95 deficientes em erg9. As placas foram incubadas durante dois a três dias a 28°C. Após o crescimento até a saturação, utilizaram-se 10 pL da cultura saturada de cada poço para inocular uma placa de 96 poços profundos contendo 300 pL de meio adequado para crescimento e produção de valenceno. A placa foi selada com fita Airpore (Qiagen) e incubada com agitação durante 3 dias.

Os produtos biossintéticos foram extraídos primeiro por adição de 250 pL de acetona contendo cedreno em cada poço, selando com selante de placa de borracha, vortexando, seguido de adição de 500 pL de hexadecano contendo n-hexano e vortexando adicionalmente. Após a separação de fases, a placa foi selada com película de alumínio e colocada na bandeja de amostra de um amostrador automático de cromatografia gasosa, que removeu um microlitro da fase orgânica de cada poço para análise de sesquiterpenos. A acetona e o hexano utilizados para a extração foram codificados com padrões internos de cedreno e hexadecano, respetivamente, para auxiliar na quantificação das amostras. As amostras extraídas foram analisadas por cromatografia gasosa e a quantidade de valenceno foi calculada a partir da área sob o pico representando valenceno. C. Resultados A Tabela 5 abaixo fornece os perfis de distribuição do produto e a quantidade de valenceno produzido pela valenceno sintase de Eryngium glaciale conforme determinado por cromatografia gasosa, para os três produtores de valenceno mais altos da ALX7-95 e os quatro produtores de valenceno mais altos da ALX11-30 e suas designações de nome de estirpe. Conforme indicado na Tabela 5, foram observados vários compostos adicionais para além do valenceno, incluindo nerolidol, farnesol e o composto, aristoloceno, no pico 2, que é aristoloceno. O resultado demonstra que esta valenceno sintase catalisa a produção de perfil de produto diferente da valenceno sintase cítrica. Cedrene e hexadecano representam os padrões internos utilizados para quantificar a quantidade de valenceno produzido. Todas as sete destas estirpes foram analisadas adicionalmente no ensaio do balão de agitação descrito no Exemplo 4.

Tabela 5. Distribuição de produtos para ensaio de microeultura

Exemplo 6

Ensaio de balão de agitação de células que expressam valenceno

As culturas de sementes foram iniciadas em frascos de 250 mL inoculando 15 mL de meio SD ou SDE (para estirpes ALX11-30 e ALX7-95, respetivamente) com colónias recentemente cultivadas das 7 estirpes apresentadas na Tabela 5 acima. As culturas cresceram durante 24 horas, e foram utilizados 2,5 mL de cada cultura para inocular 50 ml de meio de fermentação (sulfato de amónio 2%, fosfato de potássio a 2%, NaCl a 0,1%, MgSCh · 7H20 a 0,6% , 0,4% de extrato de levedura, 1 mL de solução mineral [FeSCh* 7H2O 0, 028%, ZnSCh · 7H2O 0, 029%, CuS04 · 5H20 0, 008%, Na2Mo04 · 2H20 0, 024%, C0CI2 · 6H20 0, 024%, MnSCh · H2O 0,017%, HC1 1 mL], 0,5 mL de glucose a 50%, l,5mL solução de vitaminas [biotina 0,001%, pantotenato de cálcio 0,012%, inositol 0,06%, piridoxina-HCl a 0,012%, tiamina-HCI a 0,012%], e 0,5 mL de CaCÍ2 a 10%) num balão de 250 ml com deflectores. As culturas foram cultivadas a 28°C. Após 16 horas de incubação, as culturas foram alimentadas com 3,6 mL de glicose a 50% e 0,667 mL de extrato de levedura a 12,5%. As culturas foram alimentadas a cada 24 após a alimentação inicial. O pH das culturas foi ajustado para 4,5 a cada 24 horas com a adição de NaOH a 30%. Após aproximadamente 88 horas de incubação, foram adicionados 0,1 mL de IGEPAL CA-630 e a cultura foi incubada com agitação para dispersar completamente o óleo vegetal. Após 30 minutos, foi retirada uma amostra de cultura de 2 mL para análise. A amostra foi extraída com 2 mL de solução de acetona / cedreno e depois extraída com 4 mL de solução de hexano / hexadecano. Uma alíquota da fase orgânica foi analisada por cromatografia gasosa e a quantidade de valenceno produzida foi quantificada calculando a área sob o pico representando valenceno. Os perfis de distribuição de produtos e a produção de valenceno para cada uma das 2 estirpes contendo EGVS foram comparados com um controle de valenceno sintase cítrica (CVS) e valenceno sintase V277 (descrito na Publicação pendente dos EUA No de série 2012-0246767 possuindo uma sequência de nucleótidos apresentada na SEQ ID NO: 30 e uma sequência de sequências de aminoácidos apresentada na SEQ ID NO: 31. V277 tem cerca de 83% de identidade de sequência com CVS de tipo selvagem. As células que expressam V277 produzem mais valenceno do que células que expressam CVS de tipo selvagem (sequência de aminoácidos apresentada na SEQ ID NO: 14). A Tabela 6a abaixo fornece perfis de distribuição de produtos incluindo a quantidade de valenceno produzido a partir do ensaio do balão de agitação, conforme determinado por cromatograf ia gasosa, de CVS 277 em comparação com duas estirpes que produzem EGVS na estirpe ALX11-30 (como descrito no Exemplo 3) . Conforme apresentado na Tabela 6, as valenceno sintases das estirpes de ryngium glaciale produziram mais valenceno por mL em comparação com o mutante CVS V277, que por sua vez produz mais valenceno do que o tipo selvagem CVS .

Cedreno e hexadecano representam os padrões internos utilizados para quantificar a quantidade de valenceno produzido. A Figura 3A mostra um exemplo de cromatograma de gás de um exemplar ALX7-95 da estirpe Alx-64.70.3, com valenceno com um tempo de retenção de 12,46 min e a Figura 3B mostra o espectro de massa do valenceno (pico a 12,46 min). A Figura 7 apresenta os resultados graficamente.

A Figura 7 ilustra os dados na Tabela 6b e mostra uma comparação entre a produção de valenceno em células que expressam a valenceno sintase cítrica e as células que expressam a sintase de Eryngium glaciale. As células que expressam EG sintase produzem mais de duas vezes a quantidade de valenceno em comparação com a CVS sintase.

Exemplo 7

Isolamento de Valenceno

Os caldos de duas fermentações de ALX63-70.7 (2 L cada) foram filtrados a vácuo através de um funil de filtro grosso. 0 bolo de filtração (óleo de soja, células e detritos celulares) foi transferido para um balão de 4 L e adicionou-se acetona (2 L cada) ao bolo de filtração e ao filtrado (óleo de soja e células), respetivamente, e as soluções foram agitadas durante 1 hr. As misturas heterogéneas resultantes foram filtradas e o solvente foi removido sob pressão reduzida. 0 extrato orgânico em bruto foi então submetido a cromatografia em silica gel utilizando hexanos como único solvente. Após a remoção do solvente sob pressão reduzida, o material oleoso amarelo claro foi dissolvido em acetona e os fosfolipidos foram precipitados a -20°C. Os fosfolipidos foram filtrados e a acetona no filtrado foi removida sob pressão reduzida para se obter um óleo transparente (25 g). 0 óleo transparente foi depois purificado por destilação de película descendente (0,1 torr, 125°C) para proporcionar uma fração de valenceno enriquecida (3,13 g) . O valenceno foi então purificado a partir da fração enriquecida por HPLC de fase reversa (C18) utilizando acetonitrilo isocrático como solvente e um detetor de índice de refração. A ressonância magnética nuclear (RMN) com protão (3H) e Carbono-13 (13C) da amostra purificada mostrou que a amostra purificada tinha desvios químicos idênticos como um padrão autêntico de valenceno (ver dados de RMN a seguir) . Além disso, experiências de 1D-NOESY onde o grupo metilo quaternário (Cll) foi irradiado mostraram correlações com o metino em C9 e o grupo metilo C12, sugerindo que os grupos metilo Cll e C12 e o metino C9 estão todos na mesma face da molécula. A estrutura do valenceno com numeração de carbono atribuída é apresentada abaixo:

Finalmente, a cromatografia gasosa (GC-FID), a cromatografia de gás quiral e a cromatografia gasosa-espectrometria de massa da amostra purificada mostraram que o pico de valenceno putativo tinha tempos de retenção e espectros de massa idênticos como um padrão autêntico de valenceno. Estes dados em conjunto demonstram que a estrutura do pico isolado é (+) -valenceno. !H RMN (BENZENO-de) δ: 5,36 (dt, J = 4,8, 2,6 Hz, 1H), 4,83 (s, 1H), 4,80 (s, 1H), 2,23-2,21 (m, 1H), 2,21 (s, 1H), 2,06 (ddd, J = 13,9, 4,1, 2,6 Hz, 2H), 1,90-1,96 (m, 2H), 1,69 (d, J = 0,9 Hz, 1H), 1,66 (s, 3H), 1,31-1,46 (m, 2H), 1,26 (d, J = 4,4 Hz, 2H), 1,05 (t, J = 12,7 Hz, 1H) , 0,91 (s, 3H), 0,83 (d, J = 6,6 Hz, 3H) ; 13C RMN (BENZENO-de) δ: 150,8, 143,3, 120,9, 109,3, 45,7, 41,6, 41,7, 38,5, 33,8, 33,5, 27,9, 26,7, 21,3, 18,9, 16,2.GC-MS (EI+, 70eV); (%): 55 (44), 67 (38), 79 (82), 91 (80), 93 (77), 105 (75), 107 (73), 119 (66), 133 (56), 147 (33), 161 (100), 175 (17), 189 (34), 204 (29) .

Exemplo 8

Comparação de parâmetros cinéticos de valenceno sintase de E. glaciale (EgVS) e valenceno sintase V277

Neste exemplo, a atividade da valenceno sintase de E. glaciale (EgVS; SEQ ID NO: 1) e da valenceno sintase cítrica designada V277 (SEQ ID NO: 31) foram avaliadas por análise cinética no estado estacionário. Para comparar as atividades dessas enzimas in vitro, as valenceno sintases foram marcadas com histidina no terminal C, expressas em E. coli, purificadas por cromatografia de quelato de níquel e avaliadas por atividade por análise cinética no estado estacionário. As condições de reação foram as seguintes: 50nM EgVS ou 250 nM valenceno sintase V277, 50 mM de Bis-tris propano (pH 7,5), 20mM de MgCl2, 50mM de KC1 .T = 30C. Deteção: GC / MS-SIM.

Conforme apresentado na Figura 6 e na Tabela 7 abaixo, EgVS exibe uma atividade total e específica dramaticamente maior quando comparado lado a lado com a valenceno sintase cítrica designada V277. Além do aumento da atividade, o EgVS também virou significativamente mais vezes do que a valenceno sintase V277.

Tabela 7 - Paxanve tiros cioèticos dia. CVS e SgVS no estado eataeionário j

A sintase de EgVS aqui proporcionada, assim, não só produz um perfil de terpeno diferente, em comparação com outras sintases, como a CVS, mas também exibe maior atividade, mesmo quando comparada a uma sintase CVS que foi modificada e otimizada para exibir atividade aumentada.

Uma vez que as modificações serão evidentes para os peritos nesta arte, pretende-se que este invento seja limitado apenas pelo âmbito das reivindicações anexas.

LISTAGEM das SEQUÊNCIAS <110>Allylix, Inc.

Saran, Dayal

Park, Grace Eunyoung

<120> POLIPEPTIDOS DE VALENCENO SINTASE, CODIFICADOS POR MOLÉCULAS DE ÁCIDO NUCLEICO E SUAS UTILIZAÇÕES

<130> 33322-237PC <140> Ainda não Atribuído <141> incluso <150> 61/852,462 <151> 2013-03-14 <160> 45 <170> FastSEQ para Windows Versao 4.0

<210>1 <211> 565 <212> PRT <213> Eryngium glaciale <220> <223> proteína valenceno sintase <400>1

Mat Bor Lea Asn Val 1®« Ser Thr Ser Sly Ser Ala Pro Thr Thr Ays 1 5 IS

Sax' Sax Ola lie Thr Arg Arg Sat Ala Asa Tyr Mis Pro Sot Lou frp as as 30

Sly Asp Ays Phe Lea Glu Tyr Bor Bor Pro Aap Sis Asa Ays Asa Asp 35 40 45

Sat Phe Thr Sla Ays Ays His Sits Gin Ass Ays Glu sis Val Ays Ays so ss m

Met Ass Val Sis Thr Pal SX» Ays Pro Sis Sin G1» Las Ass Asm Tie 55 70 75 00 bon Sis 11a Sis Arg Lou Sly Asa. Ser Tyr Lou Phe Glu Pro Sla 11¾ S5 00 05

Sla Ala Ale Aon Sla Sla lla Pot Val Thr fyr Asp Sin Phe €ys Cys 100 103 110

Ser Thr Asp Ala Asp Asp Leu His As» Val Ala Aeu Her Phe Arg lie 115 iao ias

Aeu Arg Sla Bis Sly His As» Val Her Oar Asp Val Phe Sin Ays Phe 130 135 140

Mat Asp Bor Asa Sly Ays lea Ays Asp Tyr Aeu Val Asa Asp Ala Arg 143 130 155 150

Sly Asa Aeu Bor Asa Tyr Sla Ala Thr His Phe Arg Val His Asa Asp 1€5 170 175

Asp Ays Aeu Sla Sla Aeu Aeu Her Val Thr Thr Her Arg Asa Sla His 100 185 150

Aeu Ays Her His Val Ays Tyr Pro Aeu Glu Asp Sla He Her Arg Ala 105 200 205

Aeu Ays His Pro Aeu His Ays Sla Aeu Ann Arg Asa Sly Ala Arg Tyr 210 215 220

Tyr He Her He Tyr Sla Aye Phe Asp Her Hie Aen Ays Aeu Aea Aeu 225 230 235 ' 240

Sla Phe Ala Ays Asa Asp Phe Ann Arg Aea Sla Ays Met Tyr S1» Ms 245 250 255

Glu Leu Ala Bis leu Thr Arg Trp ftp Lye Asp 1«« ASp Phe Thr Asa 250 255 218

Lye leu Pro Phe Ala Arg Asp Arg Xle Vai Gin Gly Tyr Phe Trp Xle 225 280 2S5

Leu Gly Mat: Tyr Phe Glu Pro 31o Arg Lys Asp Vai Arg Glu Phe leu 230 235 300

Ase Arg Vai Fhe Ala leu lie Thr Vai Vai Asp Asp Thr Tyr Astp Vai 305 310 313 320

Tyr Gly Thr Pb» Ay a Glu Leu £»n $»ix Fhe Thr Asp Ala lie Glu Arg 323 330 333

Trp Gly Thr Ser Asp leu Asp Glu leu Pro Gly Tyr Met Arg lie lie 340 345 350

Tyr Gin Ala leu Met Asp Vai Tyr Asn Gin Met Gin Glu lys leu Ser 355 360 355

Met Lys Ala Asp Cys Fro Thr Tyr Arg leu Glu Fhe Ala lie Glu Thr 370 375 300

Vai Lys Ala Met Fhe Arg Ser Tyr leu Glu Glu Ala Arg Trp Ser Lys 3SS 330 335 400

Glu Hi« Tyr lie Pro Ser Met Gin Glu Tyr Met Thr vai Ala leu Vai 405 410 415

Ser Vai Gly Tyr Lys Thr lie leu Thr Ase Ser Phe Vai Gly Met Gly 420 425 430

Asp lie Ala Thr Arg Glu Vai Phe Glu Trp Vai Fhe Asn Ser Pro leu 435 440 445

He lie Arg Ala Ser Asp leu lie Ala Arg leu Gly Asp Asp lie Gly 450 455 460

Gly Sis Glu Glu Glu Glu lya Lya Gly Asp Ala Ala Thr Ala Ile Glu 405 470 475 480

Cys Tyr lie lya Glu Ase His Vai Thr Lys Hi a Glu Ala Tyr Asp Glu 485 400 435

Fhe Gin Lys Gin lie Asp Ann Ala Trp Lys Asp leu Asa lys Glu Ala 500 505 510

Leu Arg Pro Phe Pro Vai Pro Met Thr Fhe Ile Thr Arg Vai Vai Bis 515 520 525

Fhe Thr Arg Ala lie His Vai lie Tyr Ala Aap Phe Ser Asp Gly Tyr 530 535 540

Thr Arg Ser Asp Lys Ala lie Arg Gly Tyr Xle Thr Ser Ten Leu Vai 545 550 555 560

Asp Pro lie Pro Leu 565

<210>2 <211> 1698 <212> ADN <213> Eryngium glaciale <220> <223> ADN WT valenceno sintase <400>2 afcgfccfcct&a atgfcacfefeag tacgfccaggfe fecagcfcccaa eaaecaaafcc afecfegagafct 60 agfcagfcaggfe gsgefcaafeta fesatsefcagt tfeafcggggag aeaagfefeeet ogaafeafefceg 120 agcceagate aecfegaaaaa tgatteattc ac&gaaaaga aacatgaaca actcaaagaa 180 gaggtgaaga agafegctagfc agaaacggfet caaaagecfec aacaacagcfc gaatcfegatc 240 aacgaaatac aacgaetagg tttatcatao cfcttttgaac ecgaaatfega ggctgcafcfeg 300 caggsaatsa gfcgttaseta tgatgaafetfe fcgttgtagta cagacgctga tgacc-ttcac 360 aatgttgotc tgtatttggg aatastfeaga gaaeatggas aiaatgiaic tioigaigig 420 fefefccagaaat tcatggatag caatgggaag ttgaaagact acttggttaa tgatgctaga 480 ggacfcgfctaa gcttgtaega agcaacacat fcttogggfefco ataatgatga taaaettgaa 540 gsgttgctgt cagfcaasaaa cfcctcgfeefet gageafeefeca aatcecaegfe gaagfeacccfe 600 etfcgaggasg aaatcagfcag ag«a«fcfeaag c&tcccsicc afeaaagaact aaatcgacfea 660 ggagcgagafc afctacatafcc cafcfctaegaa aaafcttgatt cacacaataa afefegofctfefcg 720 gagtttgcaa aactagstfct fcasccgaetg cagaaaatgt afccaaeafcga gsfcageeeae 780 ottao&aggt: ggtggaaaga tfetagatttt asaaasaaae feiceaifefega aagagataga $40 afefegfefegagg gtfeaetttfcg gafeafctagga afegtactfcfcg agccagaacg taaggatgtc 000 agggaafetet tgaaaagagfe atttgcactt. at-tagagtag ttgatgacae gtafegafegtg 060 t&tggtacct teaaagaact tctactgttc acfcgafcgeaa fcfegaaagafcg gggaactagt 1020 gatttggatc agatacsggg afcatafcgaga atfeattfeate aagctctcat ggatgtttafc 1080 aafecaaafegg aggaaaagtt gtsaatg&aa gctgattgte caacataccg tcttgagttt 1140 geaafeagaaa gagfctaaagc cafegfet-csg® tcafcacctcg aagaagctag at.ggt-ccaaa 1200 gaacafctata tgçgatçgat ggaagagfeafe afegaecgtgg cactggtatc ggttggctac 1260 aaaaccatat taacfcaatfcc ctfcfcgfcfegga afcgggggafca fcfe.gcaacaeg ggaagtfcfcfct 1320 gagtgggtgt teastagfecc attgattatt agagetieeg acttaattgg cagafctggga 1380 gafegafeafcfeg gaggseatga ggaggagcag aag&aaggag acgcagcc&c tgctatcgag 1440 tgfctacafcaa aagagaatea tgtaacaaag catgaagctt atgafcgaatt tcagaaacaa 1500 attg&ta&tg cfctggaagga fcfcfcgaafeaag gaagsfcefeae gfeseafefefecs fegfefeceaafeg I860 agfetteafega eaagagfet.gfe feggfefctfeasg ggsgggafeac afegfefeafefefea fegssgaefefet 1620 agtgafeggtt aeaeacgtte agaeaaggeg atcagaggtt ac&taacttc actgctcgtg 1680 gafeeefcafcfec ctfctgfcaa 1608

<210>3 <211> 1698 <212> ADN <213> Eryngium glaciale <220> <223> ADN c969a valenceno sintase <400>3 atgtcfccfcfca afcgfcaefcfcag taagtcaggt fccagefcecaa caacaaaafcc afecfcgagafcfc 00 acfccgtaggt ecgct&afcfca teafceefcagt tt&fcggggag acaagtfceet sgaafc&fcfceg 120 agsccagatc acctg&aaaa tgattcatfcc acagaaaaga aacatgaaca acsfccaaagaa ISO gaggfcg&aga agafcgctagt agaaacggfcfc caaaagccfcc aacaacagct gaafccfcgsfcc 240 aacgaaatac aacgaetagg tttatcatac ettfcfcfcg&a© ccgaaattga ggetgsafcfcg 300 caggaaatca gfcgtfcaecfca fcgat.gaatt.fc igttgfcagta cagacgcfcga tgaccfcfceae 300 aafcgfcfcgctc tcicttfcccg aafcactfcaga gaaeatggac afcaafcgtate fctctgatgtg 420 fefcfecagaaafc fccafcggafcag caafcgggaag ttgaaagacfc ae.fcfcggtfcas tgafcgcfcaga 480 ggaetgfcfcaa gcfcfcgfcacga agea&eaeat tfcfccgggfcfcc afcaafcgafcga taaacfcfcgaa $40 gagttgcfcgfc cagfcaacaac etctcgtett gagcafccfcca aatcccacgt gaagfcacccfc 000 ctfcgaggacg aaatcagfeag agoacttaag cafccccctcc ataaagaact aaafccgacfca 000 ggagegagafc afcfcacatstc cafctiacgaa saattfegatt cacacaafcaa afcfcgafefcfefc-g 320 gagttfcggaa aagfeagafctfc fcaacogactg gagaaaafegfc atcaacafcga ggfcag««eag 200 cttaeaaggt ggtggaaaga ttfcagatfcfct agaaagaaag ttccafcfcfcgc aagagatsga 040 afefegfefcgagg gtfcagfcfc.fc.fcg gafccfcfcagga atgfcacfcfcfcg agggagaacg fcaaggafcgfce 000 agggaafcfcgfc fcgaacagagfc afcfcfcgsagtfc sfcfcagagfcag fcfcgafcgaca© gfcafcgafcgfcg 000 tatggtacafc fccaaaga&cfc tctastgtts acfcgafcgcaa ttg&aagatg gggaactagfc 1020 gatttggatc agcfcaccggg atatatgaga afcfcafcfcfcafcc aagcfcctcat ggafcgfcfcfcafc 10S0 aateaaafcgg aggaaaagtt gteaatgaaa gcfcgafctgtc caac&taeeg fccfcfcgagfcfct 1140 ggaafcagaaa asgtfcaaagc gatgfcfccaga fcgafcacctcg asgasgefc&g afcggfcccaaa 1200 gaacafcfcata tcteatggafc ggaagagfcafc atgagggtgg gagfcggfcafcc ggiiggctat 1200 aaaaccafc&t taactaafctc cfcfcfcgfcfcgga atgggggafca fcfcgcaacacg gg&agttttt 1320 gagtgggtgt tgaafcagfcoc afcfcgafcfcatfe agagcttccg acfcfcaafcfcgc cagattggga 1300 gafcgafcafcfcg gaggccatga ggaggagcsg sagaaaggag acgaagccac tgcfcsfcggag 1440 igttaeafc&a aagagaatsa tgtaaeaaag catgaagcfcfc afcgatgaatt fceagaaagaa 1500 atfcgafcaafcg cfcfcggaagga tttgaafeaag gaaggfccfcac gtccattfcgg tgfcfccgaafcg 1500 acfcfcfcgafcca aaagagfctgt tcafcfctfcacg cgcgccstac atgttattfca fcggogacfefet 1020 agfcgafcggfcfc acacaegttg agacaaggcg afceagaggtt agafcaacfcfcg acfcggfcggtg 1080 gafcccfcafctc ctttgtaa 1003

<210>4 <211> 847 <212> ADN <213> Eryngium glaciale <220> <223> Sequência contig contendo EGVS parcial <400>4 tgfcaafcaagfc gcaaataatc tgfcteaagaa fctcesfcgaea tcctfcacgfct cfcggcfccaaa δδ gtacáttccfc aagáfcccaáa agtaacccté aacaattct® tcfcctfcgcaa atgga&gfctt 120 gittgtaaaa tctaaaicii tccaccacct tgtaaggigg gctagctcat gttgatacat ISO fcfcfccigcagfc eggtfcaaaafc cfcagfctfcfcgc aaactoaa&a agcaafcfciafc tgigtgaafcc 240 aaaiitfcicg iaaatggsta tgtasi.aic.fc egctcctsgt cgaiiiagii ciiiatggag 300 gggafcgeita agtgcfcotac tgattiegte: ctcaagaggg taefcfcea«gt gggafcfcfcgag 360 aigctcaaga egag&ggitg iiacfcgacag ça&çtçttaa agifcfcafccai eati&tgaae 420 ccgaaaatgt gttgcttcgt acaagciiaa cagtectcta gcaicaiiaa cc&agfcagtc 400 tfcfccaactfcc ccattgcfcafc ccatgaattt ctgaaacaca tcagaagata cattatgtcc 540 atgttctcta agtaiicgga aagagagago sacaiigiga aggtcateag cgtstgiasi 500 acsscaaaat tcatcat&gg t&acactgai ttc-ctgcaat gcagccfccaa tfctcgggttc 560 aaaaaggfcai gataaacota gtegiigfcai fctcgfcfcgaic agaifcgaggi gtigitgagg 720 cttttgaacc gtticiacia gcatcttctt cacciaiici fctgagttgtt catgtttctt 700 ticfcgtgaat gaateatiii hc&ggtgaic tgggetsgaa tafctcgagga acttgtet.se 240 ccaiaaa 047

<210> 5 <211> 32 <212> ADN <213> Sequência artificial <220> <223> Iniciador RACE 63-l-2-Fwd2 <400>5 gligotsoat ddgcagi eg 32

<210> 6 <211> 29 <212> ADN <213> Sequência artificial <220> <223> Iniciador RACE 63-l-2-Rev2 <400> 6 gdgioogio acaacctdc gtdigage 20

<210> 7 <211> 33 <212> ADN <213> Sequência artificial <220> <223> Iniciador RACE 63-l-2-NestFwd2 <400> 7 cppstMt btagllllp ap 3$

<210> 8 <211> 27 <212> ADN <213> Sequência artificial <220> <223> Iniciador RACE 63-l-2-NestRev2 <400> 8 o>c#i gtesMt gpy&cy 2?

<210> 9 <211> 60 <212> ADN <213> Sequência artificial <220> <223> Iniciador Gibson assembly 63-52-EG2FwdPart1 <400> 9 pigaatfcii agetagglaa cattaaaaaa aalgtetatl a&tgtactta gtacgisagii 60

<210> 10 <211> 33 <212> ADN <213> Sequência artificial <220> <223> Iniciador Gibson assembly 63-52-EG2RevPart1 <400> 10 gm$sm fpatgtaeaa laeaaatsa£ aeg 33

<210> 11 <211> 40 <212> ADN <213> Sequência artificial <220> <223> Iniciador Gibson assembly 63-52-EG2FwdPart2 <400> 11 g atglgtatg glaaallaaa iiàxààllàta clgileaclg 40

<210> 12 <211> 56 <212> ADN <213> Sequência artificial <220> <223> Iniciador Gibson assembly 63-52-EG2RevPart2 <400> 12 taoge^sâfcâ asagcagaga Udagalla caaaggaata ggaftcacga gcaatg 56

<210> 13 <211> 1647 <212> ADN <213> Citrus sinensis <220> <223> ADN valenceno sintase de Citrus <3 0 0> <3 0 8>GenBankGQ9 8 83 8 4.1 <309> 2009-10-20 <400> 13 gagía&aoafct· fcggtcofc&st ggag&ti-fcííc afcccstajgrtfct atggagaa&c €0 cafctfcgcfcea aaggtgettc fcgatfctcaag acagttgatc ataetgcaac tcaagaacgs 120 eacgaggcac tgaaagaaga ggtaaggaga afcgataaeag atgetgaaga taagcefcgtfc 100 «sagaagttag gettgafetga fcgaagtaea» cfccst$$fff tgggfetatea ctttfagaaa 240 gaaatagaag atgoaatasa aaaafetatgt ccaatotafea ttgacagtaa tagagctgat 300 ctccacacsg ttfcçççttga tfcttcgattg cttaggcagc aaggaatcaa gatttçgtgt 360 gaigtgfcfctg agasgtfccaa agatgatgag ggiagaifcsa agtcategtt gataaacgat 420 gfcfceaaggga tgttaagttt gfcaegaggca gcaiacatgg eagtfccgcgg agaacatata 400 tfcagatgaag ceattgcttt cactaccaot cacctgaagt eatfcggtagc tcaggateat 540 gtaaccccta. agetfcgegga scagataaat cstgctttat acegtcctct tcgtaaaaoe 500 ctaccaagat tagaggegag gtattttatg tceafcgatca afcieaaaaag tgatcafctta 660 tacaataaaa ctcfcgctgaa ttttgcaaag ttagatttta acatattgct agagctgcac 720 aaggaggaac tcaatgaafcfc aacaaagtgg tggaaagafct tag&ctteae tacaaaacta 780 ccttatgcaa gagacagafct agfcggagtta tatttttggg atttagggac atactfccgag 840 ccteaafcafcg catttgggag aaagafcaatg acecaafefca» attacafcatt afccsatcats 800 gatgatagfefe atgatgcgta tggfeagactt gaagaaet«a geetctttag tgaageagtt 860 caaagatgga atattgaggc cgtagafcatg cttccagaat acatgaaatt gatttacagg 1020 acactctt&g atgcttttaa tgaaatfcgag gaagatatgg ccaagcaagg aagateaaae 1080 fcgcgtacgit aigoaaaaga ggagaafccaa aasgtaaitg gagcatactc tgtfccaagcc 1140 aaatggtfcca gfcgaaggt.ta cgfcfcccaaca at.fcgaggagfc atatgcctat tgcacfcaaca 1200 sgt.tgfcgctt acacattcgt eataacaaat fccettoeitg gcatgggtgs ttttgcaact 1200 aaagaggttt tfcgaatggat ctccaaiaac cataaggttg taaaagcagc atcagttafcc 2320 tgcagactca tggatgacat gcaaggtcat gagtttgagc agaagagagg acatgfctgcg 2380 tcagctattg aatgttacaa. gaagcagcat ggtgt.ctcta aggaagaggc aattaaaatg 2440 ttigaagaag aagttgcaaa tgcatggasa gatafctaacg aggagttgat gaigaagcca 2600 aççgtcgfctg çcçgaççaçt gctcqqq&çq afctcttaatc ttgçtçgtgç aattgatttt i860 atfctacaaag aggacgacgg afcatacgcat tcttacctaa ttaaagatca aafcfcgcfctcfc 1620 gfcgcfcaggag aecacgfctcc afctttga 1647

<210> 14 <211> 548 <212> PRT <213> Citrus sinensis <220> <223> Proteina valenceno sintase de Citrus <400> 14

Met Ser Per Gly Slu Thr Phe Arg Pro Thr Ms Asp Phe Eie Pro Her 1 5 10 15 leu frp Arg Asn His Phe Leu Lys Sly Ala Her Asp Phe Lys Thr Val 20 m 30

Asp His Thr Ala Thr Gin Glu Arg His Slu Ala leu Ays Sis Glu Val 35 40 45

Arg Arg Met. I la Thr Asp Ala Sis Asp Lys Pro Val Gin Lys Leu Arg 50 55 SO las He Asp Slit Val Sin Arg leu Sly Val Ala fyr His Phe Slu lys 05 70 75 @0

Sis He Slu Asp Ala lie Sin lys Leu Cys Pro He fyr He Asp Her 55 30 35

Asn Arg Ala Asp leu His Thr Val Her leu His Pee Arg leu leu Arg 100 105 110

Sin Sin Sly He lys He Ser Syu Asp Val Pits Slu lys Pis lys Asp 115 120 125

Asp Slu Sly Arg Phe lys Gar Per leu He Asn Asp Val Sin Sly Met 130 135 140 leu Ser leu fyr Sin Ala Ala fyr Met Ala val Arg Sly Sin His He

145 ISO 155 ' ISO leu Asp Slu Ala He Ala Pie fir Thr fhr His leu lys Ser leu Val 105 170 175

Ala Sin Asp Eis Val Thr Pro lys leu Ala Slu Sin He Asn His Ala 150 105 100

Leu fyr Arg Pro leu Arg lys fir leu Pro Arg leu Sin Ala Arg fyr 135 200 205

Phe Met Her Met II® Asn Her Thr Her Asp His leu fyr Asn lys fhr 210 215 220 leu leu Asn Phe Ala lys leu Asp Phe Asn He leu leu Slu leu His 225 235 235 240

Lys Glu Glu Leu Asu Gin Lon Thr Lys Ttp Trp Lys Asp Leu Asp Fhe 245 255 255

Thr Thr Lys Leu Fro Tyr Ala Arp Asp Arp Lou Val Glu Leu Tyr Fho 255 255 270

Trp Asp Leo Gly Thr Tyr Pho Glu Fro Gin Tyr him Ffee Gly Arp Lys 275 255 205 lie Met Thr Gin Leu As π Tyr lie Lon Ser lie He Asp Asp Thr Tyr 230 235 300

Asp Ala Tyr Gly fàr Lou Glu Gin Lon Ser Lou The Thr Gin Ala Vol 305 310 315 320

Gin Arg Trp Asn Ilo Glu Ala Val Asp Mot Lou Ore Gin Tyr Mot Lys 325 330 335

Lon Ilo Tyr Arg Thr Lon Lon Asp Ala The Aan Gin lie Glu Glu Asp 340 345 350

Mot Ale Lye Gin Gly Arp Ser Bis Cys Val Arp Tyr Ala Lys Glu Gin 355 300 305

Aso Glu Lys val Ilo Gly Ale Tyr Ser Vol Glu Ale Lys Trp Pho Ser 370 375 330

Glu Gly Tyr Val Fro Thr He Glu Gin Tyr Mot Fro lie Ala Lon Thr 305 305 305 405

Ser Cys Mo Tyr Thr Pho Val Ho Thr Asn Ser Pho Lou Gly Met Gly 405 415 415

Asp She Mo Thr Lys Glu Val She Glu Trp lie Ser Aon Aan Fro Lys 425 425 435

Val Vol Lye Ala Mo Sor Vol He Cys Arp Lou Met Asp Asp Mot Gin 435 445 445

Gly His Glu Pho Gin Gin Lys Arp Gly Bis Vol Als Ser Mo Ho Glu 455 455 ’ 450

Cys Tyr Thr Lye Gin Bis Gly Val Sor Lys Glu Glu Ale He Lys Met 405 475 475 485

The Gin Gin Glu Val Ala Asn Ms Trp Lys Asp Ilo Aan Glu Glu Leu 435 400 495

Met Met Lys Fro Thr Vel Val Als Arg Pro Leu Lon Gly Thr He Leu 505 505 515

Asn Lou Ale Arg Ma He Asp The Ilo Tyr Lys Glu Asp Asp Gly Tyr 515 520 525

Thr His Sor Tyr Lon Ho Lys Asp Glu He Ala Sor Vol Lou Gly Asp 535 535 540

His Val Pro Phe 545

<210> 15 <211> 548 <212> PRT <213> Citrus X paradisi <220> <223> Proteína AAM00426 valenceno sintase de Citrus <3 Ο 0> <3 Ο 8>GenBankAAM0 0 42 6 <309> 2002-04-02 <400> 15

Met Ser Ser Sly Slu Thr Fhe Arg Pro Thr Alo Asp Phe Hie Pro Ser I 5 10 15

Leu Trp Arg Ase His Phe Leu Ly$ Sly Alo Ser Asp She tys Thr Vai 20 25 30

Asp Sis Thr Alo Thr Siπ Slu Arg Eis Slu Alo Leu Lys Slu Slu Vai 35 40 45

Arg Arg Met lie Thr Aep Ale Slu Aep Ly$ Pro vei Slu Lys teu Arg 50 55 50

Leu Lie Asp Slu Val Gin Arg l®u Sly val Ala tyr His The Sis Lye 85 70 75 80

Qlu XI# Sin Αήρ Ala LX# Aeu lys A«u Oy# Pre LX# Yyo? LX# Asp S#r 85 90 9$

Asa Arg Ala Asp leu Hi# The Val Her 1#® His Ph# Arg X## Aeu Arp 100 10:5 110

Sin SI# Sly XI# Ays XX# Ser Cys Asp Val PA® SX® Ays Oh# Lys Asp 115 120 125

Asp Sin Sly Arg Ph® Ay# 8®r Ser Leu Xl# Asn Asp Yal SI# Sly list 130 X3S 140 A®u Her As® Tyr Gl® Ala AX# Tyr Met Ala Yal Arg SXy SI® 81s 11# 145 ISO 155 180 A#® Asp SI® Ala Lie Ala Phe Thr Thr Thr His Asa Lys Ser Lea Ysl 155 170 175

Ala Gin Asp His Yal tht Pro Ays A#® Ala Si® Sin XX# &sn His Ala ISO 185 180

Leu Tyr Arg Pro Leu Ary Ays Thr A«® Pro Arg Leu SI® Ala Arg tyr 135 SOS ' 205

Phe M®t Sex M®t Xle Asn Ser Thr 3## Asp His X*au Tyr Asa. Ays Thr 210 215 220 leu .A#® Asa Phe Ala Ays leu Asp Hue Asn lie leu As® si® Hr# His 225 230 235 240

Ays Slu Slu Leu Asn Si® leu Thr Ays txp Lap Ays Asp Ae® Asp Phe 245 250 258

Thr The lys Leu Pro Tyr Ala Arg Asp Arg leu Val Slu Ae® Ayr Ph# 280 285 270

Trp Asp A#« Sly Thr Tyr Ph# Slu Pro Sin Tyr Ala Ph# Sly Asp Ay# 275 280 225

Xle Met Thr Sin Ae® Asn Tyr lie A#® Her lie lie Asp Asp Thr Tyr 230 235 300

Asp Ala Tyr siy Thr lea Si® Sin i#® Sen i#® Phe fhr si® Ms val 305 310 315 320

Slu Arg Trp Asn He Sin Ala val Asp Met Ae® Pro Si® Ayr Met Lys 323 330 335

Leu 11« Ayr Arg Thr 1#« Leu Asp Ala Ph# Asn Slu il# SI® Si® Asp 340 345 350

Met Ala Lys Sin Sly Arg Her His Cys Ysl Arg Syr Ala Lys SI® Slu 355 380 385

Asn Sin lys Val Lie Sly Ala Tyr Sen vsl Sin Ala lys Trp Phe Ser 370 375 380 SX® Sly Tyr Val Pro thr Lie Slu Slu Tyr Mat Pro Lie Ala Leu Thr 305 330 305 400 S#r Cys Ala Tyr Thr Phe Val Xle Thr Asn S#r Phe Leu Sly Met Sly 405 410 415

Asp Phe Ala Thr lys Slu Val Phe Si® Yrp LX® Ssr Asa Asn Pro Aye 420 425 430

Val Val Ay# Ala Ala Ser Val lie Cys Arg A#« Met- Asp Asp Met Sin 435 440 445

Sly His Slu Ph® Slu Sin Lys Arg Sly His Val Ala S«r Ma XI# Slu 450 455 480

Cys Tyr Thr lya Sin His Sly Yal S«r lys Sin Siu Ala lie Ays Met 485 470 475 400

Ph® Slu Slu Slu Val AXa Asn Ala fsp lys Asp XX# Asp SX® Slu 1®® 405 430 438 M®t Met lys Pro Thr Val Val Ala Arg Pro leu A«® Sly Thr 11® Ae® 800 505 510 A#n Aeu Ala Arg Ala Xle Asp Phe Li# Tyr lys Slu Asp Asp Sly Tyr 515 820 525

Thr His Her Tyr Ae® Lie Ays Asp Sin Li® Ala Her val leu Sly Asp 830 535 540

His Val Pro Phe 845

<210> 16 <211> 556 <212> PRT <213> Vitis vinifera <220> <223> Proteína valenceno sintase <3 0 0> <308> Uniprot C1JXK7 <309> 2011-09-21 <400> 16

Met Ser fhr Gin Vai Ser Ala Ser Ser Lee Ala Gin He Pro Gin Pro 1 5 10 15

Lys Asn Arg Pro Vai Ala Asn She His Aro Ase II® frp Gly Aap Gin 20 2$ 30

Pho lie thr fyr fhr Pro Glu Aap Lys Vai fhr Arg Ala Cy» Ay» Glu 35 40 45

Gin Gin lie Gin Asp Lee Lys Lys Glu Vai Ay a Arg Lys Len fhr Ala 50 55 60

Ala Ala Vai Ala Aso Pro Ser Gin Leu Leu Aon Ehe lie Asp Ala Vai 65 70 75 $0

Gin Arg Len Gly Vai Ala fyr Eia Phe Glu Gin Glu He Giu Glu Ala 65 50 05 leu Gin Hia He Gya Asn Sor She Sis Aap Cys Ase Asp Met Asp Gly 100 105 110

Asp Leu fyr Asn 1la Ala leu Gly Phe Arg Leu La» Arg Gin Gin Gly 115 120 125 fyr fhr lie Ser Cya Asp He She Aan lys Pho fhr Aap Gin Arg Giy ISO 135 140

Arg She Lys Gin Ala Leu lio Ser Aap Vai Arg Gly Met Aon Gly Leu

145 150 155 ISO fyr Gin Ala Ala Eis Lev Arg Vai His Gly Giu Asp lio Leu Ala Lya 165 170 175

Ala Leo Ala She fhr fhr fhr Bis len Lys Ala Met Vai Giu Ser Len 180 185 100

Gly fyr Hls Leu Ala Gin Gin Vai Ala His Ala Leu Asn Arg Pro Ile 105 200 205

Arg Lys Gly Leu Giu Arg Leu Glu Ala Arg frp fyr He Ser Vai fyr 210 215 220

Gin Aap Glu Ala Lhe Eis Asp Lya fhr Lea Len Glu Leu Ala iya Leu 225 230 235 240

Asp She Asn Len Vai Gin Ser Len Eis Lys Gin Glu Leu Ser Asn Leu 245 250 255

Ala Arg frp frp Lys Glu Leu Aap She Ala fhr Lya Lev Pro She Ala 260 265 270

Arg Asp Arg Leu Vai Gin Gly fyr She frp Met Sis Gly Vai fyr Pho 275 280 285

Giu Pro Gin fyr Leu Arg Giy Arg Arg He Leu fhr Lys Vai Ile Ala 208 255 308

Met fhr Ser Ho Leu Aap Aap He Sis Aap Ala fyr Gly fhr Pro Glu 385 310 315 320

Gin Leu Lys Len She He Glu Ala He Glu Arg frp Asp Xlo Asn Ser 325 338 335 lie Asn Gin Len Pro Giu fyr Met Lya Leu Cys fyr Vai Ala Lon Leu 348 345 350

Asp Vai fyr Lys Glu He Glu Gin Glu Met Gin Lys Glu Gly Asn Gin 355 360 365 fyr Arg Vai Eia fyr Ala Lya Glu Vai Mot Lye Aan Gin Vai Arg Ala 378 375 388 lyr Phe Ala Sits Ala Ays Trp Law His Sits Sits His Val Pro Ala Phe 383 338 333 408

Sits Sits Tyr Met Arg Val Ala Lew Ala Sar Ser Sly Tyr Cys taw Aaw 405 410 415

Ala Thx Thr Sar Phe Val sly Met Sly Sits Xla Ala Thr Ays Gla Ala 420 425 4.30

Phe Asp Irp Val Thr Ser Asp Hr a Ay a Xla Hat Sa a Ser Ser Asa Pisa 435 448 445 lie lhr Arg Law Mat Asp Asp lie Ays Sar His Ays Phe Sits Sin Ays 450 455 480 A*$ Sly His val Ala Her Ala Val Slw Cys Tyr Met Ays Sits fya Sly 485 438 475 488

Val Sar Slu Slv Sin Val Tyr Sar Sis 8he Sin Ays Sin Ila Sin Ash 405 430 435

Ala Trp Law Asp Ila Asn Sin Sltt Cys Aan Ays Pro Thr Ala Val Has 500 585 518

Mat Pro Leu law Ala Arg Aaw Law Asa Aaw Thr Arg Thr Mat Asp Val 815 528 525

Ila Tyr Ays Slw Sin Aap Sar Tyr Thr His Val Sly Ays Val Met Arg 530 535 540

Asp Aan ila Ala Sar vsl Phe ila Asn Ala val lie 543 558 555

<210> 17 <211> 573 <212> PRT <213> Chamaecyparis nootkatensis <220> <223> Proteína Valenceno sintase <400> 17

Met Pro Val Lys Asp Ala Leu Arg Arg TAr Gly As» His His Pro As» i 5 10 15

Lea irp fhr Asp Asp PAe IX» Gin Her Leu As» Her Pro fyr Ser Asp 20 as so

Her Ser fyr His Lys Hi# Arg Glu He As# He A#p Gits Us Arg Asp 35 40 45

Met Phe Her Asn Gly Glu. Gly Asp Gits Phe Gly Val As# Glu As# Ils so ss m ftp FAe Vsl Asp Val Val Gin Arg Leu Gly He Asp Arg His Phe Gift 65 70 75 80

Gi» GXa IX© Ays TAr Ala leu Asp Tyr He Tyr Ays Phe Vrp As» His 85 SO 55

Asp Her Us Phe Gly Asp Leu A#» Met- Val Ale Lee Gly Phe Arg He 100 XOS 110

Lee Arg Leu As» Arg Tyr Val Ale Her Her Asp Val PAe Lys Lys Phe 115 130 125

Lys Gly Glu Glu Sly Gin Phe Her Sly PAe G1» Her Her Asp Gin Asp 130 135 140

Ale Lys Leu Glu Met Met Leu As# Lee Tyr Lys Ala Her Glu Len Asp 145 150 155 160 FAe Pro Asp G1» Asp lie Leu Lys Gie Ale Arg Ala Pfee Ale Her Met 185 170 175

Tyr Leo Lys His Vel He Lys Gin Tyr Gly Asp He Gin Glu Her Lys 1H0 1H5 180

Asn Fro Leu Leu Met Glu He Glu Tyr Thr PAe Lys fyr Pro frp Arg 135 tOO 305

Cys Arg Leu Pro Arg Leu Glu Ala Grp Asn PAe lie His He Met Arg 210 215 220

Gin Gl# Asp Cys Asn He Her lien Ala Asn Asn leu Vy.r Lys He Pee 225 230 235 240

Lys He Fyr Met Lys Lyá He 1¾¾ (31¾ Lá» tíâ 11¾ Lee Asp FAe ASA 245 250 255

Xle L«% 01« S«r 01a Hi« 01« Eis 01% Met Xy» 1¾% 11« Ser Thr txp 260 255 270 7rp Lys As» Ser Ser Alá Ile Olá Leu Asp PAe Phe Arg Sis Arg Eis 275 280 285 n« 01« Ser Fyr FAe Frp Ftp Alá Ser Fro Leu FAe Gin Fr» Glu FAe 290 255 300

Ser FAr Gys Arg He Asa Cys Fhr Lys hm Ser FAr Ay» Met FAe tea 305 310 315 320

Leu Asp Asp 11« Fyr Asp Fhr Fyr Gly Fhr Vai Glu Gin Leu Lys Fr» 325 330 335 FAe Fhr Fhr Fhr Leu Fhr Arg Frp Asp V&l Ser Fhr Vai Asp Asa lii 340 345 350

Pr» Asp fyr Met Ays lie Ale PA» As» FAe Ser fyr Glu 11» fyr Lyá 355 300 365

Glu lie Ale Ser Glu Ala Glu Arg Lys Bis Sly Pr» Phe Vai Tyr Lys 370 375 380

Fyr Leu Glu Ser Cys Frp lys Ser Fyr 11» Glu Ale Fyr Met Gin Glu 385 330 385 40Ô

Ala Glu frp 11« Ala Ser As» Eis 11» Fr» Sly FAe Asp Glu Fyr leu 405 4X0 415

Met As» Gly Vai Lys Ser Ser Gly Met Arg 11« Leu Met lie Hie Ale 420 425 430 teu He L«% Met Asp Fhr Fro tea Ser Asp Glu He Lee Glu 01a Lee 435 440 445

Asp He Fro Ser Ser Lys Ser G1» Ala Lea Leu Ser Leu He Fhr Arg 450 455 400

Leu VAX Asp Asp Val Lys Asp Phe Glu Asp Glu G1» Ala His Gly Glu 455 470 475 400

Met Ala Ser Ser tie Glu Cye Fyr Met Lye Asp A»» Eis Gly Ser FAr 435 480 435

Arg Glu Asp Ala Leu As» Fyr Leu Lys He Arg He Glu Ser Cys Val 500 505 510

Gin Glu Leu Mu Lys Glu Leu Leu Glu Fro Ser Asa Met Eis Gly Ser 515 520 525 FAe Arg As» Leu Fyr Leu As» Val Gly Met Arg Val lie FAe FAe Met 530 535 540 tee As» Asp Gly Asp Leu FAe FAr His Ser Asa Arg Lys Glu He Gin 545 550 555 560

Asp Ala He FAr Lye Phe FAe Val Glu Pro He He Pro 565 570

<210> 18 <211> 556 <212> PRT <213> Eleutherococcus trifoliatus <220> <223> Proteína alfa-copaene sintase <3 Ο 0> <3Ο8> GenBank ADK94034.1 <3Ο9> 2012-04-01 <400> 18

Met Ala Thr I’yr Lau SI» Ala Ser Ser CSly Pro Cys Sar Thr lie Vai 1 5 lô' 15

Oro Õlu Xle Thr Arg Arg Ser Ala Asa Vyr Sis Fr o Asn Ila Trp GLy 20 25 50

Asp Sin Fha Lao Lys Tyr As» Ser F&e Asp Lao Sar Lys Vhr Asp Ala 35 m 45

to 15r Ays Si» Hie Axg Sirs Ay« Sirs Gla Val Ays &ye gg&t SO 55 SO

Aeu Val Asp Ais Sly fro Mn Sin Sirs Aes Asa Aeu lie Asp Asp lie §5 70 75 80

Sin Arg Asa Sly Vsl Als Tyr Sin Phs Giu Ms SI» I In Asp Ala Ala 85 90 95 lea Sin Arg Met Asa Val lie Phs Gin Gly Asa Asp Asp Asp lea Sis 100 105 1X0 2hr lie Her Asa Arg She Arg Aeu A#u Arp Gin His Gly Xyr Asa Val 115 xao 125

Her Her Asp Val Pfee Arg Ays Phs Set Asp Asn Asn Gly Ays Phs Ays 130 135 140

Gin Cys Aeu lie 8#r Asp Aeu Arg Gly Val Aea 9sr Asa Xyr Gin Ala

145 ISO 155 ' ISO

Vhr His Ph# Arg Val His Gly Giu Asp Sis Aeu Giu Asp Ala Aeu Giu 105 170 1?5

Hire thr Xhr S#r His Aeu Gin Arp Aea Ays Her His Aea Ays Asa Pro I$0 188 " 100

Asa Ala Ale ills Vai Ala Arg Ala Asa Ays Cys Pro Xla His Ays Gly 185 200 205

Asa Asa Arg Asa Giu Ala Ays His Ayr II# Gar Xis Xyr Ola Gin Giu 210 215 220

Asp Asp Ssr His Ass Ays Val A#u Asa Ass Ph# Ala Ays Asa Asp PAe 225 230 235 240

Ass Asa Asa Gin Ays Mst His Gls Gly Giu Asa Her His Als Xhr Arg 245 250 255

Grp frp Ays Sla Asa Asn Phs Als Ays Ays Asa Pro Mm Ala Arg Asp 280 285 270

Arg Val Vai Giu Cys Xyr FA# Trp lie Asa Gly Val Xyr Ph# Giu Pro 275 280 285

Gin Xyr Asa lie Ala Arg Arg Phe Asa XAr Ays IIs Xis Ala Met Ala 230 295 300

Ssr val Ala Asp Asp rl# Tyr Asp vsl lyr Gly Thr A#a Gla Giu Asa 305 310 315 320

Val il# Asa ihr Asp Als XXs Giu Arg frp Asp Met Gly Ala Asa Asp 325 330 335

Gin lie Pro Gin Cys Met Arg Vsl Xyr His Arg Als Asa Asa Asp Vsl 345 345 350

Ayr IHr Giu Met GIu Giu Giu Get Ala Ays thr Giy Arg Pro Ssr Ayr 355 380 385

Arg Val His Tyr Ala Ays Gla Ala Tyr Ays Gla Asa Val Arg Gin Tyr 370 375 380 A#u Ala Gla Als Ays frp PA# Gin Gla Asp Tyr Asp Pro fhr Asa Gla 385 300 395 400

Gla Ayr Aea Pro Val Ala Asa Xls Ssr Gly Gly Ayr Ays Mat Aeu Ala 405 410 415 X&r His Her Phe Vai Gly Met Gly Asp Χ<βν Aia Vhr Aye Glv Ala Phe 420 425 430

Asp Xrp Vai S#r Asa Ass Pr# A#u IIs Val Ays Ala Ssr Ssr Vsl lls 435 440 445

Cys Arg Asa Her Asp Asp Met Vsl Gly His Gla Vsl Gla His Gla Arg 450 455 480

Gly Asp Val Ala Ssr Als Val Giu Cys fyr Met Ays Gin Ayr Gly Val 485 470 475 480

Ihr Ays Gla Giu Vsl Ayr XI# Giu Phe Gls Ays Gin lie Ssr Ann Ala 485 450 495

Arp Ays Aap Mat Ass Gin Gla Cys Asa His Pro Par Ihr Val fhr Msfe 503 505 510

Pro Aeu Asa Thr vsl il# Ph« Asn Met Thr Arg Vsl lie Asn Asa Aeu 515 520 525

Tyr Aap Gla Gla Asp Gly Tyr Thr Asn Ssr Asn Thr Arg Thr Ays Asp 530 535 540

Phs 11# thr Ser Val A#u lie Asp Pro Val Gin 11# 545 55Ô 555

<210> 19 <211> 565 <212> PRT <213> Actinidia deliciosa <220> <223> Proteina germacrene-D sintase <3 0 0> <308> GenBank AAX16121.1 <309> 2005-11-01 <310> US7312323 <311> 2007-12-25 <400> 19

Met Gin Leu Pro Cys Ma Sin Ale Leu Pro Ik Pro Thr Val Thr Thr IS 10 15

Thr Thr Her He Glu Pro Pro His val Thr Arg Arg Her Ala Asa Tyr 20 25 30

His Pro Ser He Trp GXy Asp His Phe Loo Me Tyr Per Her Asp Ale 35 40 45

Met GXu Gin Gin ¥al He Asn Met GXu Gin Gin Gin Arg leu His His 50 55 60

Leu Lye Gin Lye val Mg lys Met Leu Glu Ale Ale Ma GXu Gin Ser 65 70 75 00

Her Gin Met leu Asn Leu Val Asp Lye He Gin Arg Leu GXy Val Her 85 30 95

Tyr His Phe Gin Thr Gin He Gin Thr Ala Leu Arg Hie He Tyr Lys 100 105 110

Thr Gys Asp Tyr His Phe Asp Asp Leu His Thr Ale Ms Len Her the 1X5 120 125

Arg Len Lee Arg Gin Gin GXy Tyr Pro Val Ser Cys Asp Met Phe Asp 130 135 140

Lys Phe Lys Asa Her Lys Gly Glu Phe Gin Gin Ser He He Her Asp 145 150 155 160

Val Gin Gly Met Len Her Len Tyr Glu Ale Thr Cys Len Arg He His 165 1'70 175

Gly Gin Asp He Leu Asp Glu Ale Len Me Phe Thr lie Thr Gin Len 180 185 190

Arg Her Ala Len Pro Asn Len Her Thr Pro Phe Lys Gin Gin He He 195 200 205

His Ala Leu Asn Gin Pro He His Lys Gly Len Thr Arg Len Asa Ala 2X0 215 220

Arg Her His He Leu Phe Phe Gin Gin Asn Asp Cys His Her Lys Asp 225 230 235 240

Leu Leu Asn Phe Ala Lys Len Asp Phe Asn Len Len Gin Lys Leu His 245 250 253

Gin Arg Gin Len Gys Gin He Thr Arg Trp Trp Lys Asp Leu Asa Phe 260 265 270

Ala Lys Thr Leu Pro Phe Ala Arg Asp Arg Met Val GXu Gys Tyr Phe 275 288 ' 285

Trp lie Leu Gly Val Tyr Phe GXu Pro Gin Tyr Len Len Ale Arg Arg 290 295 300

Met Leu Thr Lys Val He Ala Met He Her He He Asp Asp He Tyr 305 310 315 320

Asp Val Tyr Gly Thr Len GXu Gin Len Val Leu Phe Thr Asp Ala lie 325 338 335

Glu Arg Trp Gin He Her Ala Leu Asp Gin Len Pro Gin Tyr Met Lys 340 345 350

Leu Gys Tyr Gin Ala Len Len Asp Val Tyr Set Met He Asp GXu GXu

355 380 MS M®h Ala Ays Sift Gly Arg Ssr Tyr CyS Val Asp Tyr AX® Ays S®r Gar 370 315 350

Met Ays XI® A®« Val Arg Ala Tyr Phs Giu GX« Ala. Ays Trp Ph® His 383 390 395 433

Gift Gly Tyr V®1 Pro Thr Ma t GI® G1» Ty r Met. Gi n Vs I Al® hm.i Val 455 4X0 415

Thr Als Gly Tyt Ay® Mat As® Ala Thr S®r Set Ph® Val Gly Met Gly 420 425 433

Asp Lea Ala Thr Ays Gla Ala Ph® Asp Trp Val Gar Asa Asp Pro Lavs 433 440 445 11® Val Gin Ala AX® S®r VaX II® Gly Arg 5®« Ays Asp Asp IX® VaX 450 455 480

Gly His Ays PA® Gin GX® Ays &rg Gly Hi® VaX Al® S®r Al® VaX Gin 483 470 415 483

Cy® Tyr 8®r Lys Gin His Gly Thr Thr Gin GXu Gin Ala XI® XX® Gin MS 430 405 A®« Asp Ays GXh Val Thr His 8®r ftp Ays Asp XI® As» Al® GXu Cys 500 505 513 A«® Cys Pro XX® Ays VaX Pro M®t Pro X»®® Asa Al® Arg Val L®» Asn 5X3 520 525 A®» AXa Arg VaX Aon Tyr Val XX® Tyr Gin Asp Gin Asp Gly Tyr Thr 530 535 540

His Pro Gly Thr Ays ¥al Glu Asn Phe Val Thr Gsr VaX As® XX® Asp 545 550 555 583 S®r Mat Pr® XX® Asn 583

<210> 20 <211> 557 <212> PRT <213> Vitis vinifera <220> <223> Proteína (-)-germacreno D sintase <3 0 0> <308> NCBI XP_0 03 63 46 96.1 <309> 2011-12-07 <400> 20

Met Ser Vai Gin Ser Ser Vai Vai Aen Leu Ala Bro Ser Ay® &®n Lee 1 5 10 15

Ser Pr© Slu Vai Gly Arg Arg €y» àla Asn B&e Bi® Oro Ser lie ftp 20 as 30

Gly Aap lia She lev Ser Vyr Ala Ser Gin Phe fbr Asa ihr Asp Aap 35 40 45

Bi® Aen Aya Gin Bi® Vai Gin Gin Ae» &y» Gin Giu Vai Arg &y® Met 50 55 00

Lea Met Ala Ala Asp Asp Asp Ser Ala Gin Ay® Lee Len Leu Ile Aep 05 70 75 00

Ala lie Gin Arg leu Gly Vai Aia Tyr Bis FAe Gl» Ser Giu lie Aap S5 00 05

Gin Vai Leu Ay® Bi® Met- Abe Aap Gly Ser Vai Vai Ser Ala Gin Glu 100 10S 110

Aep Vai Tyr Vhr Ala Ser Aen Arg Phe Arg Leu Leu Arg Gin Gin Gly 115 120 .125

Tyr Sia Vai Ser Cys A®p Leu PAe Aan Asn she Ays Aap Asn Giu Gly 130 135 140

Aen Ffee Ay® Gin Ser Leu Ser Ser .Asp Vai Arg Gly Met Leu Ser leis

145 150 155 ISO fyr Gin Ala Ibr Bi® Phe Arg Vai Bis Gly Gin Aap lie Lea Aep Gin 165 170 175 ΑΧ» Asa Ala Bhs fhr fhr fhr Big Asu Sin Ssr Ala fhr Ays Big Bar 180 185 180

Sat' Asa Fro Asa Ala Gla Gin Val Val His Ala Asa Ays Gin Bra lie 185 200 205

Arg Ays Gly Aea Bra Arg Asa Gla Ala Arg Big fyr Bhs Sea Vel fyr 210 215 220

Gig Ala Asp Asp Ssr His Asa Ays Ala Asa Asa Ays Asa Als Ays Ass 225 230 235 240

Asp Phe Asa Asa Asa Gin Ays Las His Gin Ays Gla Asa Ssr Asp He 245 250 255

Ssr Ala frp frp Ays Asp Asa Asp Bhs Ma His Ays Asa Pro Bhs Ala 250 285 270 &rg Asp Arg Val Val Gla Cys Ayr BAs Arp lls Asa Gly Val Ayr BAs 275 2S0 285

Gla Bee Gin Bhs BAs Bhs Ala Arg Arg lie A-sa fhr Ays Vel lie Ale 200 205 500

Met fhr Ssr Ils Ils Asp Asp ils fyr Asp Val fyr Gly fhr Asa Gla 305 310 315 320

Gla Asa Gla Asa Bhs fhr Gla Ala Val Gla Arg frp Asp Ils Ssr Ala 325 330 335 lie Asp Gin Aea Fra Gla fyr Mat Arg Vel Gy a fyr Gla Ala Asa Asa 340 345 350 fyr Val fyr Ssr Gla Ils Gla Gla Gla Mst Ala Ays Gla Gly Arg Ssr 355 300 365 fyr Arg Asa fyr fyr Ala Ays Gla Ala Mst Ays Asa Gla Vel Arg Ala 370 375 300 fyr fyr Gla Gla Ale Ays ftp Asa Gin ¥11 Gla Gla Ils Bra fhr Mst 305 330 335 400

Gla Gla fyr Met Pro Val Ala Asa Val fhr Ssr Als fyr Ssr Mat Aaa 405 410 415

Ala fhr fhr Ssr Bhs Vel Gly Mst Gly Asp Ale Val fhr Ays Gla Ssr 420 425 430

Bhs Asp f rp Ils Bhs Ssr Ays Bro Ays Xla Val Arg Ma Ssr Ala Ils 435 440 445

Val Cys Arg Asa Mst Asp Asp Mat Vel Ssr Bis Ays Bhs Gla Gla Aye 450 455 460

Arg Gly Bis Val Ale Ssr Aim Vel Gia Cys fyr Mat Ays Gla Bis Gly 465 470 475 488

Ala Ssr Gla Gla Gla fhr Bis Asa Gin Bhs Hie Aye Gla Vel Arg Asp 485 430 435

Ale frp Ays Asp 11a Asa Gla Gla Cys Asa Ils Bro fhr Ala Val Prg 500 505 510

Met Pro Ils Ass Mst Arg Vel Asa Asa Asa Ala Arg Val Ils Asp vel 515 520 525

Ils fyr Aye Aea Gia Asp Gly fyr fhr Hie Ssr Gly fhr Vel Asa Aye 530 535 540

Asp Bhs Val fhr Ssr Mst Asa Ils Asp Bro Vel Bro Ils 545 550 555 <210> 21 <211> 562

<212> PRT <213> Santalum murrayanum <220> <223> Proteína sesquiterpeno sintase <3 0 0> <308> Uniprot F6M8H7.1 <309> 2012-10-03 <400> 21

Met Glu As« GX» Lys Met Pro lie Ser Get Val Pro As» Leo Ays Arp 15 10 IS

Leu As» Met lie Ser Arg Pro lie Ala Asa Phe Pro Pro Her lie Grp at) ' as 3 δ

Gly Asp Arg Phe lie Asn Tyr Thr Cys Glu Asp Sis As» Asp Gin Thr 35 ' U 45 G1» Lys 01« Arg G1» Val 01« Glu Leu lys 01« 01» Val Arg Arg 01« 53 SS 60

Le« Ala Ale Thr Val Asp Lya Pro teu Slu G1» leu As» He lie Asp 65 70 75 80

Ale Thr 01« Arg Xe» Gly lie Ala Tyr leu Phe 01« As» Glu lie 01« 85 00 §S

Glu $*t leu lye Ale lie Tyr Leu ale Thr tyt vai Glu Asa As» Cye ISO 105 110

Phe Glu Gly S«r Asp Asp Le« Tyr S«r Pal Ale Leu Grp PM Arg leu 115 120 125

Leu Arg 01« Asa Gly Tyr Lys Val Ser Cye Asp Val Phe As» Lys PM 130 13S 148

Arg Asp As» Glu Gly Asa Phe Lye As» Asa Leu Met Glu Asp Ala Lye 145 ISO 155 160

Gly Leu tea Glu Leu Tyr Glu Ala Thr Sis Val Ser lie His Sly Slu 165 170 175

Glu Met Leu -Sep Asp AlS Leu Slu PM Thr Lye Thr Arg Leu Slu Set ISO 185 130

Vsl Val Get Hie Leu Asa Tyr Pro Leu Ala Glu Gin Val Arg His Ala 135 200 205

Leu Tyr Sir* Pro Leu Hie Arg Sly Leu Pro Arg Leu Slu Ala Val Tyr 210 215 228

Phe Phe Arg He Tyr Gla Ala Hie Ala Her His Asa Lye Al® Leu Leu 225 230 235 ' 240

Lys Leu Ala iys Leu Asp Phe Asa Leu Leu Gin Per Phe His Ays Lyss 245 250 255

Giu leu Per Asp He Ala Arg Trp Trp Lye Set Leu Asp Phe Ala Ala 260 265 270

Lys Phe Pro Phe Als Arg Asp Arg Leu Val Glu Gly Tyr Phe Trp Val 275 200 285 leu Gly Val Tyr Phe Glu Pro Gin Tyr Her Leu Ala Arg Lys He lie 230 235 308 lie Lya Val PM Thr Met He Ser Thr lie As» Asp He Tyr Asp Ala 305 310 SIS 320

Tyr Gly Thr Leu As» 01« Leu Lya Leu PM Thr Lya Ala Met 01» Arg 325 $30 335

Trp Asp Val Gly Her Leu Asp 31« Leu Pro Glu Tyr Met Lys Pro Cys 340 345 350

Tyr Lys Ser He Leu Asp Vsl Tyr As» Glu lie Glu Glu Glu Met Ala 355 360 305

As» G1» Gly Per Leu Phe Arg Met His Tyr Ala Lya Glu val Met Ly® 370 375 380

Thr He Val Glu Sly Tyr Mat Asp Glu Ala Lys Trp Cys His Glu Lys 385 380 335 400

Tyr Val Pro Thr Phe Gla Giu Tyr Met Per Vai Ala Leu Val Thr Ser 405 410 415

Gly Tyr Thr Phe Leu Thr Thr 11« Her Tyr Leu Gly Met Gly Glu He 420 425 430

Ala Her Lys Glu Ala Phe Asp Trp Leu Phe Her His Pro Pro Val lie 435 440 445

Glu Ala Set Glu Her Val Gly Arg Leu Met Asp Asp Met Arg See His 450 455 480

Lys Phe 01« Gla Glu Arg Gly His Vai Ala Her Gly He Glu Cys Tyr 465 470 475 480

Met Lya G1» Tyr Gly val Thr Glu Giu Glu Ala Hie Asp Glu Phe Arg 485 430 485

Lye Arg Leu Val Lye Ala Trp Lys Asp lie Asa Glu Qlu Cys Leu Arg SOO SÔS 5L0

Fro Tyr Arg Val Fro lys Fro leu Leu Thr Arg lie Leu Asa Leu Thr SIS 520 52S

Arg val lie Arp Val lie fyr Lye Are <31e Mp My fyr Liter Sis Val 530 535 54Q

Lye Ays Ala Met Lye Asp Asa He Ala Ser Leu Leu lie Asp Fro Val S45 $50 555 S€0 lie Val

<210> 22 <211> 550 <212> PRT <213> Ricinus communis <220> <223> Proteina (+)-delta-cadineno sintase <3 0 0> <308> GenBank EEF38721.1 <309> 2009-02-12 <400> 22

Met Ser Ala G la Thr lea Ala He Ser Asn Leu Lys Pro Asn Thr Thr i 5 10 IS

Arg Mi leu Ale Ser Phe His Pro Aon lie Trp Sly Asp Aug Phe leu 20 23 30

Her €ys Ala Ala Glu Ser Thr Asp lie <31« Asp Asp Met. Glu Gin Sin 35 40' 45 val Glu Arg Leu lips Giu Sin val Lys Lys Met lie Ala Sen Ala Asp SO 55 «0

Giu Pro Ser Gin Ik Leu Asa Leu He Asp leu Leu Gin Arg Leu Sly PS 70 IS 00

Val Ser Tyr Hie Phe Glu lye Glu He Giu Glu Ala Leu Si a Gin Val S3 90 95

Leu Aen Met Asn Her Asp Per Asp Ays Asp Asp Asp Leu His Ser Val 100 105 HO

Ala leu Arg Phe Arg Leu Leu Arg Glu Glu Sly Leu Asn Val Her Cys 1XS 120 125

Asp Val Phe Asa Lye Phe Arg Asp Arg Aen Gly Sis Phe He Sia The 130 135 140 leu Lye Hr Asp Leu Sin Gly Met Leu Ser Leu Tyr Slit Ala Ale His

145 130 155 ISO

Phe Arg val His Gly Sin Gly He Leu Asp Asp Ala Lea Ala Phe Thr IPS 170 175

Thr Thr Tyr Leu Glu Her He Val Pro Asn Leu Ser Pro Pro Lou Ala 100 103 190

Ale Glu He Ser Arg Thr Leu Arg Glu Pro Leu Arg Lys Her Leu Ala 195 200 205

Arg Val Glu Ala Arg His Phe He Ser He Tyr Gin ©1« Asp Thr Her 210 215 220

His Asu Glu Val Leu Leu Thr Phe Ala Lye Leu Asp Phe Asn Leu Len 225 230 235 240

Glu Lys Leu Bis Sin Lys Sin Leu Lys Tyr He Ser Leu Trp Trp Lys 24S 250 255

Asp Leu Asp Phe Val Asn Lys Leu Pro Phe Thr Arg Asp Arg Pel Val 200 205 270

Glu Gly Tyr Phe Trp He Lea Gly Val Tyr Phe Glu Pro Gin Tyr His 273 200 205

Arg Ala Arg Lys Phe Val Thr Lys Val lie Asn Val Val Her Val lie 290 2SS 300

Asp Asp 11« fyr Asp Ala Tyr Oly Thr Asa OXa 01a Asp Val Val F&« SOS 310 SIS 330 fOr Asp Ala IXs Asa Arg frp Asp Xls Asp Oys xls Asp OXa Asa Asa 325 330 335 OXa lyr Mat Ays Val Oys Tyr Ays Ala Asa Asa Asa val Tyr 01« 01« 340 345 350

Sis 01« Ary AX a Ass Ssr 01u 01« Oly Arp Ear Syr Arg Ass His Tyr 355 MO 365 AXa Ays 01« Ala Met Ays Ays Ae« Val OXa AXs Tyr Asa Val 01« Ala 370 375 380

As« Arp Mat Asa Ays Asa Tyr val Fro Thr Met Asp OXa Ayr Mat Ssr 385 330 335 400 IXs Ala As« Val Ssr Oys Ala Ayr Pro As« As« Thr Val Thr Ssr Fhs 405 4X0 410

Val Oly Mst Oly Asp IXs Ala TAr Ays 01« Val Phs Asp Trp AXa Ear 420 405 430

Asa Asp Frs Ays IIs Val Arg Val Ala Ear IXs Xls Oys Arg As« Mot 435 440 445

Asp Asp Xls Val Oar His 01« PAs OX« 01« Ays Arg Oly His Xls Ala 450 455 400

Ear Ear Val 01« Oys Tyr Mat Ays 01s Ass Oly Val Ear 01« 01« Ala 465 470 475 400

Thr Arg Asp 01« Fhs Ass Ays 01« iXa Val Asp Ala Trp Ays Asp Xls 435 4E0 435

Ass 01» OX« His Asa 01a Fro As« fyr Val Fro Mat Pro FAs Arg fhr 500 505 510

Arg Val Val Ass Ear Ala Arg Ila Mat Asp Tyr Las fyr Ays Asp Asp 5X5 520 525

Asp 01« fyr fAr His Val Oly 01« Aa« Mat Ays Oly Esr Val Ala Ala 530 535 540

Aa« A«« Xls Asp Fra Ala 545 550

<210> 23 <211> 562 <212> PRT <213> Citrus X paradisi <220> <223> Proteina delta-cadineno sintase <3 0 0> <310> US7273735 <311> 2007-09-25 <400> 23 S®» As® 31® vai Ssr Ale Fsr Fr» All Ays Vai 11¾ 31» As» AI» 15 10 15 31 y Ays Asp S®r Thr Arg Arg S®r Ais A®» Ayr Hl® Fr» §®r XI® Trp 20 25 30

Gly A$p Bi® Fh» As® SI» Tyr Thr Cy$ Asp TAr 31» 31» Thr Asp Asp 35 m 45 >31y S®r Asn ¥®1 Ays His A®» 31« A®» Ay» Ay® 31« XI® Arg Arg Mat 50 55 60 A®» Ays Ala Asp As® Ays Fr» Ssr Arg Ihr As® 31» As® II® Asp A1&

65 70 75 SO lis 31» Arg A®» 31y V®A $®r Ayr His Fh» 31« S®r 31» XI® A®g Gl« 65 00 05 XI® A®« Gly Ays Mst His Ays Ala Ssr 31» Asp Ssr Asp As® Cys Asp 100 105 110

As» 31» As» Asp 31» A®» Tyr Ayr XI® 0®r L®« Eis FE® &rg A®» A»» 115 120 125

Arg Glu Asa Gly Tyr Lys 11¾ Ser Ala Asp ¥al Phe Lys Lys Phe lys 130 135 140

Asp Thr Asp Gly Asn Phe lys Thr Ser Leu Ala Lys Asp ¥al Arg Gly

145 ISO 155 ISO

Met teu Ser 1*®« Tyr Glu Ala Thr Eis Leu Gly ¥al Sis Glu Giu Asp XSS 170 175

lie Leu Asp Glu Ala Leu Ais Phe Thr Thr Ser Sis Leu Glu Ser XI® ISO 125 ISO

Ais Thr Eia Gin lia Arg Ser Pro Leu Vai Glu Gin Vai Lys Eis Ala 125 200 205

Leu ¥sl Gin Pro lie His Arg Gly Phe Gin Arg' Leu Gin Ais Arg Gin. 210 2X5 220

Tyr He Pro lie Tyr Gin Giu Gin Ser Pro Hie As π Gin Ais Leu Leu 223 230 233 240

Thr Phe Aia Lys Leu Asp Phe Aan Lys Leu Gin Lys Pro Eis Gin Lys 243 230 2S3

Giu Leu Gly Asp ile Ser Arg Trp Trp Lya Gin Leu Asp Phe Ala Mis 200 £65 £70

Lys Leu Fm Phe lie Arg Asp Arg Vai Ale Gin Cys Tyr Phe Trp lie 273 220 225

Leu Gly Vai Tyr Fhe Glu Pro Gin Tyr Ser Phe Ala Arg Arg lie Leu 230 223 300

Thr Lys Vsl lie Ser Met Thr Ser Vai lie Asp Asp lie Tyr Asp Vel 303 310 313 320

Tyr Gly Lys lie Glu Glu Leu Glu Leu Fhe Thr Ser Ala Ile Glu Arg 323 330 333

Trp Asp Ile Ser Ala lie Asp Gin Leu Fro Glu Tyr Met Lys Leu Gys 340 343 330

Tyr Arg Ala Leu Leu Asp Vai Phe Ser Glu Ala Glu Lys Asp Leu Ala 335 360 365

Pro Gin Gly Lys Ser Tyr Arg Leu Tyr Tyr Ala Lys Glu Ais Met Lys 370 375 320

Asn Met Vsl Lys Asn Tyr Phe Tyr Giu Ala Lys Trp Cys Leu Gin Asn 323 330 335 400

Tyr val Pro Thr Vsl Asp Glu Tyr Met Thr Vai Ais Leu Vai Thr Ser 403 410 415

Gly Ser Pro Met Leu Ser Thr Thr Ser Fhe Vai Gly Met Gly Asp Ile 420 423 430

Vsl Thr Lys Glu Ser Phe Glu Trp Leu Phe Ser Asn Pro Arg Phe lie 435 440 445

Arg Ala Ser Ser ile Vai Cys Arg Leu Met Asp Asp Ile Vai Ser Sis 430 433 460

Lys Phe Glu Gin Ser Arg Gly Sis Vsl Ale Ser Ser Vai Glu Cys Tyr 465 470 475 420

Met Lye Giu Eis Gly Ala Thr Giu Giu Giu Ais Cys Asn Glu Phe Arg 423 430 435

Lya Glu Vai Ser Asn Ala Trp Lys Asp lie Asn Glu Asp Cys Leu Arg 500 505 510

Pro Thr Vai Vai Pro Met Fro Leu Leu Met Arg lie Leu Asn Leu Thr SIS 520 523

Arg Vai lie Asp Vai ile Tyr Lys Tyr Glu Asp Gly Tyr Thr Eis Ser 530 535 340

Aia Vai Vai Leu Lys Asp Fhe vai Ala Ser Leu Fhe ile Asn Pm vsl 545 550 555 560

Pro ile

<210> 24 <211> 548 <212> PRT <213> Nicotiana tabacum <220> <223> Proteína 5-epi-aristoloceno sintase do tabaco <3 0 0> <308> GenBank L04680.1 <3 0 9> 1994-06-27 <400> 24

Met Ala Sor Ala Ms Val Ala As» Tyr Glu Glu Glu 11¾ Val Arg Fro IS IS IS

Val Ala Asp Fhe Ser Pro Ser Lou Trp Gly Asp Glu Fhe Leu Gar Fhe 20 25 38

Got 11« Lys Asa Glu Val Ala Glu Lys Tyr Ala Lys Glu Ha Glu Ala 35 40 4S

Lou Lys Glu Gin Thr Arg Asu Met Lon Lou Ala Thr Gly Mot Lys Leu SO S5 00

Ala Asp Thr Loo Aon Lou He Asp Thr lie Glu Arg Loo Gly He Ser

85 70 75 SO

Tyr Hie Fhe Glu Lys G1» Ho Asp Asp Ho Loo Asp Gin Ho Tyr Aon 35 90 95

Gin Aon Son Asn Cys Aon Asp Lou Cys Thr Sor Ala Lou Gin Fho Arg 100 105 HO

Lou Leu Arg Gin His Gly Fhe Asn Ho Son Fro Glu Ho Fho Son Lys 115 125 125

Fhe Gin Aap Glo Asn Gly Lys Fho Lys Glu Ser La» Als Sot Asp Val 130 135 140

Leu Gly Lou Lou Asn Leu Tyr Glu Ale Ser Hi* Vfcl Arg The His Ala 145 150 155 150

Asp Asp lie Leu G1» Asp Ala Leu Ala Fho Sor Thr Ilo Sis Lo» Gin 105 170 175

Son Ala Ala Fro His Lou Lys Ser Fro Lou Arg Glu Gin Val Thr Sis im 155 ISO

Ala Leu Glu Gin Gys Leu Sis Lys Gly Val Fro Arg Val Glu Thr Arg 155 200 205

She Fho Ho Sor Sor Ilo Tyr Asp Lys Glu Glu Sor Lys Aon Asn Val 210 215 220

Lou Lon Arg Fho Ala Lys Lon Asp Fho Asn Lon Leu Glu Mot Lon His 225 230 235 240

Lys Gin Gin Leu Ala Gin val Set Arg ftp Trp Lys Asp Lou Asp Fhe 245 250 255

Val Thr Thr Leu Fro Tyr Ala Arg Asp Arg Val Val Gin Cys Tyr Fhe 250 255 270

Trp Ala Lo» Gly Val Tyr Fho G1» Fro Gin Tyr Sor Gin Ala Arg Val 275 280 285

Mot Lon Val Lys Thr Ho Sor Mot He Sor Ho Val Asp Asp Thr Fho 280 295 300

Asp Ala Tyr Gly Thr Val Lya Glu Leu Glu Ala Tyr Thr Asp Ala He 305 310 315 320

Gin Arg Trp Asp He Asa Glu Ho Asp Arg Leu Fro Asp Tyr Met Lys 325 330 335

He Ser Tyr Lya Ala He Leu Asp Lon Tyr Lys Asp Tyr Gin Lys Glu 340 345 350

Leu For For Ale Gly Arg Ser His He Vel Cys His Ale lie Glu Arg 355 350 385

Met Lys Gin Vel Val Arg Asn Tyr Asn Val Gin Sor Thr Trp Fho lie 370 375 300

Glu Gly Tyr Thr Fro Fro Val Ser Gin Tyr Lou Ser Asu Ala Lou Ale 385 390 395 400

Thr Thr Thr Tyr Tyr Tyr Leu Ala Thr Thr Ser Tyr Len Gly Met Lys 405 ' 410 ' ' 415

Ser Ala Thr Glu Gin Asp Fho Gin Trp Leu Ser Lys Asa Fro Lys Ho 420 425 430

Len Glu Ala Ser Val He He Cys Arg Val He Aap Asp Thr Ala Thr 435 44S 445 fyr Sla Val Giu Ays Per Arg Sly Sin He Ala fhr Sly Xla Sin Cys 458 455 488

Cys Met Arg Asp Tyr Sly 11« Ssr TAr Ays GXs Ala. Met Als Ays Pha 485 470 475 480

Gin A$o Mat Als Gin XAr Als Trp Ays Asp I Is As» Sis Gly Leu Xt&u 485 430 455

Arg Pro Thr Pro Vai Sar Thr Giu Pâe Ass thr Pro Xla Leu Asm Aau 588 555 518

Ala Arg Xla Val Slu Val Thr Tyr Xla Sis As» Aau Asp Sly Tyr Thr 515 538 525

Sis Pro Glu Lys Val Ass Lys Pro His lie Xla Ass Aeu La» Val Asp 538 535 548

Sar lie Lys Xls 545

<210> 25 <211> 520 <212> PRT <213> Hyoscyamus muticus <220> <223> Proteína premnaspirodieno sintase <3 0 0> <308> GenBank AAA86337.1 <3 0 9> 1996-01-30 <400> 25

Vai Asp Άβπ Gin Vai Ala Glu Lys Tyr Ma Gin Glu lia Gin Thr Len IO 15

Lys Gin Gin Thr Ser Thr Met Leu Ser Ma Ma Cys Gly Thr Thr Leu 20 25 30

Thr Glu Lys Len lia Lee Xle Asp Ile Xle Glu &rg Ma Gly Xle Ma 35 40 45

Tyr His She Gin Lys Gin lie Gin Asp Mat Leu Asp His lie Tyr Arg 50 55 50

Ala Asp Pro Tyr Phe Gin Ala His Gin Tyr Asn Asp Mn Asn Mr Ser 55 70 75 §0

Ser Vai Gin Phe Arg Len Leu Arg Gin His Gly Tyr àss Vai Ser Pró S3 30 35

Asn lie She Ser Arg Phe Gin Asp Ala Asn Gly Lys Phe Lys Gin Ser 100 105 110 lêts &rg Ser Asp lie Arg Gly Len Len Asn Len Tyr Gin Ala Ser Sis 115 120 125

Vai Arg Thr Mis lys Gin Asp Xle Len Gin Gin Ala Len Vai Phe Ser 13Ô 135 140

Vai Gly Hl» Len Glu Ser Ala Ala Aro Eia Len Lys Ser Aro Len Ser

145 150 155 ISO

Lya Gin Vai Thr Hia Ala Leu Glu Gin Ser Leu Eia Lys Ser lie Pro 1S5 170 175

Arg Vai Gin Xle Arg Tyr Phe Xle Ser Xle Tyr Gin Gin Gin Gin Phe 180 ' ' 185 ' 130

Lys Asn Asp Len Leu Len Arg Phe Ala Lys Len Asp Tyr Asn Len Leu 135 200 205

Gin Met Len lis Lys His Glu Len Ser Gin Vai Ser Arg Trp Trp Lys 210 215 220

Aap Len Aap Phe Vai Thr Thr Len Pro Tyr Ala Arg Asp Arg Ala Vai 225 230 235 240

Gin Cya Tyr Phe Trp Thr Met Gly Vai Tyr Ala Gin Pro Gin Tyr Ser 245 250 255

Gin Ala Arg Vai Met Len Ala Lys Thr Xle Ale Met lie Ser Xle Vai 260 285 mo

Asp Asp Thr Fhe Asp Ala Tyr Sly lie Val Ays Glu Aea Gla Val Tyr 27$ 220 28$

Thr Asp Ala 11« Sin Arg Trp Asp He Far 81« 11« Asp Arg Aa« Pro 290 295 300

Gla Tyr Met Ays He Ser Tyr Ays Alá Asa Asa Asp lea 'Ayr Asp Asp 305 310 315 320

Tyr Glu Ays Glu Asa Ser Ays Asp Gly Arg S«r Asp Val Val Sis Ayr 325 330 335

Ala Aya Gla Arg Met Ays Gla 11« Val Gly Asa Ayr Fhe Xls Gla Gly 340 345 350

Ays Trp Aha 11« Gla Gly Ayr Met Fro Ser Val S«r Gla Ayr Asa Ser 355 300 365

Asa Ala Asa Ala Thr Ser Thr Tyr Tyr Asa Asa Thr Thr Thr Ser Tyr 330 375 300

Asa Gly Mst Ays Ssr Ala Thr Ays Gla His Fhe Gla Trp A«« Ala Thr 385 390 395 400

Asa Fro Ays Xls Asa Gla Ala Asa Ala Thr Asa Cys Arg Val Val Asp 405 410 415

Asp Ala Ala Thr Tyr Gla Val Gla Ays Gly Arg Gly Gla 11« Ala Thr 420 425 430

Gly 11« Gla Cys Tyr Met Arg Asp Tyr Gly Val Ser Thr Gla Val Ala 435 440 445

Met Gla Ays Fhe Gla Gla Mat Ala Asp Xla Ala Trp Ays Asp Val Asa 450 455 400

Gla Gla 11« Asa Arg Pro Thr Fro Val Ser S«r Gla 11« Asa Thr Arg 465 470 475 480

Xls Aea Asa Aea Ala Arg 11« 11« Asp Val Thr Tyr Ays His Asa Gla 405 ” 490 495

Asp Gly Tyr Thr Mia Pro Glu Ays Val Asa Ays Fro His 11« Xls Ala 500 505 510

Asa val Val Asp 5«r Xla Asp 11« 515 520

<210> 26 <211> 548 <212> PRT <213> Citrus X paradisi <220> <223> Proteina valenceno sintase <3 0 0> <310> US7273735 <311> 2007-09-25 <400> 26

Met Sar §#r Sly Sis ffe-r Ph& Arg Px® Ψίαχ Ala &$p Fh® Hi$ Fro $ar

I 5 10 IS A®« Arp Arg Asa His Fh® A®u Ays Sly Ma S®r Asp Fh® Ays Thr ¥al

as as SO

Asp His Tbs Ala Thr Gl® Glu Arg His Giu Ala Has Ay® Giu Sis ¥al 35 40 45

As® Arg Mat Si® Thy Asp Ala Sir Asp Ays Fr® Val Gla Ays Aos Arg 50 $s m

Las lie Asp Ols Val Ola Arg Las Sly Val Ala Tyr Hi a Fh® Sis Ay a

65 10 75 SO

Sits lie Sis Asp Ala lie Sis Ays Ass Cys Fro Asa Tyr il® His Ssr as 30 as

Asa Sar Fro Asp Has His Thr val Sar las Sis FAs Arg Leu Has Arg 100 105 110

Sis Ola Sly lie Ays Ho Ser Cys Asp Val The Sis Ays She Ays Asp 115 12# 125

Asp Gla Gly Arp Fhe Ays Ser Ser Lea 11¾ As» Asp Val Gla Gly Met 130 135 140

As» Ser Aeu Tyr Gla Ala Ala Tyr Met Ala Val Arg Gly Gin His 11¾ 145 150 155 150

Asm Asp Gla Ala He Ala Pfe* Thr Thr Thr His Aeu Ays Ser Aeu VA3. 105 17# 175

Ala Gin Asp His Val Thr Fro Ays tea Ala Gla Gin lie Asa His Ala

18# 185 ISO

Asa Tyr Arp Fro Aaa Arp Ays Thr Asa Fro Arg Asa Gla Ala Arg Ayr 155 2#0 .205

Phe Mot Ser Mat lie Asa Hat Thr Ser Asp His Asa Tyr Asa Ays Thr 210 215 22#

Asa Ass Asa Pho Ala Ays Asa Asp Pas Asn Ila Asa Ass Gla Asa His 225 230 255 240

Ays Gin Gla Asa Asa Gla Asa Thr Ays Arp Arp Ays Asp Asa Asp Fhe 245 250 255

Thr Thr Ays Asa Fro Tyr Ala Arp Asp Arp Asa Val Gla Asa Tyr Phe 20# 285 270

Trp Asp Asa Gly Thr Tyr Phe Gla Pro Gin Tyr Ala Phe Gly Arg Ays 275 2#0 285

Ils Met Thr Gla Asa Asa Tyr Ils Asa Hat lls lls Asp Asp Thr Ayr 250 255 300

Asp Ala Ayr Gly Thr Asa Gla Gla Asa Her Asa Phe Thr Gla Ala Val 305 810 318 320

Gla Arg Trp Asa lls Gla Ala Val Asp Met Asa Fro Gla Tyr Met Ays 325 ' 330 * 335

Asa He Tyr Arg Thr Aee Asa Asp Als Phe Asa Gla ils Gla Gla Asp 340 345 350

Mat Ala Ays Gla Gly Arg 8er Bis Gys Val Arp Tyr Ala Ays Gla Gla 355 360 365

Asa Gin Ays Val Ils Gly Ala Tyr Ssr Val Gla Ala Ays Tap Phe Ssr 370 ' 375 380

Gla Gly Tyr Val Pro Thr Ils Gla Gla Tyr Mat Pro Ha Ala Asa Thr 385 380 385 400

Her Gys Ala Tyr Thr Fhe Val Ils Thr Asa Her Phe Asa Gly Met Gly 405 410 415

Asp Fhe Als Thr Ays Gla Vsl Fha Gla frp Ho Ser Asn Asn Fro Ays 420 425 430 val Val Ays Ala Als Her Vsl Ho Gys Arg Asa Mot Asp Asp Mot Gla 435 440 445

Gly His Gla Phe Gla Gla Ays Arp Gly His Val Als Hex Ala Ho Gla

450 455 4SO

Cys Tyr Thr Ays Gin His Gly Val Ssr Ays Glu Gla Ala Π® Ays Met 465 470 475 480

Fhe Gla Gla Gla Vsl Ala Asn Ala Vrp Ays Asp Ho Asn Gla Gla Asa 485 48# 485

Mst Met Ays Fro Thr Val Val Ala Arp Fro Asa Asa Gly Thr Ils Asa 500 505 510

Asn Asa Als Arp Ala 11® Asp Phe Π® Tyr Ays Gla Asp Asp Gly Tyr 515 520 525

Thr His Her Tyr Aoa II® Ays Asp Gla He Ala Her Val Asa Gly Asp 53# 535 54#

His Val Pro Pho 545

<210> 27 <211> 548 <212> PRT <213> Citrus X paradisi <220> <223> Proteina valenceno sintase <3 0 0> <310> US7442785 <311> 2008-10-28 <400> 27

Met Ser Ser Giy «SI» fhr She Arg Pro Thr Ais As» She His Pro Sor I 5 10 IS

Leu frp Arg Asa His she Leu Lys Gly Ais Ser Asp Phe lys fhr vai SO as 30

Asp His fhr Ais Thr Gin Glu Arg His Glu Ais Leu Lys Glu Glu Vai 35 40 45

Arg Arg Met lie fhr Asp Ala Glu Asp Lys Pro Uai Gin Lys Leu Arg SO SS 60

Leo 11« Asp Giu Vai Gin Arg Leu Gly Vai Ala fyr His PA® Glu Lys €5 ?0 75 00

Gin lie Giu Asp Ala tie Leu Lys Leu €ys Pro lie fyr tie Asp Ser

SS 30 SS

Asn Arg Ala Asp leu Sis thr Vai Ser Leu Sis Phe Arg Leu Leu Arg 100 105 U0

Gin Gin Gly tie Lys lie Ser €ys Asp Vai the Glu Lys She Lys Asp 115 120 125

Asp Glu Gly Arg She Lua Ser Ser Leu Xle Asn Asp Vai Gin Glu Met 130 135 140

Leu Ser Leu fyr Gin Ala .Ala fyr Met Ala vai Arg Gly Gin His lie 145 ISO 155 150

Leu Asp Glu Ala He Ala Phe Xhr Thr fhr Sis Leu Lya Ser Leu Vai 165 170 175

Ala Gin Asp Sis Vai fhr Pro Lya Leu Ala Glu Gin lie Asn Eis Ala 100 185 ISO

Leu fyr Arg Pro Leu Arg Lya fhr Leu Pro Arg Leu Glu Ata Arg fyr 135 200 205

Phe Met Ser Mat Xle Asn Ser fhr Ser Aap Sis Leu fyr Asn Lys thr 210 215 220

Leu Leu Asa Phe Ala Lys Leu Asp Phe Aau lie Leu Leu Glu Pro Sis 225 230 235 240

Lya Glu Glu Leu Asn Glu Leu fhr Lya frp frp Lya Aap Leu Asp Phe 245 250 255 fhr fhr Lya Leu Pro fyr Ala Arg Aap Arg Leu Vai Glu Leu fyr Phe 260 265 270 frp Aap Leu Giy thr fyr Phe Gin Pro Gin. fyr Ala Phe Gly Arg Lys 275 280 285

Xle Met fhr Gin Leu Aan fyr tie Leu Ser Xle Lia Asp Asp fhr fyr 230 235 300

Asp Ala fyr Giy fhr Leu Glu Glu Leu Ser Leu Phe fhr Glu Ala Vai 305 310 315 320

Gin Arg frp Asn Lie Glu Ala Vai Aap Met Leu Pro Glu fyr Met Lya 325 330 335

Leu tie fyr Arg thr Leu Leu Asp Ala Phe Aan Glu Xle Gin Glu Aap 340 345 350

Met Ala Lys Gin Giy Arg Ser His Cya Vai Arg fyr Ala Lya Giu Glu 355 350 355

Asn Gin Lya Vai lie Gly Ala fyr Ser Vai Gin Ala Lys frp Phe Ser 370 375 380

Giu Gly fyr Vai Pro fhr tie Glu Gin fyr Met Pr» fie Ala Leu fhr 385 330 335 400

Ser Cys Ala fyr fhr Phe Vai Xle fhr Aan Ser phe Leu Gly Met Gly 405 4X0 415

Aap Phe Ala fhr Lya Glu Vai Phe Glu frp Xle Her Asn Asn Pro Lys 420 425 430

Vai Vai Lya Ala Ala Ser Vai Xle Cys Arg Len Met Asp Aap Met Gin 435 440 445

Sly His Qln Phe Gin 01» Lye Arg Sly His Val Ala Ser Ala lie Ola 450 455 4m €ys Tyr The Lys Gin His Gly Yel See Lys Gin Gin Me He Lye Met 465 470 470 4S0

Ffee Gie Gin GX« Vai Hia Asn Ale Tap Lys Asp lie As» Gla GXe As» 485 490 485

Met Met Lys Fro The Vel ¥al Ale Arg Pro Lee Leu Gly Thr He I*®» 500 505 SIC

Aen Leo Ale Arg Ale He Asp Phe lie Tyr Lye G1» Asp Asp Gly Tyr 515 520 525

Thr His See Tyr Leo He Ays Asp Gin 11« Ale Ser Val Lee Gly Asp 530 535 540

Bis val Fro Phe 545

<210> 28 <211> 556 <212> PRT <213> Vitis vinifera <220> <223> Proteina valenceno sintase <3 0 0> <308> Uniprot Q6Q3H2 <309> 2011-09-21 <400> 28

Met Ser thr Sin Val Set Me Her Ser Lee Me Sin lie Fro Sin fro 15 10 15 tys Aon Arg Pro Val Ala Ann Phe Mia Pro Aon lie frp Sly Asp Sin 20 25 30

Pha lie S&r fyr fhr Pro Sin Asp tys val f&r Arg Ala Cya Aye Sin 35 m m

Sin Sin lie Sin Asp ten tys Lys Sin Val Lys Arg tys Sen Thr Ala 50 55 50

Ala Ala Val Ala Asa Pro Sar Sin Ann ten Aon Phe He Asp Ala Val 55 70 75 30

Sin Arg Ann Sly Val Ala fyr Mia P5e Sin Sin Sin U« Sin Sin Ala 55 00 35 tan Sin Sis lie Sys Aan Per Phe His Asp Cya Aen Asp Mat Aap Sly 100 105 110

Aap ten fyr Aan lie Ala ten Sly she Arg ten ten Arg sin sin Sly 115 120 I2S fyr fAr He Her Sys Asp tie Phe Asn Lys Phe fhr Asp Sin Arg Sly 130 135 1*0

Arg Phe tys Sin Ala lan lie Her Asp Val Arg Sly Mat ten Sly tan 145 ISO 155 100 fyr Sin Ala Ala Si» ten Arg Val His Sly Sin Aap lie tan Ala tys

MS 170 I7S

Ala ten Ala Phe Thr fhr Thr Mia ten tys Ala Met Val Sin Ser ten ISO 185 130

Sly fyr His tan Ale Sin Sin Val Ala His Ala ten Aen Arg Pro lla 135 200 205

Arg tys Sly ten Sin Arg ten Sin Ala Arg frp fyr tie Ser Val fyr 210 215 220

Sin Asp Sin Ala She Hia Aap tys Thr ten ten Sin tan Ala tys tan 225 230 235 240

Aap Phe Asa ten Val Sin Ser ten Hia tye Sin Sin tan Her Asn tan 245 250 255

Ala Arg Trp frp tys Sin ten Asp Pha Ma fhr tys ten Pro Pha Ala 250 2€5 270

Arg Asp Arg teu Vai 01» Oly Tyr Phe Trp Mat Bis Oly Vai Tyr Phe 235 200 265 02» Pro Gl» Tyr te» Arg Gly Arg Arg 11« La» Thr Lys Vai 11« Ma 290 295 300

Met Thr §«r 21« h«# Asp Asp 22« Bis Asp Ma Tyr Oly Thr Pro 01« 305 310 315 320

Gl» La» Lys teu Pba 11« 02« Ala 11« Gl» Arg Trp Mp 11« Aa» Sar 325 330 333

22# Asn Gin t«v Pro 01« Tyr Met tya L«« Oye Tyr Vai Ala L«« L#« 340 345 35Q

Asp Vai Tyr Lys 02» 21« 01# Glu G2« Mat 01« tys Gl» Oly As» 02« 355 360 365

Tyr Arg Vai Bis Tyr Ala Lys 01» Vai Met Lya Aso 02# Vai Arg A2a 330 335 330

Tyr Phe Ala Olu Ala Lys Trp te# Eis Glu 01« Bi# Vai Pro Ala Phe 335 330 355 400 01» 01» Tyr Met Arg Vai Ma L«» Ala Ser Ser Oly Tyr Cys te» te» 405 410 415

Ala Thr Thr Ser Phe Va.2 Oly Mat Gly Olu 11« Ala Thr Lya Olu Ma 430 455 430

Pha Asp Trp Vai Thr Ser Asp Pro Ays 21« Mat 5«r Ser Ser As» Phe 435 440 445

Xl« Thr Arg teu Met Asp Asp 11« Lya Ear Sis Lya 2%« Gl» Gl# Lys 450 455 460

Arg Oly His Vai Thr Ser Ma Vai 01» Cys Tyr M#t Lys 01» Tyr Oly 465 470 475 400

Vai Ser Gl# Gl» 02» Vai Tyr S«r 01» Fhe 01« Lya 01» 12« Olu Ase 4SS 490 435

Ala Trp Le# Asp lie As» 02# 02» Cys Leu Lys Pro Thr Ma vai Ser 500 505 520

Mat Pro La» te# Ala Arg La» teu As» Pha Thr Arg Thr Met Aap Vai 515 520 525 22« Tyr Lys 01« 01» Aap Ser Tyr Thr His Vai Oly tys Vai Met Arg 530 535 540

Asp Aa» 21« Ma Ser Vai Phe 21a Aa» Ala Vai 21« 545 550 555

<210> 29 <211> 589 <212> PRT <213> Chamaecyparis nootkatensis <220> <223> Proteína valenceno sintase <400> 29

Met Ma. Ma Met PSa Ma Sly Ma Ser Ser Ma Asp Ely Ser Ser Cys 15 10 15

Met Mo Vai lys Asp Mia Mau Arg Arg Thr Ely Asa Sis Sis Sro Asa ao 25 S0

Sea srp lAr Mp Asp SAe 11« Ela Ser Lee Asa Ser Pm Vyr Ser Asp 35 40 45

Ser Ser fyr Els Eye Eis Arg Ma lie lea lie Asp Ma lie Arg Map 50 55 50

Met SAe Ser Ma Ely Sis Ely Asp Ela PAe Ely Vai Ma Ela Asa Xle 55 70 75 80

Esp phe Vai Map Vai Vai Ela Arg lea My lie Aap Arg Sis She Mn 85 80 85

Ela Mn lie Lya lAr Ala Lea Asp Tyr lie fyr Lys She Trp Asa Sis 100 105 110

Asp Ser lie She Ely Asp lea Asa Met Val Ala lea Ely She Arg lie 115 180 125

Aan Arg Leu Asn Arg Cyr Vai Ala Ser Ser Asp Vai Phe Ays Ays Phe 130 135 140 lys Sly Gin Giu Sly Gin Phe car Giy Ph® Gin Car 5ar Asy> Gin Asp 145 ISO 155 1 m

Ala Ays leu Gin Met Mat- Aen Asn Aen Tyr Ays Ale Her Gin Ann Asp 185 17G 175

Phe Pro Asp Gin Asp lie Aen Ays Gin Ala Arp Ala Phe Ala Ser Mat

180 185 ISO

Tyr Ann Ays His ¥al Us Ays Gin Tyr Giy Asp lie Gin Gin Sen Ays 135 200 20.3

Asn Pro Ann Aon Mat Gin 21a Gin Tyr Thr Phe Ays 'Ayr Pro Trp Arg 210 215 280

Cys Arg Aen Pro Arg Aon Gin Ala Trp A$n Ph® I la His 2 la Mat Arg 225 230 235 240

Gin Gin Asp Cys Asn 21s Car Asn Ala Asn Asn Aan Ayr Ays 21s Pro

245 250 2SS

Ays lie Tyr Mat Ays Ays Xig Asn Gin Asn Ala Ila Asa Asp Phs Asn 2 m 255 270 II® Aan Gin car Gin His Gin Hia Gin Mat Ays A®n xla Has Thr Trp 275 280 285

Trp Ays Asn Her Her Ala lie Gin Aan Asp Fhe Phs Arg His Arg His 280 285 300

Tie Gin Gar Tyr Phs Trp Trp Ala Gar Pro Aan Phs Gin Pro Gin Phe 305 310 315 320

Car Thr Cys Arg 11s Aan Cys Thr Ays Aan Her Thr Ays Mat Phe Asn 32S 330 335

Aan Asp Asp lia Tyr Asp Thr Tyr Gly Thr val Gin Gin Aan Ays Pro 340 345 350

Phe Thr Thr Thr Aan Thr Arg Trp Asp VAX Her Thr val Asp Asn His 355 ' 380 385

Pro Asp Tyr Mat Ays 11a Ala Phe As® Pha Hsr Tyr Gin 21a Tyr Ays 370 375 380

Gin Xla Ala Car Gin Ala Gin Arg Ays His Gly Pro Phs Val Tyr Ays 385 380 335 400

Tyr Aan Gin Car Cys Trp Ays Ssr Tyr 21« Gin Ala Tyr Mat Gin Glu 405 410 415

Ala Gin Trp Xla Ala Car Asn His Ila Pro Giy Phs Asp Gin Tyr Asn 420 425 430

Mat Asn Gly Val Ays Car Car Gly Mat Arg ila Aen Mat lie His Ala 435 440 445

Aan 21a Aan Mat Asp Thr Pro Aan Her Asp Gin Tie Asa Gin Gin As® 450 455 480

Asp 21a Pro Har Car Ays Car Gin Ala Aan Aan Car Aan Xla Thr Arg 485 470 475 480

Asn Val Asp Asp Val Ays Asp Phs Gin Asp Gin Gin Ala His Gly Gin 485 430 485

Mat Ala Her Car Xla Gin Cys Tyr Mat Ays Asp Asn His Gly Her Thr 500 505 510

Arg Gin Asp Ala Aan Asn Tyr Aan Ays 21a Arg 21a Gin Car Cys Val 515 520 525

Gin Gin Aen Asn Ays Gin Asn Aen Gin Pro Car Asn Mat His Gly Car 530 535 540

Phe Arg Asn Aan Tyr Aan Asn Val Gly Met Arg Val Xla Pha Phe Mat 545 550 .555 580

Lao Asn Aep Gly Aep Asn Pha Thr His Cer Asn Are Ays Gin Tie Gin 585 570 575

Asp Ala He Thr Ays Phs Phe Val Gin Pro lie lie Pro 580 585

<210> 30 <211> 1674 <212> ADN <213> Sequência artificial <220> <223> ADN valenceno sintase Citrus V277 <3 0 0> <310> US20120246767 <311> 2012-09-27 <400> 30 atgtctactc aagtcte&gc atcttctcta gcccagatte eccaacccaa aaatcgtcet 60 gfcggeaaact tteaccccaa cafcttggggt gaccaattta tcacctacac tcctgaagac ISO aaggtfcacte gtgccfcgcaa agaggagcag attgaagctt tgaagga&ga agtt&gaaga 180 aigaiittag caaccggaag gaaaccaatfc oaaaaattga gaftgattgs tgaagttcaa 240 ag&tigggtg tfcgcttacca fctttgaaaaa gaaafctgaag afcatgttgga tcacatttac 300 agagcfgatc cttattttga ggctcatgaa tscsatgatt tgcatactgt ttcttfcgcat 360 ttcagatfgt tgagacaaoa aggtattaag sttfcttgtg atgttttcga acaaitfcaag 420 gatgatgaag gtagatfcoaa aagttcfcttg atiaaigatg tfccaaggoat gttgtgtttg 480 fcatgaagctg cfciatatggc tgfetagaggt gaacataitfe tggatgaagc taitgcafeti. 540 actactactc attfgeaatc tgcagctcca catfctgaagt eacefcfcfcgge tgaaeaaatt 600 aaccatgctt tgtatag&ce atfcgagaaa® sctttgccaa gattggaagg gagatacatt 660 atgtaagfcot aocaagafcga agcfcttccat aacaagacfct fcgfcfcaaatfct egctaagttg 780 gatfctcaafca fctfcfcgtfcgga tttgcafcaaa gaagaattga aegaafcfcgac taaatggfgg 780 caagafett-gg ait-tt-actac taaaitgcca tatgcfcagag afcagattggt fgsacfcgtac 840 fcfttgggatfc iggggacfcta ttitgaatca eaatacgctfc ttggfcagaaa a&te&tgact S00 aaattg&act acatttfcgtc e&fctattgat g&tae-ctaeg afcgettaegg tactttggaa 360 gaatgoacga tgftcagfga agctgffgof ogtfggaaca tfcgaagctgt fgaiatgtig 1020 ccagafcfcata tgcgaafcfcat ctacagaact ttgttggafca cattcaacga aafagaagag 1080 gatatggcta aacaacggag aict.caitgt gtaagatacg ctaaagaaga aatfccsasag 1140 gttattggtg etiatiacgt teaagctaag tggfcfcfcfccfcg aaggfctafcgfe geetaetatt 1200 gaagaataca tgcc&attgc tttgacttct tgcgcttaca gatttgttat fcaccaattcfc 1260 tttttgggta tgggtgafctt cgctscaaag gsagtattcg aatggatttc tggtaafceea 1320 aaagttgtta aatctgefcfce tgttat-fctgt agafctgafcgg acgatatgca aggacacgaa 1380 fctigaaeaaa aaagaggfcca cgfctgcatcfc gcaattgaat gctatactaa acaacatggt 1440 gtitccaagg aagaggctat caagat.gt.ta gaggaagatg fefcgct.aacgc ttggaaggafc 1500 aicaaig&ag aattaafgat gaaaccacca gttgttgcta gaccattgtt aggtaetatfc 1560 ttgaatttgg ctagagctat cgattttatc tataaagaag atgacggfcta aactcaiict 1620 fcafcttgafcfca aggaaoaaafe cgcstcfcgfcfc fcfcgggtgafcc afcgtfcccatt ttaa 1674 <210> 31 <211> 557

<212> PRT <213> Sequência artificial <220> <223> Proteina valenceno sintase Citrus V277 <3 0 0> <310> US20120246767 <311> 2012-09-27 <400> 31

Met: Ser Thr Gin ¥al Sar Ala Ser Sar Loo Ala Gin 11« Fro Gin Fro 15 10 IS

Lye Asn Arg Fro Yal Ala Asa P&a His Fro Ass lie Trp Gly Asp Gin Μ 25 30 P&a I Is f&r Tyr f&r Fro 61« Asp lys VAX ftr Arg Ala Cys Lys Gin 33 40 45

Gin Gin 11« Gin Ala L«a Lys Gin Gl%i Val Arg Arg Mat lie lao Ala 50 55 00 xhr gly Arg Lye Fro 11« Gin Ays Ian Arg ton 11« Asp Gin v&l Gin

05 70 75 SO

Arg las Gly Val Ala fyr Sis SS« Gin Aye Gin 11« Gin Asp Mat A«a 85 SO 35

Asp Bis lie Tyr Arg Ik top fro Tyr Fhe Gla Ala Bis Gin Tyr Asn 100 105 110 A®p Bea His Thr Val Ser Beu Bis BBS Arg Beu Beu Ary gin 01n Sly 115 ISO 125 lie Bys 11« Bar Cys Asp Val Fhe Glu <31» The By® Asp Asp Glu Sly 130 135 140

Arg Phe Bys Her Her Ban lie Ask Asp Val Gin Gly Mat lee Ser Lea 145 150 155 160

Tyr Ola Ala Ale Tyr Mat Ala Vel Arg Sly Sis His lie Bea Asp Glu 165 173 175

Ala Xle Ala Phe The Thr Thr His Beu Gift Her Ala Ala Pro His Baa 100 185 100

Bye Her Fro Baa Ala Gig Gin lie Asa His Ala Baa Tyr Arg Fra Bee 135 200 205

Arg Bye Thr Baa Fra Arg Baa 0.1a Ale Arg Tyr Ila Met Mr Val Tyr 210 ' 215 ' 220

Gift Asp Glu Ala Fhe Bis Asa Bye Thr Baa Baa A$n Phe Ala By® Baa 225 230 ' 235 ' 240

Asp Fhe Asn xle Ben Baa Asp Ben His Bys Glu Gin Baa Asn Gla Ben 245 250 255

Thr Bys Tap Trp Gin Asp Bee Asp Fhe Thr Thr Bys Baa Pro Tyr Ale 2S0 265 270

Arg Asp Arg Ben val 01a Ben Tyr Pha Grp Asp Baa Gly Thr Tyr phe 275 260 285

Gla Her Gin Tyr Ale Fhe Gly Arg Bys Xle Met Thr Bys Ben Asa Tyr 230 235 300

Ila Ben Her Ila Ila Asp Asp Thr Tyr Asp Ala Tyr Gly Thr Baa Gla 305 310 315 320 01a Cys Thr Mat Fha Ser Glu Ala Vel Ala Arg Trp Ask lie 01a Ale 323 330 335

Vel Asp Met Baa Fro Asp Tyr Met Arg lie Xle Tyr Arg Thr Bea Ben 340 345 350

Asp Thr Fhe Asa Gin Ila Gla Glu Asp Mat Ale Bys Gla Arg Arg Her 355 360 365

His Cys Val Arg Tyr Ale Bye Gla Gla Ila Gla Bys Vel Ila Gly Ala 370 375 360

Tyr Tyr Val Gin Ala By® Trp Fhe Car Gin Gly Tyr Val Fro Thr Ila 365 330 335 400

Gla Gla Tyr Mat Pro lie Ala Baa Thr Ser Gys Ala Tyr Arg Fhe Val 405 410 415

Ila Thr Asn Ser Pha Ben Gly Mat Gly Asp Fhe Ala Thr Bys Gla Val 420 425 430

Fhe Glu Trp Xle Her Gly Asa Fro Bys Val Val By® Her Ala Ser Val 435 440 445 lie Cys Arg Bea Met Asp Asp Met Gin Gly His Gin Fhe Gla Gift Bys 450 455 460

Arg Gly His Vel Ala Ser Ale Xle Gla Cys Tyr Thr Bys Gin His Gly 465 470 475 480 val Her By® Gin Gla Ala He Bys Met Fhe Gin Glu A®p val Ale Asa 465 430 435

Ala Trp Bys Asp lie Asn Gin Gla Baa Met Met Bys Fro Fro Val Val 500 505 510

Ala Arg Fro Bea Baa Gly Thr lie Bea Asn Bea Ala Arg Ala lie Asp 515 520 525

Pha lie Tyr By® Gla Asp Asp Gly Tyr Thr Hi® Ser Tyr Ben Xle .By* 530 535 540

Gin Gla Ila Ala Ser Val Baa Gly Asp His Val Fro Fhe 545 550 555

<210> 32 <211> 7927 <212> ADN <213> Sequência artificial <220> <223> Vetor de expressão ADN pALx31-108.2 <400> 32 egcggeogog tggaatattt. gggatatoct tttgttgitfc gggggtgtao aatatggaot €0 tectcttttc tggçaaceaa acooatacafc çgggaitçct ataafcaoott çgttggtçtç 120 ectaacafcgt aggfcggcgga ggggagacat acaatagaac agataccaga caagacataa ISO tgggofcaaac aagact&cae caattacaot gootcattga tggtggtaca taacgaacfca 240 ataetgfcago cotagacttg atageoatga toatatcgaa gtttcactao cctt-ttfecca 300 fctigccaioi atfcgaagtaa feaafcaggegc atgcaaetfee tfctfcetfcttt ititefetttc 360 tcfcctccecc gttgttgtot caccafcatce gcaatgaoaa aaaaatgatg ga&gaeaeta 420 saggaaaaaa ttaacgacaa agacagcacc aacagaigfco gfctgttccag agctgatgag 480 gggtatotcg aagcacaoga aactttttcc ttccttcatt cagggscact actctctaat 540 gagcaacggfc atacggcctt cctfcooagtt acttg&atti gaaataaaaa aasgfcttgct 000 gtetfcgcfcat caagtataaa tagaeetgca attattaatc ttttgtttcc tcgtcattgi 600 tctc.gtfcecc tttcttcott gtttcttttt. cfcgc&caata tttcaagcta taccaagcafc 720 aaáafccaaafc ccasgctgaa ttcgagctcg gt-aseoatcá acaagtitgfc acaaasaagc 780 aggciatggc cecagctata gtgatgagta aetacgaaga ggaggagaii gttegeoctg 840 ttgcagattt ttctocaagfc cttfcggggtg atcgtttcoa tfcoattctca gttgacaatc 800 aggttgcgga aa&giaigci o&agagattg aaaetttgaa ggaacaaaca agtactatgt 800 tgtctgctgc tfcgtggaaca aesttgaotg agaaafctgaa tfetgatagat attatfcgagc 1020 geettggaafc agcfctalcat ttcgagaaac aaatagaaga iatgttggat cacatfctaca 1080 gagcfcgatcc tt&tfcttgag gctoatgaat acaatgattt aaacactfcca fcccgfcfccaafc 1140 ttcgacfcacfc cagacaacat ggitacaacg tctctccaaa tatatttagc agatfccca&g 1200 atgoaaaigg gaaattcaag gagtctctta gaagcgacat caggggcoia cfcgaacttat 1260 açgaagcfctc aoatgtaagg actçataaag aggstafcfctt ggaagaagça citgtttttt 1320 ctgtlggfcca tcttgaatcfc ge&gcfcccac afcfctgaagfce acctctgagt aagcaagtga 1380 oacatgccet. cgaa.oaat.ot otcoataaga gcattoeaag agfecgagata oggtaotica 1440 tetcçafcçta çgaagaggag gaatttaaga afcg&titgtt gettegattt gçtaaattgg 1500 attacaactt aettcag&tg ttgcacaagc atgaacfccag tgaagt&tca aggtggfcgga 2500 aagatfetgga tttcgtgaca ac-acttccafe atgotaggga cagageagtt gagtgcfcacfc 2020 ittggacgat gggggtgtat getgaacctc aatactccca ggctcgtgta atgottgcfca 1080 agaeiaiagc aat.gatt.toc atagfcagatg agacattoga tgcttatggc aicgtaaaag 2740 aacttgaagt ctacacagat gec&fcacaga ggtgggatat tagtcaaatt gatcgactcc 2800 cggaatatat gaaaatcagt tataaggctc ttttggatcfc otatgaegat tatgaaaagg 1800 agtt.gt.oa.aa ggatggtaga toogatgttg toeaofcatga aaaagaaaga atgaaggaga 1820 tfcgtgagaaa cfcattttait gaagoaaaat ggtttafctga ggg&fcatatg ecatctgfcfct 2880 eegagtaect tagcaatgca otagotacta gcacatatta efcfcgctaact acgacatcct 2040 actfcgggaafc gaaatcagoa aecaaggaac attttgaatg gttggctacg aaccctaaaa 2100 ttetggaage taatgctaoa ttatgccgag ttgfetgatga catagccaog tatgaggttg 2180 agaagggtag gggtoaaatt goaacaggaa ttg&gtgtta tatgagggafc taaggtgtat 2220 ççacagaagt agcaatggag aaattccaag aaatggctga çafcagçatgg aaggatgtaa 2280 atgaagaaat tottogacca acaccfcgtct cttoagaaafc tctfcactcgt attctcaacc 2340 tcgctcgaat tstagafcgtc actfcacaago ataatoaaga tggatacact oatcotgaaa 2400 aagtactaaa acctcacatc attgecttgg tggtggatte tattgatatt tg&acceage 8400 tttctfcgt-ac aaagtggttg atggc.tc.ttc tagaatctot gottttgtgc gcgfeatgttt 2520 atgtat.gt.ag ctctctotot atttctattt. t.t.aaaocaoo ototcaataa aataasasta 2580 ataaagtatt tt.taaggaaa agaogtgttt aagsaotgac tttatotagt t.t.t.tgtacgt 2640 tttcattgat ataatgtgtt fcigfcctcicc cttttotacg aaaatttç&a aaattgacoa 2700 aaaaaaggaa tatatafcacg aaaaactatt atatttatat atcatagtgt tgataaaaaa 2700 tgtttatcca ttggaccgtg tatcagggcc cggateotcfc aggcttggca ctggoogtcg 2820 fctttaoaaog tcgtgagfcgg gaaaaoootg gogttacgga agttsatogo cttgcagcac 2880 afccccccttt cgggagctgg ogtaatagcg aagaggcccg oacogatcgc ccttggcaac 2840 agttgggcag cotgaatggo gaatggegco tgatgcggta ttttctcctt aggcatctgfc 3000 gcggiatito acacogcata gggfcaafcaao tgatataatt aaattgaagg iotaafcfctgfc 3080 gagtttagta tacatgoatt taottataat agagtttttt agttttgctg gggggatott 3120 ctcaaatatg cttoooagoe tgettttctg taaogttoao ootctacctt agoatocctt 3280 ccctttgoaa atagtcctct tccaacaata ataatgtgag atcctgfcaga gaooacatca 3240 tccacggtto tatagtgtfcg aoccaatgcg totcocttgt. catctsaaco oaoaoogggt 3300 gfccataatca accsafcc.gt.a aggfetoatot ottccacgc.a tgfegfegtttg agoaataaag 3300 ecg&fc«A«&su* gcS«ttcg*a atçtcmmç taeeafcfc&gfc afcafctcfeasa 3420 gfcagat&ggg agscctfcgea fcgacaattet gcts&cafcca «aaggcctsi aggttccttt 3480 gfctaettott eigosgseig cttcaaaocg «taacaatasj cfcgggcccsc aae&eogtgfc 3540 geattcgta® tgfeofcgeccia fciefcggfc&tt. Gtgtatgsac cogeagagta etgcasittg 3080 agigtattag saatgtgagc- aaattttGtg fcattcgaagra gtasaaaatt gtaettgggg 3660 gataatgcct tiagcggctfc aactgfcgcce tccatggaaa aafcesgtcaa g&tafcocaea 3720 tgfegttttts gtaaacsaat tttgggacct aatgcttcaa ctasctcesg ta&ttcctfeg 3780 gtggtscgaa cstccastga agcacacaag tttgtttgct ttfccgtgcafc gatattaast 3040 agcfcfcfgeag c&acaggact aggatgagta gcagaaogtt ecttataagt agctttGg&e 3000 afcgaittata tfccgfcttcgg tttttgitci gtgcagttgg gttaagaata etgggcaatt 3300 tcatgtttct. tcaasactac atatgcgtat atatacgaat etaagtctgfc ggteettsct 4020 tcgfctcttoc ttct-gtfccgg agattaccga afccaaaaaaa ittcaaggaa anc.gaaatca 4080 aaaaa&agaa ta&aaa&aaa atgatgaatt gaaaagcact tgtfcacccat cattgaattt 4140 tg»a.cat«og aaectgggag tttt«oetga «*c«g*tagt atattigaac «tgiatasta 4200 atatatagtc tagcgcttta cggaagacaa tgtatgtatt tcggttccfeg gagasac-tat 4200 tgcatgfeatt. gaataggfcaa oct-t-gsacgt cgcatcoccg gtOcatittc tgcgfcttasa 4320 tettgcactt caat-agcata tctttgfcfcaa cgaagcatct gtgettcatt ttgtaaaaea 4300 aaaatgeaac gegagagcgc taatttttca aacaaagaat etgagctgca tttttacaga 4440 acaga&atgo aacgçsga&ag cgctattfcfea ccaacgaaga atctgtgctfc catfcfcttgta 4500 aaacasaaat gcsacgcgag agcgctsaii fcfctoaaacaa agaatctgag ctgcattttfc 4860 aeagaaeaga aatg«sacga gag&gggeta tfettaecaag aaag&atefca t&cfcfcGtttfe 4020 ttgttctaoa saaafcggatg oogagsgego tattotioto aoaaagGaio ttogafet-ogt 4800 tttttOGtcg fctigOgsggt ctataatgca gtctcttgat aacttttagc actgoaggtc- 4740 egttaaggtt agaagaaggc tactttggtg tctafctitct cfcfcecata&a a&aagcctga 4300 ctccacttcs ggggttfcaet gattactagc gaagotgggg góge&ttfctt tsaagataaa 4060 ggcatccsgeg att&taitct afeacegatgt ggatfcgogca tacfcttgtga acaga&agtg 4320 atagcgttga tgattcttca ttggtc-agaa aattatgaac ggtttcttct attttgtcta 4880 tatatactaa gtatagg&aa tgtttacatt tfccgfcattgt tfcfcegattca ctctatgaat 5040 agifccttacfc aesattfcttt tgtcfcaaaga gt-aatacfcag agataaacafc aaaaaatgfca SI00 gsggiogagt fct&gatgg&a gttgooggag ggaaaggtgg atgggtaggt tataiaggga 5280 fcatagcagag agaSat-atag caa&gagata cOtttgagea stgfctOgtgg aageggfc&fct 5220 ggoaatattt tagtagetgg ttag&gfcoog gfcgcgtttfci ggattttiga sagtgogtet 5280 tcagagggot totggtittc aaaagcgst-e tgasgfeiCGt aOactttcfea gctagagaat 5340 aggaaçttag gaaáaggaaç ttcaaagçgt ttcçgaaaac gagcgctççç gaaaafcgc&a §400 egcgagctgc gcscatscag cteactgttc acgtcgaacc tatatctgsg tgttgcctgt 5480 atafcatatat acatgagaag aacggcatag fegcgtgtfcta tgcttaaatg cgfcfcatggfeg SS20 cactctcagt acaatctgct c.fcgatgcc.gc atsgfetaagc cagccccgac accogccasc 5500 acccgctgac gegccctgae gggct-tgtct gctcceggca tccgcttaas gacaagctgt S640 gaccgtctcc gggagctgca tgtgtcagag gttttcaecg tcate&ccga a&cgcgcgag §700 acgaaagggcí et«gtgatae gcetatttfet ataggOfcaafc gfes&tgataa taaOggtttc S78Ô ttagaagtca gqtqqc&abb ttaggggaaa fegtgcgcgga aGcest-atOt- gttfcafcfctfcfc §8.20 ataaataaat. taaaafcafcgt afcccgcfccat gag&caafcaa ««afcgataaa tgcfcfccaafea 3880 atattgaaaa aggaag&gfca fcgagtattca acatfcfecsgt gtcgaccfcfca ttecetfcttt. §340 tgcggcafctt tgcgfcfcGOtg tfctttgctga Gccagaaacg ctggtgaaag táááagatgo 8000 tgaagatcag ttgggtgcac gagfegggfcta gatcgsagfeg gatctcaaca ggggtaagat 0080 ecttgagagt titcgcaccg aagaacgt.tt tccaatgatg agcaetttta aagttctget 8120 atgtggcggg gtattstcco gtattgacgg ogggoa&gag eaacfccggtc gccgcat&ca 8180 ctattctcag aatgaettgg ttgagtactc accagtcaas gaaasgg&tc tt&cggatgg 8240 cstgaeagta agaga&ttat gcagfcgctgc cataaccatg agtgataaaa ctgoggccaa 8300 çtSast-tçtg açaaçg&fceg gagg&eggaa ggagotaaca gçtttttàgç aGaagafcggg 8380 ggafcçafcgta actcgccttg atcgttggga aççggaggfcg a&tgaagçaa fcaeea&aega 6420 cgagççtgac accaggatgc Ctgtagcaat ggcaaçaacg ttgcgcaaac tattaaçtgg 8480 cgaactaatfc «ctcfcagott cccggcs&ca attsatagac tggat.ggagg cggataaagt 6540 tgcsaggacga attGtggg^t cggcsattog ggctggcfegg tttattgc-tg ataaatctgg 8600 agGCggfcgag ggfcgggOctç ggggtafccat t-gçaggaatg gggggagatg gt-aaggaetc 8880 ccgfcatcgta gttatcfcaoa cgacggggag fccaggcaact «tggatgaac gaaatagsea 8720 gatcgcfegag &taggtgscfe cactgafcfcaa gcatfcggteaa cfegtc&gacc a&gfcfctacts 8700 atafcatastt tag&ttgatfe taaaacttea tttttaattt aaaaggatat aggtga&gafc 8840 estttttgat aatcfes&tga ccaaaafccoo tt&acgtgag ttttsgttcc aatgagcgtc 8300 agaccaagta gaaaagat-ca aaggatcttc fcfcgagatcGt ttfcttfcetgo gagtaaOaag 8360 efegcttgcaa acaaaa&a&c caeGgetacG aggggtggtt tgtttggcgg ate&agagcfc 7020 acGâa*tgtt tttgegaagg taactggett gageagagcg eagataccsa ataetgfetct 7080 tctagtgtag c.cg&agfctag gecaaesactt aaagaactct gtagaacscgG atac-afeacca 7240 cgctstgcfca atccfcgfcfc&c c&gtggcfcgc tgcc&gfcggc gata&gfccgt gictiaccgg 7200 gfefeggacfeaa agacgafeagfe fcaocggafcaa ggegcsgcgg togggctgaa cggggggttc 72§0 gfcgea«a«ag ggaaggttgg ag^aaggag gtaoaeogaa ctgagataco tacagcgtga 7320 gctatgagaa agcgeeaege ttcsscgaagg gaga.aa.ggcg gacaggfcat.c o-ggfcaagcgg 7330 oagggtcgga acaggagage gcacgaggga gcitceaggg ggaaaageei ggtaiatiia 7440 fcagtcctgfcc gggifctcgce acctcfcgaafc tgagcgfcgs tttttgtgat gctcgfccagg 7S00 gggggggaga atatggaaaa aggceaggaa cggggeettt ttsgggfeteo tggegttfctg 7530 efcggeatfctt gatcacatgt tctttcctgc gttatcccct gattctgtgg ataaccgtafc 7520 taccgccttt gagtgagctg ataccgetcg cogcagccga acgaccgagc gcagcgagtc 7530 agtgagcgag gsagcggaag agcgccoaat acgcaaaccg cetctccecg cgcgtiggce 7740 gattcattaa tgcagctggc acgacaggtt tcccgactgg aaagcgggca gtgacgcaac 7000 gcaattaatg tgagttagat cactcattag gcaccccagg ctttacactt tatgettcog 7030 gstcgtafcgt tgtgtggaat tgtgagagga taaeaattfcc acacaggaaa cagcfeafegac 7320 atgatta 792?

<210> 33 <211> 7902 <212> ADN <213> Sequência artificial <220> <223> Construção de expressão ADN pALX63-71 <400> 33 ©gcgggegog tggaataifct «gg»t.afce«fe tt.t.gttgttt ccgggfc.gfcac aat&tggacfc 60 tcctcttttc iggcaaecaa accostaeat cgggattccfc ataatacctt egtfcggtctc 120 ©ctaacatgt aggtggogga ggggagatat aoaafeagaac agaiacsaga oaagacataa 180 fcgggcfcaaac aagasfcacac caafct&cacfc gecfccafcfcga tggtggtaoa taacgaacta £40 atacfcgfcagc ccfcagactfcg atagccatca fccatatcgaa gfctfccacta® ectfcfcfclcca 300 fctigecafcct afctgaagtaa fcaataggegc atgoaacttc ttttcttttt fcttfcctlfcfcc 360 fcctctggggg gtfcgtfcg&efc caecatatoc go&atgacaa aaaaatgatg gaagacacta 420 aaggaaaaaa ttaacgacaa agaoagcacc aaeagatgto gttgttccag agctgatgag 480 gggfcaiefccg aagcacacga aaetttttcc fcfcccttcafct cacgcacact actctcfcaat 540 gagcaaeggt atacggccstt eefcteeagfct acttgaattt gaaataaaaa aaagttfegcfc 600 gfccttget&t caagtataaa tagacctgca attattaatc tttfcgfcfctcc tcgtcattgfe 660 fccfccgfcfcoce tttcttcctt gtttcttttt ctgcaaaata tttcaagcta tacea&gcafe 720 acaatcaact gcaaggtgaa ttcgagotog gfcaccattaa aaaaaatgtg tcttaatgta 780 cfcfcagtacgt caggttcagc tccaacaacc aaatcatctg agatfcagfccg taggtccgct 840 aattafccatc ctagtttatg gggagacaag ttcctcgaat attcgagece agafccacctg 800 aaaaaigatt cattoacaga aaagaaacat gaaoaactcs aagaagaggi gaagaagatg 360 etagt-agaaa cggttcaaaa gccfccaacaa cagctgaatc tgateaacga aatacaacgs 1020 ctaggttt&t catacctifci fegsscccgaa attg&ggcfeg cattgcagga a&tcagtgtt 1080 acctafcgatg aatttfcgttg tagtaeagac gctg&tgaee ttcacaatgi tgetctctet 2140 ttccgaatac tfcagagaaaa tggacataat gfcalcttctg atgtgtttca gaaattcafcg 1200 gafcagcaatg ggaagfetgaa agactacttg gttaatgatg ctagaggact giiaagcttg 1260 fcacgaageaa cacatttlcg ggttcafeaat gatgataaac ttgaagagtt gctgtcagta 1320 aca&cctctc giefcfcgagca tctcaastoo cacgtgaagt accc-tctfega ggacgaaate 1380 agtagagcac ttaagcatco cetccataaa gaaotaaaic gacfcaggago gagatatiac 1440 atafcccafcfcfc acgaaaaatt tgafctcacac aataaafctgc ttttggagtfc tgcaaaacta 1500 gaitfetaasc gactgoagaa aatgt&tca® eatgagctag cccaccitao aaggtggtgg 2560 aaagafcfcfeag afctttacaaa csaactfccc® tttgcaagag afcagaattgt fcgagggttac 2620 ttitggatat tagga&tgia efefctgagcc® ga&cgfcaagg atgtcaggga aifcctfcgaao 2880 agagfcafcfefeg cacttatiae agfcagttgat gacacgtafeg atgtgtatgg fcacafctcaaa 2740 g&acttct&c tgttcactga igeaattgaa agatggggaa otagtgatti ggateagota 2800 ccgggatafca tgagaattat ttateaagct ctcatggatg tttafcaatca aatggaggaa 1860 aagttgtcaa tgaaagetga ttgieeaaea taccgtcttg agfcfcfegcaat agaaacagtfc 1820 aaagogatgt igagafcaata ggt-cgaagaa ggtagat-ggi ggaaagaaga ttatatggca 1280 fccgafcggaag agtatatgac cgtggc&ctg gtatcggttg gciacaaaac catatfcaact £040 aattcctttg ttggaatggg ggatattgca acacgggaag tttttgagtg ggtgttcaat £100 agtccafctga ttattagagc ttccgactta atfcgccagat cgggagatga tattggaggc £160 cafcgagga>gg agcsgaagaa aggagacgca gccactgcfea tcgagtgtta cat aa a a gag 2220 aatgafegfcaa casageatga agefefeatgsfc gaatttcaga aaoaaattga fcaafegottgg 2280 aaggattfega »ta»ggaagc fegfeaggtcca tttgctgtfee eaatgacttt cateagaaga 2340 gfctgfctcaftfc ttacgcgcgc c&taaatgtt atttatgceg aofctt&gtga tggtt&a&m 3400 cgtfcesg&ea aggeg&fccag aggtt&cata aettcacfegc tegtggatcd fcafctcetfetg 2400 ts&tetagas ifsietgotfet igigsgcgta fcgtttatgfca tgtecctctc tctsfcafcttc 2528 tatttttaaa ee&eectefc« aafcaaaataa ggataataaa gftatttitaa ggaaaagaog 3580 tgattaagca etgactttat. ataat-tfefetg tacgtttfeoa ttgatataat gtgdtt-tgtc 2440 tctccctitt ctacgaaaat ttcaaaaatt gaccaaasaa agga&tatsi atacg&aaaa 3700 ctafctatatfc fcaiafcatcat agtgttgaia aasaatgfefcfc atccatfcgga ccgtgfcatca 2740 gggeccggat ccicfcaggct tggcactgge ogtcgttfcta caacgtcgtg aotggga&aa 3820 cccfeggegit «ccca&etta atcgeettgc ageacafcecc oetitcgcea getggcgt&a 2880 tagsgaagag ggccgcaccg atcgeccfctc ecsscagfc.fcg cgcagcctgs atggcgaatg 2240 gsgccfcgatg cggtattttc tccttaegea fcctgtgcggt afctteaeace gcatagggfca 3000 afcaaetgata taattaa&tt gaagatcfcaa tttgtgagfct tagfcatacat gcafcttaetfc 3240 ataafcacagt tttttagttt tgdfcggoegc afccitetcaa afcatgcttcc cagecfcgctt 3320 ttcfcgtaacg tfceascctct accttagcat oecttccett tgcaaatagt ccfccttcc&a 3280 caafcastaafc gteagatcct giagagacca eatcatenae ggttetatac tgtfcgaeeca 3240 atgcgtaftec cttgfecafcct aaasecacac cgggfcgteat aafcaaaccaa t-egtaacctfc 3300 catotcttcc acecatgtct ctttgagcaa taaagccgat aacaaaatet ttgtcgctct 3340 tegcaatgte aacagfcaeee ttagtatatt cfcccagtaga tagggagcec ttgeatgaca 3420 atfeetgetaa catcaaaagg ectctaggfct ootttgfefcac ttcttcfcgec gcctge.fctea 3480 aaeegctaae aaiaectggg ccc&ccaeae egfcgtgeatt cgtaatgtct gcceattctg 3540 etafctdtgta tacaeeegea gagt&etgca atttgaetgt atfcaecaatg teagcaaatfc 3800 ttet-gtette gaagagtaaa aaatt.gtac.t tggcggafeaa tgcctttagc ggcttaac-tg 3663 tgecctccat ggaaaaataa gtcaagatat ccacafcgfcgt tfettagtaaa caaattttgg 3720 gacctaatge ttcaaetaac tccagtaatt cettggtggt aagaacatce aatgaageae 3780 acaagfetfcgt ttgctfctteg tgcatgatat taaatagctt ggcagcaaca ggaetaggafc 3840 gagtageage acgtteefcfca tatgfcagctt tegaeafcgat ttatefetcgt ttcggttttt 3380 gfcieçgtgça gtfcgggfetaa ggatactggg eeattteatg tttctteaac actseatatg 3350 cgtataiata ccaafecfcaag tctgt-gctcc ttdcttcgtt cttc-cttctg tteggagatfc 4020 accgaatcaa aaaaatttca agga&accga aatcaaaaaa aagaataaaa aaaaaatgat 4380 gaattgaaaa geacttgtta ggçatcatfcg aattttgaag atccgaagct gggagttttc 4140 cctgaaacag atagtatatt tgaacctgta taataatata tagtetageg etLtacggaa 4200 gacaatgfcat gtaefctcggt tcetggagaa actattgsat ceattgeata ggtaatcfceg 4280 eacgtdgg&t ccddggfcfcca ttfctdtgcgt tfcdd&tottg gaettcaata geatatettt- 4320 gfciaacgaag eatctgtgct fceaitttgta aascaasaat gcaaegegag agegetaatt 4380 tttcaaacaa agaafccfcgag ctgcattttt acagaasaga aafcgeaacgc gaaagegcta 4440 ttttaceaae gaagaatetg tgettcattt ttgtaaaaca aaaatgcaae gegagagege 4S80 taatttttca aacaaaga&t efcgagctgea tttttacaga acagaaatgc aaegegagag 4580 egctatfctta ccaacaaaga atetataett ctfcttttgtt ctaeaaaaat geatcccg&g 4420 aggggtatt-t tfcgt&acaaa geatettaga t,taottt.fet.t. teteefetfegt gegstetata 4880 atgcagfcete ttgafcaaett tttgdactgt aggteegtta aggttagaag aaggetaett. 4740 feggfcgtetat fcfctcfccttcc afcaa&aaaag eetgaeteea ettcccgegt ttaetgatta 4800 etagegaage tgegggtgca fctttttcaag ataaaggeat ccccgatfcat attstatacc 4880 gatgtggatfc gcgcataetfe fcgtgaaeaga aagtgatage gttgatgatt ettsattggt 4320 cagaaaatta tgaacggttt ettetatfett gtctctafeafc actaegfcata ggaaafcgttt 4280 aeattttegt attgfcttteg attcaetcta tgaatagttc ttactacaat. ttttttgtet S040 s&agagfcaat aetagagata aaeataaaaa atgtagaggt, cgagfct.taga tgcaagttca S100 aggagegaaa ggtggatggg t&qqttatat agggatafcag cacsagagafca fcatagcaaag 5180 agataatttt gagcaatgtt fcgtggaagcg gtattcgcaa tattttagta getcgfcfcacsa 5220 gteeggtgeg ttttfcggttt tfcfcgaaagfcg egtetteaga gcgcttttgg tttfccaaaag 5280 egetetgaag ttccfcataefc ttetagetag agaataggaa çèteggaata ggaacttcaa §340 agegfcttccg aaaacgsgcg ettccgaaaa tgcaacgega getgegeaea tacageteac 5430 tgttc&egtc gcacctatat ctgcgegfctg cctgtatats tafcatacafeg agaagaaagg 5480 catagtgcgt gtttatgctt aaatgegfeta feggtgcactc tcagfcacaat ctget.cfcgat 3520 gcsge&tagt taagecagcc ecgaeacceg eeaacaseeg etgaagegec ctgaegggct 5580 tgtctgdfcec cgga&teegc ttaeagacaa ggfcgtgaccg tefceegggag etgeatgtgt. §840 cagaggtttt eaeegtcatc aeegsaaege gegagaegaa agggcctegt gataegeeta 5738 ttetttatagg ttaafegt.cat gafcaafeaatg gfettcfcfeaga cgfcesggtgg caefctttcgg 5780 ggaaatgtge gcggaaeecc tatitgttta tttttetaaa taeattcaaa tatgfcatccg §820 ctgatgagac aataaecetg afcaaatgctt eastaatatt gaaa&aggaa gagtatgagt 5880 attcaadatt teegt-gtege ccttattccc ttttttgcgg cafctttgcdt- t-eetgtttt-t §040 gat-eacccag aaacgciggt. gaaagtaaaa gatgetgaag atcagt-tggg tgcaegagfeg 8338 ggttacatcg aactggatct caacagcggt aagafccctetg agagttttdg cccsgaagaa 8060 cgtfcttedaa tgatgageae tttt&aagtt ctgstatgtg gegeggtatt ateccgtatfc §228 gacgecggge aag&gca&ct cggfccgccgc afc&e&efcafcfc efccagaafcga ctiggttgag 6180 tacteaccag tcaaagaaaa geatcttacg gatggcatga cagtaagaga afefcat.gcagt 6240 getgecataa ce&ig&gfcga ts&csctgcg gcc&actisc ttctgacaac gataggsgga 6300 ecgaaggage taaccgcttfc tfcfcgeaeaae atgggggatc atgtaacfccg ecifcgsfcagfc 6360 fcgggaaccgg agctgaatga agccafcacca aacgacgagc gtgacaccac gatgcctgta 6420 geaatggcaa caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg 6480 caacaattaa tagactggat ggaggcggat a&agttgcag gaccacttet gcgctcggcc 6540 cttccggotg gotggt-t-tat fegcfegafeaaa tct-ggagccg gfcgagcgfcgg gt-ct-agcggt- 6600 atcatigcag g&cfcggggce agatggtaag ccctcccgta tagtagttat et&cacgseg 6660 gggagfccagg caactatgga tgaaagaaat agacagatcg cfcgagafcagg fcgccteactg 6720 attaagcatfc ggt&actgtc agaceaagit tacfccatata tagtttagat igattiaaaa 8780 cfefecat.fct.tfc ssttfcaaaag gatetaggtg aagafeccfefcfe fefcgafcaafect cafcgaccaaa 6840 atcccttaae gtgagtfcfcfcc gtfcccacfcga gcgtcagacc eegtagaaaa gatcaaagga 6800 tcttcttgag atccfefctt.fct tcfcgcgcgfca atctgctgct tgcaaacaaa aaaacoaecg 6360 ctaccagcgg tggt&tgttt gggggatgaa gagctaccaa ctcttttt-oo gaaggtaaat 7020 ggcttcagca gagcgcagat accaaatact gtfeofcfcctag tgtagccgta gttaggccss 7080 cactfecaaga actctgtagc secgccfcaca taccacgcfcc tgctaatcct gttaccagtg 7140 gcfcgefcgoc» gtggcgataa gtegtgtett accgggfcfcgg acfecaagacg atagttaccg 7200 gataaggcgc. agcggtcggg cfcgaacgggg ggttcgtgca cacagcccag cfcfcggagcga 7260 acgaeet&ga gggaagfegag ataectacag cgtgagctat gagaaagggg gac.ggfet.ogc 7320 gaaggg&gaa agggggagag gfcafcegggfca agoggo&ggg teggaaaagg agagegg&gg 7380 agggagcttc caggggga&a egactggtafc cfcfciaiagtc ctgtcgggtt togceamtc 7440 t.gacfctgagc gtcgattttt gtgatgetog tcaggggggc ggagcct.atg gaaaaacgec 7500 agcaacgegg oottttt-acg gtfcectggcc tttfcgstggc efcfctfcgetea catgttcttt 7580 eetgegttat cccctgatfcc tgfcggataac cgtattaccg cetttgagtg agofegafeaco 7620 gcfecgcogoa gcogaaogao cgagcgcagc gsgtcagtga gogaggaago ggaagagcgo 7680 ccaatacgca aaccgcctct eeeegegegt tggccgattc attaatgcag ctggcacg&c 7740 aggtfcfecccg actggaaagc gggeagtgao goaaogoaafe fcaafcgtgagt tagctcactc 7800 afcfeaggcacc ccaggcttta cacttfeatgc tiooggofeog tafegttgtgt ggaattgtga 7880 ggggsfc&aca atttcacaca ggaaacagat afegacafegafe fca 7302

<210> 34 <211> 548 <212> PRT <213> Citrus sinensis <220> <223> Proteina valenceno sintase Citrus <3 0 0> <308> GenBank AAQ04608 <309> 2004-01-12 <400> 34

Mat Sar Sar Sly Sis Thr Pha Arg Pro Thr Ala Asp Phg His Pro Sar 1 5 10 15

Las txp Arg Asa His Phe Las Lye Sly' Ala Sag Aap Pha Ays fhr VAX Pa 25 30

Asp His Thr Ala Thr Sin Slu Arg His Sis Ala leu Ays Sis Sis Val 35 40 40

Arg Arg Mat Ila Thr Asp Ala Sis Asp Lys Pro "Sal Sin Lya las Arg SO 35 00 las lie Aap Sis V&l Gin Arg Las Sly Val Ala Tyr Hia Pha Gls Lya

«S 10 15 HO

Sis He Sly Asp Ala 11« Sis Lys Isas Cya Pro I la Tyr I la Asp Sar 35 00 05

Asm Arg Ala Aap Has Hia Thr Vai Sar Las His Pha Arg Lou Las Arg 100 105 110

Sis Sis Sly Ha Lya Ha Gar Cys Aap Val Pha Sis Lya Pha Lya Aap ns ião xas

Aap Gls Sly Arg Pha Lya Sar Par Las Ha Ann Aap Val Sis Sly Mat 130 135 140

Las Sar Las Tyr Sis Ala Ala Tyr Mat Ala Val Arg Sly Sis Hi a Ha 145 ISO 155 'MÓ

Leu Asa Slu Ala lie Ala Phe Thr Thr Thr Sis Leu Lye Set Lee Yal 155 170 175

Ala (Sirs Asp- His Yal Thr Fro Lys Lae Ala Slu Sin lie Asn Sis Ala ISO 185 ISO

Las Tyr Arg Fro Leu Arg Lye Thr Lae Pro Arg Leu Sis Ala Aeg Tyr 185 200 285

Fha Hat Ser Hat lie Asa Ser Thr Ser Asp His Leu Cys Asa Lye Thr 210 215 220

Lao Lao Asa Phe Ala Lye Leu Asp Phe Aon Ha Lao Lao Glo Leu Hie 225 238 235 248

Lye Slu Ola Lau Asa Slu Lao Thr Lye Trp Trp Lys Asp Lau Asp Phe 245 258 255

Thr Thr Lys Lau Fro Tyr Ala Arg Asp .Arg Lau Val Gin Lau Tyr Fha 200 285 270

Trp Asp Leu Sly Thr Tyr Fha Slu Fro Gin Tyr Ala Phe Sly Arg Lys 275 280 285 lie Mat Thr Gin Lau A$n Tyr lie Leu Ser lie lie Asp Asp Thr Tyr 230 223 300

Asp Ala Tyr Sly Thr Leu Glu Glu Lau 5ar Leu Fha Tfer Slu Ala Val 30S 310 313 320

Sin Arg Trp Asn lie Slu Ala Yal Asp Met Lau Pro Slu Tyr Mat Lys 325 330 333

Lau Ila Tyr Arg Thr Leu Lau Asp Ala Fhs Ass Slu Ila Slu Slu Aap 340 345 350

Mat Ala Lys Sin Sly Arg Ser His Cys Yal Arg Tyr Ala Lys Slu Slu 355 388 385

Asn Sin Lys Yal Ila Sly Ala Tyr Ser Yal Slu Ala Lys Trp PLe Ser 370 375 380

Slu Sly Tyr Yal Pro Thr lla Slu Slu Tyr Met Pro lie Ala Lau Thr 385 330 385 400

Ser Cys Ala Tyr Thr Fha Yal lie Thr Asn Ser Phe Lao Sly Mat Sly 405 410 415

Asp Fhe Ala Thr Lys Slu Yal Fha 01« Trp He Her Asn Asn Pro Lys 420 425 430

Yal Yal Lys Ala Ala Her v&I lie Cys Arg Leo Met Aep Asp Mat Sin 435 448 445

Sly His Slu Fha Slu Sin Lye Arg Sly Sis Yal Ala Her Ala He Slu 458 455 488

Cys Tyr Thr Lye Slu Hie Sly Yal Ser Lys Slu Slu Ale lie Lye Mat 405 478 475 488

Fha Slu Slu Slu Yal Ala Asa Ala Trp Lys Asp lla Asn Slu Slu Lau 485 430 485

Mat Met Lye Fro Thr Yal Yal Ala Arg Fro Leu Leu Sly Thr XXa Leu 580 505 510

Asn Lao Ala Arg Ala He Asp Phe lie Tyr Lys Slo Asp Asp Sly Tyr 515 820 523

Thr His Par Tyr Lau 11« Lys Asp Sin He Ala Ser Yal Lau Gly Asp 530 535 540

His Yal Fra Fha 545 <210> 35 <211> 5

<212> PRT <213> Sequência artificial <220> <223> Motivo região 1 rica em aspartato <220> <221> Variante <222> 3,4 <223> Xaa = qualquer aminoácido <400> 35

Asp Asp Xaa Xaa Aap I 5

<210> 36 <211> 9 <212> PRT <213> Sequência artificial <220> <223> Motivo NSD/DTE <220> <221> Variante <222> 1 <223> Xaa = Asn ou Asp <220> <221> Variante <222> 2,3,4,6,7,8 <223> Xaa = qualquer aminoácido <220> <221> Variante <222>5<223> Xaa = Ser ou Thr <400> 36

Xaa Xaa Xaa, Xaa Xaa Xaa Xaa Xaa 01a 1 B

<210> 37 <211> 548 <212> PRT <213> Citrus sinensis <220> <223> Valenceno sintase A5171, 1518V <3 0 0> <308> GenBank AAQ04608.1 <309> 2004-01-12 <400> 37

Mat Ser Ser Giy Glu Thr She Arg Pro Thr Ma Aap Pha His Pro Sor i 5 XO 15 tOO Trp Arg Asn Pha Leu Lyg Giy Sor Aap Pho Ay® Thr Vai 20 25 30

Asp Sis Thr Ais Thr Gio Glu Arg His Glu Ala Leu Lys Glu Glu Pai 35 40 45

Arg Arg Met lie Thr Asp Ma Glu Asp Lys Pro Vai Gin Lys Leu Arg 50 55 S0 I>«« Xlo Asp Giu Vai Gin Arg Leu SXy Vai Ma Tyr Xis Pha Glu Lys 53 20 35 S0

Giu XXe GXy Aap Ala Xlo Glu Lys Leu Gys Pro XXe Tyr XXe Aap Ser 85 30 35

Aso Arg Ala Asp Lao His Thr Vai Sor Loo His Pho Arg Leu Leu Arg 100 105 1Í0

Sl& Gin Sly 11¾ Ays 11® S®r €y$ Asp Val Ph® Glut Ays PA® Ays Asp 11.5 120 125

Asp Gin Gly Arg PA® Ays Sar Sar A®® 11® km Asp Val Gin Gly M®t 130 135 100

As® Sor A®» fyr Gin Ms Ms fyr Mat Ms VsX Mg Gly Gin Ms 11® 145 155 155 ISO

Aau Asp Gin Ms XI® Ala PA® Thr Thr fhr His A®» Ays Sar A®® Val 155 170 175 AX® Gin Asp Bis Val Thr Pro Ays Aau Ala Gin Gin II® Asa His Ala 130 185 180

Aau Tyr Arg Pro Aau Arg Ays Thr Aau Pro Arg A®n Glu Ala Arg Tyr 185 aoo aos

Pha Met Sar Mai Xl® As® Sar Thr Gar Asp His Asm Cys Asn Ays Thr 210 215 220

Aau Aau Asn PA® Ala Ays Aau Asp Pha As® Ila Aau Xao Glu As® His 225 230 235 £40

Ays Gin Gin A®® As® Gin Aau Thr Ays Trp Trp Ays Asp A®® Asp Ph® 245 250 255

Thr fhr Ays Aau Pro Tyr Ala Arg Asp Arg La® Vai Glu Aan Tyr Pha 280 205 270

Grp Asp Aau Gly Thr Tyr Pha Glu Pr® Gl® fyr Ala Pha Gly Arg Ays 275 280 285 11a Mat Thr Gin A®n As® Ayr IX® Aan Per Ila Ila Asp Asp Ihr Tyr 250 285 300

Asp Ala Ayr Gly Thr Aau Gin Gin Aan Sar Aan PA® Thr gig Ala val 305 ' 310 315 320

Gin Arg Grp As® Ila Gin Ala Val Asp Mat Aan Pro Glu Tyr Met Ays 325 330 335 A®n XX® Tyr Arg Thr a®« Aau Asp Ala Phe a#® Gin ila Gin Gin Asp 340 345 350

Mat Ala Ays Gin Gly Arg Sat His Cys Vai Arg Ayr Ala Ays Glu Glu 355 380 385

As® Gin Ays V®1 xia Gly Ala Tyr 3®r val Gl® Al® Ays Grp Pha Sar 370 375 380

Gin Gly Tyr Val Pro fhr XI® Gin Glu fyr Mat Pro II® Ala X®u fhr 385 380 335 400

Gar Cys Ala fyr Thr Ph® VsX IXa fhr As® Sar Pha Aau Gly Mat Gly 405 4X0 4X5

Asp Phe Ala fhr Ays Glu Val Pha Glu Trp Ila Par Asn As® Pro Ays 420 425 430 VAX Val Ays Ala Ala Sar Val IX® Cys Arg Aau Mat Asp Asp Mat Gin 435 440 445

Gly His Gin Pha Glu Gin Ays Arg Gly His Val Ala Sar Ala Ila Gin 450 455 480

Cys fyr fhr Ays Gin His Gly v&i Sar Ays Gin Glu Ala XX® X<ys Mat 485 470 475 480

Pha Glu Glu Gin Val Ms Aan Ala Trp Ays Asp Xla As® Gin Gin Aan 485 430 435

Met Mat Ays Pro fhr Val Val Ala Arg Pro Aan Aan Gly fhr Ila Aan 500 505 510

As® Aan Ai® Arg Xla Vai Asp Pha Xla fyr Ays Gin Asp Asp Gly fyr 515 528 525

Thr His 5®r fyr Aan 11® Ays Asp Gin XI® Ala S®r Val Aau Gly Asp 530 535 540

Bis Val Pm Ph® 545

<210> 38 <211> 550 <212> PRT <213> Perilla frutescens var.frutescens <220> <223> Proteína Valenceno sintase <3 0 0> <308> GenBank AAX16077.1 <309> 2005-03-01 <400> 38

Hast Ma Bar Gl® 6k Má Gl® Mss His Arg Pro Val Ala Asp Pha Bar i S IS 15

Pro Bor Lau Trp My Asp Gl® Pha Val Ays Tyr Asp Bar Cvs Pro Gin 20 as 30

Val Gin Ays Ays Tyr Bar &sn Thr Val Asp Val Lao Ays Ays Sin Val 35 40 45

Ays Gly Hat 11« Thr Ala Pro Sly Thr Ay® Hat VAX Asp Thr Hot Slu 50 55 m

Aau 51a Asp Thr Xls Glu Arg las Gly Val S®r Pha Hi® Pha Sin Asp

55 70 75 SO

Glu Xl® Slu Gin Ay® A®u Gin Si® Pha Ph® A®p Leu Ay® Thr Asp Tyr 85 80 85

Cys As® Asp Gly Asp Asp Ala Tyr Asp Aa® Tyr Thr Pal Ala Aau Hi® 100 105 110

Pha Arp A®® Pha Arp Gin Hi® Gly Tyr Arp Xls Bar Cys Asp XI® Pha 115 120 125

Gly Arg Trp II® A®p Gly As® Gly Ay® Pha Ays Glu Gly Aau Ay® Bar 130 135 140

Asp Sly Ays Bar Aau Aau Bar Aau Tyr Glu Ala Bar Tyr Aau Arg Thr 145 ISO 155 180

Arg Sly Gin Thr Xla Aau Asp Gin Al® Aau Asp Ph® Ala Ala Ala Bar 185 170 175

La® Ays Bar Xla Ala Pro His Aau Gl® Bar Pro Aa® Gly Ays Gin Val 1B0 IBS 180 val His Ala A®® Val Gl® Pro Aan His Pha Gly A®® Pro Arg Xla Glu 185 200 205

Al® Arg Asa. Pha Xla Bar Xla Tyr Gl® Glu Tyr Gl® Gly Hat As® Glu 210 215 220

Ala Aau Aau Arg Aau Ala Ays A®a Asp Tyr A®® Aau As® Gl® Hat A®® 225 230 235 240

His Ays Gl® Gin As® His Gin Pal Bar Arg Trp Trp Ay® Asp Aan Asp 245 250 255

Aau 11® Thr Ays As® Pro Tyr Al® Arg Asp Arg Val Val Glu Cys Pha 280 265 270

Pha Trp Ala Val Gly Val Tyr Hi® Glu Pro Gl® Tyr Bar Arg Ala Arg 275 280 285

Vat Hat Aa® Thr Ays Thr At® val Hat Thr B®r At® Xla Asp Asp Thr 280 285 300

Tyr Asp Ala Tyr Gly Thr XX® Gin Glu A®® Asp 11® Pha Thr Glu Ala 305 310 3X5 320 11® Glu Arg Trp As® Val SI® Gin Thr Ays Arg As® Pro Glu Tyr Hat 325 330 335

Ay® Pro Aan Tyr Ays Ala As® Aan Glu Aau Tyr Ay® Gin Ph® Slu Gin 340 345 350

Glu Aau Glu Ay® Glu Gly Arg Bar Tyr Val Ala Tyr Tyr Al® Xla Glu 355 360 385

Bar Aau Ly® Gl® Aau Val Arg Bar Tyr Arg XX® Gl® Ala Ays Trp Ph® 370 375 380 II® Gin Gly Tyr Aau Pro Pro Tyr Gl® Glu Tyr A®n Ays As® Ala Aau 385 380 385 400 XI® Thr Cys Thr Tyr €y® Tyr Bis Thr Thr Thr B®r Aau Aa® Gly Val 403 410 4X5

Glu Bar Ala Xla Ay® Slu As® Ph® Glu Trp Aau Bar As® Ays Pr® Ays 420 425 430

Mat Lau Val Ala Gly Aau Lau He Cys Arg Aau xls Asp Α®ρ XX® Ala 435 440 445

fhr fyr lie Lsn Gin Arg Gly Arg Gly Gin Val Ala Phr Gly Xla Glu 450 455 4SO S«r Tyr Met X«ys Asp Asn Sly Ala T&r Gin Glu Gin Pro Xls Ala Lys 465 476 475 436

He Pha Gio xla Ala x&r Asp Ala Step lys Asp xla Aan Asp Gin Cys 485 480 485 la» Arg Pro Sar loo. Xyr Aan 5ar Arg Asp Yal Lau Mat Arg Xla Pha 500 505 5X0

Asa Lao Gin Arg Xla Xla Asp Val Thr Tyr Xys Gly As» Gin Asp Arg 515 520 525 fyr fhr Gin Pro Glu Aya Val las Ays Pro His Xla Iis Val P5a Phs 536 535 540 PAs Asp Pro 11s Isa Xls 545 550

<210> 39 <211> 1653 <212> ADN <213> Perilla frutescens var.frutescens <220> <223> ADN Valenceno sintase <3 0 0> <308> GenBank AY917195.1 <309> 2005-03-01 <400> 39 afcggefcfce&g aaea&geaaa aaatcatcgc ceegtegaag atfcteteaea eagaifcgfcgg 60 ggcgafccagfc tcgfccaaata tgafcfccfcfcgfc cc&c&ggttc agaagaagta fcfceg&aeaeg 120 gfctgafcgttfc tgaagsagga agttaagggt sfcgsfcasetg etcetggaae eaaaafcggfce 180 gae&egatgg agetgattga eacgategaa ogtot&qgaq tqtçqtttcã efcfcfce&agafc .240 gagatfcgaae aaaaattgca gcagfcfcfcfcfcfc gafccfceaaaa cagattattg caacgatggfc 300 gafcgacgcet afcgafcfcfcgfca eaefcgfcfcget et.fceafcfcfccc gafcfcai.fccag gea&csfcgge 3S0 tacogtatat cttgtgacat ttfctggfcaga tgg&tcgatg gg&atgggaa stteaaggag 420 ggsetgaaga gfegatgggaa gagtfcfcggfca &gtefcgfcaeg aggegtegfca fcefcgagaaea 480 egtggegaaa oeataefcega cgaggcgctc gaetfcfcgcfcg oggcfc&gfcct. gaagtegata 540 gcgccacace tec&afceaee ccfctgggaaa eaagfcfcgfcge acgeecfcagt gcageefcfcfcg 600 eacfctfcggca afcocaagaafc ogaagogogfc aafcfcteaiei ccatetatga ggasiafcgsa 660 ggcatgaatg aagcfceieti gaggfcfcagcfc aaafcfcagaafc afca&fcefcafct gcaaafcgcfca 720 catsaggagg aacttcatca agtctcgagg tggtggaaag atttgg&tct gato&eg&aa 780 cfcfcccatatg aaagagatag agtggtggag fcgfcfefcefcfcfcfc gggesgtegg agfcafcaccafc 848 gageeaeaafc afcfcetegfc.ge fcegfcgfcaafcg efcfcaefcaaaa ccafcegtfcafc gacctcfcafca 000 aiagafcgafca etfcafcgafcge ttatggtacc atigaagaae ttgafeatttt saetgaagea 060 atagagaggt ggaatgfctga agagacfcaaa aggsfcaccsg agtacatgaa aeeafctgfcafc 1020 aaagctcttc tggaactcta caagcagttt gaacaagaac tagaaaagga aggaagafcee 1080 fcacgtggeat aefcatgceat egaafcetefcfc aaggaattgg tgagaagcta tcgcattgag 1140 geaaagfcggt fcfcafcacaagg at.afc.fct.aeea eefcfcaegaag aafeaecfcaaa gaatgcactg 1200 afccaecfcgea efcfcacfcgfcfca eeaeaeaaeg aegfcegfc.fc.gfc. fcgggggfc.fc.ga afccsgccsfce 1260 aaggaaaaet fccgaatggcfc aagcaacaaa ectaaaafcga tfcgtagctgg eeteefcaata 1320 fcgfccgacfcca tfcgafcgacafc agcfcacfcfcafc atcctggaga qqggt&qqqq teaggttget 1380 ggfcgggafcgg agfcggfcaeafc gaaggafcaafc ggegeaaeae aagaggaaee eatagefcaaa 1440 afcfctfcegaaa tagefcaeaga fcgeafcggaag gafcafcaaafcg segaafcgefcfc gsgaeefcsge 1500 cfcfcfcaoaaefc ogagggafcgfc fcfcfcgafcgega afcafcfcfcaaee fetgaaegfeat- aatagacgtt 1560 acfctac&aag gcaaccaaga tcgafcacaafc caaccagasa aggttfctgaa gecfceaeate 1620 sfcfcgfcefcfccfe tcfctogafccc cafctctcafcfc fcaa 1883

<210> 40 <211> 1647 <212> ADN <213> Citrus sinensis <220> <223> ADN Valenceno sintase Citrus <3 0 0> <308> GenBank AF441124.1 <309> 2004-01-12 <400> 40 atgtcgtctg gagaaacait fccgfccctact gcagatfctcc afcccfcagttt atggagaaac €0 cafcfcfcectca aaggtgctfcc tgafcttcaag acagltgafcc afcacfcgcaac tcaagaacga 120 cacgaggcse tgaaagssga ggfc&sggags atgataaeag atgetgaaga ta&gegtgtt 180 cagaagttac gcttgattga fcgaagtae&a egectggggg tggcttatca otttgagaaa 249 gasataggag atgcaataca aaaattatgfc cca&tctafca tfcg&cagtaa tagagctgat 309 ctccacaecg ttteeettea ttttcggttg ctt&ggeage aaggaatcaa g&tttc&tgi 380 gatgtgtttg agaagttcaa agafcgatgag ggtagattca agtcatcgtt gataaacgat 420 gttc&gggga tgfcts&gttt gtacgaggsa gcataaatgg cagtfcogcgg aga&cat&ta 489 ttagatgaag ccattgcttt eaetaecact cacctgaagt cattggtagc tcaggafccafe 549 gtsaecceta agcttgcgga aeagataaai catgctttat acegfcoetofc. fccgtaaaacc 500 ctaccaagat tagaggegag gtaitttatg tccatgatca attcaacaag tgatcattta 550 fcgcaafcaaaa ctctgctgaa ttttgcaaag tfeagatttta acatattgct agagctgcac 720 aaggaggaac tcaatgaatt aacaaagtgg tggaaagafet tagacttcaa taga&aagta 780 ccttatgc&a gagacagatt agtggagtta tatttttggg atttagggac atacttcgag 840 cctcaatatg catttgggag aaagataatg actcaafciaa attscatatt atccafccata 800 gatgatacfct afcgafcgagta tggtacactt gaagaactca gcctctttac tga&gcagtt 050 oaaagatgga atattgaggc egtagatatg cttccagsat acatgaaatt gatttscsgg 1020 acaetcttag atgctfc.fc.taa fcgaaafcfcgag gaagatatgg ccaagcaagg aagateaeac 1080 tgcgtacgtt atgcaaaaga ggagaattaa aaagtaattg gageataetc fcgttcaagcc 1140 aaatggttca gtgaaggtfca cgtfccaaaca attgaggagt atatgcctafe tgcaafcaaca 1800 agttgtgctt aoagattogt e&taaggaat tgettocttg gcatgggtga ttttgcaact 1250 aaagaggttfc ttg&atggat cfcccaataac cctaaggttg taaaagcagc atcagttatc 1320 tgcagactca tggatgscat gcsaggtnafc gagtfctgagc agaagagagg acafcgfctgcg 1380 tcagctattg astgttaeae gaagcagcat ggtgtcfccta aggaagaggc aatfcaaaatg 1440 tfetgaagaag aagfetgcaaa igcatggaaa gataifcaacg aggagitgat gatgaagcca 1500 acggtggttg ccegaecaet gctcgggacg attcttaatc ttgctcgtgc aattgatttt 1550 atttacaaag aggacg&egg ctafcacgcat tcttacctaa ttaaagatca aattgctfcct 1820 gtgctaggag accacgttcc attttga 1847

<210> 41 <211> 1750 <212> ADN <213> Hyoscyamus muticus <220> <223> ADN premnaspirodieno sintase <3 0 0> <308> GenBank U20188.1 <3 0 9> 1996-01-31 <400> 41 gttgacaatc aggttgcgga aaagtatgct caagagafcfcg aaactfclgaa ggaacaaaca ¢0 agtaetaigt tgfcctgctgc tigiggaaca acattgacfcg agaaattgaa tttgatagat 120 afefcattgagc gccfctggaat agctiafccat ttcgagaaac saatagaaga tatgifcggat 180 oa«attla«a g&getgatcc ttatfcifcgag gctcatgaat aeaatgattt aaaeacttaa 240 fcccgttcaafc ttcgactact cagaaaacat ggfctacaacg tetctccaaa. tatatttagc 300 agattccaag atgeaaatgg caaattcaag gagtctctta gaagcgacat caggggecta 368 gtga&cttat aegaaggt-to aeatgtaagg agfc&ataaag &ggatafct.tt ggaagaagea 420 cfcfcgtttt.tt ctgttggtaa totfcgaafcefc gcagctoeac atttgaagte aoototgagfc 480 aaggaagtga cacatgggst ogaacaatet «tcaataaga gcattegaag agtogagata 840 cggtacttca tctccatcta ogaagaggag gaatttaaga atgatttgtfc gcfcfecgafctt €00 gctsaattgg attacaacti acticagatg ttgcacaagc atgaactcag fcgaagtafcca 880 aggtggfcgga sagafcfctgga ttfcsgtgaea acactteeat afcgetaggga cagageagfefc 720 gagtgctacfe tttggacgafc gggggfegtafc gctgaaccte aatacfcccca ggcfccgtgtc 780 atgcfcfcgeta agaetafcagc aaigafcitce stagtagaig aeacaitega fcgefcfcatggg 840 ategtxaaaag aacfctgaagt. ct&e&eagafc gccatacaga ggtgggatafc fc&gteaaait 900 gatcgactcc cggaataiat gaaaatcagt tafcaaggctc ttttggatct etatgacgat 380 tatgaaaagg agttgtcaaa ggatggtaga tccgatgttg tccactatgc aaaagaaaga 1028 atgaaggaga tfegtgggaaa otattttatt gaaggaaaat ggtttattga gggatatafeg 1S8Q ecafcctgtfct ccgagtacct tagcaafcgca ctagctacta gcagatatta cttgctaast 1140 acg«c«feocfe actlgggaat gaaatcagca accaaggaac atifctgaatg gttggctacg 1200 aacccfcaaaa ttctggaagc t-aatgctaca tfcatgecgag ttgttgaiga c&tagccacg 1280 tatgaggfetg agaagggtag gggfccaaat-t- goaaçaggaa ttgagtgt-ta featgagggat 1320 tacggtgtafe eoacagaagi agcaatggag aaatfcçç&ag aaatggctga eafcageafcgg 1380 aaggatgtaa atgaagaaat tcttcgacaa aoacctgtct cfctcagaaat tatfcactcgfc 1440 attctcaac-c iggcicgaat tafcagatgtc actiacaagc afcaatcaaga tggatacaafe 1508 oatcctgaaa aagfcacfcaaa acctcacatc atcgccttgg tggtggattc tattgaiatfc 1588 tgaatcaeea aitgtt.gt.gt acacctggga geaeiiggtt cccaccccct caaataagtt 1888 fcttgaeagae acttgaigga tggtatctcfc gttgataggt ataeatgiig taatcgtgca 1680 gtgaagttac gtccttaatt etfeiigtatg attatttaea tttgaaatat aataattctg 1740 ciiittaacfc 17 50

<210> 42 <211> 1839 <212> ADN <213> Citrus hystrix <220> <223> ADN germacreno D sintase <3 0 0> <308> GenBank HQ652871.1 <309> 2011-06-28 <400> 42 atgtet.gfctg aaggfcteige çga&gsattt ggggfcg&tça tfefcççttcaa €0 tatacfccgfcg acttcscagga aactggtgat cgaagtgtaa agcatctaga gcfcgaagaaa 120 gaaafcfcagaa gaatgefc&aa agctgtaaae aagacttcac atacactcga attgatagat 188 gcaatfccagc ggtfcaggagfc gfccfcfc&ccat tfcfcga&agfcg agattgatga aatctfcggga 248 aag&tgesoa agaefcfcatag agactgfcg&t ctfctgtgata aigaaaatga fcgagefcttat 388 tatatetttg tttagtttsg attgttcaga eaaaatggtt· afcagaatttg ggçfcgatgtt 388 tfceaat&cgfe tcaagggcag egafcgggaaa tfctaagggai etefctgc&aa agatgfcfcega 428 ggaatgttaa ggttgtafcga agstagacat ctgngggtt« atggagaaaa tstagfctgst· 488 gaggcgefctg cttfccace&e tagtcacctt gagtcagfcag caaaacaagfc cigttefccca §48 cfcagttgaae aagtea&gea egccttagtt eagccfcatcc acaagggctt ag&aaggett 808 g&ggcaagac actacattcc taictafccaa ggagaatcfct cccacaatga agctefcgtta 888 acctttgcaa agttsggttt taaiggattg caaaagctfcc accagaagga actcggtgafe 728 at.fctc»aggt ggt.ggaaàg& attagaettt gggeatsagc tàceatfccgt sagagataga 788 att.gcagagg tc-tacttttg ggaagfeagga gttaatt.fecg agcccaaafea tt-cgtttac.t 848 agaaaactat ttacgaaagt gaitfcafcatg acatctafeca ttgatgacafe otatgatgtg 808 feafeggcaaaa itgaagaaci igatetfctfct acttcagcfca ttgaaaggtg ggaiafceaafc 988 gccatagate asettcetga gtatatgaaa ctgtgtatta gggcgcttat caatgtttac 1828 agtgaagfcag agaaagattt ggtetcccag gggaagttat aecgactcea tfe&tgcgaaa 1888 gaagcsatga agaatcaagfc taagcattac ttctttgaag cisaatggtg teateagaat 1148 tatgttccga cggfcggatga gtacatgacg gttgc&ttaa ttagctctgg eoaeacaaat 1288 ttgteaacca tatcttttgt tggcctggga gacattgtaa ciaaagaate tt-ttgaatgg 1288 ttafcteagca atccfcagatc gattagggcfc tcttgfcgcag itggcagact aat-gaatgac 1328 atggtgte&e acaagtttga aoaaagoaga gggoaogttg eotgaagcgt tgagtgttac 1388 atcaaceaat atggagcaac agaagaggaa gíjatacagtg agttgeggaa acaagtttca 1448 a&tgcat-gga aggatat&aa tgaggaatgc ctgegeecaa etgttgtgcc agtgecacfcfc 1588 ettatgcgaa ttetcaafcct tacacgagct gcagatgtca tfctacaagta iaaagafcggc 1588 tacaettact ccgaagagct gaaagatttt attgttfccfcc tgcfetafctaa tectgtgecg 1828 atatgagcat gatatlaage ttatgtttca aeaccetgct ggaaaataat tagfcecattg 1888 «cgtttcaga ttggatgstfc tfcfeaaaasta aattgaaggg tggtgafcecc cgttgtaafce 1748 agagtgcaet caaatagaca agt.ggt.aata aagt.tttata gctctatt.fea attaaattat 1888 ecagcagiit geaegattaa aaasaaaaaa aaaaaaaaa 1833

<210> 43 <211> 1722 <212> ADN <213> Chamaecyparis nootkatensis <220> <223> ADN valenceno sintase <3 0 0> <310> WO 2011/074954 <309> 2010-12-15 <400> 43 afcgcccgtga aggacgccct tcgtcggacfc ggaaatcafcc afccctaacfcfc gfcggactgafc 60 gatttcatae agtcccfccaa ttctccatat tcggatfccfct cataccataa acatagggaa 120 afcactaattg atgagattcg tgafcatgttt tctaafcggag aaggcgatga gfctcggtgta 180 ctfcgaaaata ttfcggttfcgt tgafcgtfcgta caaegtfctgg gaatagatcg acattttcaa 240 gaggaaatea aaaetgeact fcgattaiatc tacaagttat ggaateatga tagtaiittt 300 ggegafccica acatggtggc fcctaggattt cgga&aefcae gaeiga&iag atatgtcgct 360 tcttcagatg tttttaaaaa gfcfccaaaggt gaagaaggae aattctctgg tttcgaatct 420 agagatcaag afcgcaaaafcfc ag&aatgatg ttaaatttat afcaaagctta agaattagat 4B0 tfcfcectgatg aagafcatefefc aaaagaagca agagcgttfcg cfctctafcgfca cetgaaacat 340 gfctatoaaag aatafcggtga catacaagaa tcaaaaaafcc eacttcfcaat ggagatagag 600 tac&cvfciia sat&tcettg gagatgtagg cfctccaaggt tggaggcttg gaacifeiafefc 660 c&iataatgs g&ca&eaaga fefegca&tata tcsettgcca aiaaecfctta iaaaafct.»ca 720 ***M*fc*fc*fc* tgaaaaagat attggagcta ggastaetgg ag$tg««t»t tttgoagtea ?$0 caacatc-asc at.gaaa.tgaa attaatatgç. acstggtgga aaaattcaag tgcaafctcaa §40 fctggafcttat ttcggcatcg toacatagaa agfctatfcttt ggtgggctag fceeafcfcatfct 800 gaacctgagt tcagtaeatg tagaattaat tgfcaecaaat tatctaeaaa aatgttccte 960 cttgacgata ttfcatgacac atafcgggacfc gttgaggaai tgaaaccatt cacaacaaca 1020 feisscaagat gggaigittc cac.agkt.gafc aatcafcccag actatafcgaa aafcfcgcfcfcfcc. 1080 aafcfcfcfctcai atgagatata taaggaaatt gcaagtgaag ccgaaagaaa gcatggtccc 1140 fcfcfcgfcfctaca asfcaccttca atcfcfcgefcgg aagagfcfcafca tcgaggctta fcafcgt&agaa 1200 gcagaatgga tagcfcfccfcaa tcafcatacca ggfcttfcgatg aatacttgat gaatggagia 1260 aaaagtagcg gcafcgcgaat tcfcaafcgata catgc-aatsa tactaatggs tsctccttta 1320 tatgatgaaa ttttggagga açtfcgatafcc ççaiçafccca agtçgç&agg tcttgtatça 1300 tfcsattactc g&cfcagfcgga fcg&tgteaaa g&cfctfcgagg atgaaca&gc fcsafcggggag 1440 atggcafccaa gtatagagfcg ct&catgaaa gacaaccafcg gfctctacaag ggaagatgct ISO 0 tigaatiaic tcaaaattcg t&tagagagt tgtgtgcaag agttaaataa ggagcttctc 1S60 gagccttçaa atatgcatgg atcttttaga aacçt&tatc tçaafcgfcigg e&tgçgagfca 1620 atatttttts tgctcaatga tggtgatctc fcfcfcacacast ccaatagaaa agagafcacaa 1660 gatgcaataa caaaatttfet tgtggaacca afccafcfcceat ag 1722

<210> 44 <211> 1770 <212> ADN <213> Chamaecyparis nootkatensis <220> <223> ADN valenceno sintase <3 0 0> <310> WO 2011/074954 <309> 2010-12-15 <400> 44 atggctgaaa tgfcfcfcaafcgg aaafcfcccagc aatgafcggaa gkkisktqa&k gcccgigaag SÔ gacgccctfcc gtcggactgg aaatcatcafc ccfcaaefcfcgt ggaefcgafcga tfcfccaiacag 120 fccecicaatfc ctceaiattc ggattcfctca taceataaac atagggaaat actaattgat 180 gagattcgtg afcatgfcttte taatggagaa ggcgafcgagfc feeggtgtact cgaaaatatt 240 tggtttgttg atgtfcgtaca acgtttggga afcagatcgac attttcaaga ggaaatcaaa 300 aefegcacttg afctatafceta caagtfccagg aafccafcgata gtafcttttgg og&fcctcaac 300 atggiggetc taggatfcfceg gatactacga ctgaatagat atgtcgettc ttcagatgtt 420 tttaaaaagt tcaaaggtga agaaggacaa ttctafcggtt ttgaatctag cgataaagat 480 gcaaaatfcag aaatgafcgfcfc aaafcitatafc aaagettcag aatt&gattt tcctgatgaa 840 gatatctfcaa aagaagaaag agcgfctfegct ictafcgfcacc tgaaaeatgt tatcaaagaa 800 tatggfcgaea tacaagaatc aaaaaafecca çfctçtaatgg agafcagagca cacttttaaa 880 tatcottgga gatglaggct tccaaggttg gaggcttgga açtttattca tataatgaga 320 caacaagatt gcaatatatc acfctgceaafc aacctttata aaattc-caaa aatatatafcg 780 aaaaagatat tggaactage aatactggac ttcaatatfct tgcagtcaca acatcaacat 840 gaaatgaaafc feaatatccac atggtggaaa aattcaagtg caattcaatt gg&ttfccttt 800 cggcatcgtc acatagaaag ttatttttgg tgggctagtc cattatttga acctgagttc 880 agtacatgta gaattaattg taccaaatta tctacaaaaa tgfctcctcct tgaeg&t&fcfc 1020 tatgacacat atgggactgt- tgaggaattg aaaccattca caacaacatt aacaagaigg 1080 gafegttfceca aagfctgaiaa tcstccagae taeafegaaaa ttgctttcaa fctttteaiafc 1140 gagatafcata aggaaattga aagtgaagce gaaagaaage afeggtccctfe fegtttacaaa 1200 fcaacttcaafc cfcfegctggaa gagttafcatc gaggcttafca fcgeaagaaga agaatggata 1280 gefcfcctaate afcataccagg tfcfctgatgaa fcactfcgatga afcggagfcaaa aagtageggc 1320 afegcgaattc iaatgafcaca tgeactaata cfcaafeggafca atectttatc igatgaaafcfe 1380 tt-ggagcaac t-tgatatccc atcatccaag tageaagcfcc tfectatcatfe aattactcga 1440 afcagtggatg atgto&aaga sfctfcgaggafc gaaeaagcfcc afcggggagafc ggcatcaagt 1500 atagagtgct asatg&aaga saaccatggt tctacaaggg aagatgcttt gaattatsfca 1500 aaaattcgta tagagagttg tgtgcaagag ttaaataagg agottctcga gccttcaaat 1820 atgcatggat cfefettagaaa ectafcatctc aatgttggca fcgcgagtaafc attttttafcg 1880 afccaafegatg gtgatctcfcfc fcacacacfccc aafcagaaaag agatacaags fcgcaataaca 1740 aaattttttg fcggaaccaat cattccatag 1770

<210> 45 <211> 541 <212> PRT <213> Citrus hystrix <220> <223> Proteína germacreno D sintase <3 0 0> <308> GenBank ADX01384.1 <309> 2011-06-28 <400> 45

Met Ser Vai Glu Gly Ser Ma Asn She Hi a Sro Ser lie !rp Gly Asp i 5 18 15 III the Leu Gin fyr f&r Ara Asp the Gin Gin fhr Gly Asp Are Ser 20 £5 m

Vai Ays His Lee Gin leu Aya Ays Gin lie Arg Arg Mat leu Ays Ala 35 40 43 vai Asn lys fhr Ser Mia Thr leu Gin Leu lie Asp Ala Ile Gin Arg 50 55 88

Leu Gly Vai Ser Tyr Mia the Gin Ser Gin Ile Asp Gin ile Aeu Gly SS 70 75 88

Lys Met His Ays Thr fyr Arg Asp Cys Asp Aeu Cys Asp Asn Gin Asn 85 * 80 85

Asp Gin Leu fyr iyr Ile Ser Aen Gin the Arg Leu the Arg Gin Asn 100 185 118

Gly Syr Arg Ile Ser Ala Asp Vai the Asn Thr the Ays Gly Ser Asp 115 128 125

Gly Ays the Ays Ala Ser Leu Ais Lys Asp Vai Arg Gly Met Aeu Ser 138 135 148

Ann fyr Gin Ala fhr His Leu Arg Vai Sis Gly Gin As» lie Leu Asp 145 150 155 188

Gin Ala Aeu Ala the Thr Thr Ser Mia Aen Glu Ser Vai Ala Lys Gin 185 178 175

Vai Cys Ser Pro Aen Vai Gin Gin Vai Ays His Ala Leu Vai Glu Sro 180 188 180 lie Hia Ays Gly Aen Glu Arg Leu Gin Ala Arg His Tyr Ile Sro Ile 195 200 205

Tyr Gin Sly Slu Sar Sar Els Asn Slu Ala leu leu Thr Fhe Ala Lye 210 215 220 Leu Sly Fhe Aau Sly 18¾ Sin Lys Leu Hie Sin Lys Slu Leu Sly Asp 225 230 235 240 lie Sea Ary Trp Trp lya Slu leu Asp She Ala Hie lya leu Pro She 245 250 255

Val Are Asp Arg Ila Ala SI a Sal Syr Fhe Trp Ala Sal Sly Sal Mia 200 205 220

She Slu Fra Sin Tyr Ear Pha Thr Arg Lya leu She Thr lya sal lie 275 200 205

Tyr Mat Thr Oar He He Asp Asp He Tyr Asp Vai Tyr Sly lya He 290 295 300

Slu Slu lau Asp leu Fhe Thr Sar Ala Xla Sin Arg Trp Asp Xla Asu 305 310 315 320

Ala Xla Asp Sin leu Fro Slu Tyr Met Lys lau Cys Xla Arg Ala leu 325 330 335

He Asa Sal Tyr Sar Slu SaX Slu lya Asp leu Val Ser Gin Sly Aye 340 345 350 leu Tyr Arg leu Els Tyr Ala lys Slu Ala Mat lya Asa Sin sal lya 355 300 305

Mia Tyr Fhe Fhe Slu Ala lya Trp Cys Eis Sla Asa Tyr Sal Fre Thr 370 375 380

Sal Aap Slu Tyr Mat Thr Sal Ala Lau Xla far Ser Sly si a Fro Asa 385 390 395 400 lau 8ar Thr Ha Ear She Sal Siy leu Sly Aap lie Sal Thr Ays Slu 405 410 415

Sar Phe Slu Trp Leu Fhe Ear Aon Pro Arg Sar lit Arg Ala Ser €ye 420 425 430

Ala sal sly Arg lau Met Aan Aap Mat sal Her Hie lya Fhe Slu Slu 435 440 445

Oar Arg Sly Eis Sal Ala Sar Ear Val Slu Cya Tyr Xla Asa Slu Tyr 450 455 400

Sly Ala Thr Slu Slu Slu Ala Tyr Sar Slu Fhe Arg lya Sla Sal Sar 455 470 475 * 480

Asa Ala Trp lya Aap He Aau Slu Slu Cya leu Arg Fra Thr Val Sal 485 490 495

Fra Sal Fro leu leu Mat Arg He leu Aaa lau The Arg Ala Ala Aap 500 505 510 sal He Tyr lya Tyr lya Aap Sly Tyr Thr Tyr Ser Slu Slu lau lya 515 520 525

Aap Pha Ha Sal Sar lau leu Ha Aan Fro Sal Fra Xla 530 535 540

Claims

REIVINDICAÇÕES

1. Um polipéptido isolado de valenceno sintase de Eryngium, compreendendo uma sequência de aminoácidos que tem pelo menos 90% de identidade de sequência com o polipéptido de valenceno sintase cuja sequência é apresentada em SEQ ID NO: 1 ou a um seu fragmento cataliticamente ativo, em que: o polipéptido de sintase catalisa a formação de valenceno a partir de um precursor de pirofosfato de terpeno acíclico; e as células que expressam o polipéptido de valenceno sintase de SEQ ID NO: 1 catalisam quantidades mais elevadas de valenceno em comparação com células que expressam a valenceno sintase cítrica (Citrus sinensis) (CVS) cuja sequência é apresentada na SEQ ID NO: 14.

2. O polipéptido de valenceno sintase isolado de acordo com a reivindicação 1, que compreende ou consiste na sequência de aminoácidos estabelecida na SEQ ID NO: 1 ou um seu fragmento cataliticamente ativo.

3. O polipéptido de valenceno sintase isolado de acordo com a reivindicação 1 ou a reivindicação 2, em que o precursor de pirofosfato de terpeno aciclico é difosfato de farnesilo.

4 Um polipéptido de valenceno sintase que é um fragmento cataliticamente ativo do polipéptido de valenceno sintase isolado de qualquer reivindicação 1 ou reivindicação 2, em que o fragmento cataliticamente ativo catalisa a formação de valenceno a partir de um precursor de pirofosfato de terpeno aciclico.

5. Uma molécula de ácido nucleico isolada que codifica um polipéptido de valenceno sintase de Eryngium glaciale ou um fragmento cataliticamente ativo de qualquer das reivindicações 1-4.

6. Uma molécula de ácido nucleico que codifica um polipéptido de valenceno sintase de Eryngium glaciale ou um fragmento cataliticamente ativo segundo qualquer uma das reivindicações 1-4, em que a molécula de ácido nucleico é cADN.

7. A molécula de ácido nucleico isolada de acordo com a reivindicação 5 ou a reivindicação 6, em que: o polipéptido de valenceno sintase codificado compreende uma sequência de aminoácidos apresentada na SEQ ID NO: 1; ou o polipéptido de valenceno sintase codificado compreende uma sequência de aminoácidos que tem pelo menos 95% de identidade de sequência com o polipéptido de valenceno sintase cuja sequência é apresentada em SEQ ID NO: 1 ou com um seu fragmento catalit icamente ativo.

8. A molécula de ácido nucleico isolada de acordo com a reivindicação 5, em que o polipéptido codificado de valenceno sintase exibe pelo menos 95% de identidade de sequência de aminoácidos com a sequência de aminoácidos apresentada na SEQ ID NO: 1 ou a um seu fragmento cataliticamente ativo.

9. A molécula de ácido nucleico isolada de qualquer uma das reivindicações 5-7, selecionada entre as moléculas de ácido nucleico compreendendo: (a) a sequência de ácidos nucleicos apresentada na SEQ ID NO: 2; (b) uma sequência de ácidos nucleicos com pelo menos 85% de identidade de sequência com uma sequência de ácidos nucleicos estabelecida na SEQ ID NO: 2 e codificando um polipéptido de valenceno sintase com pelo menos 90% de identidade de sequência com o polipéptido da SEQ ID NO: 1; e (c) degenerados de (a) e (b).

10. A molécula de ácido nucleico isolada de qualquer uma das reivindicações 5-9, compreendendo ou consistindo na sequência de nucleótidos apresentada na SEQ ID NO: 2.

11. A molécula de ácido nucleico isolada de qualquer uma das reivindicações 5-10, em que o polipéptido de valenceno sintase codificado compreende a sequência de aminoácidos apresentada na SEQ ID NO: 1.

12. Um vetor, que compreende a molécula de ácido nucleico de qualquer uma das reivindicações 5-11.

13. Um vetor de acordo com a reivindicação 12, em que o vetor é um vetor procariótico, um vetor virai ou um vetor eucariótico, de preferência em que o vetor é um vetor de levedura.

14. Uma célula compreendendo a molécula de ácido nucleico de qualquer das reivindicações 5 a 11, em que a molécula de ácido nucleico é heteróloga para a célula e se a célula é uma célula humana, é uma célula isolada ou está numa cultura de células; ou uma célula hospedeira que: a) codifica um polipéptido de valenceno sintase ou um seu fragmento cataliticamente ativo de qualquer uma das reivindicações 1 a 4, em que a célula hospedeira produz um precursor de pirofosfato de terpeno acíclico; o polipéptido de valenceno sintase é heterólogo para o hospedeiro; o polipéptido de valenceno sintase catalisa a produção de valenceno a partir do precursor; e se a célula hospedeira é uma célula humana, é uma célula isolada ou uma célula cultivada; b) compreende o vetor da reivindicação 12 ou reivindicação 13, em que, se a célula é uma célula humana, é uma célula isolada ou está numa cultura de células; ou c) compreende um ácido nucleico que codifica o polipéptido de valenceno segundo a reivindicação 1, em que o polipéptido de valenceno sintase codificado tem pelo menos 95% de identidade de sequência com o polipéptido de valenceno sintase cuja sequência é apresentada em SEQ ID NO: 1 ou a um seu fragmento cataliticamente ativo ; o polipéptido de valenceno sintase ou o seu fragmento cataliticamente ativo catalisa a formação de valenceno a partir de um precursor de pirofosfato de terpeno aciclico; o ácido nucleico é heterólogo para a célula hospedeira; e se a célula é uma célula humana, é uma célula isolada ou está numa cultura celular.

15. A célula da reivindicação 14, que é uma célula procariótica ou uma célula eucariótica.

16. Célula de acordo com a reivindicação 14 ou reivindicação 15, que é selecionada entre uma bactéria, de preferência Escherichia coli, levedura, inseto, planta e célula de mamífero.

17. Célula de qualquer das reivindicações 14 a 16, que é uma célula de levedura e é uma célula do gênero Saccharomyces, de preferência Saccharomyces cerevisiae ou uma célula do gênero Pichia.

18. A célula de qualquer das reivindicações 14 a 17, que produz difosfato de farnesilo nativamente ou é modificada para produzir mais difosfato de farnesilo em comparação com uma célula não modificada.

19. A célula hospedeira da reivindicação 14 que é uma célula hospedeira de levedura, de preferência uma célula de Saccharomyces cerevisiae.

20. Célula hospedeira da reivindicação 14 ou reivindicação 19, em que o precursor é difosfato de farnesilo.

21. Uma planta transgênica, compreendendo o vetor de qualquer uma das reivindicações 12-13 ou molécula de ácido nucleico de qualquer uma das reivindicações 5-11, em que a molécula de ácido nucleico é heteróloga para a planta.

22. A planta transgênica da reivindicação 21 que é uma planta de tabaco.

23. Um método para produzir um polipéptido de valenceno sintase, que compreende: a) a cultura de uma célula de qualquer uma das reivindicações 14-20 em condições adequadas para a expressão do polipéptido de valenceno sintase para produzir o polipéptido de valenceno sintase ou um seu fragmento cataliticamente ativo. b) a introdução de uma molécula de ácido nucleico de qualquer uma das reivindicações 5-11 ou de um vetor de acordo com a reivindicação 12 ou a reivindicação 13 dentro de uma célula; cultivando a célula in vitro ou in vivo em condições adequadas para a expressão do polipéptido de valenceno sintase, pelo que o polipéptido de valenceno sintase codificado ou um seu fragmento cataliticamente ativo é expresso.

24. 0 método da reivindicação 23, compreendendo ainda o isolamento do polipéptido de valenceno sintase e / ou um seu fragmento cataliticamente ativo.

25. Um método para a produção de valenceno, que compreende: a) contactar um precursor de pirofosfato de terpeno acíclico com o polipéptido de valenceno sintase ou fragmento cataliticamente ativo de qualquer das reivindicações 1-4 ou o polipéptido ou fragmento codificado pela molécula de ácido nucleico de qualquer das reivindicações 5-11, em condições adequadas para a formação de valenceno do precursor de pirofosfato de terpeno acíclico, em que o passo de contacto do precursor de pirofosfato de terpeno acíclico com o polipéptido de valenceno sintase é efetuado in vitro ou in vivo, com a condição de que, se contactado in vivo numa célula, o polipéptido codificado de valenceno sintase é heterólogo para a célula hospedeira, e se a célula é uma célula humana é uma célula isolada ou está numa cultura celular; ou b) cultura de uma célula que contém a molécula de ácido nucleico de qualquer uma das reivindicações 5-11 ou um vetor de qualquer das reivindicações 12 ou 13 para produzir valenceno, em que: a molécula de ácido nucleico é heteróloga para a célula. a célula produz um precursor de pirofosfato de terpeno acíclico; o polipéptido de valenceno sintase codificado pela molécula ou vetor de ácido nucleico é expresso; e o polipéptido de valenceno sintase catalisa a formação de valenceno a partir do precursor de pirofosfato de terpeno acíclico para produzir valenceno.

26. 0 método da reivindicação 25, em que o precursor de pirofosfato de terpeno acíclico é difosfato de farnesilo.

27. 0 método da reivindicação 25 ou 26, em que a célula é uma célula procariótica ou uma célula eucariótica que é selecionada entre uma bactéria, levedura, inseto, planta ou célula de mamífero.

28. 0 método de qualquer das reivindicações 25 a 27, em que a célula é uma célula de levedura que é uma célula do género Saccharomyces, de preferência Saccharomyces cerevisiae, ou uma célula do gênero Pichia.

29. 0 método de qualquer das reivindicações 25-28, em que a célula produz difosfato de farnesilo ou é modificada para produzir mais difosfato de farnesilo em comparação com uma célula não modificada.

30. 0 método de qualquer uma das reivindicações 25 a 29, compreendendo ainda o isolamento do valenceno.

31. Um método para a produção de nootkatona, que compreende: (D (a) contatar o difosfato de farnesilo com o polipéptido de valenceno sintase de qualquer uma das reivindicações 1-4 e/ou o polipéptido codificado pela molécula de ácido nucleico de qualquer uma das reivindicações 5-11, pelo que o valenceno é produzido; (b) isolar o valenceno produzido no passo (a); (c) oxidar o valenceno para produzir nootkatona; e (d) isolar o nootkatona; ou (ii) (a) cultivar uma célula compreendendo uma molécula de ácido nucleico de qualquer uma das reivindicações 5-11 ou um vetor das reivindicações 12-13 em condições que resultam na produção de valenceno; (b) isolar o valenceno produzido no passo (a); (c) oxidar o valenceno para produzir nootkatona; e (d) isolar o nootkatona; em que a célula produz um precursor de pirofosfato de terpeno aciclico; o polipéptido de valenceno sintase codificado pela molécula de ácido nucleico ou vetor é expresso; e o polipéptido de valenceno sintase catalisa a formação de valenceno a partir do precursor de pirofosfato de terpeno aciclico.

32. 0 método da reivindicação 30 ou 31, em que o valenceno é isolado por extração com um solvente orgânico e / ou cromatografia em coluna.

33. O método de qualquer das reivindicações 24 a 32, em que a oxidação é realizada biosintéticamente ou quimicamente.

34. O método de qualquer das reivindicações 24-30 ou 32, compreendendo ainda a oxidação do valenceno para produzir nootaktona e isolar a nootaktona.

35. O método de qualquer uma das reivindicações 31 a 34, em que o nootkatone é isolado por extração com um solvente orgânico e / ou cromatografia em coluna.

36. O método de qualquer uma das reivindicações 31 (ii), 32 ou 33, compreendendo ainda isolar aristoloceno, que é o composto do pico n. 0 2 na Figura 3A.