PT975765E - Plant fatty acid epoxygenase genes and uses therefor - Google Patents

Plant fatty acid epoxygenase genes and uses therefor Download PDF

Info

Publication number
PT975765E
PT975765E PT98913438T PT98913438T PT975765E PT 975765 E PT975765 E PT 975765E PT 98913438 T PT98913438 T PT 98913438T PT 98913438 T PT98913438 T PT 98913438T PT 975765 E PT975765 E PT 975765E
Authority
PT
Portugal
Prior art keywords
leu
epoxygenase
phe
tyr
gly
Prior art date
Application number
PT98913438T
Other languages
Portuguese (pt)
Inventor
Allan Green
Surinder Singh
Marit Lenman
Original Assignee
Basf Plant Science Gmbh
Commw Scient Ind Res Org
Commw Scient And Ind Res
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AUPO6223A external-priority patent/AUPO622397A0/en
Priority claimed from AUPO6226A external-priority patent/AUPO622697A0/en
Application filed by Basf Plant Science Gmbh, Commw Scient Ind Res Org, Commw Scient And Ind Res filed Critical Basf Plant Science Gmbh
Publication of PT975765E publication Critical patent/PT975765E/en

Links

Landscapes

  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Description

DESCRIÇÃO "GENES DE EPOXIGENASE DE ÁCIDO GORDO VEGETAL E SUAS UTILIZAÇÕES"EPOXYGENASE GENES OF VEGETABLE FATTY ACID AND ITS UTILIZATIONS "

CAMPO DA INVENÇÃO A presente invenção refere-se, de forma geral, a novas sequências genéticas que codificam enzimas epoxigenases de ácido gordo. Em particular, a presente invenção refere-se a sequências genéticas que codificam enzimas A12-epoxigenases de ácido gordo, como aqui definido. Mais particularmente, a presente invenção proporciona ADNc e sequências génicas genómicas que codificam epoxigenases de ácido gordo vegetais, de um modo preferido A12-epoxigenases de Crepis palaestina ou Euphorbia lagascae. As sequências genéticas da presente invenção proporcionam os meios através dos quais o metabolismo dos ácidos gordos pode ser alterado ou manipulado em organismos, tais como leveduras, bolores, bactérias, insectos, pássaros, mamíferos e plantas, em particular para converter aí ácidos gordos insaturados em ácidos gordos epoxigenados. A invenção estende-se a organismos acumuladores de óleo geneticamente modificados, transformados com as sequências genéticas em causa, e aos óleos derivados dos mesmos. Os óleos assim produzidos proporcionam os meios para a matéria-prima rentável para utilização na produção eficiente de revestimentos, resinas, colas, plásticos, tensioactivos e lubrificantes, entre outros.FIELD OF THE INVENTION The present invention relates generally to novel genetic sequences encoding fatty acid epoxygenases. In particular, the present invention relates to genetic sequences encoding A12-epoxygenases fatty acid enzymes, as defined herein. More particularly, the present invention provides cDNAs and genomic gene sequences encoding plant fatty acid epoxygenases, preferably A12-epoxygenases of Crepis palaestin or Euphorbia lagascae. The genetic sequences of the present invention provide the means by which fatty acid metabolism can be altered or manipulated in organisms such as yeasts, molds, bacteria, insects, birds, mammals and plants, in particular to convert therein unsaturated fatty acids into epoxidized fatty acids. The invention extends to genetically modified oil accumulating organisms, transformed with the genetic sequences in question, and to the oils derived therefrom. The oils thus produced provide the means for the cost-effective raw material for use in the efficient production of coatings, resins, adhesives, plastics, surfactants and lubricants, among others.

Ao longo desta descrição e das reivindicações que se seguem, salvo se o contexto requerer o contrário, a palavra "compreende", ou variações, tais como "compreendem" ou "compreendendo", será entendida como implicando a inclusão de 1 uma entidade completa ou um grupo de entidades completas referidas, mas não a exclusão de qualquer outra entidade completa ou grupo de entidades completas.Throughout this description and the claims that follow, unless the context requires otherwise, the word " comprises ", or variations, such as " or " comprising " will be understood to imply the inclusion of 1 a complete entity or a group of full entities referred to, but not the exclusion of any other complete entity or group of complete entities.

Os detalhes bibliográficos das publicações referidas pelo autor, nesta descrição são reunidos no fim da descrição. Os números de identidade das sequências (SEQ ID Nos.) para as sequências de nucleótidos e aminoácidos referidas na descrição são definidos depois da bibliografia.The bibliographic details of the publications referred to by the author in this description are gathered at the end of the description. Sequence identity numbers (SEQ ID Nos.) For the nucleotide and amino acid sequences referred to in the disclosure are set forth after the literature.

ANTECEDENTES DA INVENÇÃOBACKGROUND OF THE INVENTION

Existe mundialmente, interesse considerável na produção de matéria-prima química, tal como ácidos gordos, para utilização industrial a partir de fontes vegetais renováveis em vez de petroquímicos não renováveis. Este conceito tem uma vasta aceitação pelos fabricantes e consumidores com base na conservação de recursos e proporciona uma oportunidade significativa para desenvolver novas culturas industriais para a agricultura.There is considerable worldwide interest in the production of chemical raw materials, such as fatty acids, for industrial use from renewable plant sources rather than non-renewable petrochemicals. This concept has a wide acceptance by manufacturers and consumers based on the conservation of resources and provides a significant opportunity to develop new industrial crops for agriculture.

Existe um conjunto diverso de ácidos gordos invulgares na natureza e estes foram bem caracterizados (Badam & Patil, 1981/ Smith, 1970) . Muitos destes ácidos gordos invulgares têm potencial industrial e isto conduziu ao interesse na domesticação dessas espécies para permitir produção agrícola de ácidos gordos particulares.There is a diverse set of unusual fatty acids in nature and these have been well characterized (Badam & Patil, 1981 / Smith, 1970). Many of these unusual fatty acids have industrial potential and this has led to the interest in domestication of these species to allow agricultural production of particular fatty acids.

Uma classe de ácidos gordos de particular interesse são os ácidos gordos epoxi, consistindo de uma cadeia acilo em que duas ligações de carbono adjacentes estão ligadas por uma ponte epoxi. Devido às suas elevadas reactividades, estes têm aplicação considerável na produção de revestimentos, resinas, 2 colas, plásticos, tensioactivos e lubrificantes. Estes ácidos gordos são actualmente produzidos por epoxidação quimica de óleos vegetais, principalmente óleo de soja e óleo de linhaça, contudo este processo produz misturas de formas múltiplas e isoméricas e envolve custos significativos de processamento.One class of fatty acids of particular interest are the epoxy fatty acids, consisting of an acyl chain wherein two adjacent carbon bonds are attached by an epoxy bridge. Due to their high reactivities, they have considerable application in the production of coatings, resins, glues, plastics, surfactants and lubricants. These fatty acids are currently produced by chemical epoxidation of vegetable oils, especially soybean oil and linseed oil, however this process produces mixtures of multiple and isomeric forms and involves significant processing costs.

Estão a ser feitas tentativas por outros para desenvolver algumas plantas selvagens que contêm ácidos gordos epoxi (e. g., Euphorbia lagascae, Vernonia galamensis) em fontes comerciais destes óleos. Contudo, problemas com aptidão agronómica e potencial de baixo rendimento limitam gravemente a utilidade comercial de abordagens tradicionais de cultivo e reprodução de plantas. A sofisticação, rapidamente crescente, da tecnologia de ADN recombinante está a facilitar grandemente a eficiência de processos industriais comercialmente importantes, através da expressão de genes isolados a partir de um primeiro organismo ou espécie num segundo organismo ou espécie para ai conferir novos fenótipos. Mais particularmente, os processos industriais convencionais podem ser tornados mais eficientes ou rentáveis, resultando em maiores rendimentos por custo de unidade, através da aplicação de técnicas de ADN recombinante.Attempts are being made by others to develop some wild plants containing epoxy fatty acids (e.g., Euphorbia lagascae, Vernonia galamensis) in commercial sources of these oils. However, problems with agronomic aptitude and low yield potential severely limit the commercial utility of traditional approaches to plant breeding and breeding. The rapidly increasing sophistication of recombinant DNA technology is greatly facilitating the efficiency of commercially important industrial processes by expressing genes isolated from a first organism or species in a second organism or species to thereby confer new phenotypes. More particularly, conventional industrial processes can be rendered more efficient or cost-effective, resulting in higher yields per unit cost, through the application of recombinant DNA techniques.

Além disso, a escolha apropriada do organismo hospedeiro para a expressão de uma sequência genética de interesse proporciona a produção de compostos que não são normalmente produzidos ou sintetizados pelo hospedeiro, com um elevado rendimento e pureza.In addition, the appropriate choice of the host organism for the expression of a genetic sequence of interest provides the production of compounds which are not normally produced or synthesized by the host in high yield and purity.

Contudo, apesar da eficácia geral da tecnologia de ADN recombinante, o isolamento de sequências genéticas que codificam enzimas importantes no metabolismo dos ácidos gordos, em particular, os genes que codificam as enzimas A12-epoxigenases 3 de ácido gordo responsáveis para pela produção de ácido 12.13- epoxi-9-octadecenóico (ácido vernólico) e ácido 12.13- epoxi-9,15-octadecadienóico, entre outros, permanece um principal obstáculo ao desenvolvimento de organismos geneticamente manipulados gue produzem estes ácidos gordos.However, in spite of the general effectiveness of recombinant DNA technology, the isolation of genetic sequences encoding enzymes important in fatty acid metabolism, in particular, the genes encoding the fatty acid A12-epoxygenases 3 enzymes responsible for the production of 12,13 epoxy-9,15-octadecenoic acid, among others, remains a major obstacle to the development of genetically engineered organisms that produce these fatty acids.

Até à presente invenção, existiam apenas dados bioquímicos limitados indicando a natureza de enzimas epoxigenases de ácido gordo, em particular A12-epoxigenases. Contudo, em Euphorbia lagascae, a formação de ácido 12,13-epoxi-9-octadecenóico (ácido vernólico) a partir de ácido linoleico parece ser catalizada por uma enzima A12-epoxigenase dependente de citocromo-P450 (Bafor et al., 1993; Blee et al., 1994). Adicionalmente, a semente em desenvolvimento de plantas de linhaça tem a capacidade para converter ácido vernólico adicionado, em ácido 12,13-epoxi-9,15-octadecadienóico através de uma dessaturase Δ15 endógena (Engeseth e Stymne, 1996) . Os ácidos gordos epoxi também podem ser produzidos através de uma peroxigenase dependente de peróxido em tecidos vegetais (Blee e Schuber, 1990).Until the present invention, only limited biochemical data exist indicating the nature of epoxygenases fatty acid enzymes, in particular A12-epoxygenases. However, in Euphorbia lagascae, the formation of 12,13-epoxy-9-octadecenoic acid (vernolic acid) from linoleic acid appears to be catalyzed by a cytochrome-P450-dependent A12-epoxygenase enzyme (Bafor et al., 1993; Blee et al., 1994). In addition, seed in developing flax plants has the ability to convert added vernolic acid to 12,13-epoxy-9,15-octadecadienoic acid through an endogenous Δ15 desaturase (Engeseth and Stymne, 1996). Epoxy fatty acids can also be produced by peroxide-dependent peroxygenase in plant tissues (Blee and Schuber, 1990).

No trabalho que conduz à presente invenção, os requerentes procuraram isolar sequências genéticas que codificam genes que são importantes para a produção de ácidos gordos epoxi, tais como ácido 12,13-epoxi-9-octadecenóico (ácido vernólico) ou ácido 12,13-epoxi-9,15-octadecadienóico, e para transferir estas sequências genéticas em plantas comerciais de semente oleaginosa altamente produtivas e/ou outros organismos acumuladores de óleo.In the work leading to the present invention, the inventors sought to isolate genetic sequences encoding genes that are important for the production of epoxy fatty acids, such as 12,13-epoxy-9-octadecenoic acid (vernolic acid) or 12,13- epoxy-9,15-octadecadienoic acid, and to transfer these genetic sequences into commercially productive oleaginous seed plants and / or other oil accumulating organisms.

SUMÁRIO DA INVENÇÃO 4SUMMARY OF THE INVENTION

Um aspecto da invenção proporciona uma molécula de ácido nucleico isolada que codifica, ou é complementar a uma molécula de ácido nucleico isolada que codifica uma epoxigenase de ácido gordo.One aspect of the invention provides an isolated nucleic acid molecule that encodes, or is complementary to, an isolated nucleic acid molecule encoding a fatty acid epoxygenase.

Um segundo aspecto da invenção proporciona uma molécula de ácido nucleico isolada que híbrida sob condições de, pelo menos, baixa restringência com, pelo menos, 20 nucleótidos contíguos de SEQ ID Nos: 1 ou 3 ou 5 ou 19 ou 20, ou uma sua sequência complementar.A second aspect of the invention provides an isolated nucleic acid molecule that hybridizes under conditions of at least low stringency with at least 20 contiguous nucleotides of SEQ ID Nos: 1 or 3 or 5 or 19 or 20, or a sequence thereof complementary.

Um aspecto adicional da invenção proporciona uma molécula de ácido nucleico isolada que compreende uma sequência de nucleótidos que é, pelo menos, 65% idêntica à SEQ ID N°: 1 ou 3 ou 5 ou que é, pelo menos, 75% idêntica a, pelo menos, 200 nucleótidos contíguos em SEQ ID Nos: 19 ou 20, ou uma sua sequência complementar.A further aspect of the invention provides an isolated nucleic acid molecule comprising a nucleotide sequence that is at least 65% identical to SEQ ID NO: 1 or 3 or 5 or which is at least 75% identical to, at least 200 contiguous nucleotides in SEQ ID Nos: 19 or 20, or a complementary sequence thereof.

Um aspecto adicional da invenção proporciona uma construção genética que compreende a molécula de ácido nucleico isolada supra, quer seja na orientação sentido ou anti-sentido, em conexão operável com uma sequência promotora.A further aspect of the invention provides a genetic construct comprising the above isolated nucleic acid molecule, either in the sense or antisense orientation, in operable connection with a promoter sequence.

Um aspecto adicional da invenção proporciona um método de alteração do nível de ácidos gordos epoxi numa célula, tecido, órgão ou organismo, compreendendo o referido método a expressão de uma molécula de sentido, anti-sentido, ribozima ou de co-supressão compreendendo a molécula de ácido nucleico isolada supra na referida célula durante um período de tempo e sob condições suficientes para ser aumentado ou reduzido o nível dos ácidos gordos epoxi aí presentes.A further aspect of the invention provides a method of altering the level of epoxy fatty acids in a cell, tissue, organ or organism, said method comprising the expression of a sense, antisense, ribozyme or co-suppression molecule comprising the molecule of the above isolated nucleic acid in said cell over a period of time and under conditions sufficient to increase or decrease the level of the epoxy fatty acids present therein.

Um aspecto adicional da invenção proporciona um método de produção de um polipéptido de epoxigenase recombinante enzimaticamente activo numa célula, compreendendo o referido 5 método a expressão da molécula de ácido nucleico isolada supra na referida célula durante um período de tempo e sob condições suficientes para a epoxigenase assim codificada ser produzida.A further aspect of the invention provides a method of producing an enzymatically active recombinant epoxygenase polypeptide in a cell, said method comprising expressing the above isolated nucleic acid molecule in said cell over a period of time and under conditions sufficient for epoxygenase so coded to be produced.

Um aspecto adicional da invenção proporciona um método de produção de um polipéptido de epoxigenase recombinante enzimaticamente activo numa célula, compreendendo o referido método os passos de: (i) produção de uma construção genética que compreende a molécula de ácido nucleico isolada supra colocada operacionalmente sob o controlo de um promotor capaz de conferir expressão na referida sequência genética na referida célula, e opcionalmente um elemento de intensificação da expressão; (ii) transformação da referida construção genética na referida célula; e (iii) selecção dos transformantes que expressam a um nível elevado uma epoxigenase funcional codificada através da sequência genética.A further aspect of the invention provides a method of producing an enzymatically active recombinant epoxygenase polypeptide in a cell, said method comprising the steps of: (i) producing a genetic construct comprising the above isolated nucleic acid molecule operably placed under the controlling a promoter capable of conferring expression in said gene sequence in said cell, and optionally an expression enhancing element; (ii) transforming said genetic construct into said cell; and (iii) selecting transformants that express at a high level a functional epoxygenase encoded through the genetic sequence.

Ainda um aspecto adicional da invenção proporciona um método de produção de um polipéptido de epoxigenase recombinante enzimaticamente activo, numa planta transgénica compreendendo os passos de: (i) produção de uma construção genética que compreende a molécula de ácido nucleico isolada supra colocada operacionalmente sob o controlo de um promotor específico de semente e opcionalmente um elemento de intensificação da expressão, em que a referida sequência genética é também colocada a montante de uma sequência terminadora de transcrição; 6 (ii) transformação da referida construção genética numa célula ou tecido da referida planta; e (iii) selecção dos transformantes que expressam a um nivel elevado em sementes, uma epoxigenase funcional codificada através da sequência genética.A still further aspect of the invention provides a method of producing an enzymatically active recombinant epoxygenase polypeptide in a transgenic plant comprising the steps of: (i) producing a genetic construct comprising the above isolated nucleic acid molecule operably placed under the control of a specific seed promoter and optionally an expression enhancing element, wherein said genetic sequence is also placed upstream of a transcription terminator sequence; (Ii) transforming said genetic construct into a cell or tissue of said plant; and (iii) selection of transformants expressing at a high seed level, a functional epoxygenase encoded through the genetic sequence.

Um aspecto adicional da invenção proporciona um polipéptido de epoxigenase recombinante ou uma molécula enzimática funcional.A further aspect of the invention provides a recombinant epoxygenase polypeptide or a functional enzyme molecule.

Um aspecto adicional da invenção proporciona uma epoxigenase recombinante que compreende uma sequência de aminoácidos apresentada em qualquer uma de SEQ ID Nos: 2 ou 4 ou 6 ou um seu homólogo, análogo ou derivado que seja, pelo menos, cerca de 50% idêntico a isso.A further aspect of the invention provides a recombinant epoxygenase comprising an amino acid sequence shown in any one of SEQ ID Nos: 2 or 4 or 6 or a homologue, analogue or derivative thereof that is at least about 50% identical thereto .

Ainda um aspecto adicional da invenção proporciona um método de produção de um ácido gordo epoxigenado numa célula, tecido, órgão ou organismo, compreendendo o referido método a incubação de uma célula, tecido, órgão ou organismo que expressa uma epoxigenase recombinante enzimaticamente activa com um substrato de ácido gordo e, de um modo preferido, um substrato de ácido gordo insaturado, durante um periodo de tempo e sob condições suficientes para, pelo menos, uma ligação de carbono, de um modo preferido, uma ligação dupla de carbono, do referido substrato ser convertida num grupo epoxi.A still further aspect of the invention provides a method of producing an epoxygenated fatty acid in a cell, tissue, organ or organism, said method comprising incubating a cell, tissue, organ or organism which expresses an enzymatically active recombinant epoxygenase with a substrate of fatty acid and, preferably, an unsaturated fatty acid substrate, for a period of time and under conditions sufficient for at least one carbon bond, preferably a carbon double bond, of said substrate be converted into an epoxy group.

Um aspecto adicional da invenção proporciona uma molécula imunologicamente interactiva que se liga ao polipéptido de epoxigenase recombinante aqui descrito, ou um seu homólogo, análogo ou derivado.A further aspect of the invention provides an immunologically interacting molecule which binds to the recombinant epoxygenase polypeptide described herein, or a homologue, analogue or derivative thereof.

BREVE DESCRIÇÃO DOS DESENHOS 7 A Figura 1 é uma representação linear de um plasmídeo de expressão compreendendo um gene estrutural de epoxigenase, colocado operacionalmente sob o controlo do promotor napin truncado (FP1; caixa a tracejado da direita) e colocado a montante da sequência do terminador NOS (caixa pontilhada da direita). A sequência genética da epoxigenase é indicada pela caixa rectangular a branco da direita. A construção também compreende o promotor NOS (caixa a tracejado da esquerda) que dirige a expressão do gene NPTII (caixa a branco da esquerda) e colocado a montante do terminador NOS (caixa pontilhada da esquerda). São também indicadas as sequências fronteira da esquerda e direita do plasmídeo Ti de Agrobacterium tumefaciens. A Figura 2 é uma representação esquemática mostrando o alinhamento das sequências de aminoácidos do polipéptido de epoxigenase de Crepis palaestina (Cpal2; SEQ ID N°: 2), uma epoxigenase adicional derivada a partir de Crepis sp., diferente de C. palaestina, que produz níveis elevados de ácido vernólico (CrepX; SEQ ID N°: 4), uma sequência de aminoácidos parcial de um polipéptido de epoxigenase derivado a partir de Vernonia galamensis (Vgall; SEQ ID N°: 6) , a sequência de aminoácidos da Δ12 acetilenase de Crepis alpina (Crepl; SEQ ID N°: 8), as Δ12 dessaturases de A. thaliana (L26296; SEQ ID N°: 9), Brassica juncea (X91139; SEQ ID N°: 10), Glycine max (L43921; SEQ ID N°: 11), Solanum commersoníi (X92847; SEQ ID N°: 12) e Glycine max (L43920; SEQ ID N°: 13), e a Δ12 hidroxilase de Ricinus communis (U22378; SEQ ID N°: 14). Estão sublinhados três motivos ricos em histidina que são conservados em monooxigenases de função mista não contendo hemo. A Figura 3 é uma cópia de uma representação fotográfica de uma hibridação de transferência de Northern mostrando a expressão especifica de semente do gene de epoxigenase de Crepis palaestina exemplificado através da SEQ ID N°: 1. Análise de transferência de Northern do ARN total de folhas (pista 1) e sementes em desenvolvimento (pista 2) de Crepis palaestina. 15 pg de ARN total foram migrados num gel de Northern e transferidos para membrana Hybond N+ da Amersham de acordo com as instruções do fabricante. A transferência foi hibridada a 60 °C com uma sonda preparada a partir da região 3' não traduzida da SEQ ID N°: 1. A transferência foi lavada duas vezes em 2 x SSC (tampão de Citrato de Sódio-NaCl) à temperatura ambiente durante 10 minutos, depois em 0,1 x SSC a 60 °C durante 20 minutos. A Figura 4 é uma representação esquemática mostrando a sequência de nucleótidos do iniciador de PCR degenerado (direcção 5' para 3' ) utilizado para isolar os genes de epoxigenase de Euphorbia lagascae aqui descritos. A Figura 5 é uma cópia de uma representação fotográfica de uma hibridação de transferência em gota de ARN mostrando a expressão do gene de epoxigenase exemplificado em SEQ ID N°: 3 em plantas que produzem ácido vernólico comparativamente a plantas que não produzem ácido vernólico. Foi isolado um pg de ARN total a partir do tecido especificado e submetido a transferência em gota na membrana Hybond N+ da Amersham de acordo com as instruções do fabricante. A transferência foi hibridada a 42 °C em 50% de formamida com a sonda relevante marcada com 32P preparada a partir da SEQ ID N°: 3 durante 16 horas. As transferências foram lavadas duas vezes em 2 x SSC (tampão de Citrato de Sódio-NaCl) à temperatura ambiente, depois em 0,5 x SSC a 55 °C durante 20 minutos. 9BRIEF DESCRIPTION OF THE DRAWINGS Figure 1 is a linear representation of an expression plasmid comprising an epoxygenase structural gene operably placed under the control of the truncated napin promoter (FP1; right-hand dashed box) and placed upstream of the terminator sequence NOS (right-hand dotted box). The genetic sequence of epoxygenase is indicated by the rectangular white box on the right. The construct also comprises the NOS promoter (left-sided box) which directs the expression of the NPTII gene (left blank) and placed upstream of the NOS terminator (left dotted box). Also indicated are the left and right border sequences of the Ti plasmid of Agrobacterium tumefaciens. Figure 2 is a schematic representation showing the alignment of the amino acid sequences of the Crepis palaestin epoxygene polypeptide (Cpal2; SEQ ID NO: 2), an additional epoxygenase derived from Crepis sp., Different from C. palaestina, which produces a high levels of vernolic acid (CrepX; SEQ ID NO: 4), a partial amino acid sequence of an epoxygenase polypeptide derived from Vernonia galamensis (Vgall; SEQ ID NO: 6), the amino acid sequence of Δ12 (SEQ ID NO: 9), Brassica juncea (X91139; SEQ ID NO: 10), Glycine max (L43921; SEQ ID NO: 9), Crepis alpina acetylenase (Crepl; SEQ ID NO: 8), Δ12 desaturases of A. thaliana SEQ ID NO: 13), and the Δ12 hydroxylase of Ricinus communis (U22378; SEQ ID NO: 11), Solanum commersoni (X92847; SEQ ID NO: 12) and Glycine max (L43920; 14). Three histidine rich motifs that are conserved in non-heme mixed function monooxygenases are underlined. Figure 3 is a copy of a photographic representation of a Northern blot hybridization showing the specific seed expression of the Crepis palaestin epoxygenase gene exemplified through SEQ ID NO: 1. Northern blot analysis of total leaf RNA (lane 1) and developing seeds (lane 2) of Crepis palaestina. 15æg of total RNA was migrated on a Northern gel and transferred to Amersham Hybond N + membrane according to the manufacturer's instructions. The blot was hybridized at 60 ° C with a probe prepared from the 3 'untranslated region of SEQ ID NO: 1. The blot was washed twice in 2 x SSC (Sodium Citrate-NaCl buffer) at room temperature for 10 minutes, then in 0.1 x SSC at 60 ° C for 20 minutes. Figure 4 is a schematic representation showing the nucleotide sequence of the degenerate PCR primer (5 'to 3' direction) used to isolate the Euphorbia lagascae epoxygenase genes described herein. Figure 5 is a copy of a photographic representation of a RNA drop transfer hybridization showing the expression of the epoxygenase gene exemplified in SEQ ID NO: 3 in plants that produce vernolic acid compared to plants that do not produce vernolic acid. One pg of total RNA was isolated from the specified tissue and dripped onto Amersham Hybond N + membrane according to the manufacturer's instructions. The blot was hybridized at 42 ° C in 50% formamide with the 32 P-labeled probe prepared from SEQ ID NO: 3 for 16 hours. The blots were washed twice in 2 x SSC (Sodium Citrate-NaCl buffer) at room temperature, then in 0.5 x SSC at 55øC for 20 minutes. 9

Foram obtidas autorradiografias após uma exposição de um dia para o outro. 0 painel A mostra ARN total de semente em desenvolvimento de Euphorbia lagascae (1), Euphorbia cyparissus (2), Vernonia galamensis (3), e flax (Linum usitatissimum) (4) . 0 painel B mostra ARN total de vários tecidos de Euphorbia lagascae, incluindo semente em desenvolvimento (1), raiz (2) e folha (3). A Figura 6 é uma representação esquemática mostrando o método de hibridação subtractiva utilizado para isolar os genes de epoxigenase de Euphorbia lagascae aqui descritos. 0 agrupamento de +6ADNc consistiu predominantemente em sequências de tipo proteína de armazenamento de semente. Um agrupamento de 15 dessas sequências foi biotinilado e ainda subtraído do +6ADNc. HL = Hibridação Longa - 20 h; HC = Hibridação Curta - 3 h. A Figura 7 é uma cópia de uma representação fotográfica de uma hibridação de transferência em gota de ARN mostrando a expressão do gene de epoxigenase exemplificado em SEQ ID N°: 20 em plantas que produzem ácido vernólico comparativamente a plantas que não produzem ácido vernólico. Foi isolado um pg de ARN total a partir do tecido especificado e submetido a transferência em gota na membrana Hybond N+ da Amersham de acordo com as instruções do fabricante. A transferência foi hibridada a 42 °C em 50% de formamida com a sonda relevante marcada com 32P preparada a partir da SEQ ID N°: 20 durante 16 horas. As transferências foram lavadas duas vezes em 2 x SSC (tampão de Citrato de Sódio-NaCl) à temperatura ambiente, depois em 0,5 x SSC a 55 °C durante 20 minutos. Foram obtidas autorradiografias após uma exposição de um dia para o outro. O painel A mostra ARN total de semente em desenvolvimento de Euphorbia lagascae (1), Euphorbia 10 cyparissus (2), Vernonia galamensis (3), e flax (Linum usitatissimum) (4) . 0 painel B mostra ARN total de vários tecidos de Euphorbia lagascae, incluindo semente em desenvolvimento (1), raiz (2) e folha (3). A Figura 8 é uma representação esquemática de um vector plasmidico binário contendo uma cassete de expressão que compreende o promotor napin truncado especifico de semente (Napin) e o terminador de nopalina sintase (NT) , com um sitio de clonagem BamHI entre os dois, para além do gene de resistência à canamicina NPTII ligado operacionalmente às sequências do promotor da nopalina sintase (NP) e do terminador da nopalina sintase (NT) . A cassete de expressão é flanqueada por sequências de T-ADN da fronteira esquerda (LB) e fronteira direita (RB). A Figura 9 é uma representação esquemática de um vector plasmidico binário contendo uma cassete de expressão que compreende a SEQ ID N°: 1 colocada operacionalmente sob o controlo de um promotor napin truncado especifico de semente (Napin) e a montante do terminador da nopalina sintase (NT) , para além do gene de resistência à canamicina NPTII ligado operacionalmente às sequências do promotor da nopalina sintase (NP) e do terminador da nopalina sintase (NT) . A cassete de expressão é flanqueada por sequências fronteira de T-ADN da esquerda (LB) e da direita (RB) . Para produzir esta construção, a SEQ ID N°: 1 é introduzida no sítio BamHI do vector binário apresentado na Figura 8. A Figura 10 é uma representação gráfica dos perfis de cromatografia gasosa de ésteres metálicos de ácido gordo, preparados a partir de sementes oleaginosas de plantas não transformadas de Arabidopsis thaliana [painel (a)], ou 11 plantas de A. thaliana (linha transgénica Cpal-17) que foram transformadas com SEQ ID N°: 1, utilizando a construção genética apresentada na Figura 9 [painéis (b) e (c) ] . Nos painéis (a) e (b), os ésteres metilicos de ácido gordo foram separados utilizando separação em coluna empacotada. No painel (c) , os ésteres metilicos de ácido gordo foram separados utilizando separação em coluna capilar. São indicadas as posições de eluição do ácido vernólico. A Figura 11 é uma representação gráfica mostrando a distribuição conjunta de ácidos gordos epoxi em semente pura de plantas Ti, de plantas de Arabidopsis thaliana transformadas com Cpal2, como determinado utilizando cromatografia gasosa. Os níveis tanto do ácido vernólico (eixo x) como do ácido 12,13-epoxi-9,15-octadecadienóico (eixo y) foram determinados e traçados relativamente um ao outro. Os dados mostram uma correlação positiva entre os níveis destes ácidos gordos em plantas transgénicas. A Figura 12 é uma representação gráfica mostrando a incorporação de marcação com 14C na fase clorofórmica obtida a partir de extracção lipídica de cotilédones de semente de linhaça durante a alimentação com substrato marcado. Símbolos utilizados; ♦ , alimentação com ácido [14C]oleico; , alimentação com ácido [14C] vernólico. A Figura 13 é uma representação gráfica mostrando a incorporação de marcação com 14C na fosfatidilcolina de cotilédones de semente de linhaça durante a alimentação com substrato marcado. Símbolos utilizados; ♦, alimentação com ácido [14C]oleico; , alimentação com ácido [14C] vernólico. 12 A Figura 14 é uma representação gráfica mostrando a incorporação de marcação com 14C em triacilgliceróis de cotilédones de semente de linhaça durante a alimentação com substrato marcado. Símbolos utilizados; ♦, alimentação com ácido [14C]oleico; , alimentação com ácido [14C] vernólico.Autoradiographies were obtained after an overnight exposure. Panel A shows total RNA of seed in development of Euphorbia lagascae (1), Euphorbia cyparissus (2), Vernonia galamensis (3), and flax (Linum usitatissimum) (4). Panel B shows total RNA of various tissues of Euphorbia lagascae, including seed in development (1), root (2) and leaf (3). Figure 6 is a schematic representation showing the subtractive hybridization method used to isolate the Euphorbia lagascae epoxygenase genes described herein. The + 6ADNc pool consisted predominantly of seed storage protein type sequences. A cluster of 15 of these sequences was biotinylated and further subtracted from + 6DNAc. HL = Long Hybridization - 20 h; HC = Short Hybridization - 3 h. Figure 7 is a copy of a photographic representation of a RNA drop transfer hybridization showing expression of the epoxygenase gene exemplified in SEQ ID NO: 20 in plants that produce vernolic acid compared to plants that do not produce vernolic acid. One pg of total RNA was isolated from the specified tissue and dripped onto Amersham Hybond N + membrane according to the manufacturer's instructions. The blot was hybridized at 42 ° C in 50% formamide with the 32 P-labeled probe prepared from SEQ ID NO: 20 for 16 hours. The blots were washed twice in 2 x SSC (Sodium Citrate-NaCl buffer) at room temperature, then in 0.5 x SSC at 55øC for 20 minutes. Autoradiographies were obtained after an overnight exposure. Panel A shows total RNA of developing seed of Euphorbia lagascae (1), Euphorbia 10 cyparissus (2), Vernonia galamensis (3), and flax (Linum usitatissimum) (4). Panel B shows total RNA of various tissues of Euphorbia lagascae, including seed in development (1), root (2) and leaf (3). Figure 8 is a schematic representation of a binary plasmid vector containing an expression cassette comprising the specific truncated napin (Napin) promoter and the nopaline synthase (NT) terminator, with a BamHI cloning site between the two, for in addition to the NPTII kanamycin resistance gene operably linked to the nopaline synthase (NP) and the nopaline synthase (NT) terminator sequences. The expression cassette is flanked by left-border (LB) and right-border (RB) T-DNA sequences. Figure 9 is a schematic representation of a binary plasmid vector containing an expression cassette comprising SEQ ID NO: 1 operably placed under the control of a seed specific truncated napin (Napin) promoter and upstream of the nopaline synthase terminator (NT), in addition to the kanamycin resistance gene NPTII operably linked to the nopaline synthase (NP) promoter and the nopaline synthase (NT) terminator sequences. The expression cassette is flanked by left (LB) and right (RB) T-DNA border sequences. To produce this construct, SEQ ID NO: 1 is introduced into the BamHI site of the binary vector shown in Figure 8. Figure 10 is a graphical representation of the gas chromatography profiles of fatty acid metal esters prepared from oilseeds of untransformed plants of Arabidopsis thaliana [panel (a)], or 11 plants of A. thaliana (transgenic line Cpal-17) which were transformed with SEQ ID NO: 1 using the genetic construct shown in Figure 9 [panels b) and (c)]. In panels (a) and (b), the fatty acid methyl esters were separated using packed column separation. In panel (c), the fatty acid methyl esters were separated using capillary column separation. The positions of elution of vernolic acid are indicated. Figure 11 is a graphical representation showing the joint distribution of pure plant epoxy fatty acids of Ti plants from Cpal2-transformed Arabidopsis thaliana plants as determined using gas chromatography. The levels of both vernolic acid (x-axis) and 12,13-epoxy-9,15-octadecadienoic acid (y-axis) were determined and plotted relative to each other. The data show a positive correlation between the levels of these fatty acids in transgenic plants. Figure 12 is a graphical representation showing the incorporation of 14C labeling in the chloroform phase obtained from lipid extraction of cotyledons from flax seed during feeding with labeled substrate. Symbols used; ♦, feed with [14C] oleic acid; , feeding with [14C] vernolic acid. Figure 13 is a graphical representation showing the incorporation of 14C labeling into phosphatidylcholine of linseed cotyledons during feeding with labeled substrate. Symbols used; ♦, feed with [14C] oleic acid; , feeding with [14C] vernolic acid. Figure 14 is a graphical representation showing the incorporation of 14C labeling into triacylglycerols of flax seed cotyledons during feeding with labeled substrate. Symbols used; ♦, feed with [14C] oleic acid; , feeding with [14C] vernolic acid.

DESCRIÇÃO DETALHADA DAS FORMAS DE REALIZAÇÃO PREFERIDASDETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS

Um aspecto da presente invenção proporciona uma molécula de ácido nucleico isolada que codifica ou é complementar de uma molécula de ácido nucleico isolada que codifica uma epoxigenase de ácido gordo.One aspect of the present invention provides an isolated nucleic acid molecule that encodes or is complementary to an isolated nucleic acid molecule encoding a fatty acid epoxygenase.

Em que a molécula de ácido nucleico isolada da invenção codifica uma enzima que está envolvida na epoxidação directa de ácido araquidónico, e é particularmente preferido que a molécula de ácido nucleico em causa seja derivada de uma fonte não mamífera.In which the isolated nucleic acid molecule of the invention encodes an enzyme that is involved in the direct epoxidation of arachidonic acid, and it is particularly preferred that the nucleic acid molecule in question is derived from a non-mammalian source.

Como aqui utilizado, o termo "derivado de" deve ser entendido para indicar que uma entidade completa particular ou grupo de entidades completas foi originada a partir da espécie especificada, mas não foi necessariamente obtida directamente a partir da fonte especificada. 0 termo "fonte não mamífera" refere-se a qualquer organismo diferente de um mamífero ou um tecido ou célula derivada do mesmo.As used herein, the term " derived from " shall be understood to indicate that a particular complete entity or complete entity group originated from the specified species but was not necessarily obtained directly from the specified source. The term " non-mammalian source " refers to any organism other than a mammal or a tissue or cell derived therefrom.

No presente contexto, o termo "derivado de uma fonte não mamífera" deve ser entendido para indicar que uma entidade completa particular ou um grupo de entidades completas foi 13 derivada a partir de bactérias, leveduras, pássaros, anfibios, répteis, insectos, plantas, fungos, bolores e algas ou outros não mamíferos.In the present context, the term " derived from a non-mammalian source " should be understood to indicate that a particular complete entity or a complete set of entities has been derived from bacteria, yeasts, birds, amphibians, reptiles, insects, plants, fungi, molds and algae or other non-mammals.

Numa forma de realização preferida da presente invenção, o organismo fonte é um organismo possuindo a capacidade genética para sintetizar ácidos gordos epoxi. De um modo mais preferido, o organismo fonte é uma planta tal como, mas não limitada a, Chrysanthemum spp., Crepis spp., Euphorbia spp. e Vernonia spp., entre outros.In a preferred embodiment of the present invention, the source organism is an organism having the genetic ability to synthesize epoxy fatty acids. More preferably, the source organism is a plant such as, but not limited to, Chrysanthemum spp., Crepis spp., Euphorbia spp. and Vernonia spp., among others.

De um modo ainda mais preferido, o organismo fonte é seleccionado da lista compreendendo Crepis biennis, Crepis aurea, Crepis conyzaefolia, Crepis intermédia, Crepis occidentalis, Crepis palaestina, Crepis vesicaria, Crepis xacintha, Euphorbia lagascae e Vernonia galamensis. Não estão excluídas espécies adicionais.Even more preferably, the source organism is selected from the list comprising Crepis biennis, Crepis aurea, Crepis conyzaefolia, Crepis intermédia, Crepis occidentalis, Crepis palaestina, Crepis vesicaria, Crepis xacintha, Euphorbia lagascae and Vernonia galamensis. No additional species are excluded.

Numa forma de realização particularmente preferida da presente invenção, o organismo fonte é Crepis sp. que contém niveis elevados de ácido vernólico, tal como Crepis palaestina, entre outros, ou alternativamente, Vernonia galamensis ou Euphorbia lagascae.In a particularly preferred embodiment of the present invention, the source organism is Crepis sp. which contains high levels of vernolic acid, such as Crepis palaestin, among others, or alternatively, Vernonia galamensis or Euphorbia lagascae.

Em que a molécula de ácido nucleico isolada da invenção codifica uma enzima Δβ-epoxigenase ou A9-epoxigenase ou enzima A12-epoxigenase ou Al5-epoxigenase, ou codifica, pelo menos, uma enzima que não está envolvida na epoxidação directa de ácido araquidónico, e a molécula de ácido nucleico em causa pode ser derivada a partir de qualquer fonte produtora da referida enzima, incluindo, mas não se limitando a, leveduras, bolores, bactérias, insectos, pássaros, mamíferos e plantas. 14 A molécula de ácido nucleico da invenção de acordo com qualquer das formas de realização antecedentes pode ser ADN, tal como um gene, molécula de ADNc, molécula de ARN ou uma molécula sintética de oligonucleótido, quer seja de cadeia simples ou cadeia dupla e independentemente de quaisquer caracteristicas da estrutura secundária, salvo especificamente referido.Wherein the isolated nucleic acid molecule of the invention encodes an Δβ-epoxygenase or A9-epoxygenase enzyme or A12-epoxygenase or Al5-epoxygenase enzyme, or encodes at least one enzyme which is not involved in the direct epoxidation of arachidonic acid, and the nucleic acid molecule in question may be derived from any source producing said enzyme, including but not limited to yeast, mold, bacteria, insects, birds, mammals and plants. The nucleic acid molecule of the invention according to any of the foregoing embodiments may be DNA, such as a gene, cDNA molecule, RNA molecule or a synthetic oligonucleotide molecule, whether single-chain or double-stranded and independently of any characteristics of the secondary structure unless specifically mentioned.

Aqui a referência a um "gene" deve ser entendida no seu contexto mais vasto e inclui: (i) um gene genómico clássico consistindo de sequências reguladoras de transcrição e/ou tradução e/ou uma região codificante e/ou sequências não traduzidas (i. e., intrões, sequências 5' e 3' não traduzidas); ou (ii) ARNm ou ADNc correspondente às regiões codificantes (i. e., exões) e sequências 5' e 3' não traduzidas do gene. O termo "gene" é também utilizado para descrever moléculas sintéticas ou de fusão codificando todo ou parte de um produto funcional. Os genes de epoxigenase preferidos da presente invenção podem ser derivados de um gene de epoxigenase de ocorrência natural através de técnicas recombinantes convencionais. Geralmente, um gene de epoxigenase pode ser submetido a mutagénese para produzir substituições, delecções e/ou adições nucleotidicas simples ou múltiplas.Here reference to a " gene " is to be understood in its broader context and includes: (i) a classical genomic gene consisting of transcriptional and / or translation regulatory sequences and / or a coding region and / or untranslated sequences (ie, introns, 5 'and 3 'untranslated); or (ii) mRNA or cDNA corresponding to the coding regions (i.e., exons) and 5 'and 3' untranslated sequences of the gene. The term " gene " is also used to describe synthetic or fusion molecules encoding all or part of a functional product. The preferred epoxygenase genes of the present invention may be derived from a naturally occurring epoxygenase gene by conventional recombinant techniques. Generally, an epoxygenase gene can be mutagenized to produce single or multiple nucleotide substitutions, deletions and / or additions.

Os derivados de inserção nucleotidica incluem fusões terminais 5' e 3' assim como inserções intra-sequência de nucleótidos simples e múltiplos. As variantes de sequência de inserção nucleotidica são aquelas em que um ou mais nucleótidos são introduzidos num sitio predeterminado na sequência de nucleótidos embora seja também possível inserção aleatória com rastreio adequado do produto resultante. 15Nucleotide insert derivatives include 5 'and 3' terminal fusions as well as single and multiple nucleotide intra-sequence insertions. Nucleotide insert sequence variants are those in which one or more nucleotides are introduced at a predetermined site in the nucleotide sequence although random insertion is also possible with suitable screening of the resulting product. 15

As variantes de delecção são caracterizadas pela remoção de um ou mais nucleótidos da sequência.Deletion variants are characterized by the removal of one or more nucleotides from the sequence.

As variantes de substituição nucleotidica são aquelas em que, pelo menos, um nucleótido na sequência foi removido e um nucleótido diferente introduzido no seu lugar. Essa substituição pode ser "silenciosa" pelo que a substituição não altera o aminoácido definido pelo codão. Alternativamente, os substituintes são concebidos para alterar um aminoácido para outro aminoácido que actua de modo semelhante, ou aminoácido de carga, polaridade ou hidrofobicidade semelhante.Nucleotide substitution variants are those wherein at least one nucleotide in the sequence has been removed and a different nucleotide introduced in its place. This replacement can be " silent " whereby the substitution does not change the amino acid defined by the codon. Alternatively, substituents are designed to change one amino acid to another similarly acting amino acid, or charge amino acid, polarity or similar hydrophobicity.

No contexto da presente invenção, o termo "epoxigenase de ácido gordo" deve ser entendido para referir qualquer enzima ou equivalente funcional ou seus derivados enzimaticamente activos que catalizam a biossintese de um ácido gordo epoxigenado, por conversão de uma ligação de carbono de um ácido gordo num grupo epoxi e, de um modo preferido, por conversão de uma ligação dupla de carbono de um ácido gordo insaturado num grupo epoxi. Embora não limitando a invenção, uma epoxigenase de ácido gordo pode catalizar a biossintese de um ácido gordo epoxi seleccionado da lista compreendendo ácido 12,13-epoxi-9-octadecenóico (ácido vernólico) , ácido 12,13-epoxi-9,15-octadecadienóico, ácido 15,16-epoxi-9,12-octadecadienóico, ácido 9,10-epoxi-12-octadecenóico e ácido 9,10-epoxi-octadecanóico, entre outros. 0 termo "epoxi", "grupo epoxi" e "resíduo epoxi" será conhecido dos especialistas na técnica para referir um anel de três membros compreendendo dois átomos de carbono e um átomo de oxigénio ligado através de ligações simples como se segue: 16 \/c οIn the context of the present invention, the term " fatty acid epoxyigenase " should be understood to refer to any enzyme or functional equivalent or its enzymatically active derivatives which catalyze the biosynthesis of an epoxygenated fatty acid by conversion of a carbon bond of a fatty acid to an epoxy group and preferably by conversion of a carbon double bond of an unsaturated fatty acid to an epoxy group. Although not limiting the invention, a fatty acid epoxygenase can catalyze the biosynthesis of an epoxy fatty acid selected from the list comprising 12,13-epoxy-9-octadecenoic acid (vernolic acid), 12,13-epoxy-9,15- octadecadienoic acid, 15,16-epoxy-9,12-octadecadienoic acid, 9,10-epoxy-12-octadecenoic acid and 9,10-epoxy octadecanoic acid, among others. The term " epoxy ", " " epoxy group " and " epoxy residue " it will be known to those skilled in the art to refer to a three membered ring comprising two carbon atoms and one oxygen atom connected through single bonds as follows: 16 c

De acordo com o exposto, o termo "epóxido" refere-se a compostos que compreendem, pelo menos, um grupo epoxi, como aqui definido anteriormente.Accordingly, the term " epoxide " refers to compounds which comprise at least one epoxy group, as defined hereinbefore.

Os especialistas na técnica estão cientes que a nomenclatura de ácidos gordos é baseada no comprimento da cadeia de carbono e na posição dos átomos de carbono insaturados dentro dessa cadeia de carbono. Assim, os ácidos gordos são designados utilizando a notação estenográfica:Those skilled in the art are aware that the fatty acid nomenclature is based on the length of the carbon chain and the position of the unsaturated carbon atoms within that carbon chain. Thus, fatty acids are designated using the shorthand notation:

Carbonototai: ligação duplatotalposiçâo da ligaçâo dupla (Δ), em que as ligações duplas são cis, salvo indicação em contrário. Por exemplo, o ácido palmítico (ácido n-hexadecanóico) é um ácido gordo saturado de 16 carbonos (i. e., 16:0), o ácido oleico (ácido octadecenóico) é um ácido gordo insaturado de 18 carbonos com uma ligação dupla entre C-9 e C-10 (i. e., 18:1Δ9) e o ácido linoleico (ácido octadecadienóico) é um ácido gordo insaturado de 18 carbonos com duas ligações duplas entre C-9 e C-10 e entre C-12 e C-13 (i. e., 18:2*9'12).Carbonototai: double bond binding of the double bond (Δ), in which the double bonds are cis, unless otherwise indicated. For example, palmitic acid (n-hexadecanoic acid) is a saturated fatty acid of 16 carbons (ie, 16: 0), oleic acid (octadecenoic acid) is an 18-carbon unsaturated fatty acid with a double bond between C- 9 and C-10 (ie, 18: 1Δ9) and linoleic acid (octadecadienoic acid) is an 18-carbon unsaturated fatty acid with two double bonds between C-9 and C-10 and between C-12 and C-13 ie, 18: 2 * 9'12).

Contudo, no presente contexto uma enzima epoxigenase pode catalizar a conversão de qualquer ligação de carbono num grupo epoxi ou alternativamente, a conversão de qualquer dupla num substrato de ácido gordo insaturado num grupo epoxi. A este respeito, é bem conhecido dos especialistas na técnica que a maioria dos ácidos gordos mono-insaturados de organismos superiores são ácidos gordos insaturados de 18 carbonos (i. e., 18:1Δ9), enquanto que a maioria dos ácidos gordos poliinsaturados 17 derivados de organismos superiores sejam ácidos gordos de 18 carbonos com, pelo menos, uma das ligações duplas ai situadas entre C-9 e C-10. Adicionalmente, as bactérias também possuem ácidos gordos mono-insaturados em C16. Além disso, a epoxigenase da presente invenção pode actuar em mais do gue uma única molécula de substrato de ácido gordo e, consequentemente, a presente invenção não está limitada pela natureza da molécula de substrato sobre a qual actua a enzima epoxigenase em causa.However, in the present context an epoxygenase enzyme can catalyze the conversion of any carbon linkage to an epoxy group or alternatively, the conversion of any dipole into an unsaturated fatty acid substrate into an epoxy group. In this regard, it is well known to those skilled in the art that most mono-unsaturated fatty acids of higher organisms are 18-carbon unsaturated fatty acids (ie, 18: 1Δ9), while most polyunsaturated fatty acids 17 derived from organisms higher fatty acids are 18-carbon fatty acids with at least one of the double bonds therein located between C-9 and C-10. In addition, the bacteria also have C16 mono-unsaturated fatty acids. In addition, the epoxygenase of the present invention may act on more than one single fatty acid substrate molecule and accordingly the present invention is not limited by the nature of the substrate molecule on which the epoxygenase enzyme in question acts.

De um modo preferido, a molécula de substrato para a epoxigenase da presente invenção é um ácido gordo insaturado que contém, pelo menos, uma ligação dupla.Preferably, the substrate molecule for the epoxygenase of the present invention is an unsaturated fatty acid containing at least one double bond.

Além disso, as enzimas epoxigenases podem actuar sobre qualquer número de átomos de carbono em qualquer uma molécula de substrato. Por exemplo, podem ser caracterizadas como enzimas Δβ-epoxigenase, A9-epoxigenase, A12-epoxigenase ou ál5-epoxigenase, entre outras. De acordo com o exposto, a presente invenção não é limitada pela posição do átomo de carbono no substrato sobre o qual pode actuar uma enzima epoxigenase.In addition, the epoxygenases enzymes can act on any number of carbon atoms in any one substrate molecule. For example, they may be characterized as Δβ-epoxygenase, A9-epoxygenase, Δ12-epoxygenase or Î ± -epoxygenase enzymes, among others. Accordingly, the present invention is not limited by the position of the carbon atom on the substrate on which an epoxygenase enzyme can act.

Como aqui utilizado, o termo "Δβ-epoxigenase" deve ser entendido para referir uma enzima epoxigenase que cataliza a conversão da ligação de carbono Δ6 de um substrato de ácido gordo num grupo epoxi Δ6 e, de um modo preferido, cataliza a conversão da ligação dupla Δ6 de, pelo menos, um ácido gordo insaturado num grupo epoxi Δ6.As used herein, the term " Δβ-epoxygenase " should be understood to refer to an epoxygenase enzyme which catalyzes the conversion of the Δ6 carbon bond of a fatty acid substrate into an Δ6 epoxy group and preferably catalyzes the conversion of the Δ6 double bond of at least one unsaturated fatty acid in an Δ6 epoxy group.

Como aqui utilizado, o termo "A9-epoxigenase" deve ser entendido para referir uma enzima epoxigenase que cataliza a conversão da ligação de carbono Δ9 de um substrato de ácido gordo num grupo epoxi Δ9 e, de um modo preferido, cataliza a 18 conversão da ligação dupla Δ9 de, pelo menos, um ácido gordo insaturado num grupo epoxi Δ9.As used herein, the term " A9-epoxygenase " should be understood to refer to an epoxygenase enzyme which catalyzes the conversion of Δ9 carbon bond from a fatty acid substrate into an Δ9 epoxy group and preferably catalyzes the conversion of Δ9 double bond of at least one fatty acid unsaturated in an Δ9 epoxy group.

Como aqui utilizado, o termo "A12-epoxigenase" deve ser entendido para referir uma enzima epoxigenase que cataliza a conversão da ligação de carbono Δ12 de um substrato de ácido gordo num grupo epoxi Δ12 e, de um modo preferido, cataliza a conversão da ligação dupla Δ12 de, pelo menos, um ácido gordo insaturado num grupo epoxi Δ12.As used herein, the term " A12-epoxygenase " should be understood to refer to an epoxygenase enzyme which catalyzes the conversion of the Δ12 carbon bond of a fatty acid substrate into an Δ12 epoxy group and preferably catalyzes the conversion of the Δ12 double bond of at least one unsaturated fatty acid in an Δ12 epoxy group.

Como aqui utilizado, o termo "ál5-epoxigenase" deve ser entendido para referir uma enzima epoxigenase que cataliza a conversão da ligação de carbono Δ15 de um substrato de ácido gordo num grupo epoxi Δ15 e, de um modo preferido, cataliza a conversão da ligação dupla Δ15 de, pelo menos, um ácido gordo insaturado num grupo epoxi Δ15. A presente invenção estende-se claramente a sequências genéticas que codificam todas as enzimas epoxigenases listadas supra, entre outras.As used herein, the term " al5-epoxygenase " should be understood to refer to an epoxygenase enzyme which catalyzes the conversion of the Δ15 carbon bond of a fatty acid substrate into an Δ15 epoxy group and preferably catalyzes the conversion of the Δ15 double bond of at least one unsaturated fatty acid in an Δ15 epoxy group. The present invention clearly extends to genetic sequences encoding all the epoxygenases enzymes listed above, among others.

Numa forma de realização preferida da invenção, a molécula de ácido nucleico isolada codifica uma enzima epoxigenase de ácido gordo que converte, pelo menos, uma ligação de carbono em ácido palmitoleico (16:1a9) , ácido oleico (18:1Δ9), ácido linoleico (18:2Δ9'12), ácido linolénico (18: 3Δ9'12'15) , ou ácido araquidónico (20 : 4á5'8'11,:L4) numa ligação epoxi. De um modo preferido, a ligação de carbono é uma ligação dupla de carbono.In a preferred embodiment of the invention, the isolated nucleic acid molecule encodes a fatty acid epoxygenase enzyme which converts at least one carbon bond into palmitoleic acid (16: 1 to 9), oleic acid (18: 1Δ9), linoleic acid (18: 2Δ9'12), linolenic acid (18: 3Δ9'12'15), or arachidonic acid (20: 4a5'8'11: L4) in an epoxy bond. Preferably, the carbon bond is a carbon double bond.

De um modo mais preferido, a molécula de ácido nucleico isolada da invenção codifica uma enzima epoxigenase de ácido gordo que converte, pelo menos, uma ou ambas as ligações duplas em ácido linoleico num grupo epoxi. De acordo com esta forma de realização, uma epoxigenase que converte ambas as ligações 19 duplas Δ9 e Δ12 de ácido linoleico num grupo epoxi, pode catalizar essas conversões independentemente de cada uma, de modo que a referida epoxigenase é uma enzima A9-epoxigenase e/ou ál2-epoxigenase, como aqui definido anteriormente.More preferably, the isolated nucleic acid molecule of the invention encodes a fatty acid epoxygenase enzyme which converts at least one or both of the double bonds in linoleic acid to an epoxy group. According to this embodiment, an epoxygenase which converts both the double bonds Δ9 and Δ12 of linoleic acid into an epoxy group, can catalyze such conversions independently of each other, so that said epoxygenase is an A9-epoxygenase enzyme and / or al2-epoxygenase, as defined hereinbefore.

Numa forma de realização preferida alternativa, a epoxigenase de ácido gordo da presente invenção é uma ál2-epoxigenase, uma A15-epoxigenase ou uma A9-epoxigenase, como aqui definido anteriormente.In an alternative preferred embodiment, the fatty acid epoxygenase of the present invention is an α2-epoxygenase, an Δ15-epoxygenase or an Δ9-epoxygenase, as defined hereinbefore.

De um modo mais preferido, a epoxigenase de ácido gordo da invenção é uma A12-epoxigenase, como aqui definido anteriormente.More preferably, the fatty acid epoxyigenase of the invention is an Δ12-epoxygenase, as defined hereinbefore.

Numa forma de realização particularmente preferida da invenção, é proporcionada uma molécula de ácido nucleico isolada que codifica a linoleato A12-epoxigenase, a enzima que converte, pelo menos, a ligação dupla Δ12 de ácido linoleico num grupo Δ12-εροχί, produzindo assim ácido 12,13-epoxi-9-octadecenóico (ácido vernólico).In a particularly preferred embodiment of the invention, there is provided an isolated nucleic acid molecule encoding the A12-epoxygenase linoleate, the enzyme which converts at least the Δ12 double bond of linoleic acid to a Δ12-εροχί group, thereby producing 12 , 13-epoxy-9-octadecenoic acid (vernolic acid).

Embora não limitando a presente invenção, a fonte preferida da A12-epoxigenase da invenção é uma planta, em particular Crepis palaestina ou uma Crepis sp. adicional que é distinta da C. palaestina mas contém niveis elevados de ácido vernólico, Vernonia galamensis ou Euphorbia lagascae.Although not limiting the present invention, the preferred source of the A12-epoxygenase of the invention is a plant, in particular Crepis palaestin or Crepis sp. which is distinct from C. palaestina but contains high levels of vernolic acid, Vernonia galamensis or Euphorbia lagascae.

De acordo com esta forma de realização, uma Al2-epoxigenase pode catalizar a conversão de ácido palmitoleico em ácido 9, 10-epoxi-palmitico e/ou a conversão de ácido oleico em ácido 9, 10-epoxi-esteárico e/ou a conversão de ácido linoleico em qualquer um ou mais de ácido 9,10-epoxi-12-octadecenóico ou ácido 12,13-epoxi-9-octadecenóico ou ácido 9,10,12,13-diepoxiesteárico e/ou a conversão de ácido linolénico em 20 qualquer um ou mais de ácido 9,10-epoxi-12,15-octadecadienóico ou ácido 12,13-epoxi-9,15-octadecadienóico ou ácido 15,16-epoxi-octadecadienóico ou ácido 9,10,12,13-diepoxi-15-octadecenóico ou ácido 9,10,15,16-diepoxi-12-octadecenóico ou ácido 12,13,15,16-diepoxi-9-octadecenóico ou ácido 9,10,12,13,15,16-triepoxi-esteárico e/ou a conversão de ácido araquidónico em qualquer um ou mais de ácido 5,6-epoxi-8,11,14-tetracosatrienóico ou ácido 8,9-epoxi-5,11,14-tetracosatrienóico ou ácido 11,12-epoxi-5, 8,14-tetracosatrienóico ou ácido 14,15-epoxi-5,8,11 tetracosatrienóico ou ácido OD KD LO 9-diepoxi-ll,14- tetracosadienóico ou ácido 5,6,11, 12-diepoxi-8,14- tetracosadienóico ou ácido 5,6,14, 15-diepoxi-8,11- tetracosadienóico ou ácido 8,9,11, 12-diepoxi-5,14- tetracosadienóico ou 8,9,14,15-diepoxi-5,11-tetracosadienóico ou ácido 11,12,14,15-diepoxi-5,8-tetracosadienóico ou ácido 5, 6,8,9,11,12-triepoxi-14-tetracosenóico ou ácido 5,6,8,9,14,15-triepoxi-ll-tetracosenóico ou 5,6,11,12,14,15-triepoxi-8-tetracosenóico ácido ou ácido 8,9,11,12,14,15-triepoxi-5-tetracosenóico, entre outros.According to this embodiment, an Al2-epoxygenase can catalyze the conversion of palmitoleic acid to 9,10-epoxy-palmitic acid and / or the conversion of oleic acid to 9,10-epoxy stearic acid and / or conversion of linoleic acid in any one or more of 9,10-epoxy-12-octadecenoic acid or 12,13-epoxy-9-octadecenoic acid or 9,10,12,13-diepoxystearic acid and / or the conversion of linolenic acid to Any one or more of 9,10-epoxy-12,15-octadecadienoic acid or 12,13-epoxy-9,15-octadecadienoic acid or 15,16-epoxy-octadecadienoic acid or 9,10,12,13- diepoxy-15-octadecenoic acid or 9,10,15,16-diepoxy-12-octadecenoic acid or 12,13,15,16-diepoxy-9-octadecenoic acid or 9,10,12,13,15,16-triepoxy acid and / or the conversion of arachidonic acid to any one or more of 5,6-epoxy-8,11,14-tetracosatrienoic acid or 8,9-epoxy-5,11,14-tetracosatrienoic acid or 11,12 -epoxy-5,8,14-tetracatriatrienoic acid or 14.1 5-epoxy-5,8,11-tetracosatrienoic acid or OD KD LO 9-diepoxy-11,14-tetracosadienoic acid or 5,6,11,12-diepoxy-8,14-tetracosadienoic acid or 5,6,14,15 -depoxy-8,11-tetracosadienoic acid or 8,9,11,12-diepoxy-5,14-tetracosadienoic acid or 8,9,14,15-diepoxy-5,11-tetracosadienoic acid or 11,12,14,15 -depoxy-5,8-tetracosadienoic acid or 5,6,8,9,11,12-triepoxy-14-tetracosenoic acid or 5,6,8,9,14,15-triepoxy-11-tetracosenoic acid or 5,6 , 11,12,14,15-triepoxy-8-tetracosenoic acid or 8,9,11,12,14,15-triepoxy-5-tetracenoic acid, among others.

Os especialistas na técnica podem estar cientes que nem todos os substratos listados supra podem ser deriváveis a partir de uma fonte natural, mas apesar disso, podem ser produzidos através de meios sintéticos químicos. A conversão de ácidos gordos insaturados tanto de ocorrência natural como sintetizados quimicamente para ácidos gordos epoxi está dentro do âmbito da presente invenção, sendo a única exigência que a molécula de ácido nucleico da presente invenção, como aqui descrita, codifique uma enzima ou parte funcional da mesma que seja capaz de catalizar a referida conversão.Those skilled in the art may be aware that not all substrates listed above may be derivable from a natural source, but nonetheless, they may be produced by chemical synthetic means. The conversion of both naturally occurring and chemically synthesized unsaturated fatty acids to epoxy fatty acids is within the scope of the present invention, the only requirement being that the nucleic acid molecule of the present invention, as described herein, encodes an enzyme or functional part of the which is capable of catalyzing said conversion.

De acordo com a discussão precedente, os especialistas na técnica estarão cientes que uma enzima epoxigenase de ácido gordo pode ser uma enzima monooxigenase dependente de citocromo- 21 Ρ450 ou uma enzima monooxigenase de função mista ou alternativamente uma enzima peroxigenase dependente de peróxido, ou enzima semelhante, entre outras. Contudo, a presente invenção é particularmente dirigida para aquelas enzimas epoxigenases que são enzimas monooxigenases de função mista e moléculas de ácidos nucleicos codificando as mesmas e suas utilizações. De acordo com o exposto, é particularmente preferido que a molécula de ácido nucleico da invenção codifique uma epoxigenase de ácido gordo que seja uma enzima monooxigenase de função mista.According to the foregoing discussion, those skilled in the art will appreciate that a fatty acid epoxygenase enzyme may be a cytochrome 21 Ρ 450 dependent monooxygenase enzyme or a mixed function monooxygenase enzyme or alternatively a peroxide dependent peroxygen enzyme or similar enzyme , among others. However, the present invention is particularly directed to those epoxygenases enzymes which are mixed function monooxygenases and nucleic acid molecules encoding the same and their uses. Accordingly, it is particularly preferred that the nucleic acid molecule of the invention encodes a fatty acid epoxygenase which is a mixed function monooxygenase enzyme.

No contexto da presente invenção, o termo "enzima monooxigenase de função mista" deve ser entendido para referir qualquer enzima que cataliza a epoxigenação de uma ligação de carbono ou ligação dupla de carbono num molécula de ácido gordo, em que a referida enzima compreende ainda uma sequência de aminoácidos que contém três regiões ricas em histidina como se seguem: (i) His-(Xaa) 3-4-His; (ii) His-(Xaa) 2-3-His-His; e (iii) His-(Xaa) 2-3-His-His, em que His designa histidina, Xaa designa qualquer residuo de aminoácido de ocorrência natural, como aqui apresentado na Tabela 1, a entidade completa (Xaa)3_4 refere-se a uma sequência de aminoácidos compreendendo três ou quatro repetições de Xaa, e a entidade completa (Xaa) 2-3 refere-se a uma sequência de aminoácidos compreendendo dois ou três repetições de Xaa. 0 termo "tipo enzima monooxigenase de função mista" deve ser entendido para referir qualquer enzima que compreende três das regiões ricas em histidina listadas supra. 22In the context of the present invention, the term " mixed function monooxygenase enzyme " should be understood to refer to any enzyme that catalyzes the epoxygenation of a carbon bond or carbon double bond in a fatty acid molecule, wherein said enzyme further comprises an amino acid sequence containing three histidine rich regions as follows: i) His- (Xaa) 3-4-His; (ii) His- (Xaa) 2-3-His-His; and (iii) His- (Xaa) 2-3-His-His, wherein His denotes histidine, Xaa designates any naturally occurring amino acid residue, as shown in Table 1, the (Xaa) 3-4 complete entity refers to to an amino acid sequence comprising three or four Xaa repeats, and the complete (Xaa) 2-3 refers to an amino acid sequence comprising two or three Xaa repeats. The term " mixed function monooxygenase enzyme " should be understood to refer to any enzyme comprising three of the histidine rich regions listed supra. 22

Na exemplificação da invenção aqui descrita, os requerentes demonstraram que a sequência de aminoácidos de Crepis palaestina aqui proporcionada, compreende uma enzima A12-epoxigenase que incluí os motivos característicos de sequência de aminoácidos de uma enzima monooxigenase de função mista, como aqui definido anteriormente. A identidade próxima de sequência de aminoácidos entre a enzima A12-epoxigenase de C. palaestina (SEQ ID N°: 2) e as sequências de aminoácidos de polipéptidos derivados de uma Crepis sp. não identificada e Vernonia galamensis como aqui proporcionadas (SEQ ID Nos: 4 e 6), comparativamente às sequências de aminoácidos de outras monooxigenases de função mista, tais como dessaturases e hidroxilases, sugere que as referidas sequências de aminoácidos de Crepis sp. e V. galamensis são também enzimas epoxigenases de ácido gordo e podem ser enzimas A12-epoxigenase. A este respeito, a sequência de aminoácidos de Vernonia galamensis, aqui exemplificada, é uma sequência parcial que compreende apenas um motivo rico em histidina completo (i. e., His-Arg-Asn-His-His) e uma sequência parcial do primeiro motivo rico em histidina (i. e., compreende os dois últimos resíduos de histidina do motivo His-Glu-Cys-Gly-His-His), porque a sequência de nucleótidos correspondente codificando o mesmo foi amplificada por reacção em cadeia da polimerase como uma sequência de ADNc parcial, utilizando um primeiro iniciador para este primeiro motivo rico em histidina e um segundo iniciador de amplificação concebido para uma região a montante do terceiro motivo rico em histidina (i. e., His-Val-Met-His-His). Adicionalmente, o facto de a sequência de V. galamensis ter sido amplificada utilizando um iniciador específico para o primeiro motivo rico em histidina, indica que a sequência de tamanho total correspondente também compreenderia este motivo. 23In the exemplification of the invention described herein, Applicants have demonstrated that the amino acid sequence of Crepis palaestin provided herein comprises an A12-epoxygenase enzyme which includes the characteristic amino acid sequence motifs of a monocyte fungus of mixed function as hereinbefore defined. The close identity of the amino acid sequence between the A12-epoxygenase enzyme of C. palaestina (SEQ ID NO: 2) and the amino acid sequences of polypeptides derived from a Crepis sp. and Vernonia galamensis as provided herein (SEQ ID Nos: 4 and 6), compared to the amino acid sequences of other mixed function monooxygenases, such as desaturases and hydroxylases, suggests that said amino acid sequences of Crepis sp. and V. galamensis are also fatty acid epoxygenases enzymes and may be A12-epoxygenase enzymes. In this regard, the amino acid sequence of Vernonia galamensis, exemplified herein, is a partial sequence comprising only a full histidine rich motif (ie, His-Arg-Asn-His-His) and a partial sequence of the first rich motif in histidine (ie, comprises the last two histidine residues of the His-Glu-Cys-Gly-His-His motif), because the corresponding nucleotide sequence encoding the same was amplified by polymerase chain reaction as a partial cDNA sequence, using a first primer for this first histidine rich motif and a second amplification primer designed for a region upstream of the third histidine rich motif (ie, His-Val-Met-His-His). In addition, the fact that the V. galamensis sequence was amplified using a specific primer for the first histidine rich motif indicates that the corresponding full size sequence would also comprise this motif. 23

De acordo com o exposto, numa forma de realização particularmente preferida, a molécula de ácido nucleico da invenção codifica uma enzima epoxigenase monooxigenase de função mista ou enzima semelhante derivada de Crepis spp., incluindo Crepís palaestina ou alternativamente, derivada de Vernonia galamensis. De acordo com esta forma de realização, é ainda mais preferido que a epoxigenase em causa compreenda, pelo menos, uma sequência de aminoácidos que contém três ou mais regiões ricas em histidina como se seguem: (i) His-Glu-Cys-Gly-His-His (SEQ ID N°: 15); (ii) His-Arg-Asn-His-His (SEQ ID N°: 16); e (iii) His-Val-Met-His-His (SEQ ID N°: 17), ou homólogo, análogo ou derivado do mesmo, em que His designa histidina, Glu designa glutamato, Cys designa cisteina, Gly designa glicina, Arg designa arginina, Asn designa asparagina, Vai designa valina, Met designa metionina. A presente invenção estende-se claramente a genes de epoxigenase derivados de outras espécies, incluindo os genes de epoxigenase derivados de Chrysanthemum spp. e Euphorbia lagascae, entre outras.Accordingly, in a particularly preferred embodiment, the nucleic acid molecule of the invention encodes a mixed function or a similar enzyme monooxygenase enzyme derived from Crepis spp., Including Crepes palaestina or alternatively, derived from Vernonia galamensis. According to this embodiment, it is still more preferred that the subject epoxygenase comprises at least one amino acid sequence containing three or more histidine rich regions as follows: (i) His-Glu-Cys-Gly- His-His (SEQ ID NO: 15); (ii) His-Arg-Asn-His-His (SEQ ID NO: 16); and (iii) His-Val-Met-His-His (SEQ ID NO: 17), or homologue, analogue or derivative thereof, wherein His designates histidine, Glu designates glutamate, Cys designates cysteine, Gly designates glycine, Arg refers to arginine, Asn designates asparagine, Val is valine, Met is methionine. The present invention clearly extends to epoxygenase genes derived from other species, including the epoxygenase genes derived from Chrysanthemum spp. and Euphorbia lagascae, among others.

Numa forma de realização preferida, embora não limitando a presente invenção, os genes de epoxigenase de outras espécies que estão abrangidos pela presente invenção codificam enzimas monooxigenases de função mista. A presente invenção estende-se ainda aos polipéptidos isolados ou recombinantes codificados por esses genes e utilizações dos referidos genes e polipéptidos. A invenção descrita de acordo com esta forma de realização não abrange moléculas de ácidos nucleicos que codifiquem actividades enzimáticas diferentes das actividades de 24 epoxigenase, como aqui definido, em particular as enzimas A12-dessaturase derivadas de Arabidopsis thaliana, Brassica juncea, Brassica napus ou Glycine max, entre outras, que são conhecidas por conter motivos ricos em histidina semelhantes.In a preferred embodiment, although not limiting the present invention, the epoxygenase genes of other species which are encompassed by the present invention encode mixed function monooxygenase enzymes. The present invention further extends to isolated or recombinant polypeptides encoded by such genes and uses of said genes and polypeptides. The invention described in accordance with this embodiment does not encompass nucleic acid molecules encoding enzymatic activities other than epoxygenase activities as defined herein, in particular the A12-desaturase enzymes derived from Arabidopsis thaliana, Brassica juncea, Brassica napus or Glycine max, among others, which are known to contain similar histidine rich motifs.

No presente contexto, os "homólogos" de uma sequência de aminoácidos refere-se àquelas sequências de aminoácidos ou sequências de péptidos que são derivadas a partir de polipéptidos, enzimas ou proteínas da presente invenção ou alternativamente, correspondam substancialmente às sequências de aminoácidos listadas supra, apesar de quaisquer substituições, adições ou delecções de aminoácidos de ocorrência natural nos mesmos.In the present context, " homologues " of an amino acid sequence refers to those amino acid sequences or peptide sequences that are derived from polypeptides, enzymes or proteins of the present invention or alternatively substantially correspond to the amino acid sequences listed above, in spite of any substitutions, additions or deletions of naturally occurring amino acids therein.

Por exemplo, os aminoácidos podem ser substituídos por outros aminoácidos possuindo propriedades semelhantes, por exemplo, hidrofobicidade, hidrofilicidade, momento hidrofóbico, antigenicidade, propensidade para formar ou quebrar estruturas α-helicoidais ou estruturas em folha β, e assim por diante. Alternativamente, ou além disso, os aminoácidos de uma sequência de aminoácidos homóloga pode ser substituída por outros aminoácidos possuindo propriedades semelhantes, por exemplo, hidrofobicidade, hidrofilicidade, momento hidrofóbico, carga ou antigenicidade, e assim por diante.For example, amino acids may be substituted for other amino acids having similar properties, for example, hydrophobicity, hydrophilicity, hydrophobic moment, antigenicity, propensity to form or break α-helical structures or β-sheet structures, and so on. Alternatively, or in addition, the amino acids of a homologous amino acid sequence may be substituted for other amino acids having similar properties, for example, hydrophobicity, hydrophilicity, hydrophobic moment, charge or antigenicity, and so on.

Os residuos de aminoácidos de ocorrência natural aqui contemplados são descritos na Tabela 1.The naturally occurring amino acid residues contemplated herein are described in Table 1.

Um homólogo de uma sequência de aminoácidos pode ser um péptido sintético produzido através de qualquer método conhecido dos especialistas na técnica, tal como por utilização de quimica de Fmoc. 25A homologue of an amino acid sequence may be a synthetic peptide produced by any method known to those skilled in the art, such as by use of Fmoc chemistry. 25

Alternativamente, um homólogo de uma sequência de aminoácidos pode ser derivado a partir de uma fonte natural, tal como a mesma ou uma outra espécie como os polipéptidos, enzimas ou proteínas da presente invenção. As fontes preferidas de homólogos das sequências de aminoácidos listadas supra incluem qualquer uma das fontes aqui contempladas.Alternatively, a homologue of an amino acid sequence may be derived from a natural source, such as the same or another species such as the polypeptides, enzymes or proteins of the present invention. Preferred sources of amino acid sequence homologues listed above include any of the sources contemplated herein.

Os "análogos" de uma sequência de aminoácidos abrangem aquelas sequências de aminoácidos que são substancialmente idênticas às sequências de aminoácidos listadas supra apesar da ocorrência aí de quaisquer análogos de aminoácidos de ocorrência não natural.&Quot; analogs " of an amino acid sequence encompass those amino acid sequences which are substantially identical to the amino acid sequences listed above despite the occurrence there of any non-naturally occurring amino acid analogues therein.

Os aminoácidos de ocorrência não natural preferidos aqui contemplados são listados abaixo na Tabela 2. 0 termo "derivado", relativamente a uma sequência de aminoácidos, deve ser entendido para referir aqui adiante mutantes, partes, fragmentos ou fusões de polipéptido das sequências de aminoácidos listadas supra. Os derivados incluem sequências de aminoácidos modificadas ou péptidos em que os ligandos estão ligados a um ou mais dos resíduos de aminoácidos aí contidos, tais como hidratos de carbono, enzimas, proteínas, polipéptidos ou moléculas repórter, tais como radionuclidos ou compostos fluorescentes. Estão também contemplados pela presente invenção as forma glicosiladas, fluorescentes, aciladas ou alquiladas dos péptidos em causa. Adicionalmente, os derivados podem compreender fragmentos ou partes de uma sequência de aminoácidos aqui divulgada e estão dentro do âmbito da invenção, como estão homopolímeros ou heteropolímeros compreendendo duas ou mais cópias das sequências em causa.The preferred non-naturally occurring amino acids contemplated herein are listed below in Table 2. The term " derived ", relative to an amino acid sequence, should be understood to refer to hereinafter amino acid sequence polypeptide mutants, fragments, or fusions listed above. Derivatives include modified amino acid sequences or peptides in which the ligands are linked to one or more of the amino acid residues contained therein, such as carbohydrates, enzymes, proteins, polypeptides or reporter molecules, such as radionuclides or fluorescent compounds. Also contemplated by the present invention are the glycosylated, fluorescent, acylated or alkylated forms of the subject peptides. In addition, the derivatives may comprise fragments or portions of an amino acid sequence disclosed herein and are within the scope of the invention, as are homopolymers or heteropolymers comprising two or more copies of the sequences in question.

Os processos para derivatizar péptidos são bem conhecidos na técnica. 26Methods for derivatizing peptides are well known in the art. 26

As substituições abrangem alterações de aminoácidos em que um aminoácido é substituído com um residuo de aminoácido de ocorrência natural ou não convencional diferente. Essas substituições podem ser classificadas como "conservadoras", que nesse caso um residuo de aminoácido é substituído com um outro aminoácido de ocorrência natural de carácter semelhante, por exemplo, Glye^Ala, Vale^Ilee^Leu, Asp<->Glu, Lys<->Arg, Asne^Gln ou Phe<->Trp<->Tyr.Substitutions encompass amino acid changes wherein one amino acid is substituted with a different naturally occurring or non-conventional amino acid residue. Such substitutions may be classified as " conservative ", in which case an amino acid residue is replaced with another naturally occurring amino acid of similar character, for example, Glye® Ala, Vale® Ilee® Leu, Asp > Glu , Lys > Arg, Asne < / RTI > Gln or Phe > Trp < - > Tyr.

As substituições abrangidas pela presente invenção também podem ser "não conservadoras", em que um resíduo de aminoácido que está presente num polipéptido repressor é substituído com um aminoácido possuindo propriedades diferentes, tais como um aminoácido de ocorrência natural a partir de um grupo diferente (e. g., um aminoácido carregado ou hidrofóbico substituído com alanina), ou alternativamente, em que um aminoácido de ocorrência natural é substituído com um aminoácido não convencional.Substitutions encompassed by the present invention may also be " non-conservative ", wherein an amino acid residue which is present in a repressor polypeptide is replaced with an amino acid having different properties, such as a naturally occurring amino acid from a different group ( eg, a charged or hydrophobic amino acid substituted with alanine), or alternatively, where a naturally occurring amino acid is substituted with an unconventional amino acid.

As substituições de aminoácidos são tipicamente de resíduos individuais, mas podem ser de resíduos múltiplos, quer estejam aglomerados ou dispersos.Amino acid substitutions are typically individual residues, but may be multiple residues, whether agglomerated or dispersed.

As delecções de aminoácidos serão geralmente da ordem de cerca de 1-10 resíduos de aminoácidos, enquanto as inserções podem ser de qualquer comprimento. As delecções e inserções podem ser realizadas no terminal N, terminal C ou podem ser delecções ou inserções internas. Geralmente, as inserções dentro da sequência de aminoácidos serão menores do que fusões do terminal amino ou terminal carboxilo e da ordem de 1-4 resíduos de aminoácidos. 27 A presente invenção estende-se claramente à molécula de ácido nucleico isolada em causa quando integrada no genoma de uma célula como uma adição ao complemento celular endógeno de genes de epoxigenase. Alternativamente, em que a célula do hospedeiro não codifica normalmente enzimas requeridas para a biossintese de ácido gordo epoxi, a presente invenção estende-se à molécula de ácido nucleico isolada em causa quando integrada no genoma da referida célula como uma adição ao genoma celular endógeno. TABELA 1Amino acid deletions will generally be on the order of about 1-10 amino acid residues, while the insertions may be of any length. Deletions and insertions may be performed at the N-terminus, C-terminus or may be deletions or internal insertions. Generally, the insertions within the amino acid sequence will be smaller than amino- or carboxyl-terminal fusions and on the order of 1-4 amino acid residues. The present invention clearly extends to the subject isolated nucleic acid molecule when integrated into the genome of a cell as an addition to the endogenous cellular complement of epoxygenase genes. Alternatively, where the host cell does not normally encode enzymes required for epoxy fatty acid biosynthesis, the present invention extends to the subject isolated nucleic acid molecule when integrated into the genome of said cell as an addition to the endogenous cellular genome. TABLE 1

Aminoácido Abreviatura de três letras Símbolo de uma letra Alanina Ala A Arginina Arg R Asparagina Asn N Ácido aspártico Asp D Cisteina Cys C Glutamina Gin Q Ácido glutâmico Glu E Glicina Gly G Histidina His H Isoleucina Ile I Leucina Leu L Lisina Lys K Metionina Met M Fenilalanina Phe F (continuação)Amino Acid Three-letter abbreviation Symbol of a letter Alanine Ala Arginine Arg R Asparagine Asn N Aspartic acid Asp D Cysteine Cys C Glutamine Gin Q Glutamic acid Glu E Glycine Gly G Histidine His H Isoleucine Ile I Leucine Leu L Lysine Lys K Methionine Met M Phenylalanine Phe F (continued)

Aminoácido Abreviatura de Símbolo de três letras uma letra Prolina Pro P 28Amino Acid Letter Abbreviation for a three letter symbol Prolina Pro P 28

Serina Ser S Treonina Thr T Triptofano Trp w Tirosina Tyr Y Valina Vai V Qualquer aminoácido como acima Xaa X TABELA 2Serine Ser S Threonine Thr T Tryptophan Trp Tyrosine Tyr Y Valine Val V Any amino acid as above Xaa X TABLE 2

Aminoácido não convencional Código Aminoácido não convencional Código ácido α-aminobutírico Abu L-N-metilalanina Nmala a-amino-a-metilbutirato Mgabu L-N-metilarginina Nmarg aminociclopropano- Cpro L-N-metilasparagina Nmasn carboxilato ácido L-N-metilaspártico Nmasp ácido aminoisobutirico Aib L-N-metilcisteína Nmcys aminonorbornil- L-N-metilglutamina Nmgln carboxilato Norb ácido L-N-metilglutâmico Nmglu ciclo-hexilalanina Chexa L-N-metil-histidina Nmhis ciclopentilalanina Cpen L-N-metilisoleucina Nmile D-alanina Dal L-N-metileucina Nmleu D-arginina Darg L-N-metilisina Nmlys ácido D-aspártico Dasp L-N-metilmetionina Nmmet D-cisteina Dcys L-N-metilnorleucina Nmnle D-glutamina Dgln L-N-metilnorvalina Nmnva ácido D-glutâmico Dglu L-N-metilornitina Nmorn (continuação) Aminoácido não Código Aminoácido não Código convencional convencional D-histidina Dhis L-N-metilfenilalanina Nmphe D-isoleucina Dile L-N-metilprolina Nmpro 29 D-leucina Dleu L-N-metilserina Nmser D-lisina Dlys L-N-metiltreonina Nmthr D-metionina Dmet L-N-metiltriptofano mtrp D-ornitina Dorn L-N-metiltirosina Nmtyr D-fenilalanina Dphe L-N-metilvalina Nmval D-prolina Dpro L-N-metiletilglicina Nmetg D-serina Dser L-N-metil-t-butilglicina Nmtbug D-treonina Dthr L-norleucina Nle D-triptofano Dtrp L-norvalina Nva D-tirosina Dtyr a-metil-aminoisobutirato Maib D-valina Dval a-metil-y-aminobutirato Mgabu D-a-metilalanina Dmala a-metilciclo- hexilalanina Mchexa D-a-metilarginina Dmarg a-metilcilcopentil- alanina Mcpen D-a-metilasparagina Dmasn a-metil-a-naptilalanina Manap D-a-metilaspartato Dmasp α-metilpenicilamina Mpen D-a-metilcisteína Dmcys N-(4-aminobutil)glicina Nglu D-a-metiIglutamina Dmgln N-(2-aminoetil)glicina Naeg D-a-metil-histidina Dmhis N-(3-aminopropil)glicina Norn D-a-metilisoleucina Dmile N-amino-a-metilbutirato Nmaabu D-a-metileucina Dmleu α-naptilaianina Anap D-a-metilisina Dmlys N-benzilglicina Nphe D-a-metilmetionina Dmmet N- (2-carbamiletil)- glicina Ngln D-a-metilornitina Dmorn N-(carbamilmetil)glicina Nasn D-a-metilfenilalanina Dmphe N- (2-carboxietil)glicina Nglu D-a-metilprolina Dmpro N- (carboximetil)glicina Nasp (continuação) Aminoácido não Código Aminoácido não Código convencional convencional D-a-metilserina Dmser N-ciclobutilglicina Ncbut D-a-metiltreonina Dmthr N-ciclo-heptilglicina Nchep D-a-metiltriptofano Dmtrp N-ciclo-hexilglicina Nchex 30 D-a-metiltirosina Dmty N-ciclodecilglicina Ncdec D-a-metilvalina Dmval N-cilcododecilglicina Ncdod D-N-metilalanina Dnmala N-ciclooctilglicina Ncoct D-N-metilarginina Dnmarg N-ciclopropilglicina Ncpro D-N-metilasparagina Dnmasn N-cicloundecilglicina Ncund D-N-metilaspartato Dnmasp N-(2,2-difeniletil)- glicina Nbhm D-N-metilcisteína Dnmcys N-(3,3-difenilpropil)- glicina Nbhe D-N-metilglutamina Dnmgln N-(3-guanidinopropil)- glicina Narg D-N-metilglutamato Dnmglu N-(1-hidroxietil)glicina Nthr D-N-metil-histidina Dnmhis N-(hidroxietil))glicina Nser D-N-metilisoleucina Dnmile N-(imidazoliletil))- glicina Nhis D-N-metileucina Dnmleu N-(3-indolilietil)- glicina Nhtrp D-N-metilisina Dnmlys N-metil-y-aminobutirato Nmgabu N-metilciclo- D-N-metilmetionina Dnmmet hexilalanina Nmchexa D-N-metilornitina Dnmorn N-metilciclopentil- alanina Nmcpen N-metilglicina Nala D-N-metilfenilalanina Dnmphe N-metilaminoisobutirato Nmaib D-N-metilprolina Dnmpro N-(1-metilpropil)glicina Nile D-N-metilserina Dnmser N-(2-metilpropil)glicina Nleu D-N-metiltreonina Dnmthr D-N-metiltriptofano Dnmtrp N-(1-metiletil)glicina Nval (continuação) Aminoácido não Código Aminoácido não Código convencional convencional D-N-metiltirosina Dnmtyr N-metil-naptilalanina Nmanap D-N-metilvalina Dnmval N-metilpenicilamina Nmpen ácido γ-aminobutírico Gabu N-(p-hidroxifenil)- glicina Nhtyr 31 L-t-butilglicina Tbug L-etilglicina Etg L-homofenilalanina Hphe L-a-metilarginina Marg L-a-metilaspartato Masp L-a-metileisterna Mcys L-a-metiIglutamina Mgln L-a-metil-histidina Mhis L-a-metilisoleucina Mile L-a-metileucina Mleu L-a-metilmetionina Mmet L-a-metilnorvalina Mnva L-a-metilfenilalanina Mphe L-a-metilserina Mser L-a-metiltriptofano Mtrp L-a-metilvalina Mval N-(N-(2,2-difeniletil)- carbamilmetil)glicina Nnbhm 1-carboxi-l-(2,2- difeniletilamino)- ciclopropano Nmbc N-(tiometil)glicina Ncys penicilamina Pen L-a-metilalanina Mala L-a-metilasparagina Masn L-a-metil-t-butilglicina Mtbug L-metiletilglicina Metg L-a-metilglutamato Mglu L-a-metil- homofenilalanina Mhphe N- (2- metiltioetil)glicina Nmet L-a-metilisina Mlys L-a-metilnorleucina Mnle L-a-metilornitina Morn L-a-metilprolina Mpro L-a-metiltreonina Mthr L-a-metiltirosina Mtyr L-N-metil-homofenilalanina Nmhphe N-(N-(3,3-difenilpropil)- carbamilmetil)glicina NnbheAmino Acid Non-Conventional Code Amino Acid Amino Acid Amino Amino Amino Amino Amino Amino Amino Amino Amino Amino Amino Amino Amino Acid Mgabu LN-Methylarginine Amino Amino Acid Methyl Amino Acid Amino Amino Acid - LN-methylglutamine Nmgln carboxylate Norb LN-methylglutamic acid Nmglu cyclohexylalanine Chexa LN-methylhistidine Nmhis cyclopentylalanine Cpen LN-methylisoleucine Nmile D-alanine Dal LN-methyleucine Nmleu D-arginine Darg LN-methylisine Nmlys D-aspartic acid Dasp LN -methylmethionine Nmmet D-cysteine Dcys LN-methylnorleucine Nmnle D-glutamine Dgln LN-methylnorvaline Nmnva D-glutamic acid Dglu LN-methylornithine Nmorn (continued) Amino acid no Code Amino acid no Conventional conventional code D-histidine Dhis LN-methylphenylalanine Nmphe D-isoleucine Dile LN-methylproline Nmpro 29 D-leucine Dleu L- N-methylserine Nmser D-lysine Dlys LN-methylthreonine Nmthr D-methionine Dmet LN-methyltryptophan mtrp D-ornithine Dorn L-methyltyrosine Nmtyr D-phenylalanine Dphe LN-methylvaline Nmval D-proline Dpro L-methylethylglycine Nmetg D-serine Dser LN- methyl-t-butylglycine Nmtbug D-threonine Dthr L-norleucine Nle D-tryptophan Dtrp L-norvaline Nva D-tyrosine Dtyr Î ± -methylaminoisobutyrate Maib D-valine Dvala-methyl-γ-aminobutyrate Mgabu Da-methylalanine Dmala a- methylcyclohexylalanine Mmaxa Da-methylarginine Dmax a-methylcyclopenten-alanine Mcpen Da-methylasparagine Dmasn α-methyl-α-naphthalalanine Manap Da-methylaspartate Dmasp α-methylpenicillamine Mpen Da-methylcysteine Dmcys N- (4-aminobutyl) glycine Nglu Da-methylglutamine Dmgln N- (2-aminoethyl) glycine Naeg Da-methylhistidine Dmhis N- (3-aminopropyl) glycine Norn Da-methylisoleucine Dmile N-amino-Î ± -methylbutyrate Nmaabu Da-methyleucine Dmleu α-napthylanine Anap Da-methylisine Dmlys N -benzylglycine Nphe D-methylmethioni (Carbamethylmethyl) glycine Nasm D-methylphenylalanine Dmp N- (2-carboxyethyl) glycine Nglu Da-methylproline Dmpro N- (carboxymethyl) glycine Nasp (continuation) Amino acid no Code Amino acid no Conventional conventional code Da-methylserine Dmser N-cyclobutylglycine Ncbut Da-methylthreonine Dmthr N-cycloheptylglycine Nchep Da-methyltryptophan Dmtrp N-cyclohexylglycine Nchex 30 Da-methyltyrosine Dmty N-cyclodecylglycine Ncdec Da-methylvaline Dmval N -cylododecylglycine Ncdod N-cycloalkylglycine Ncdn N-cyclooctylglycine Ncoct DN-methylarginine Dnmarg N-cyclopropylglycine Ncpro DN-methylasparagine Dnmasn N-cycloundecylglycine Ncund DN-methylaspartate Dnmasp N- (2,2-diphenylethyl) glycine Nbhm DN-methylcysteine Dnmcys N- 3,3-diphenylpropyl) glycine Nbhe DN-methylglutamine Dnmgln N- (3-guanidinopropyl) glycine Narg DN-methylglutamate Dnmglu N- (1-hydroxyethyl) glycine Nthr DN-methyl-h isethrin Nmis N- (hydroxyethyl) glycine Ndel N-methylisoleucine Dnmile N- (imidazolylethyl)) glycine Nhis DN-methyleucine Dnmleu N- (3-indolylethyl) glycine Nhtrp DN-methylisine Dnmlys N-methyl-γ-aminobutyrate Nmgabu N N-methylcyclopentyl-alanine Nmcpen N-methylglycine Nala N-methylphenylalanine Dnmphe N-methylaminobutyrate Nmaib DN-methylproline Dnmpro N- (1-methylpropyl) glycine Nile DN-methylserine Dnmser N- (2-methylpropyl) glycine Nleu DN-methylthreonine Dnmthr DN-methyltryptophan Dnmtrp N- (1-methylethyl) glycine Nval Amino acid no Code Amino acid no Conventional conventional code DN-methyltyrosine Dnmtyr N-methyl napthalalanine Nmanap DN-methylvaline Dnmval N -methylpenicillamine Nmpen γ-aminobutyric acid Gabu N- (p-hydroxyphenyl) -glycine Nhtyr 31 Lt-butylglycine Tbug L-ethylglycine Etg L-homophenylalanine Hphe La-methylarginine Marg La-me Tylospartate Masp La-methylethyster Mcys La-methyl-histidine Mhis La-methylisoleucine Mile La-methyleucine Mleu La-methylmethionine Mmet La-methylnorvaline Mnva La-methylphenylalanine Mphe La-methylserine Mser La-methyltryptophan Mtrp La-methylvaline Mval N- (N- (2,2-diphenylethyl) carbamylmethyl) glycine Nnbhm 1-carboxy-1- (2,2-diphenylethylamino) cyclopropane Nmbc N- (thiomethyl) glycine Ncys penicillamine Pen La-methylalanine Mala La-methylasparagine Masn La- methyl-t-butylglycine methylethylmethylglycine methylethyl methylglycine Methylethylmethylglutamate Methylethylmethyl-homophenylalanine Mhphe N- (2-methylthioethyl) glycine Nmet La-methylisine Mlys La-methylnorleucine Mnle La-methylornithine Morn La-methylproline Mpro La-methylthreonine Mthr La -methylthiorosine Mtyr LN-methyl-homophenylalanine Nmhphe N- (N- (3,3-diphenylpropyl) -carbamylmethyl) glycine Nnbhe

Um segundo aspecto da presente invenção proporciona uma molécula de ácido nucleico isolada que compreende a sequência de nucleótidos apresentada em qualquer uma de SEQ ID Nos: 1 ou 3 ou 5 ou 19 ou 2 0 ou uma sua sequência complementar, ou um seu homólogo, análogo ou derivado. 32A second aspect of the present invention provides an isolated nucleic acid molecule comprising the nucleotide sequence set forth in any one of SEQ ID Nos: 1 or 3 or 5 or 19 or 20 or a complementary sequence thereof, or a homologue, analog thereof or derivative. 32

Para os objectivos da nomenclatura, a sequência de nucleótidos apresentada em SEQ ID N°: 1 é derivada de Crepis palaestina e codifica a sequência de monooxigenase de função mista ou a sequência de tipo monooxigenase de função mista apresentada em SEQ ID N°: 2. Como aqui exemplificado, a sequência de aminoácidos apresentada em SEQ ID N°: 2 tem actividade de epoxigenase, mais particularmente actividade de Δ12-epoxigenase. A sequência de nucleótidos apresentada em SEQ ID N°: 3 corresponde a um ADNc derivado de Crepis sp. diferente de C.For the purposes of the nomenclature, the nucleotide sequence shown in SEQ ID NO: 1 is derived from Crepis palaestin and encodes the mixed function monooxygenase sequence or the mixed function monooxygenase type sequence shown in SEQ ID NO: 2. As exemplified herein, the amino acid sequence shown in SEQ ID NO: 2 has epoxygenase activity, more particularly Δ12-epoxygenase activity. The nucleotide sequence shown in SEQ ID NO: 3 corresponds to a cDNA derived from Crepis sp. different from C.

palaestina que contém niveis elevados de ácido vernólico. A sequência de aminoácidos apresentada em SEQ ID N°: 4 corresponde à sequência de aminoácidos derivada do gene de epoxigenase depalaestin which contains high levels of vernolic acid. The amino acid sequence shown in SEQ ID NO: 4 corresponds to the amino acid sequence derived from the epoxygenase gene of

Crepis sp. proporcionado em SEQ ID N°: 3. A sequência de nucleótidos apresentada em SEQ ID N°: 5 corresponde a ADN amplificado derivado de Vernonia galamensis utilizando iniciadores de amplificação derivados de uma sequência de consenso de monooxigenases de função mista, incluindo as sequências do gene de epoxigenase de Crepis spp. da invenção. O ADN amplificado compreende uma sequência parcial do gene de epoxigenase, que inclui sequências de nucleótidos capazes de codificar o motivo rico em histidina His-Arg-Asn-His-His que é caracteristico de enzimas monooxigenases de função mista. A sequência de aminoácidos apresentada em SEQ ID N°: 6 corresponde à sequência de aminoácidos derivada do gene de epoxigenase do Vernonia galamensis proporcionado em SEQ ID N° : 5. A sequência de nucleótidos apresentada em SEQ ID N°: 7 refere-se à sequência parcial de um gene de acetilenase de Crepis alpina que foi utilizada como uma sonda para isolar a 33 molécula de ácido nucleico compreendendo a sequência de nucleótidos apresentada em SEQ ID N°: 1. A sequência de aminoácidos apresentada em SEQ ID N°: 8 corresponde à sequência de aminoácidos derivada da referida sequência parcial do gene de acetilenase de C. alpina.Crepis sp. provided in SEQ ID NO: 3. The nucleotide sequence shown in SEQ ID NO: 5 corresponds to amplified DNA derived from Vernonia galamensis using amplification primers derived from a consensus sequence of mixed function monooxygenases, including the sequences of the gene of epoxigenase from Crepis spp. of the invention. The amplified DNA comprises a partial sequence of the epoxygenase gene, which includes nucleotide sequences capable of encoding the His-Arg-Asn-His-His histidine rich motif which is characteristic of mixed function monooxygenases. The amino acid sequence shown in SEQ ID NO: 6 corresponds to the amino acid sequence derived from the epoxygenase gene of Vernonia galamensis provided in SEQ ID NO: 5. The nucleotide sequence shown in SEQ ID NO: 7 refers to partial sequence of a Crepis alpina acetylenase gene which has been used as a probe to isolate the nucleic acid molecule comprising the nucleotide sequence set forth in SEQ ID NO: 1. The amino acid sequence shown in SEQ ID NO: 8 corresponds to the amino acid sequence derived from said partial sequence of the C. alpina acetylenase gene.

Como aqui utilizado, o termo "acetilenase" deve ser entendido para referir uma enzima que seja capaz de catalizar a conversão de uma ligação dupla de carbono numa molécula de substrato de ácido gordo numa ligação tripla de carbono ou, alternativamente, que seja capaz de catalizar a formação de uma ligação tripla de carbono numa molécula de ácido gordo. A sequência de nucleótidos apresentada em SEQ ID N°: 18 corresponde a um iniciador de amplificação degenerado utilizado para amplificar sequências putativas do gene de epoxigenase deAs used herein, the term " acetylenase " should be understood to refer to an enzyme which is capable of catalyzing the conversion of a carbon double bond to a fatty acid substrate molecule in a triple carbon bond or alternatively which is capable of catalyzing the formation of a triple carbon bond in a fatty acid molecule. The nucleotide sequence shown in SEQ ID NO: 18 corresponds to a degenerate amplification primer used to amplify putative sequences of the epoxygenase gene of

Euphorbia lagascae. A este respeito, os resíduos de nucleótidos mostrados em SEQ ID N°: 18 são aqueles recomendados pelaEuphorbia lagascae. In this regard, the nucleotide residues shown in SEQ ID NO: 18 are those recommended by

IUPAC-IUB Nomenclature Biochemical Commission, em que A representa Adenina, C representa Citosina, G representa Guanina, T representa timina, Y representa um resíduo de pirimidina, R representa um resíduo de purina, M representa Adenina ouIUPAC-IUB Nomenclature Biochemical Commission, wherein A represents Adenine, C represents Cytosine, G represents Guanine, T represents thymine, Y represents a pyrimidine residue, R represents a purine residue, M represents Adenine or

Citosina, K representa Guanina ou Timina, S representa Guanina ou Citosina, W representa Adenina ou Timina, H representa um nucleótido diferente de Guanina, B representa um nucleótido diferente de Adenina, V representa um nucleótido diferente deCytosine, K represents Guanine or Thymine, S represents Guanine or Cytosine, W represents Adenine or Thymine, H represents a nucleotide other than Guanine, B represents a nucleotide other than Adenine, V represents a nucleotide other than

Timina, D representa um nucleótido diferente de Citosina e N representa qualquer resíduo de nucleótidos. A sequência de nucleótidos apresentada em SEQ ID N°: 19 é derivada de Euphorbia lagascae e codifica a sequência de monooxigenase dependente de citocromo P-450 ou a sequência de tipo monooxigenase dependente de citocromo P-450 putativa. 34 A sequência de nucleótidos apresentada em SEQ ID N°: 20 é derivada de Euphorbia lagascae e codifica uma sequência de monooxigenase dependente de citocromo P-450 ou uma sequência de tipo monooxigenase dependente de citocromo P-450 putativa. A presente invenção estende-se claramente aos equivalentes de genes genómicos das moléculas de ADNc exemplificadas em qualquer uma de SEQ ID Nos: 1, 3, 5, 19 ou 20.Thymine, D represents a nucleotide other than Cytosine and N represents any nucleotide residue. The nucleotide sequence shown in SEQ ID NO: 19 is derived from Euphorbia lagascae and encodes the cytochrome P-450 dependent monooxygenase sequence or the putative cytochrome P-450 dependent monooxygenase type sequence. The nucleotide sequence shown in SEQ ID NO: 20 is derived from Euphorbia lagascae and encodes a cytochrome P-450 dependent monooxygenase sequence or a putative cytochrome P-450 dependent monooxygenase type sequence. The present invention clearly extends to the genomic gene equivalents of the cDNA molecules exemplified in any one of SEQ ID Nos: 1, 3, 5, 19 or 20.

Numa forma de realização muito particularmente preferida, a presente invenção proporciona uma molécula de ácido nucleico isolada que compreende a sequência de nucleótidos apresentada em qualquer uma de SEQ ID Nos: 1, 3, 5, 19 ou 20 ou um equivalente de gene genómico da referida sequência de nucleótidos ou um seu homólogo, análogo ou derivado.In a very particularly preferred embodiment, the present invention provides an isolated nucleic acid molecule comprising the nucleotide sequence set forth in any one of SEQ ID Nos: 1, 3, 5, 19 or 20 or a genomic gene equivalent of said nucleotide sequence or a homologue, analogue or derivative thereof.

Para o presente objectivo, "homólogos" de uma sequência de nucleótidos, deve ser entendido para referir uma molécula de ácido nucleico isolada que seja substancialmente a mesma que a molécula de ácido nucleico da presente invenção ou a sua sequência de nucleótidos complementar, apesar da ocorrência dentro da referida sequência, de uma ou mais substituições, inserções, delecções ou rearranjos de nucleótidos. "Análogos" de uma sequência de nucleótidos aqui apresentada deve ser entendido para referir uma molécula de ácido nucleico isolada que seja substancialmente a mesma que uma molécula de ácido nucleico da presente invenção ou a sua sequência de nucleótidos complementar, apesar da ocorrência de quaisquer constituintes não nucleotidicos não habitualmente presentes na referida molécula de ácido nucleico isolada, por exemplo, hidratos de carbono, radioquímicos, incluindo radionucleótidos, moléculas repórter, tais como, mas não limitadas a DIG, fosfatase alcalina ou peroxidase de rábano, entre outros. 35 "Derivados" de uma sequência de nucleótidos aqui apresentada deve ser entendido para referir qualquer molécula de ácido nucleico isolada que contiver similaridade de sequência significativa com a referida sequência ou uma sua parte.For the present purpose, " homologues " of a nucleotide sequence, is to be understood to refer to an isolated nucleic acid molecule that is substantially the same as the nucleic acid molecule of the present invention or its complementary nucleotide sequence, despite occurrence within said sequence, of one or more more substitutions, insertions, deletions or nucleotide rearrangements. " Analogs " of a nucleotide sequence presented herein should be understood to refer to an isolated nucleic acid molecule that is substantially the same as a nucleic acid molecule of the present invention or its complementary nucleotide sequence, despite the occurrence of any non-nucleotide constituents not usually present in said isolated nucleic acid molecule, for example, carbohydrates, radiochemicals, including radionucleotides, reporter molecules, such as but not limited to DIG, alkaline phosphatase or horseradish peroxidase, among others. 35 " Derivatives " of a nucleotide sequence presented herein should be understood to refer to any isolated nucleic acid molecule which contains significant sequence similarity to said sequence or a portion thereof.

Geralmente, os homólogos, análoqos ou derivados da molécula de ácido nucleico da invenção são produzidos através de meios sintéticos ou alternativamente, derivados de fontes de ocorrência natural. Por exemplo, a sequência de nucleótidos da presente invenção pode ser submetida a mutagénese para produzir substituições, delecções e/ou inserções simples ou múltiplas de nucleótidos, como indicado supra.Generally, homologs, analogs or derivatives of the nucleic acid molecule of the invention are produced by synthetic means or alternatively derived from naturally occurring sources. For example, the nucleotide sequence of the present invention may be mutagenized to produce single or multiple nucleotide substitutions, deletions and / or insertions as indicated supra.

Numa forma de realização da invenção, os homólogos, análogos ou derivados preferidos das sequências de nucleótidos apresentadas em qualquer uma de SEQ ID Nos: 1, 3, 5, 19 ou 20 ou suas sequências complementares, codificam polipéptidos imunologicamente activos ou enzimaticamente-activos.In one embodiment of the invention, preferred homologues, analogs or derivatives of the nucleotide sequences set forth in any one of SEQ ID Nos: 1,3,5,19 or 20 or the complementary sequences thereof encode immunologically active or enzymatically active polypeptides.

Como aqui utilizado, o termo "imunologicamente activo" deve ser entendido para referir a capacidade de uma molécula de polipéptido para induzir uma resposta imune num mamifero, em particular uma resposta imune suficiente para produzir uma molécula de anticorpo, tal como, mas não se limitando a, uma molécula de IgM ou IgG ou soro completo contendo a referida molécula de anticorpo. O termo "imunologicamente activo" estende-se também à capacidade de um polipéptido para induzir uma resposta imune suficiente para a produção de anticorpos monoclonais, fragmentos Fab sintéticos de uma molécula de anticorpo, molécula de anticorpo de cadeia simples ou outra molécula imunointeractiva. 36As used herein, the term " immunologically active " should be understood to refer to the ability of a polypeptide molecule to induce an immune response in a mammal, in particular a sufficient immune response to produce an antibody molecule, such as, but not limited to, an IgM or IgG or serum molecule complete antibody containing said antibody molecule. The term " immunologically active " also extends to the ability of a polypeptide to induce a sufficient immune response for the production of monoclonal antibodies, synthetic Fab fragments of an antibody molecule, single chain antibody molecule or other immunoperative molecule. 36

Como aqui utilizado, o termo "enzimaticamente activo" deve ser entendido para referir a capacidade de uma molécula de polipéptido para catalizar uma reacção enzimática, em particular uma reacção enzimática que compreende a epoxigenação de uma ligação de carbono numa molécula de substrato de ácido gordo. Mais particularmente, embora não limitando a invenção, o termo "enzimaticamente activo" pode também referir a capacidade de uma molécula de polipéptido para catalizar a epoxigenação de Δ-9 ou Δ-12 numa molécula de substrato de ácido gordo, tal como ácido linoleico ou ácido vernólico.As used herein, the term " enzymatically active " should be understood to refer to the ability of a polypeptide molecule to catalyze an enzymatic reaction, in particular an enzymatic reaction comprising the epoxygenation of a carbon bond in a fatty acid substrate molecule. More particularly, while not limiting the invention, the term " enzymatically active " may also refer to the ability of a polypeptide molecule to catalyze the epoxygenation of Δ-9 or Δ-12 in a fatty acid substrate molecule, such as linoleic acid or vernolic acid.

Numa forma de realização alternativa, um homólogo, análogo ou derivado preferido da sequência de nucleótidos apresentada em qualquer uma de SEQ ID Nos: 1 ou 3 ou 5, ou uma sua sequência complementar, compreende uma sequência de nucleótidos que seja, pelo menos, 65% idêntica a, pelo menos, 20 nucleótidos contíguos aí presentes, diferente de uma sequência de nucleótidos que codifique uma enzima acetilenase de Crepis sp.In an alternative embodiment, a preferred homologue, analogue or derivative of the nucleotide sequence set forth in any one of SEQ ID Nos: 1 or 3 or 5, or a complementary sequence thereof, comprises a nucleotide sequence that is at least 65 % identical to at least 20 contiguous nucleotides present therein, other than a nucleotide sequence encoding an acetylenase enzyme of Crepis sp.

De um modo mais preferido, a percentagem de identidade para qualquer uma de SEQ ID Nos: 1 ou 3 ou 5 é, pelo menos, cerca de 85%. De um modo ainda mais preferido, um homólogo, análogo ou derivado de SEQ ID Nos: 1 ou 3 ou 5 é, pelo menos, cerca de 90% e, de um modo ainda mais preferido, pelo menos, cerca de 95% idêntico a, pelo menos, 100 ou 250 ou 500 ou 1000 nucleótidos contíguos aí presentes. A percentagem de identidade para SEQ ID Nos: 19 ou 20, ou suas sequências complementares, é, pelo menos, cerca de 75%, relativamente a, pelo menos, cerca de 200 nucleótidos contíguos, de um modo ainda mais preferido, pelo menos, cerca de 80%, ainda de um modo ainda mais preferido, pelo menos, cerca de 90% e ainda de um modo ainda mais preferido, pelo menos, cerca de 95%, incluindo, pelo menos, cerca de 99% de identidade. As sequências 37 de nucleótidos que são, pelo menos, 65% relativamente a, pelo menos, cerca de 400 nucleótidos contíguos em SEQ ID Nos: 19 ou 20 estão também dentro do âmbito da invenção.More preferably, the percentage identity to any one of SEQ ID Nos: 1 or 3 or 5 is at least about 85%. Even more preferably, a homologue, analogue or derivative of SEQ ID Nos: 1 or 3 or 5 is at least about 90%, and even more preferably at least about 95% identical to , at least 100 or 250 or 500 or 1000 contiguous nucleotides present therein. The percent identity to SEQ ID NOS: 19 or 20, or their complementary sequences, is at least about 75%, relative to at least about 200 contiguous nucleotides, even more preferably at least, about 80%, still more preferably at least about 90%, and still more preferably at least about 95%, including at least about 99% identity. Nucleotide sequences 37 that are at least 65% relative to at least about 400 contiguous nucleotides in SEQ ID Nos: 19 or 20 are also within the scope of the invention.

Aqui a referência a uma percentagem de identidade ou percentagem de similaridade entre dois ou mais nucleótidos ou sequências de aminoácidos deve ser entendida para referir o número de resíduos idênticos ou semelhantes num alinhamento de sequências de nucleótidos ou aminoácidos, como determinado utilizando qualquer algoritmo padrão conhecido dos especialistas na técnica. Em particular, as identidades e similaridades de sequências de nucleótidos e/ou aminoácidos podem ser calculadas utilizando o programa Gap, que utiliza o algoritmo de Needleman e Wunsch (1970) para maximizar o número de resíduos condizentes e minimizar o número de lacunas de sequência. O programa Gap é parte do Sequence and Analysis Software Package do Computer Genetics Group Inc., University Research Park, Madison, Wisconsin, Estados Unidos da América (Devereux et al., 1984).Here reference to a percentage identity or percentage similarity between two or more nucleotides or amino acid sequences should be understood to refer to the number of identical or similar residues in an alignment of nucleotide or amino acid sequences as determined using any standard algorithm known from skilled in the art. In particular, nucleotide and / or amino acid sequence identities and similarities can be calculated using the Gap program, which uses the algorithm of Needleman and Wunsch (1970) to maximize the number of suitable residues and minimize the number of sequence gaps. The Gap program is part of the Sequence and Analysis Software Package of Computer Genetics Group Inc., University Research Park, Madison, Wisconsin, USA (Devereux et al., 1984).

Numa forma de realização alternativa adicional, um homólogo, análogo ou derivado preferido da sequência de nucleótidos apresentada em qualquer uma de SEQ ID Nos: 1, 3, 5, 19 ou 20 ou uma sua sequência complementar, hibrida sob condições, pelo menos, de baixa restringência com, pelo menos, 20 nucleótidos contíguos derivados da referida sequência.In a further alternative embodiment, a preferred homologue, analogue or derivative of the nucleotide sequence set forth in any one of SEQ ID Nos: 1, 3, 5, 19 or 20 or a complementary sequence thereof, hybridizes under conditions of at least low stringency with at least 20 contiguous nucleotides derived from said sequence.

De um modo mais preferido, a restringência de hibridação é, pelo menos, restringência moderada, de um modo ainda mais preferido, pelo menos, restringência elevada.More preferably, the hybridization stringency is at least moderate stringency, even more preferably at least high stringency.

Para os objectivos de definir o nível de restringência, os especialistas na técnica estarão cientes que podem ser utilizadas diversas condições de hibridação diferentes. Por exemplo, uma restringência baixa pode compreender uma hibridação 38 e/ou lavagem realizada em tampão 6 x SSC, 0,1% (p/v) de SDS a 28 °C. Uma restringência moderada pode compreender uma hibridação e/ou lavagem realizada em tampão 2 x SSC, 0,1% (p/v) de SDS a uma temperatura na gama de 45 °C a 65 °C. Uma restringência elevada pode compreender uma hibridação e/ou lavagem realizada em tampão 0,1 x SSC, 0,1% (p/v) de SDS a uma temperatura de, pelo menos, 65 °C.For the purposes of setting the level of stringency, those skilled in the art will be aware that various different hybridization conditions may be utilized. For example, a low stringency may comprise hybridization and / or lavage performed in buffer 6 x SSC, 0.1% (w / v) SDS at 28 ° C. A moderate stringency may comprise hybridization and / or lavage performed in 2 x SSC buffer, 0.1% (w / v) SDS at a temperature in the range of 45øC to 65øC. A high stringency may comprise hybridization and / or washing performed in 0.1 x SSC buffer, 0.1% (w / v) SDS at a temperature of at least 65 ° C.

Geralmente, a restringência é aumentada por redução da concentração do tampão SSC, e/ou aumentando a concentração de SDS no tampão de hibridação ou tampão de lavagem e/ou aumentando a temperatura em que a hibridação e/ou lavagem é realizada. As condições para hibridações e lavagens são bem compreendidas por um especialista na técnica. Para os objectivos de esclarecimento dos parâmetros que afectam a hibridação entre moléculas de ácido nucleico, pode ser feita convenientemente referência às páginas 2.10.8 até 2.10.16. de Ausubel et al. (1987), que é aqui incorporado por referência.Generally, the stringency is increased by reducing the concentration of the SSC buffer, and / or increasing the concentration of SDS in the hybridization buffer or wash buffer and / or increasing the temperature at which hybridization and / or washing is performed. Conditions for hybridizations and washes are well understood by one skilled in the art. For the purposes of clarifying the parameters affecting the hybridization between nucleic acid molecules, reference may conveniently be made to pages 2.10.8 to 2.10.16. of Ausubel et al. (1987), which is hereby incorporated by reference.

As moléculas de ácido nucleico isoladas aqui divulgadas podem ser utilizadas para isolar ou identificar os seus homólogos, análogos ou derivados a partir de outros tipos de células, tecidos ou órgãos, ou a partir das células, tecidos, órgãos de outras espécies utilizando qualquer um de uma variedade de meios conhecidos dos especialistas na técnica.The isolated nucleic acid molecules disclosed herein may be used to isolate or identify homologs, analogs or derivatives thereof from other types of cells, tissues or organs, or from cells, tissues, organs of other species using any of a variety of means known to those skilled in the art.

Por exemplo, o ADN genómico, ou ARNm, ou ADNc pode ser contactado, sob condições, pelo menos, de hibridação de baixa restringência ou equivalente, com uma quantidade de hibridação eficaz de uma molécula de ácido nucleico isolada que compreende a sequência de nucleótidos apresentada em qualquer uma de SEQ ID Nos: 1, 3, 5, 19 ou 20 ou uma sua sequência complementar, ou uma sua parte funcional, e a hibridação detectada utilizando meios de detecção. 39For example, genomic DNA or mRNA or cDNA may be contacted under conditions of at least low stringency hybridization or equivalent with an effective hybridization amount of an isolated nucleic acid molecule comprising the nucleotide sequence shown in any one of SEQ ID Nos: 1, 3, 5, 19 or 20 or a complementary sequence thereof, or a functional part thereof, and the hybridization detected using detection means. 39

Os meios de detecção podem ser uma molécula repórter capaz de dar um sinal identificável (e. g., um radioisótopo, tal como 32P ou 35S, ou uma molécula biotinilada) ligado covalentemente à molécula de ácido nucleico isolada da invenção.The detection means may be a reporter molecule capable of giving an identifiable signal (e.g., a radioisotope, such as 32 P or 35 S, or a biotinylated molecule) covalently linked to the isolated nucleic acid molecule of the invention.

Num método alternativo, o meio de detecção é qualquer formato conhecido da reacção em cadeia da polimerase (PCR). De acordo com este método, são concebidos agrupamentos degenerados de "moléculas iniciadoras" de ácido nucleico de cerca de 15-50 nucleótidos de comprimento com base nas sequências de nucleótidos divulgadas em SEQ ID Nos: 1, 3, 5, 19 ou 20 ou uma sua sequência complementar. Os homólogos, análogos ou derivados (i. e., a "molécula molde") são hibridados com duas das referidas moléculas iniciadoras, de modo que um primeiro iniciador híbrida com uma região numa cadeia da molécula molde e um segundo iniciador híbrida com uma sua sequência complementar, em que o primeiro e segundo iniciadores não estão hibridados dentro das mesmas ou sobrepostas regiões da molécula molde e em que cada iniciador está posicionado numa orientação 5' para 3' relativamente à posição em que o outro iniciador está hibridado na cadeia oposta. Cópias da molécula de ácido nucleico específicas da molécula molde são enzimaticamente amplificadas numa reacção em cadeia da polimerase, uma técnica que é bem conhecida de um especialista na técnica.In an alternative method, the detection means is any known format of the polymerase chain reaction (PCR). According to this method, degenerate pools of " starter molecules " of nucleic acid about 15-50 nucleotides in length based on the nucleotide sequences disclosed in SEQ ID Nos: 1, 3, 5, 19 or 20 or a complementary sequence thereof. Homologs, analogs or derivatives (ie, " template molecule ") are hybridized with two of said primer molecules, so that a first hybrid primer with a region in a template molecule chain and a second hybrid primer with a complementary sequence , wherein the first and second primers are not hybridized within the same or overlapping regions of the template molecule and wherein each primer is positioned in a 5 'to 3' orientation relative to the position where the other primer is hybridized to the opposite strand. Copies of the template nucleic acid molecule specific are enzymatically amplified in a polymerase chain reaction, a technique that is well known to a person skilled in the art.

As moléculas iniciadoras podem compreender qualquer resíduo de nucleótido de ocorrência natural (i. e., adenina, citidina, guanina, timidina) e/ou compreendem inosina ou seus análogos ou derivados funcionais, capazes de serem incorporados numa molécula de polinucleótido. As moléculas iniciadoras de ácido nucleico podem também estar contidas numa mistura aquosa de outras moléculas iniciadoras de ácido nucleico ou estarem numa forma substancialmente pura. 40 A sequência detectada pode estar numa forma recombinante, numa partícula virai, partícula do bacteriófago, célula de levedura, célula animal, ou uma célula vegetal. De um modo preferido, a sequência genética relacionada é originária de outra espécie vegetal.The initiator molecules may comprise any naturally-occurring nucleotide residues (i.e., adenine, cytidine, guanine, thymidine) and / or comprise inosine or analogs or functional derivatives thereof, capable of being incorporated into a polynucleotide molecule. Nucleic acid primer molecules may also be contained in an aqueous mixture of other nucleic acid primer molecules or in substantially pure form. The detected sequence may be in a recombinant form, in a viral particle, bacteriophage particle, yeast cell, animal cell, or a plant cell. Preferably, the related genetic sequence is from another plant species.

Um terceiro aspecto da presente invenção proporciona uma molécula de ácido nucleico isolada que codifica a sequência de aminoácidos apresentada em qualquer uma de SEQ ID Nos: 2 ou 4 ou 6 ou um seu homólogo, análogo ou derivado.A third aspect of the present invention provides an isolated nucleic acid molecule encoding the amino acid sequence shown in any one of SEQ ID Nos: 2 or 4 or 6 or a homologue, analogue or derivative thereof.

Numa forma de realização aqui contemplada, os homólogos, análogos ou derivados preferidos das sequências de aminoácidos apresentadas em SEQ ID Nos: 2, 4, ou 6, são polipéptidos imunologicamente activos ou enzimaticamente activos, como definido supra.In one embodiment contemplated herein, preferred homologues, analogs or derivatives of the amino acid sequences shown in SEQ ID Nos. 2, 4, or 6 are immunologically active or enzymatically active polypeptides as defined supra.

Numa forma de realização alternativa da invenção, os homólogos, análogos ou derivados preferidos da sequência de aminoácidos apresentada em qualquer uma de SEQ ID Nos: 2, 4 ou 6, compreendem uma sequência de aminoácidos que é, pelo menos, 60% idêntica à mesma, e diferente de um polipéptido de acetilenase de Crepis sp. De um modo mais preferido, os homólogos, análogos ou derivados de SEQ ID Nos: 2 ou 4 ou 6 que são abrangidos pela presente invenção são, pelo menos, cerca de 85% idênticos, de um modo ainda mais preferido, pelo menos, cerca de 90% idênticos e ainda de um modo ainda mais preferido, pelo menos, cerca de 95% idênticos, e de um modo ainda mais preferido, pelo menos, cerca de 99%-100% idênticos à mesma.In an alternative embodiment of the invention, preferred homologues, analogs or derivatives of the amino acid sequence set forth in any one of SEQ ID Nos: 2, 4 or 6 comprise an amino acid sequence that is at least 60% identical to the same , and different from an acetylenase polypeptide of Crepis sp. More preferably, the homologues, analogs or derivatives of SEQ ID Nos: 2 or 4 or 6 which are encompassed by the present invention are at least about 85% identical, even more preferably at least about of 90% identical and even more preferably at least about 95% identical, and still more preferably at least about 99% -100% identical thereto.

Os homólogos, análogos ou derivados de qualquer uma de SEQ ID Nos: 2 ou 4 ou 6 podem ainda compreender uma região rica em histidina como definido supra. De um modo ainda mais preferido, 41 a epoxigenase em causa compreende, pelo menos, uma sequência de aminoácidos que contém três ou mais regiões ricas em histidina como se seguem: (i) His-Glu-Cys-Gly-His-His (SEQ ID N°: 15); (ii) His-Arg-Asn-His-His (SEQ ID N°: 16); e (iii) His-Val-Met-His-His (SEQ ID N°: 17), ou um seu homólogo, análogo ou derivado. A invenção descrita de acordo com esta forma de realização alternativa não abrange as enzimas A12-dessaturases derivadas de Arabidopsis thaliana, Brassica juncea, Brassica napus ou Glycine max, entre outras. A molécula de ácido nucleico isolada da presente invenção é útil para desenvolver construções genéticas compreendendo uma molécula de sentido, em que as referidas construções genéticas são concebidas para a expressão numa célula que não expressa normalmente a referida molécula de ácido nucleico ou a sobreexpressão da referida molécula de ácido nucleico numa célula que expressa normalmente a referida molécula de ácido nucleico.Homologs, analogs or derivatives of any of SEQ ID Nos: 2 or 4 or 6 may further comprise a histidine rich region as defined supra. Even more preferably, the subject epoxygenase comprises at least one amino acid sequence containing three or more histidine rich regions as follows: (i) His-Glu-Cys-Gly-His-His (SEQ ID NO: ID No. 15); (ii) His-Arg-Asn-His-His (SEQ ID NO: 16); and (iii) His-Val-Met-His-His (SEQ ID NO: 17), or a homologue, analogue or derivative thereof. The invention described in accordance with this alternative embodiment does not encompass the A12-desaturases enzymes derived from Arabidopsis thaliana, Brassica juncea, Brassica napus or Glycine max, among others. The isolated nucleic acid molecule of the present invention is useful for the development of genetic constructs comprising a sense molecule, wherein said genetic constructs are designed for expression in a cell which does not normally express said nucleic acid molecule or overexpression of said molecule of nucleic acid in a cell which normally expresses said nucleic acid molecule.

De acordo com o exposto, um aspecto adicional da invenção proporciona uma construção genética que compreende uma molécula de sentido que é ligada operacionalmente a uma sequência promotora. 0 termo "molécula de sentido" como aqui utilizado deve ser entendido para referir uma molécula de ácido nucleico isolada que codifica ou é complementar a uma molécula de ácido nucleico isolada que codifica uma epoxigenase de ácido gordo, em que a referida molécula de ácido nucleico é proporcionada num formato 42 adequado para a sua expressão, para produzir um polipéptido recombinante quando a referida molécula de sentido é introduzida numa célula hospedeira através de transfecção ou transformação.Accordingly, a further aspect of the invention provides a genetic construct comprising a sense molecule that is operably linked to a promoter sequence. The term " sense molecule " as used herein should be understood to refer to an isolated nucleic acid molecule which encodes or is complementary to an isolated nucleic acid molecule encoding a fatty acid epoxygenase, wherein said nucleic acid molecule is provided in a format suitable for to produce a recombinant polypeptide when said sense molecule is introduced into a host cell by transfection or transformation.

Os especialistas na técnica estarão cientes que uma construção genética pode ser utilizada para "transfectar" uma célula, o que nesse caso é introduzida na referida célula sem integração no genoma da célula. Alternativamente, uma construção genética pode ser utilizada para "transformar" uma célula, o que nesse caso é integrado estavelmente no genoma da referida célula.Those skilled in the art will be aware that a genetic construct can be used to " transfect " a cell, which in this case is introduced into said cell without integration into the cell's genome. Alternatively, a genetic construct can be used to " transform " a cell, which in this case is stably integrated into the genome of said cell.

Uma molécula de sentido que corresponda a uma sequência do gene de epoxigenase de ácido gordo ou um seu homólogo, análogo ou derivado, pode ser introduzida numa célula utilizando qualquer método conhecido para a transfecção ou transformação da referida célula. Em que uma célula é transformada pela construção genética da invenção, um organismo inteiro pode ser regenerado a partir de uma única célula transformada, utilizando qualquer método conhecido dos especialistas na técnica.A sense molecule corresponding to a sequence of the fatty acid epoxygenase gene or a homologue, analogue or derivative thereof may be introduced into a cell using any known method for transfection or transformation of said cell. In which a cell is transformed by the genetic construct of the invention, an entire organism can be regenerated from a single transformed cell, using any method known to those skilled in the art.

Assim, os genes de epoxigenase aqui descritos podem ser utilizados para desenvolver células individuais ou organismos inteiros que sintetizam ácidos gordos epoxi não produzidos normalmente por organismos selvagens ou de ocorrência natural, pertencentes aos mesmos géneros ou espécies do que os géneros ou espécies dos quais é derivada a célula transfectada ou transformada, ou para aumentar os níveis desses ácidos gordos acima dos níveis normalmente encontrados nesses organismos selvagens ou de ocorrência natural.Thus, the epoxygenase genes described herein can be used to develop individual cells or whole organisms which synthesize epoxy fatty acids not normally produced by wild or naturally occurring organisms belonging to the same genera or species as the genera or species from which they are derived the transfected or transformed cell, or to raise the levels of these fatty acids above the levels normally found in such wild or naturally occurring organisms.

Numa forma de realização preferida alternativa, a molécula de ácido nucleico isolada da invenção é capaz de reduzir o nível de ácidos gordos epoxi numa célula, quando aí expressa, na 43 orientação de anti-sentido ou como uma molécula de ribozima ou de co-supressão, sob o controlo de uma sequência promotora adequada. A co-supressão é a redução em expressão de um gene endógeno que ocorre quando uma ou mais cópias do referido gene, ou uma ou mais cópias de um gene substancialmente semelhante, é introduzida na célula. A presente invenção estende-se também à utilização de co-supressão para inibir a expressão de um gene de epoxigenase como o aqui descrito.In an alternative preferred embodiment, the isolated nucleic acid molecule of the invention is capable of reducing the level of epoxy fatty acids in a cell, when expressed therein, in the antisense orientation or as a ribozyme or co-suppression molecule , under the control of a suitable promoter sequence. Co-suppression is the reduction in expression of an endogenous gene that occurs when one or more copies of said gene, or one or more copies of a substantially similar gene, is introduced into the cell. The present invention also extends to the use of co-suppression to inhibit the expression of an epoxygenase gene as described herein.

No contexto da presente invenção, uma molécula de anti-sentido é uma molécula de ARN que é transcrita a partir da cadeia complementar de um gene nuclear, o qual é normalmente transcrito para produzir uma molécula de ARNm de "sentido" capaz de ser traduzida num polipéptido. A molécula de anti-sentido é, deste modo complementar ao ARNm de sentido, ou uma sua parte. Embora não limitando o modo de acção das moléculas de anti-sentido da presente invenção em qualquer mecanismo específico, a molécula de ARN de anti-sentido possui a capacidade para formar um ARNm de cadeia dupla através de emparelhamento de bases com o ARNm de sentido, que pode prevenir a tradução do ARNm de sentido e subsequente síntese de um produto génico de polipéptido.In the context of the present invention, an antisense molecule is an RNA molecule that is transcribed from the complementary strand of a nuclear gene, which is normally transcribed to produce a " sense " mRNA molecule " capable of being translated into a polypeptide. The antisense molecule is thus complementary to the sense mRNA, or a part thereof. While not limiting the mode of action of the antisense molecules of the present invention in any particular mechanism, the antisense RNA molecule has the ability to form a double stranded mRNA by base pairing with sense mRNA, which can prevent the translation of sense mRNA and subsequent synthesis of a polypeptide gene product.

As ribozimas são moléculas de ARN sintéticas que compreendem uma região de hibridação complementar a duas regiões, cada uma de, pelo menos, 5 bases nucleotídicas contíguas no ARNm de sentido alvo. Além disso, as ribozimas possuem actividade endoribonuclease altamente específica, que cliva autocataliticamente o ARNm de sentido alvo. Uma descrição completa de função das ribozimas é apresentada por Haseloff e Gerlach (1988) e contida no Pedido de Patente Internacional N° WO89/05852. A presente invenção estende-se a ribozimas que se 44 dirigem a um ARNm de sentido codificando um polipéptido de epoxigenase aqui descrito, hibridando desse modo com o referido ARNm de sentido e clivando-o, de modo a não ser mais capaz de ser traduzido para sintetizar um produto polipeptídico funcional.Ribozymes are synthetic RNA molecules which comprise a hybridization region complementary to two regions, each of at least 5 contiguous nucleotide bases in the sense sense mRNA. In addition, the ribozymes possess highly specific endoribonuclease activity, which autocatalytically cleaves the target sense mRNA. A complete description of ribozymes function is presented by Haseloff and Gerlach (1988) and contained in International Patent Application No. WO89 / 05852. The present invention extends to ribozymes which target a sense mRNA encoding an epoxygenase polypeptide described herein, thereby hybridizing to said sense mRNA and cleaving it, so as to be no longer capable of being translated into synthesize a functional polypeptide product.

De acordo com esta forma de realização, a presente invenção proporciona uma ribozima ou molécula de anti-sentido compreendendo uma sequência de bases nucleotidicas contíguas que são capazes de formar um complexo ligado por pontes de hidrogénio com um ARNm de sentido, codificando uma epoxigenase aqui descrita para reduzir a tradução do referido ARNm. Embora as moléculas preferidas de anti-sentido e/ou de ribozima hibridem com, pelo menos, cerca de 10 a 20 nucleótidos da molécula alvo, a presente invenção estende-se a moléculas capazes de hibridar com, pelo menos, cerca de 50-100 bases nucleotidicas de comprimento, ou uma molécula capaz de hibridar com um ARNm de epoxigenase de tamanho total ou substancialmente tamanho total. É compreendido na técnica que determinadas modificações, incluindo substituições de nucleótidos, entre outras, podem ser realizadas nas moléculas de anti-sentido e/ou de ribozima da presente invenção, sem destruir a eficácia das referidas moléculas na inibição da expressão do gene de epoxigenase. Está, deste modo, dentro do âmbito da presente invenção a inclusão de todas as variantes, homólogos, análogos ou fragmentos da sequência de nucleótidos do referido gene que codifica o mesmo, sendo a única exigência que essa referida variante da sequência de nucleótidos, quando transcrita, produza uma molécula de anti-sentido e/ou de ribozima que seja capaz de hibridar com a referida molécula de ARNm de sentido. 45 A presente invenção estende-se a construções genéticas concebidas para facilitar a expressão de uma molécula de sentido, uma molécula de anti-sentido, molécula de ribozima ou molécula de co-supressão que é capaz de alterar o nivel de ácidos gordos epoxi numa célula.According to this embodiment, the present invention provides a ribozyme or antisense molecule comprising a sequence of contiguous nucleotide bases which are capable of forming a hydrogen bonded complex with a sense mRNA, encoding an epoxygenase described herein to reduce the translation of said mRNA. Although preferred antisense and / or ribozyme molecules hybridize with at least about 10 to 20 nucleotides of the target molecule, the present invention extends to molecules capable of hybridizing with at least about 50-100 nucleotide bases in length, or a molecule capable of hybridizing to a full-size or substantially full-size epoxygenase mRNA. It is understood in the art that certain modifications, including nucleotide substitutions, among others, may be performed on the antisense and / or ribozyme molecules of the present invention without destroying the efficacy of said molecules in inhibiting the expression of the epoxygenase gene. It is thus within the scope of the present invention to include all variants, homologues, analogs or fragments of the nucleotide sequence of said gene encoding the same, the only requirement being that said variant of the nucleotide sequence, when transcribed , produces an antisense and / or ribozyme molecule which is capable of hybridizing to said sense mRNA molecule. The present invention extends to genetic constructs designed to facilitate the expression of a sense molecule, an antisense molecule, ribozyme molecule or co-suppression molecule which is capable of altering the level of epoxy fatty acids in a cell .

Numa forma de realização particularmente preferida, a molécula de sentido, molécula de anti-sentido, molécula de ribozima, molécula de co-supressão, ou molécula dirigida ao gene que é capaz de alterar a composição de ácidos gordos epoxi de uma célula derivada de planta ou outro organismo, compreende uma sequência de nucleótidos apresentada em qualquer uma de SEQ ID Nos: 1, 3, 5, 19 ou 20 e, de um modo mais preferido, em qualquer uma de SEQ ID Nos: 1 ou 3 ou 5 e, de um modo ainda mais preferido em SEQ ID N°: 1 ou uma sua cadeia complementar, homólogo, análogo ou derivado.In a particularly preferred embodiment, the sense molecule, antisense molecule, ribozyme molecule, co-suppression molecule, or molecule directed to the gene that is capable of altering the epoxy fatty acid composition of a plant-derived cell or other organism, comprises a nucleotide sequence set forth in any one of SEQ ID Nos: 1, 3, 5, 19 or 20, and more preferably in any one of SEQ ID Nos: 1 or 3 or 5 and, even more preferably in SEQ ID NO: 1 or a complementary, homologous, analogous or derivative thereof.

Os especialistas na técnica estarão também cientes que a expressão de uma molécula de sentido, anti-sentido, ribozima ou co-supressão pode requerer que a molécula de ácido nucleico da invenção seja colocada em ligação operável com uma sequência promotora. A escolha do promotor para o presente objectivo pode variar dependendo do nivel de expressão da molécula de sentido requerida e/ou das espécies das quais a célula hospedeira é derivada e/ou da especificidade do tecido ou especificidade de desenvolvimento da expressão da molécula de sentido que é requerida.Those skilled in the art will also be aware that expression of a sense, antisense, ribozyme or co-suppression molecule may require that the nucleic acid molecule of the invention be put into operable linkage with a promoter sequence. The choice of the promoter for the present object may vary depending upon the level of expression of the required sense molecule and / or the species from which the host cell is derived and / or the tissue specificity or developmental specificity of the expression of the sense molecule which is required.

Aqui a referência a um "promotor" deve ser entendida no seu contexto mais lato e inclui as sequências reguladores de transcrição de um gene genómico eucariótico clássico, incluindo a caixa TATA que é requerida para iniciação da transcrição rigorosa, com ou sem uma sequência da caixa CCAAT e elementos reguladores adicionais (i. e., sequências activadoras a 46 montante, intensificadores e silenciadores) que alteram a expressão génica em resposta aos estímulos de desenvolvimento e/ou externos, ou de um modo especifico de tecido. No contexto da presente invenção, o termo "promotor" inclui também as sequências reguladores de transcrição de um gene procariótico clássico, que nesse caso pode incluir uma sequência da caixa -35 e/ou sequências reguladores de transcrição da caixa -10.Here reference to a " promoter " should be understood in its broader context and includes the transcriptional regulatory sequences of a classical eukaryotic genomic gene, including the TATA box which is required for initiation of the rigorous transcription, with or without a sequence of the CCAAT box and additional regulatory elements (ie, upstream activating sequences, enhancers and silencers) that alter gene expression in response to developmental and / or external stimuli, or in a tissue-specific manner. In the context of the present invention, the term " promoter " also includes the transcriptional regulatory sequences of a classical prokaryotic gene, which in this case may include a -35 box sequence and / or box-10 transcriptional regulatory sequences.

No presente contexto, o termo "promotor" é também utilizado para descrever uma molécula sintética ou de fusão, ou derivada que confere, activa ou intensifica a expressão de referida molécula de sentido numa célula. Os promotores preferidos podem conter cópias adicionais de um ou mais elementos reguladores específicos, para intensificar adicionalmente a expressão da molécula de sentido e/ou para alterar a expressão espacial e/ou a expressão temporal da referida molécula de sentido. Por exemplo, podem ser colocados elementos reguladores responsivos a cobre adjacentemente a uma sequência promotora heteróloga que dirige a expressão de uma molécula de sentido para conferir ai expressão indutivel a cobre.In the present context, the term " promoter " is also used to describe a synthetic or fusion molecule, or derivative which confers, activates or enhances the expression of said sense molecule in a cell. Preferred promoters may contain additional copies of one or more specific regulatory elements to further enhance expression of the sense molecule and / or to alter the spatial expression and / or time expression of said sense molecule. For example, copper responsive regulatory elements may be placed adjacent to a heterologous promoter sequence that directs the expression of a sense molecule to impart copper-inducible expression.

Colocando uma molécula de sentido, anti-sentido, ribozima ou co-supressão sob o controlo regulador de uma sequência promotora, significa posicionar a referida molécula de modo que a expressão seja controlada pela sequência promotora. Um promotor está geralmente, mas não necessariamente, posicionado a montante ou 5' de uma molécula de ácido nucleico que regula. Além disso, os elementos reguladores compreendendo um promotor estão geralmente posicionados no intervalo de 2 kb do sitio de inicio da transcrição da molécula de sentido, anti-sentido, ribozima ou co-supressão, ou gene quimérico, compreendendo os mesmos. Na construção de combinações heterólogas de gene estrutural/promotor é geralmente preferido posicionar o promotor a uma distância do sitio de inicio da transcrição génica que é 47 aproximadamente a mesma que a distância entre esse promotor e o gene que controla no seu contexto natural, i. e., o gene do qual o promotor é derivado. É sabido na técnica, que pode ser acomodada alguma variação nesta distância, sem perda da função do promotor. Do mesmo modo, o posicionamento preferido de um elemento de sequência regulador relativamente a um gene heterólogo a ser colocado sob seu controlo é definido pelo posicionamento do elemento no seu contexto natural, i. e., os genes dos quais o promotor é derivado. Novamente, como é sabido na técnica, pode também ocorrer alguma variação nesta distância.By placing a sense, antisense, ribozyme or co-suppression molecule under the regulatory control of a promoter sequence, it means positioning said molecule so that the expression is controlled by the promoter sequence. A promoter is generally, but not necessarily, positioned upstream or downstream of a regulatory nucleic acid molecule. In addition, regulatory elements comprising a promoter are generally positioned within the 2 kb range of the transcription start site of the sense, antisense, ribozyme or co-suppression molecule, or chimeric gene, comprising the same. In constructing heterologous structural gene / promoter combinations it is generally preferred to position the promoter at a distance from the gene transcription start site which is approximately the same as the distance between that promoter and the control gene in its natural context, the gene from which the promoter is derived. It is known in the art that some variation in this distance can be accommodated without loss of promoter function. Likewise, the preferred positioning of a regulatory sequence element relative to a heterologous gene to be placed under its control is defined by positioning the element in its natural context, i. the genes from which the promoter is derived. Again, as is known in the art, some variation in this distance may also occur.

Os exemplos de promotores adequados para utilização em construções genéticas da presente invenção incluem promotores derivados de genes de virus, leveduras, bolores, bactérias, insectos, pássaros, mamiferos e plantas que são capazes de funcionar em células isoladas ou organismos inteiros dai regenerados. 0 promotor pode regular a expressão da molécula de sentido, anti-sentido, ribozima ou co-supressão constitutivamente, ou diferencialmente, relativamente ao tecido em que ocorre a expressão ou, relativamente à fase de desenvolvimento em que a ocorre expressão, ou em resposta a estímulos externos, tais como stresses fisiológicos, patogenes, ou iões metálicos, entre outros.Examples of promoters suitable for use in genetic constructs of the present invention include promoters derived from virus, yeast, fungal, bacterial, insect, bird, mammalian and plant genes that are capable of functioning in isolated cells or whole regenerated organisms. The promoter may regulate the expression of the sense, antisense, ribozyme or co-suppression molecule constitutively, or differentially, relative to the tissue in which the expression occurs, or, in the development phase in which expression occurs, or in response to external stimuli, such as physiological stresses, pathogens, or metal ions, among others.

Os exemplos de promotores incluem o promotor 35S de CaMV, promotor NOS, promotor da octopina sintase (OCS), promotor do gene SSU de Arabidopsis thaliana, promotor napin específico de semente, promotor P32, promotor imm de BK5-T, promotor lac, promotor tac, promotores do fago lambda XL ou XR, promotor CMV (Patente US N° 5168062), promotor T7, promotor lacUV5, promotor SV40 precoce (Patente US N° 5118627), promotor SV40 tardio (Patente US N° 5118627), promotor de adenovírus, promotor de baculovírus PIO ou poli-hedrina (Patentes US Nos 5243041, 5242687, 5266317, 4745051 e 5169784), e semelhantes. Para além 48 dos promotores específicos aqui identificados, são úteis promotores celulares para os denominados genes housekeeping.Examples of promoters include the CaMV 35S promoter, NOS promoter, octopine synthase (OCS) promoter, Arabidopsis thaliana SSU gene promoter, seed-specific napin promoter, P32 promoter, BK5-T imm promoter, lac promoter, promoter tac promoters, lambda XL or XR phage promoters, CMV promoter (US Patent No. 5168062), T7 promoter, lacUV5 promoter, SV40 early promoter (U.S. Patent No. 5,116,827), late SV40 promoter (U.S. Patent No. 5,116,827), adenovirus, PIO baculovirus promoter or polyhedrin (U.S. Patent Nos. 5,264,041, 5,264,267, 5,266,317, 4,750,501 and 5,169,884), and the like. In addition to the specific promoters identified herein, cell promoters for so-called housekeeping genes are useful.

Os promotores preferidos, de acordo com esta forma de realização, são aqueles promotores que são capazes de funcionar em células de levedura, bolor ou vegetais. De um modo mais preferido, os promotores adequados para utilização de acordo com esta forma de realização são capazes de funcionar em células derivadas de leveduras oleaginosas, bolores oleaginosos ou cultivares de semente oleoginosa, tais como linho vendido sob a marca registada Linola® (aqui referida adiante como "linho Linola®"), girassol, cártamo, soja, linhaça, sésamo, semente de algodão, amendoim, azeitona ou palma-de-azeite, entre outros. A Linola® é uma marca registada da Commonwealth Scientific and Industrial Research Organisation (CSIRO), Austrália.Preferred promoters according to this embodiment are those promoters which are capable of functioning in yeast, mold or plant cells. More preferably, promoters suitable for use according to this embodiment are capable of functioning in cells derived from oleaginous yeasts, oleaginous molds or oleaginous seed cultivars, such as linen sold under the trademark Linola® (referred to herein flax, safflower, soya, linseed, sesame, cottonseed, peanut, olive or palm oil, among others. Linola® is a registered trademark of the Commonwealth Scientific and Industrial Research Organization (CSIRO), Australia.

Numa forma de realização mais preferida, o promotor pode ser derivado de um clone genómico codificando uma enzima epoxigenase, derivada, de um modo preferido, dos equivalentes do gene genómico de genes de epoxigenase derivados de Chrysanthemum spp.r Crepis spp., incluindo C. palaestina ou outros Crepis sp., Euphorbia lagascae ou Vernonia galamensis, que são aqui referidos.In a more preferred embodiment, the promoter may be derived from a genomic clone encoding an epoxygenase enzyme, preferably derived from the genomic gene eigenvirus gene gene derived from Chrysanthemum spp. Crepis spp., Including C. palaestin or other Crepis sp., Euphorbia lagascae or Vernonia galamensis, which are referred to herein.

Numa forma de realização mais preferida, o promotor pode ser derivado de um gene de semente altamente expresso, tal como o gene napin, entre outros. A construção genética da invenção pode ainda compreender uma sequência terminadora e ser introduzida numa célula hospedeira adequada onde seja capaz de ser expressa para produzir um produto génico de polipéptido recombinante ou alternativamente, uma ribozima ou molécula de anti-sentido. 49 0 termo "terminador" refere-se a uma sequência de ADN na extremidade de uma unidade de transcrição que sinaliza a terminação da transcrição. Os terminadores são sequências de ADN 3' não traduzidas contendo um sinal de poliadenilação que facilita a adição de sequências de poliadenilato à extremidade 3' de um transcripto primário. São conhecidos e descritos na literatura terminadores activos em células derivadas de virus, leveduras, bolores, bactérias, insectos, pássaros, mamíferos e plantas. Podem ser isolados a partir de bactérias, fungos, virus, animais e/ou plantas.In a more preferred embodiment, the promoter can be derived from a highly expressed seed gene, such as the napin gene, among others. The genetic construct of the invention may further comprise a terminator sequence and be introduced into a suitable host cell where it is capable of being expressed to produce a recombinant polypeptide gene product or alternatively, a ribozyme or antisense molecule. The term " terminator " refers to a DNA sequence at the end of a transcription unit that signals the termination of transcription. Terminators are 3 'untranslated DNA sequences containing a polyadenylation signal that facilitates the addition of polyadenylate sequences to the 3' end of a primary transcript. Active terminators in cells derived from viruses, yeasts, molds, bacteria, insects, birds, mammals and plants are known and described in the literature. They can be isolated from bacteria, fungi, viruses, animals and / or plants.

Os exemplos de terminadores particularmente adequados para utilização nas construções genéticas da presente invenção incluem o terminador do gene da nopalina sintase (NOS) de Agrobacterium tumefaciens, o terminador do gene 35S do virus do mosaico de Couve-flor (CaMV) , o terminador do gene zein de Zea mays, as sequências terminadoras do gene da subunidade pequena da Rubisco (SSU) , terminadores da sequência génica do stunt virus de trevo subterrâneo (SCSV), qualquer terminador de E. coli independente de rho, entre outros.Examples of terminators particularly suitable for use in the genetic constructs of the present invention include the Agrobacterium tumefaciens nopaline synthase (NOS) gene terminator, cauliflower mosaic virus (CaMV) 35S gene terminator, the gene terminator Zein mays, the Rubisco small subunit gene (SSU) terminator sequences, starch clover virus (SCSV) gene sequence terminators, any rho-independent E. coli terminator, among others.

Os especialistas na técnica estarão cientes de sequências promotoras e sequências terminadoras adicionais que podem ser adequadas para utilização na realização da invenção. Essas sequências podem ser prontamente utilizadas sem qualquer experimentação supérflua.Those skilled in the art will be aware of additional promoter sequences and terminator sequences that may be suitable for use in the practice of the invention. Such sequences can readily be used without any superfluous experimentation.

As construções genéticas da invenção podem ainda incluir uma sequência de origem de replicação que é requerida para replicação num tipo especifico de célula, por exemplo, uma célula bacteriana, quando a referida construção genética é 50 requerida para ser mantida como um elemento genético epissomal (e. g., molécula de plasmideo ou cosmideo) na referida célula.The genetic constructs of the invention may further comprise an origin of replication sequence which is required for replication in a specific cell type, for example, a bacterial cell, when said genetic construct is required to be maintained as an episomal genetic element (eg , plasmid or cosmid molecule) in said cell.

As origens de replicação preferidas incluem, mas não são limitadas, às origens de replicação fl-ori e colEl. A construção genética pode ainda compreender um gene ou genes marcadores de selecção que são funcionais numa célula em que é introduzida a referida construção genética.Preferred origins of replication include, but are not limited to, the origins of fl-ori and colE110 replication. The genetic construct may further comprise a selection marker gene (s) that is functional in a cell in which said genetic construct is introduced.

Como aqui utilizado, o termo "gene marcador de selecção" inclui qualquer gene que confira um fenótipo numa célula em que é expresso para facilitar a identificação e/ou selecção de células que são transfectadas ou transformadas com uma construção genética da invenção ou um seu derivado.As used herein, the term " selection marker gene " includes any gene that confers a phenotype on a cell in which it is expressed to facilitate the identification and / or selection of cells that are transfected or transformed with a genetic construct of the invention or a derivative thereof.

Os genes marcadores de selecção adequados aqui contemplados incluem o de resistência à ampicilina (Ampr) , gene de resistência à tetraciclina (Tcr) , gene bacteriano de resistência à canamicina (Kanr) , gene de resistência à fosfinotricina, gene da neomicina fosfotransferase (nptll), gene de resistência à higromicina, gene da β-glucuronidase (GUS), gene da cloranfenicol acetiltransferase (CAT) e gene da luciferase, entre outros.Suitable selection marker genes contemplated herein include ampicillin resistance (Ampr), tetracycline resistance gene (Tcr), bacterial kanamycin resistance gene (Kanr), phosphinothricin resistance gene, neomycin phosphotransferase (nptll) gene, , hygromycin resistance gene, β-glucuronidase gene (GUS), chloramphenicol acetyltransferase (CAT) gene, and luciferase gene, among others.

Um aspecto adicional da presente invenção proporciona uma célula, tecido, órgão ou organismo inteiro transfectado ou transformado que expressa um polipéptido de epoxigenase recombinante ou uma molécula de ribozima, anti-sentido ou co-supressão como aqui descritos, ou um seu homólogo, análogo ou derivado.A further aspect of the present invention provides a transfected or transformed whole cell, tissue, organ or organism expressing a recombinant epoxygenase polypeptide or a ribozyme, antisense or co-suppression molecule as described herein, or a homologue, analog or derivative.

De um modo preferido, a molécula de ácido nucleico isolada está contida numa construção genética como a aqui descrita. A construção genética da presente invenção pode ser introduzida 51 numa célula através de várias técnicas conhecidas dos especialistas na técnica. A técnica utilizada pode variar dependendo das técnicas bem sucedidas conhecidas para esse organismo particular.Preferably, the isolated nucleic acid molecule is contained within a genetic construct as described herein. The genetic construct of the present invention may be introduced into a cell by various techniques known to those skilled in the art. The technique used may vary depending upon the successful techniques known for that particular organism.

Os meios para introduzir ADN recombinante em células bacterianas, células de levedura, ou células ou tecidos de plantas, insectos, fungos (incluindo bolor), aves ou mamíferos incluem, mas não são limitados, a transformação utilizando CaCl2 e suas variações, em particular o método descrito por Hanahan (1983), incorporação directa de ADN em protoplastos (Krens et al., 1982/ Paszkowski et al., 1984), incorporação mediada por PEG em protoplastos (Armstrong et al., 1990) bombardeamento de microparticulas, electroporação (Fromm et al., 1985), microinjecção de ADN (Crossway et al., 1986), bombardeamento de microparticulas de explantes de tecido ou células (Christou et al., 1988; Sanford, 1988), infiltração por vácuo de tecido com ácido nucleico, ou no caso de plantas, transferência mediada por T-ADN de Agrobacterium para o tecido vegetal como essencialmente descrito por An et al. (1985), Herrera-Estrella et al. (1983a, 1983b, 1985).Means for introducing recombinant DNA into bacterial cells, yeast cells, or cells or tissues of plants, insects, fungi (including mold), birds or mammals include, but are not limited to, transformation using CaCl 2 and its variations, in particular The method was described by Hanahan (1983), direct incorporation of DNA into protoplasts (Krens et al., 1982 / Paszkowski et al., 1984), PEG-mediated incorporation into protoplasts (Armstrong et al., 1990), microporticle bombardment, electroporation Fromm et al., 1985), microinjection of DNA (Crossway et al., 1986), bombardment of microparticles of tissue explants or cells (Christou et al., 1988; Sanford, 1988), vacuum infiltration of tissue with nucleic acid , or in the case of plants, Agrobacterium T-DNA mediated transfer to the plant tissue as essentially described by An et al. (1985), Herrera-Estrella et al. (1983a, 1983b, 1985).

Para o bombardeamento de microparticulas de células, uma microparticula é propulsionada numa célula para produzir uma célula transformada. Pode ser utilizada qualquer metodologia e dispositivo de transformação celular balística adequada na realização da presente invenção. São divulgados dispositivos e processos exemplares por Stomp et al. (Patente US N° 5122466) e Sanford e Wolf (Patente US N° 4945050). Ao utilizar processos de transformação balística, a construção genética pode incorporar um plasmídeo capaz de replicação na célula a ser transformada. 52For the bombardment of cell microparticles, a microparticle is propelled into a cell to produce a transformed cell. Any suitable ballistic cell transformation methodology and device may be used in carrying out the present invention. Exemplary devices and processes are disclosed by Stomp et al. (U.S. Patent No. 5122466) and Sanford and Wolf (U.S. Patent No. 4,945050). By using ballistic transformation processes, the genetic construct may incorporate a plasmid capable of replication in the cell to be transformed. 52

Os exemplos de micropartículas adequadas para utilização nesses sistemas incluem esferas de ouro de 1 a 5 pm. A construção de ADN pode ser depositada na micropartícula através de qualquer técnica adequada, tal como por precipitação.Examples of microparticles suitable for use in such systems include gold beads of 1 to 5 μm. The DNA construct may be deposited on the microparticle by any suitable technique, such as by precipitation.

Numa forma de realização particularmente preferida, em que a construção genética compreende uma molécula de "sentido", é particularmente preferido que o polipéptido de epoxigenase recombinante ai produzido seja enzimaticamente activo.In a particularly preferred embodiment, wherein the genetic construct comprises a " sense " molecule, it is particularly preferred that the recombinant epoxygenase polypeptide produced therein is enzymatically active.

Alternativamente, um organismo inteiro pode ser regenerado a partir da célula transformada, em que a célula é derivada de um organismo multicelular e em que está disponível tecnologia relevante, de acordo com processos bem conhecidos na técnica.Alternatively, an entire organism can be regenerated from the transformed cell, wherein the cell is derived from a multicellular organism and where relevant technology is available, according to procedures well known in the art.

Os especialistas na técnica estarão também cientes dos métodos para transformar, regenerar e propagar outros tipos de células, tais como aquelas de fungos.Those skilled in the art will also be aware of methods for transforming, regenerating and propagating other cell types, such as those of fungi.

No caso de plantas, pode ser transformado tecido vegetal capaz de subsequente propagação clonal, quer por organogénese ou embriogénese, com uma construção genética da presente invenção e daí regenerada uma planta inteira. 0 tecido particular escolhido variará dependendo dos sistemas de propagação clonal disponíveis, e mais adequados, para a espécie particular a ser transformada. Os alvos tecidulares exemplares incluem discos de folha, pólen, embriões, cotilédones, hipocótilos, megagametófitos, tecido de callus, tecido meristemático existente (e. g., meristema apical, rebentos axilares e meristemas radiculares) e tecido de meristema induzido (e. g., meristema de cotilédone e meristema de hipocótilo). 53 0 termo "organogénese", como aqui utilizado, significa um processo através do qual são sequencialmente desenvolvidos rebentos e raizes a partir de centros meristemáticos. 0 termo "embriogénese", como aqui utilizado, significa um processo através do qual que são desenvolvidos conjuntamente rebentos e raizes numa forma concertada (não sequencialmente) , quer a partir de células somáticas ou gâmetas.In the case of plants, plant tissue capable of subsequent clonal propagation may be transformed either by organogenesis or embryogenesis, with a genetic construct of the present invention and thereafter regenerated an entire plant. The particular tissue chosen will vary depending on the clonal propagation systems available, and more suitable, for the particular species to be transformed. Exemplary tissue targets include leaf discs, pollen, embryos, cotyledons, hypocotyls, megagametophytes, callus tissue, existing meristematic tissue (eg, apical meristem, axillary shoots and root meristems) and induced meristem tissue (eg, cotyledon meristem and hypocotyl meristem). The term " organogenesis " as used herein means a process by which shoots and roots are sequentially developed from meristematic centers. The term " embryogenesis " as used herein means a process whereby shoots and roots are co-developed in a concerted (not sequentially) form, either from somatic cells or gametes.

As plantas transformadas regeneradas podem ser propagadas através de uma variedade de meios, tais como através de propagação clonal ou técnicas clássicas de reprodução. Por exemplo, uma planta transformada de primeira geração (ou Tl) pode ser auto-cruzada para produzir um transformante de segunda geração (ou T2) homozigótico, e as plantas T2 propagadas adicionalmente através de técnicas clássicas de reprodução.Transformed regenerated plants can be propagated through a variety of media, such as through clonal propagation or classical breeding techniques. For example, a first generation (or T1) transformed plant may be self-crosslinked to produce a second generation homozygous transformant (or T2), and the T2 plants propagated further through classical breeding techniques.

Os organismos transformados regenerados, aqui contemplados, podem apresentar uma variedade de formas. Por exemplo, podem ser quimeras de células transformadas e células não transformadas; transformantes clonais (e. g., todas as células transformadas para conter a cassete de expressão); enxertos de tecidos transformados e não transformadas (e. g., em plantas, um raizame transformado enxertado com um rebento não transformado) .The regenerated transformed organisms contemplated herein may have a variety of forms. For example, they may be chimeras of transformed cells and non-transformed cells; clonal transformants (e.g., all cells transformed to contain the expression cassette); grafts of transformed and untransformed tissues (e.g., in plants, a transformed root grafted with an unprocessed shoot).

Um aspecto adicional da invenção proporciona um método de alteração do nivel de ácidos gordos epoxi numa célula, tecido, órgão ou organismo, compreendendo o referido método a expressão de uma molécula de sentido, anti-sentido, ribozima ou co-supressão como aqui descrita, na referida célula durante um periodo de tempo e sob condições suficientes para ser aumentado ou reduzido o nivel de ácidos gordos ai presente. 54A further aspect of the invention provides a method of altering the level of epoxy fatty acids in a cell, tissue, organ or organism, said method comprising the expression of a sense, antisense, ribozyme or co-suppression molecule as described herein, in said cell for a period of time and under conditions sufficient to be increased or reduced the level of fatty acids present therein. 54

Numa forma de realização preferida, o método em causa compreende o primeiro passo adicional de transformação da célula, tecido, órgão ou organismo com a molécula de sentido, anti-sentido, ribozima ou co-supressão.In a preferred embodiment, the method comprises the first additional step of transforming the cell, tissue, organ or organism to the sense, antisense, ribozyme or co-suppression molecule.

Como discutido supra, a molécula de ácido nucleico isolada pode estar contida numa construção genética.As discussed above, the isolated nucleic acid molecule may be contained within a genetic construct.

De acordo com esta forma de realização, a célula, órgão, tecido ou organismo em que a molécula de sentido, anti-sentido, ribozima ou co-supressão em causa é expressa, pode ser derivada de uma bactéria, levedura, fungo (incluindo um bolor), insecto, planta, pássaro ou mamífero.According to this embodiment, the cell, organ, tissue or organism in which the sense, anti-sense, ribozyme or co-suppression molecule in question is expressed can be derived from a bacterium, yeast, fungus (including a mold), insect, plant, bird or mammal.

Porque um polipéptido de epoxigenase recombinante pode ser produzido no transformante regenerado assim como ex vivo, uma forma de realização preferida alternativa da presente invenção proporciona um método de produção de um polipéptido de epoxigenase recombinante enzimaticamente activo numa célula, compreendendo o referido método os passos de: (i) produção de uma construção genética que compreende o ADNc ou a sequência genética genómica de epoxigenase da invenção colocada operacionalmente sob o controlo de um promotor capaz de conferir expressão na referida sequência genética na referida célula, e opcionalmente um elemento de intensificação da expressão; (ii) transformação da referida construção genética na referida célula; e (iii) selecção dos transformantes que expressam a um nível elevado, a epoxigenase codificada pela sequência genética.Because a recombinant epoxygenase polypeptide can be produced in the regenerated as well as ex vivo transformant, an alternative preferred embodiment of the present invention provides a method of producing an enzymatically active recombinant epoxygenase polypeptide in a cell, said method comprising the steps of: (i) producing a genetic construct comprising the cDNA or the epoxygenase genomic genetic sequence of the invention operably placed under the control of a promoter capable of conferring expression on said gene sequence in said cell, and optionally an expression enhancing element; (ii) transforming said genetic construct into said cell; and (iii) selection of transformants expressing at a high level, the epoxigenase encoded by the genetic sequence.

Uma forma de realização particularmente preferida da presente invenção proporciona um método de produção de um 55 polipéptido de epoxigenase recombinante enzimaticamente activo numa planta transgénica compreendendo os passos de: (i) produção de uma construção genética que compreende o ADNc ou a sequência genética genómica de epoxigenase da invenção colocada operacionalmente sob o controlo de um promotor especifico de semente, e opcionalmente de um elemento de intensificação da expressão, em que a referida sequência genética é também colocada a montante de uma sequência terminadora de transcrição; (ii) transformação da referida construção genética numa célula ou tecido da referida planta; e (iii) selecção dos transformantes que expressam a um nivel elevado em sementes, a epoxigenase codificada pela sequência genética.A particularly preferred embodiment of the present invention provides a method of producing an enzymatically active recombinant epoxygenase polypeptide in a transgenic plant comprising the steps of: (i) producing a genetic construct comprising the cDNA or the epoxygenase genomic genetic sequence of the invention operatively placed under the control of a specific seed promoter, and optionally an expression enhancement element, wherein said gene sequence is also placed upstream of a transcription terminator sequence; (ii) transforming said genetic construct into a cell or tissue of said plant; and (iii) selection of the transformants expressing at a high seed level, the epoxigenase encoded by the genetic sequence.

Numa forma de realização mais particularmente preferida, a planta é uma espécie de semente oleaginosa que produz normalmente niveis significativos de ácido linoleico, por exemplo, linho Linola®, colza de semente oleaginosa, girassol, cártamo, soja, linhaça, sésamo, semente de algodão, amendoim, azeitona ou palma-de-azeite, entre outras.In a more particularly preferred embodiment the plant is a kind of oleaginous seed which normally produces significant levels of linoleic acid, for example Linola® flax, oilseed rape, sunflower, safflower, soybean, linseed, sesame, cottonseed , peanuts, olives or olive oil, among others.

Numa forma de realização ainda mais particularmente preferida, a planta é uma espécie de semente oleaginosa que produz normalmente niveis significativos de ácido linoleico, por exemplo, linho Linola®, girassol ou cártamo, entre outras.In an even more particularly preferred embodiment the plant is a kind of oleaginous seed which normally produces significant levels of linoleic acid, for example Linola®, sunflower or safflower, among others.

As epoxigenases recombinantes enzimaticamente activas, aqui descritas, são particularmente úteis para a produção de ácidos gordos epoxigenados a partir de substratos de ácidos gordos insaturados. A presente invenção contempla especialmente a produção de ácidos gordos epoxigenados específicos em células ou 56 organismos transformados regenerados que não produzem normalmente esse ácido gordo epoxigenado especifico.The enzymatically active recombinant epoxygenases described herein are particularly useful for the production of epoxygen fatty acids from unsaturated fatty acid substrates. The present invention particularly contemplates the production of specific epoxygen fatty acids in cells or regenerated transformed organisms that do not normally produce this specific epoxygen fatty acid.

De acordo com o exposto, um aspecto adicional da invenção proporciona um método de produção de um ácido gordo epoxigenado numa célula, tecido, órgão ou organismo, compreendendo o referido método a incubação de uma célula, tecido, órgão ou organismo que expressa uma epoxigenase recombinante enzimaticamente activa da presente invenção, com uma molécula de substrato de ácido gordo, de um modo preferido uma molécula de substrato de ácido gordo insaturado, durante um periodo de tempo e sob condições suficientes para, pelo menos, uma ligação de carbono do referido substrato ser convertida num grupo epoxi.Accordingly, a further aspect of the invention provides a method of producing an epoxygenated fatty acid in a cell, tissue, organ or organism, said method comprising incubating a cell, tissue, organ or organism expressing a recombinant epoxygenase enzymatically active compound of the present invention with a fatty acid substrate molecule, preferably an unsaturated fatty acid substrate molecule, for a period of time and under conditions sufficient for at least one carbon bond of said substrate to be converted into an epoxy group.

Numa forma de realização alternativa, o método em causa compreende ainda o primeiro passo adicional de transformar ou transfectar a célula, tecido, órgão ou organismo com uma molécula de ácido nucleico que codifica a referida epoxigenase recombinante ou um seu homólogo, análogo ou derivado, como aqui descrito anteriormente. Como discutido supra, a molécula de ácido nucleico isolada pode estar contida numa construção genética.In an alternative embodiment, the method in question further comprises the first additional step of transforming or transfecting the cell, tissue, organ or organism with a nucleic acid molecule encoding said recombinant epoxygenase or a homologue, analogue or derivative thereof, such as described hereinbefore. As discussed above, the isolated nucleic acid molecule may be contained within a genetic construct.

De acordo com esta forma de realização, a célula, órgão, tecido ou organismo em que a epoxigenase em causa é expressa, é derivada de bactéria, levedura, fungo (incluindo um bolor), insecto, planta, pássaro ou mamífero. De um modo mais preferido, a célula, órgão, tecido ou organismo é derivada de uma levedura, planta ou fungo, de um modo ainda mais preferido de uma levedura ou planta ou fungo oleaginosa, ou de uma planta de semente oleaginosa que não expressa normalmente a epoxigenase recombinante da invenção. 57According to this embodiment, the cell, organ, tissue or organism in which the subject epoxygenase is expressed is derived from bacterium, yeast, fungus (including a mold), insect, plant, bird or mammal. More preferably, the cell, organ, tissue or organism is derived from a yeast, plant or fungus, even more preferably from a yeast or oleaginous plant or fungus, or from an oil seed plant which is not normally expressed the recombinant epoxigenase of the invention. 57

Entre as principais plantas de semente oleaginosa económicas, aqui contempladas, são alvos preferidos os genótipos de linoleico elevado de linho, girassol, milho e cártamo. A soja e a semente de colza são alvos alternativos mas são menos adequados para sintese máxima de ácido gordo epoxi por causa dos seus niveis inferiores de substrato de ácido linoleico e da presença de uma A15-dessaturase activa que compete com a epoxigenase para o substrato de ácido linoleico.Among the main economical oilseed plants, contemplated herein, the high linoleic genotypes of flax, sunflower, corn and safflower are preferred targets. Soybean and rape seed are alternate targets but are less suitable for maximum synthesis of fatty acid epoxy because of their lower levels of linoleic acid substrate and the presence of an active A15 desaturase competing with the epoxygenase for the substrate of linoleic acid.

Uma forma de realização alternativa é a transformação de Linola® (= linho de baixo ácido linolénico) com a epoxigenase da invenção. 0 linho Linola® contém normalmente cerca de 70% de ácido linoleico, sendo muito pouco deste (< 2%) subsequentemente convertido em ácido linolénico pela A15-dessaturase (Green, 1986).An alternative embodiment is the transformation of Linola® (= linolenic acid flax) with the epoxygenase of the invention. Linola® linen normally contains about 70% linoleic acid, and very little (< 2%) is subsequently converted to linolenic acid by A15-desaturase (Green, 1986).

Os substratos de ácido gordo insaturado preferidos, aqui contemplados incluem, mas não são limitados a, ácido palmitoleico, ácido oleico, ácido linoleico, ácido linolénico e ácido araquidónico, entre outros.Preferred unsaturated fatty acid substrates contemplated herein include, but are not limited to, palmitoleic acid, oleic acid, linoleic acid, linolenic acid and arachidonic acid, among others.

Nas espécies vegetais que contêm naturalmente niveis elevados de ácido vernólico, a A12-epoxigenase ai presente pode ser muito eficiente na epoxidação do ácido linoleico. Consequentemente, a presente invenção contempla particularmente a expressão de A12-epoxigenase recombinante derivada de Euphorbia lagascae, Vernonia spp. e Crepis spp. a niveis elevados em sementes oleaginosas transgénicas durante a sintese de óleo de semente, para ai produzir niveis elevados de ácido vernólico.In plant species which naturally contain high levels of vernolic acid, the β12-epoxyigenase present can be very efficient in the epoxidation of linoleic acid. Accordingly, the present invention particularly contemplates the expression of recombinant A12-epoxygenase derived from Euphorbia lagascae, Vernonia spp. and Crepis spp. at elevated levels in transgenic oilseeds during seed oil synthesis, to thereby produce high levels of vernolic acid.

De acordo com o exposto, o ácido linoleico é um substrato particularmente preferido, de acordo com esta forma de realização da invenção. Não são excluídos substratos adicionais. 58Accordingly, linoleic acid is a particularly preferred substrate, in accordance with this embodiment of the invention. No additional substrates are excluded. 58

Os produtos das moléculas de substrato listadas supra são prontamente determinados pelos especialistas na técnica, sem experimentação supérflua. Os ácidos gordos epoxi particularmente preferidos produzidos de acordo com a presente invenção incluem o ácido 12,13-epoxi-9-octadecenóico (ácido vernólico) e o ácido 12,13-epoxi-9,15-octadecadienóico, entre outros.The products of the substrate molecules listed above are readily determined by those skilled in the art without undue experimentation. Particularly preferred epoxy fatty acids produced according to the present invention include 12,13-epoxy-9-octadecenoic acid (vernolic acid) and 12,13-epoxy-9,15-octadecadienoic acid, among others.

As condições para a incubação de células, órgãos, tecidos ou organismos que expressam a epoxigenase recombinante na presença da molécula de substrato vai variar dependendo, pelo menos, da incorporação do substrato na célula, tecido, órgão ou organismo, e da afinidade da epoxigenase para a molécula de substrato no ambiente particular seleccionado. As condições óptimas podem ser prontamente determinadas pelos especialistas na técnica relevante. A presente invenção estende-se claramente ao óleo isolado contendo os ácidos gordos epoxi, e/ou ao próprio ácido gordo epoxi isolado, produzido como aqui descrito, e a quaisquer produtos dai derivados, por exemplo, revestimentos, resinas, colas, plásticos, tensioactivos e lubrificantes, entre outros.Conditions for incubating cells, organs, tissues or organisms expressing recombinant epoxygenase in the presence of the substrate molecule will vary depending on at least the incorporation of the substrate into the cell, tissue, organ or organism, and the affinity of epoxygenase to the substrate molecule in the particular environment selected. Optimal conditions may be readily determined by those skilled in the relevant art. The present invention clearly extends to the isolated oil containing the epoxy fatty acids, and / or to the isolated epoxy fatty acid itself, produced as described herein, and to any derivatives thereof, for example, coatings, resins, glues, plastics, surfactants and lubricants, among others.

Os requerentes mostraram ainda que as monooxigenases de função mista (MMO) que realizam funções catalíticas, tais como dessaturação, acetilenação, hidroxilação e/ou epoxigenação, formam uma familia de genes que partilham considerável similaridade de sequência de nucleótidos e aminoácidos. Por exemplo, as enzimas dessaturase, acetilenase, hidroxilase e/ou epoxigenase que actuam sobre moléculas de substrato possuindo um comprimento de cadeia e posição de qual(ais)quer ligação (ões) dupla (s) de carbono (se presente) semelhantes estão mais intimamente relacionadas entre si do que as enzimas que actuam sobre outros substratos, e podem ser consideradas uma "familia". 59Applicants have further shown that mixed function monooxygenases (MMOs) performing catalytic functions, such as desaturation, acetylenation, hydroxylation and / or epoxygenation, form a family of genes that share considerable nucleotide and amino acid sequence similarity. For example, desaturase, acetylenase, hydroxylase and / or epoxygenase enzymes which act on substrate molecules having a chain length and position of either (or) similar carbon double bond (s) (if present) are closely related to each other than enzymes acting on other substrates, and may be considered a " family ". 59

Sem se estar ligado a qualquer teoria ou modo de acção, a similaridade de sequência entre os membros de qualquer família génica têm a sua base na identidade do substrato envolvido e na similaridade bioquímica dos eventos reaccionais que ocorrem na ligação de carbono alvo, durante a reacção de modificação, sugerindo que as sequências divergentes dentro de uma família podem compreender determinantes catalíticos ou, pelo menos, uma sua parte funcional que contribua para as propriedades catalíticas específicas dos membros da família.Without being bound by any theory or mode of action, sequence similarity between the members of any gene family is based on the identity of the substrate involved and the biochemical similarity of the reaction events occurring at the target carbon bond during the reaction suggesting that the divergent sequences within a family may comprise catalytic determinants or at least a functional part thereof which contributes to the specific catalytic properties of the family members.

Um exemplo de uma família é as enzimas dessaturase, acetilenase, hidroxilase e/ou epoxigenase que catalizam a dessaturação, acetilenação, hidroxilação e/ou epoxigenação, respectivamente, da posição Δ12 do ácido linoleico (aqui referida adiante como a "família C18 Δ12-ΜΜ0"). Os presentes requerentes compararam as sequências de nucleótidos e aminoácidos dos membros da família C18 A12-MM0 para determinar as suas regiões divergentes que compreendem potencialmente os determinantes de funções catalíticas alternativas na posição Δ12 (aqui referidos adiante como "determinantes catalíticos putativos").An example of a family is the desaturase, acetylenase, hydroxylase and / or epoxygenase enzymes which catalyze the desaturation, acetylenation, hydroxylation and / or epoxygenation, respectively, of the Δ12 position of linoleic acid (hereinafter referred to as the " C18 family & ΜΜ0 "). The present inventors compared the nucleotide and amino acid sequences of members of the A12-MM0 C18 family to determine their divergent regions which potentially comprise the determinants of alternative catalytic functions at the Δ12 position (referred to hereinafter as " putative catalytic determinants ").

Além disso, a presença dessas famílias de MMOs modificadoras de ácido gordo está contemplada relativamente a outros comprimentos da cadeia de ácido gordo e posições da ligação dupla. Por exemplo, a C18A15-dessaturase está contemplada pertencer a uma família de enzimas relacionadas capazes de dessaturação, acetilenação, hidroxilação e/ou epoxidação da posição Δ15 em substratos de ácido gordo C18, a família C18 Δ15-ΜΜ0.In addition, the presence of such families of fatty acid modifying MMOs is contemplated relative to other lengths of the fatty acid chain and double bond positions. For example, C18A15 desaturase is contemplated to belong to a family of related enzymes capable of desaturation, acetylenation, hydroxylation and / or epoxidation of the Δ15 position on C18 fatty acid substrates, the C18Δ15-ΜΜ0 family.

Através da produção de genes sintéticos em que estes determinantes catalíticos foram permutados (referida como 60 "permuta de domínio") é possível converter genes codificando uma função catalítica naqueles, codificando funções catalíticas alternativas. Por exemplo, a Δ12 epoxigenase da presente invenção pode ser convertida numa AI 2 acetilenase por substituição de porções das suas sequências do terminal C e terminal N com os domínios equivalentes da Δ12 acetilenase de Crepis alpina. Do mesmo modo, também pode ser realizada permuta inversa de domínio.Through the production of synthetic genes in which these catalytic determinants have been exchanged (referred to as " domain exchange "), it is possible to convert genes encoding a catalytic function into them, encoding alternative catalytic functions. For example, the Δ 12 epoxygenase of the present invention can be converted to an Δ12 acetylenase by substituting portions of its C-terminal and N-terminal sequences with the equivalent domains of Δ12 acetylenase from Crepis alpina. Likewise, reverse domain exchange can also be performed.

Como um refinamento adicional, essas alterações na função catalítica podem ser igualmente efectuadas através da realização de alterações específicas (e. g., adição, substituição ou delecção) apenas naqueles aminoácidos dentro de cada domínio que são críticos para a determinação da função catalítica relevante (tal como por mutagénese dirigida).As a further refinement, such changes in catalytic function may also be effected by making specific changes (eg, addition, substitution or deletion) only in those amino acids within each domain that are critical for determining the relevant catalytic function (such as directed mutagenesis).

De acordo com o exposto, um aspecto adicional da presente invenção contempla um gene de ácido gordo sintético compreendendo uma sequência de nucleótidos derivada de um gene de epoxigenase como aqui descrito, em que o referido gene de ácido gordo sintético codifica um polipéptido com actividade de epoxigenase ou acetilenase ou hidroxilase ou dessaturase, em que o referido polipéptido compreende quer uma sequência de aminoácidos que difere de uma enzima epoxigenase ou acetilenase ou hidroxilase ou dessaturase de ocorrência natural, ou o referido polipéptido apresenta propriedades catalíticas que são diferentes de uma enzima epoxigenase ou acetilenase ou hidroxilase ou dessaturase de ocorrência natural, ou o referido polipéptido compreende uma sequência de aminoácidos que é, pelo menos, cerca de 60% idêntica a uma parte de SEQ ID N°: 2 ou 4 ou 6 ou homólogo, análogo ou derivado da referida parte.Accordingly, a further aspect of the present invention contemplates a synthetic fatty acid gene comprising a nucleotide sequence derived from an epoxygenase gene as described herein, wherein said synthetic fatty acid gene encodes a polypeptide having epoxygenase activity or acetylenase or hydroxylase or desaturase, wherein said polypeptide comprises either an amino acid sequence that differs from an epoxygenase or acetylenase enzyme or naturally occurring hydroxylase or desaturase, or said polypeptide exhibits catalytic properties which are different from an enzyme epoxygenase or acetylenase or hydroxylase or naturally occurring desaturase, or said polypeptide comprises an amino acid sequence that is at least about 60% identical to a part of SEQ ID NO: 2 or 4 or 6 or homologue, analogue or derivative of said part.

De um modo preferido, o gene de ácido gordo sintético da invenção é derivado de um gene de Δ12 epoxigenase. 61Preferably, the synthetic fatty acid gene of the invention is derived from a Δ12 epoxygenase gene. 61

Numa forma de realização, o gene de ácido gordo sintético da invenção codifica um polipéptido de fusão, no qual os aminoácidos do terminal N e/ou terminal C de qualquer uma de SEQ ID Nos: 2 ou 4 ou 6 são substituídos, em grelha, por sequências de aminoácidos de um membro diferente da mesma familia.In one embodiment, the synthetic fatty acid gene of the invention encodes a fusion polypeptide in which the N-terminal and / or C-terminal amino acids of any one of SEQ ID Nos: 2 or 4 or 6 are screened, by amino acid sequences of a different member of the same family.

Numa forma de realização particularmente preferida, os aminoácidos do terminal N e/ou terminal C de SEQ ID N°: 2 ou 4 ou 6 são substituídos por regiões correspondentes dos polipéptidos de acetilenase, dessaturase ou hidroxilase apresentados na Figura 2. De um modo mais preferido, pelo menos, cerca de 30 resíduos de aminoácidos das regiões do terminal N e/ou terminal C de qualquer uma de SEQ ID Nos: 2 ou 4 ou 6 são substituídos, em grelha, pelas regiões correspondentes dos polipéptidos de acetilenase, dessaturase ou hidroxilase apresentados na Figura 2.In a particularly preferred embodiment, the N-terminal and / or C-terminal amino acids of SEQ ID NO: 2 or 4 or 6 are replaced by corresponding regions of the acetylenase, desaturase or hydroxylase polypeptides shown in Figure 2. In a more preferred embodiment Preferably, at least about 30 amino acid residues of the N-terminal and / or C-terminus regions of any one of SEQ ID Nos: 2 or 4 or 6 are gratefully substituted by the corresponding regions of the acetylenase, desaturase or polypeptide polypeptides. hydroxylase compounds shown in Figure 2.

Numa forma de realização alternativa, o gene de ácido gordo sintético da invenção codifica um polipéptido de fusão, no qual os aminoácidos do terminal N e/ou terminal C de uma acetilenase de ácido gordo ou hidroxilase de ácido gordo ou dessaturase de ácido gordo são substituídos, em grelha, pela região do terminal N e/ou terminal C de qualquer uma de SEQ ID Nos: 2 ou 4 ou 6.In an alternative embodiment, the synthetic fatty acid gene of the invention encodes a fusion polypeptide in which the N-terminal and / or C-terminal amino acids of a fatty acid acetylenase or fatty acid hydroxylase or fatty acid desaturase are substituted , by the N-terminal region and / or C-terminus of any one of SEQ ID Nos: 2 or 4 or 6.

Numa forma de realização particularmente preferida, os aminoácidos do terminal N e/ou terminal C de uma acetilenase de ácido gordo ou dessaturase de ácido gordo ou hidroxilase de ácido gordo são substituídos, em grelha, pela região do terminal N e/ou terminal C de qualquer uma de SEQ ID Nos: 2 ou 4 ou 6. De um modo ainda mais preferido, a acetilenase de ácido gordo ou dessaturase de ácido gordo ou hidroxilase de ácido gordo é seleccionada da lista apresentada na Figura 2. 62In a particularly preferred embodiment, the N-terminal and / or C-terminal amino acids of a fatty acid acetylenase or fatty acid desaturase or fatty acid hydroxylase are gratefully substituted by the N-terminal and / or C-terminus region of any of SEQ ID NOS: 2 or 4 or 6. Still more preferably, the fatty acid acetylenase or fatty acid desaturase or fatty acid hydroxylase is selected from the list shown in Figure 2.

Ainda de um modo ainda mais preferido, pelo menos, cerca de 30 residuos de aminoácidos das regiões do terminal N e/ou terminal C de uma acetilenase de ácido gordo ou dessaturase de ácido gordo ou hidroxilase de ácido gordo são substituídos, em grelha, pela região do terminal N e/ou terminal C de qualquer uma de SEQ ID Nos: 2 ou 4 ou 6.Yet still more preferably, at least about 30 amino acid residues of the N-terminal and / or C-terminal regions of a fatty acid acetylenase or fatty acid desaturase or fatty acid hydroxylase are replaced, in grate, by the N-terminal region and / or C-terminus of any one of SEQ ID Nos: 2 or 4 or 6.

De acordo com o exposto, a presente invenção estende-se a quaisquer variantes das enzimas epoxigenases aqui referidas, em que as referidas variantes são derivadas de um polipéptido de epoxigenase como aqui descrito e apresentam actividade demonstrável de acetilenase ou hidroxilase ou dessaturase, e compreendem, quer uma sequência de aminoácidos que difere de uma enzima acetilenase ou hidroxilase ou dessaturase de ocorrência natural, ou apresentam propriedades catalíticas que são diferentes de uma enzima acetilenase ou hidroxilase ou dessaturase de ocorrência natural, ou compreendem uma sequência de aminoácidos que é, pelo menos, cerca de 60% idêntica a qualquer uma de SEQ ID Nos: 2 ou 4 ou 6.Accordingly, the present invention extends to any variants of the epoxygenases enzymes referred to herein, wherein said variants are derived from an epoxygenase polypeptide as described herein and exhibit demonstrable acetylenase or hydroxylase or desaturase activity and comprise, or an amino acid sequence that differs from a naturally occurring acetylenase or hydroxylase or desaturase enzyme, or exhibit catalytic properties which are different from an naturally occurring acetylenase or hydroxylase or desaturase enzyme, or comprise an amino acid sequence which is at least one amino acid sequence, about 60% identical to any of SEQ ID Nos: 2 or 4 or 6.

Como com outros aspectos da invenção, as variantes aqui descritas pode ser produzidas como polipéptidos recombinantes ou em organismos transgénicos, assim que os genes sintéticos em causa sejam introduzidos numa célula hospedeira adequada e aí expressos.As with other aspects of the invention, the variants described herein may be produced as recombinant polypeptides or in transgenic organisms once the synthetic genes concerned are introduced into a suitable host cell and expressed therein.

Os polipéptidos recombinantes aqui descritos ou um seu homólogo, análogo ou derivado, também podem ser moléculas imunologicamente activas.The recombinant polypeptides described herein or a homologue, analogue or derivative thereof may also be immunologically active molecules.

Um aspecto adicional da presente invenção proporciona uma molécula imunologicamente interactiva que é capaz de ligação a um polipéptido de epoxigenase recombinante da invenção. 63A further aspect of the present invention provides an immunologically interacting molecule which is capable of binding to a recombinant epoxygenase polypeptide of the invention. 63

De um modo preferido, o polipéptido de epoxigenase recombinante, ao qual a molécula imunologicamente interactiva é capaz de ligação compreende uma sequência de aminoácidos apresentada em qualquer uma de SEQ ID Nos: 2, 4 ou 6, ou um seu homólogo, análogo ou derivado.Preferably, the recombinant epoxygenase polypeptide to which the immunologically interacting molecule is capable of binding comprises an amino acid sequence shown in any one of SEQ ID Nos: 2, 4 or 6, or a homologue, analogue or derivative thereof.

Numa forma de realização, a molécula imunologicamente interactiva é uma molécula de anticorpo. A molécula de anticorpo pode ser monoclonal ou policlonal. Os anticorpos monoclonais ou policlonais podem ser seleccionados a partir de anticorpos de ocorrência natural para um epitopo, ou fragmento peptidico, ou péptido sintético de epoxigenase derivado de um produto génico recombinante ou pode ser produzido especificamente contra uma epoxigenase recombinante ou um seu homólogo, análogo ou derivado.In one embodiment, the immunologically interacting molecule is an antibody molecule. The antibody molecule may be either monoclonal or polyclonal. Monoclonal or polyclonal antibodies may be selected from naturally occurring antibodies to an epitope, or peptide fragment, or synthetic epoxygenase peptide derived from a recombinant gene product or may be specifically produced against a recombinant epoxygenase or a homologue thereof, analogous or derivative.

Ambos os anticorpos policlonais e monoclonais são obteníveis por imunização com um produto génico, ou epitopo, ou fragmento peptidico apropriado de um produto génico. Alternativamente, podem ser utilizados fragmentos de anticorpos, tais como fragmentos Fab. A presente invenção estende-se a anticorpos recombinantes e sintéticos e a híbridos de anticorpos. Um "anticorpo sintético" é aqui considerado como incluindo fragmentos e híbridos de anticorposBoth the polyclonal and monoclonal antibodies are obtainable by immunization with a gene product, or epitope, or appropriate peptide fragment of a gene product. Alternatively, antibody fragments, such as Fab fragments, may be used. The present invention extends to recombinant and synthetic antibodies and to antibody hybrids. &Quot; synthetic antibody " is considered herein to include fragments and hybrids of antibodies

Os anticorpos aqui contemplados podem ser utilizados para identificar sequências genéticas que expressam polipéptidos de epoxigenase relacionados, abrangidos pelas formas de realização aqui descritas. 0 único requisito para a detecção bem sucedida de uma sequência genética de epoxigenase relacionada é que a referida sequência genética seja expressa para produzir, pelo menos, um epitopo reconhecido pela molécula de anticorpo. De um modo 64 preferido, para o objectivo de obter expressão para facilitar a detecção, a sequência genética relacionada é colocada operacionalmente atrás de uma sequência promotora, por exemplo, o promotor lac bacteriano. De acordo com esta forma de realização preferida, os anticorpos são utilizados para detectar a presença de um plasmideo ou bacteriófago que expressa a epoxigenase relacionada. De acordo com o exposto, as moléculas de anticorpo são também úteis na purificação do plasmideo ou bacteriófago que expressa a epoxigenase relacionada.Antibodies contemplated herein can be used to identify genetic sequences expressing related epoxygenase polypeptides encompassed by the embodiments described herein. The only requirement for the successful detection of a related epoxygenase genetic sequence is that said genetic sequence is expressed to produce at least one epitope recognized by the antibody molecule. Preferably, for the purpose of obtaining expression to facilitate detection, the related genetic sequence is placed operably behind a promoter sequence, for example, the lac bacterial promoter. According to this preferred embodiment, the antibodies are used to detect the presence of a plasmid or bacteriophage which expresses the related epoxygenase. Accordingly, antibody molecules are also useful in purification of the plasmid or bacteriophage which expresses the related epoxygenase.

As moléculas de anticorpo em causa podem também ser utilizadas para purificar a epoxigenase recombinante da invenção ou um equivalente de ocorrência natural ou um homólogo, análogo ou derivado da mesma. A presente invenção é ainda descrita por referência aos seguintes Exemplos não limitantes. EXEMPLO 1The subject antibody molecules may also be used to purify the recombinant epoxygenase of the invention or a naturally occurring equivalent or a homologue, analogue or derivative thereof. The present invention is further described by reference to the following non-limiting Examples. EXAMPLE 1

Caracterização de ácidos gordos epoxi em Euphorbia lagascae e Crepis spp.Characterization of epoxy fatty acids in Euphorbia lagascae and Crepis spp.

Sementes das espécies selvagens de Euphorbia lagascae e de várias espécies de Crepis foram rastreadas através de cromatografia liquida gasosa para a presença de ácidos gordos epoxi.Seeds of the wild species of Euphorbia lagascae and various species of Crepis were screened by liquid gas chromatography for the presence of epoxy fatty acids.

Como mostrado na Tabela 3, a Euphorbia lagascae contêm niveis muito elevados do ácido gordo epoxi ácido vernólico no 65 seu óleo de semente. Foi demonstrado que sementes de Crepis palaestina contêm 61,4% em peso de ácido vernólico e 0,71% em peso do ácido gordo acetilénico ácido crepeninico, de ácidos gordos totais (Tabela 3) . TABELA 3As shown in Table 3, Euphorbia lagascae contain very high levels of the fatty acid epoxy vernolic acid in its seed oil. Crepis palaestin seeds have been shown to contain 61.4% by weight of vernolic acid and 0.71% by weight of the fatty acid acetylenic acid of crepeninic acid, of total fatty acids (Table 3). TABLE 3

Composição de ácidos gordos de lipidos derivados de sementes de Crepis alpina, Crepis palaestina e Euphorbia lagascae Ácido Gordo Distribui Crepis alpina .ção Relativa (% Crepis palaestina em peso)a Euphorbia lagascae Palmitico 3, 9 5,1 4,3 Esteárico 1,3 2,3 1,8 Oleico 1,8 6, 3 22,0 Linoleico 14,0 23, 0 10,0 Crepeninico 75, 0 0,7 0 Vernólico 0 61,4 58,0 Outro 4,0 1,2 3,9 (continuação) a Calculado a partir da % de área do total das áreas dos picos integrados na determinação de cromatografia liquida gasosa de derivados de éster metilico dos lipidos da semente EXEMPLO 2Fatty acid composition of lipids derived from seeds of Crepis alpina, Crepis palaestina and Euphorbia lagascae Gordo Acid Distributes Crepis alpina. Relative (% Crepis palaestina by weight) to Euphorbia lagascae Palmitico 3, 9 5.1 4.3 Stearic 1,3 2.3 1.8 Oleic 1.8 6, 3 22.0 Linoleic 14.0 23.0 0 10.0 Crepeninic 75.0 0.7 0 Vernolic 0 61.4 58.0 Other 4.0 1.2 3 , 9 (continued) a Calculated from the% area of the total areas of the peaks integrated in the determination of gas liquid chromatography of methyl ester derivatives of the seed lipids EXAMPLE 2

Caracterização bioquímica de linoleato A12-epoxigenases em Euphorbia lagascae e Crepis palaestina 66 A enzima linoleato A12-epoxigenase sintetiza ácido vernólico a partir de ácido linoleico. As linoleato A12-epoxigenases derivadas de Euphorbia do e Crepis palaestina estão localizadas nos microssomas. As enzimas, pelo menos destas espécies, podem permanecer activas em fracções membranares (microssomais) preparadas a partir de sementes em desenvolvimento.Biochemical characterization of A12-epoxygenases linoleate in Euphorbia lagascae and Crepis palaestina 66 The enzyme linoleate A12-epoxygenase synthesizes vernolic acid from linoleic acid. The A12-epoxygenases linoleate derived from Euphorbia do and Crepis palaestina are located in the microsomes. Enzymes, at least of these species, may remain active in membrane fractions (microsomal) prepared from developing seeds.

As preparações de membranas de Euphorbia lagascae e ensaios das suas actividades de epoxigenase foram realizadas como descrito por Bafor et ai. (1993), com incubações contendo NADPH, salvo indicação em contrário na Tabela 4. A extracção de lipidos, separação e metilação assim como as separações por GLC e rádio-GLC foram realizadas essencialmente como descrito por Kohn et ai. (1994) e Bafor et ai. (1993).The membrane preparations of Euphorbia lagascae and assays of their epoxygenase activities were performed as described by Bafor et al. (1993), with incubations containing NADPH, unless otherwise noted in Table 4. Lipid extraction, separation and methylation as well as separations by GLC and radio-GLC were performed essentially as described by Kohn et al. (1994) and Bafor et al. (1993).

As preparações de membranas de Crepis alpina e Crepis palaestina foram obtidas como se segue. As plantas de Crepis alpina e Crepis palaestina foram cultivadas em estufas e as sementes foram recolhidas na fase intermédia de desenvolvimento (17-20 dias após floração) . Os cotilédones foram removidos dos seus revestimentos de semente por aperto e homogeneizados com almofariz e pilão em tampão fosfato a 0,1 M, pH 7,2 contendo sacarose a 0,33 M, NADH a 4 mM, CoASH a 2 mM, 1 mg de albumina de soro bovino/mL e 4000 unidades de catalase/mL. O homogenato foi centrifugado durante 10 minutos a 18000 x g e o sobrenadante resultante centrifugado durante 60 minutos a 150000 x g para obter um precipitado microssomal.The membrane preparations of Crepis alpina and Crepis palaestin were obtained as follows. The Crepis alpina and Crepis palaestina plants were grown in greenhouses and the seeds were harvested in the intermediate stage of development (17-20 days after flowering). Cotyledons were removed from their seed coatings by squeezing and homogenized with mortar and pestle in 0.1 M phosphate buffer, pH 7.2 containing 0.33 M sucrose, 4 mM NADH, 2 mM CoASH, 1 mg of bovine serum albumin / mL and 4000 units of catalase / mL. The homogenate was centrifuged for 10 minutes at 18,000 x g and the resulting supernatant centrifuged for 60 minutes at 150000 x g to obtain a microsomal precipitate.

Os ensaios padrão de dessaturase, acetilenase e epoxigenase com membranas microssomais das espécies Crepis foram realizados a 25 °C com preparações microssomais equivalentes a 0,2 mg de proteina microssomal, ressuspensas em tampão de homogeneização fresco e 10 mmol quer de [ 1—14C] 18 :1-CoA ou [ 1—14C] 18 : 2-CoA 67 (actividade específica de 85000 d.p.m./nmol) num volume total de 360 pL. Quando foi utilizado NADPH como co-redutor, as membranas foram ressuspensas em tampão de homogeneização, em que NADH foi substituído por NADPH. A caracterização bioquímica da linoleato A12-epoxigenase microssomal derivada de Euphorbia lagascae e Crepis palaestina foi realizada e os dados obtidos foram comparados com as características bioquímicas das enzimas oleato A12-dessaturase e linoleato A12-acetilenase derivadas de preparações microssomais de Crepis alpina (Tabela 4).Standard desaturase, acetylenase and epoxygenase assays with microspore membranes of the Crepis species were performed at 25 ° C with microsomal preparations equivalent to 0.2 mg of microsomal protein, resuspended in fresh homogenization buffer and 10 mmol either [1-14 C] 18: 1-CoA or [1-14 C] 18: 2-CoA 67 (specific activity of 85,000 dpm / nmol) in a total volume of 360 æL. When NADPH was used as a co-reducer, the membranes were resuspended in homogenization buffer, where NADH was replaced by NADPH. The biochemical characterization of the microsomal A12-epoxyigenase linoleate derived from Euphorbia lagascae and Crepis palaestina was performed and the data obtained were compared with the biochemical characteristics of the oleate A12-desaturase and A12-acetylenase linoleate enzymes derived from Crepis alpina microsomal preparations (Table 4) .

Como mostrado na Tabela 4, a linoleato A12-epoxigenase de Crepis palaestina apresenta características bioquímicas semelhantes às da linoleato A12-acetilenase e oleato A12-dessaturase de Crepis alpina, no que diz respeito às três enzimas requererem 02, trabalharem igualmente bem, quer com NADH ou NADPH como co-redutores, e serem inibidas por cianeto mas não por monóxido de carbono. Adicionalmente, nenhumas destas enzimas são inibidas por anticorpos monoclonais contra a citocromo P450 redutase.As shown in Table 4, Crepis palaestin A12-epoxygenase linoleate exhibits biochemical characteristics similar to those of the A12-acetylenase linoleate and Crepis alpina oleate A12-desaturase, with respect to the three enzymes requiring 02, to work equally well either with NADH or NADPH as co-reductors, and are inhibited by cyanide but not by carbon monoxide. In addition, none of these enzymes are inhibited by monoclonal antibodies against cytochrome P450 reductase.

Os dados na Tabela 4 sugerem que a linoleato A12-epoxigenase de Crepis palaestina pertence à mesma classe enzimática que a oleato A12-dessaturase e linoleato A12-acetilenase microssomal de Crepis alpina.The data in Table 4 suggest that Crepis palaestin A12-epoxygenase linoleate belongs to the same enzyme class as Crepis alpina A12-desaturase oleate and A12-acetylenase linoleate.

Em contraste, a linoleato A12-epoxigenase de Euphorbia lagascae requer NADPH como co-redutor, não é inibida por cianeto, mas é inibida por monóxido de carbono (Tabela 4). Adicionalmente, os requerentes descobriram que a linoleato Al2-epoxigenase de Euphorbia lagascae é inibida por anticorpos monoclonais produzidos contra uma enzima citocromo P450 68 redutase. Estes dados sugerem que a linoleato A12-epoxigenase de Euphorbia lagascae pertence à classe proteica do citocromo P450 e não está, deste modo, relacionada bioquimicamente com a linoleato A12-epoxigenase de Crepis palaestina. TABELA 4In contrast, E121-epoxygenase linoleate of Euphorbia lagascae requires NADPH as a co-reducer, is not inhibited by cyanide, but is inhibited by carbon monoxide (Table 4). In addition, we have discovered that Euphorbia lagascae Al2-epoxygenase linoleate is inhibited by monoclonal antibodies raised against a cytochrome P450 68 reductase enzyme. These data suggest that E121-epoxyigenase linoleate of Euphorbia lagascae belongs to the cytochrome P450 protein class and is therefore not biochemically related to Crepis palaestin A12-epoxygenase linoleate. TABLE 4

Comparação das caracteristicas bioquímicas das epoxigenases, acetilenases e dessaturases derivadas de Crepis spp. e Euphorbia lagascae Tratamento Actividade enzimática (% do controlo) Oleato A12- linoleato linoleato linoleato dessaturase A12- A12- Δ12- de C. acetilenase epoxigenase epoxigenase alpina de C. de C. de E. alpina palaestina lagascae monóxido de carbono 85 84 88 3 (continuação)Comparison of the biochemical characteristics of the epoxygenases, acetylenases and desaturases derived from Crepis spp. and Euphorbia lagascae Treatment Enzymatic activity (% of control) Oleate A12-linoleate linoleate linoleate desaturase A12-A12- Δ12- of C. acetylenase epoxigenase alpha epoxigenase E. coli alpina palaestina lagascae carbon monoxide 85 84 88 3 (continuation)

Comparação das caracteristicas bioquímicas das epoxigenases, acetilenases e dessaturases derivadas de Crepis spp. e Euphorbia lagascaeComparison of the biochemical characteristics of the epoxygenases, acetylenases and desaturases derived from Crepis spp. and Euphorbia lagascae

TratamentoTreatment

Actividade enzimática (% do controlo)Enzyme activity (% of control)

Oleato A12- linoleato linoleato linoleato dessaturase A12- A12- Δ12- de C. acetilenase epoxigenase epoxigenase alpina de C. de C. de E. alpina palaestina lagascae 69 anticorpos Anti-P450 redutase (CsA5) 96 91 94 33 KCN 16 0 35 92 menos NADH 100 mais NADPH 95 73 94 (controlo) menos NADPH 100 100 100 mais NADH (controlo) (controlo) (controlo) 11 EXEMPLO 3Oleate A12-linoleate linoleate linoleate desaturase A12-A12- Δ12- of C. acetylenase epoxigenase alpha epoxigenase of E. alpina C. alpina palaestina lagascae 69 antibodies Anti-P450 reductase (CsA5) 96 91 94 33 KCN 16 0 35 92 less NADH 100 plus NADPH 95 73 94 (control) minus NADPH 100 100 100 plus NADH (control) (control) (control) EXAMPLE 3

Estratégia para clonagem de genes de epoxigenase de Crepis palaestina A clonagem dos genes de epoxigenase de Crepis palaestina baseou-se nas características das enzimas de C. palaestina e C. alpina descritas no Exemplos precedentes.Strategy for Cloning of Crepis palaestin epoxygenase genes The cloning of the Crepis palaestina epoxygenase genes was based on the characteristics of the C. palaestina and C. alpina enzymes described in the preceding Examples.

Em particular, foi isolado ARN poli (A)+ a partir de sementes em desenvolvimento de Crepis palaestina utilizando um kit de purificação de ARNm QuickPrep Micro (PharmaciaIn particular, poly (A) + RNA was isolated from developing seeds of Crepis palaestin using a QuickPrep Micro mRNA purification kit (Pharmacia

Biotechnology) e utilizado para sintetizar um ADNc de dupla cadeia iniciado com oligossacárido d(T). 0 ADNc de cadeia dupla foi ligado a adaptadores EcoRI/Notl (Pharmacia Biotechnology) e foi construída uma biblioteca de ADNc utilizando o kit de clonagem ZAP-cDNA Gigapack (Stratagene).Biotechnology) and used to synthesize a d (T) oligosaccharide-initiated double stranded cDNA. The double stranded cDNA was ligated to EcoRI / NotI adapters (Pharmacia Biotechnology) and a cDNA library was constructed using the Gigapack ZAP-cDNA cloning kit (Stratagene).

Foi preparado ADNc de cadeia simples a partir de ARN derivado de sementes em desenvolvimento de Crepis alpina, utilizando processos convencionais. Um fragmento de PCR, designado como D12V (SEQ ID N°: 7), foi obtido por amplificação 70 do ADNc de cadeia simples utilizando iniciadores derivados a partir das sequências de aminoácidos deduzidas de monooxigenases de função mista vegetais. 0 fragmento D12V foi subsequentemente marcado aleatoriamente e utilizado para rastrear a biblioteca de ADNc de Crepis palaestina supra em filtros membranares Hybond N+ da Amersham, como prescrito pelo fabricante utilizando condições de hibridação padrão. Esta abordagem resultou na purificação de um bacteriófago recombinante, designado Cpal2. A sequência de nucleótidos do ADNc Cpal2 foi determinada e é apresentada em SEQ ID N°: 1. 0 ADNc Cpal2 pareceu ser de tamanho total. É apresentada na Figura 1 uma representação esquemática de um vector de expressão compreendendo o ADNc Cpal2. A construção genética ai apresentada é concebida para introdução em material vegetal, para a produção de uma planta transgénica que expresse a epoxigenase em causa. Os especialistas na técnica reconhecerão que podem ser produzidos vectores de expressão semelhantes, sem experimentação supérflua, e utilizados para a produção de plantas transgénicas que expressam quaisquer das sequências genéticas da presente invenção, por substituição do ADNc Cpal2 com outra sequência de gene estrutural.Single-stranded cDNA was prepared from RNA derived from developing seeds of Crepis alpina, using standard procedures. A PCR fragment, designated as D12V (SEQ ID NO: 7), was obtained by amplification 70 of single stranded cDNA using primers derived from the deduced amino acid sequences of plant mixed function monooxygenases. The D12V fragment was subsequently randomly labeled and used to screen the above Crepis palaestin cDNA library on Amersham Hybond N + membrane filters as prescribed by the manufacturer using standard hybridization conditions. This approach resulted in the purification of a recombinant bacteriophage, designated Cpal2. The nucleotide sequence of the Cpal2 cDNA was determined and is shown in SEQ ID NO: 1. The Cpal2 cDNA appeared to be full-length. A schematic representation of an expression vector comprising the Cpal2 cDNA is shown in Figure 1. The genetic construct presented therein is designed for introduction into plant material for the production of a transgenic plant expressing the subject epoxygenase. Those skilled in the art will recognize that similar expression vectors can be produced without superfluous experimentation and used for the production of transgenic plants expressing any of the genetic sequences of the present invention by replacing the Cpβ2 cDNA with another structural gene sequence.

Como mostrado na Figura 2, a sequência de nucleótidos do ADNc Crepl codificava um polipéptido que foi infimamente relacionado ao nivel de aminoácidos, pelo menos, com uma enzima acetilenase de C. alpina (Bafor et al. 1997/ Pedido de PatenteAs shown in Figure 2, the nucleotide sequence of the Crepl cDNA encoded a polypeptide that was infrequently related to the amino acid level with at least one C. alpina acetylenase enzyme (Bafor et al., 1997)

Internacional N° PCT/SE97/00247). A inserção de 1,4 kb de pCpal2 foi sequenciada (SEQ ID N° 1) e mostrada compreender um grelha de leitura aberta que codifica 71 um polipéptido de 374 aminoácidos em comprimento. A sequência de aminoácidos deduzida de Cpal2 mostrou 81% de identidade e 92% de similaridade com a A12-acetilenase de Crepis alpina e aproximadamente 60% de identidade e 80% de similaridade com proteínas A12-dessaturases microssomais vegetais (Figura 2). Contudo, o polipéptido codificado por Cpal2 compreendia diferenças significativas na sequência de aminoácidos comparativamente com enzimas não epoxigenases. Em particular, o Cpal2 tem uma delecção de seis aminoácidos contíguos na região terminal 5' comparativamente a todas as Δ12 dessaturases microssomais, e uma delecção de dois aminoácidos contíguos na região terminal 3' comparativamente à Δ12 acetilenase de Crepl (Figura 2) .International No. PCT / SE97 / 00247). The 1.4 kb insert of pCpal2 was sequenced (SEQ ID NO: 1) and shown to comprise an open reading frame encoding a polypeptide of 374 amino acids in length. The deduced amino acid sequence of Cpal2 showed 81% identity and 92% similarity to Crepis alpina A12-acetylenase and approximately 60% identity and 80% similarity to plant microsomal A12-desaturase proteins (Figure 2). However, the polypeptide encoded by Cpal2 comprised significant differences in the amino acid sequence compared to non-epoxygenetic enzymes. In particular, Cpal2 has a deletion of six contiguous amino acids in the 5 'terminal region compared to all microsomal Δ12 desaturases, and a deletion of two contiguous amino acids in the 3' terminal region compared to Crepl Δ12 acetylenase (Figure 2).

Embora os genes da dessaturase de ácidos gordos ligada à membrana mostre homologias de sequência limitadas, todos contêm três regiões de motivos ricos em histidina conservados, como se segue: (i) His-(Xaa) 3-4-His; (ii) His-(Xaa) 2-3-His-His; e (iii) His-(Xaa) 2-3-His-His, em que His designa histidina, Xaa designa qualquer resíduo de aminoácido de ocorrência natural como aqui apresentado na Tabela 1, a entidade completa (Xaa)3_4 refere-se a uma sequência de aminoácidos compreendendo três ou quatro repetições de Xaa, e a entidade completa (Xaa)2-3 refere-se a uma sequência de aminoácidos compreendendo dois ou três repetições de Xaa. É sugerido que estas regiões ricas em histidina sejam uma parte do centro activo da enzima (Shanklin et al., 1994). A sequência de aminoácidos codificada pelo ADNc Cpal2 compreende três motivos ricos em histidina semelhantes, mas não 72 idênticos, aos motivos ricos em histidina das enzimas Al2-dessaturases. Estes dados sugerem que o ADNc Cpal2 codifica uma enzima que pertence à classe de monooxigenase de função mista das enzimas. A análise dos ácidos gordos apresentados no Exemplo 1 supra indicava que o ácido vernólico estava, pelo menos, presente nas sementes de Crepis palaestina. Esta enzima pode de facto estar presente exclusivamente nas sementes de C. palaestina. A expressão do gene Cpal2 foi examinada utilizando a região 3' não traduzida do clone de ADNc Cpal2 como uma sonda de hibridação em transferências de Northern de ARNm derivado de sementes em desenvolvimento e folhas de C. palaestina. Como mostrado na Figura 3, o gene Cpal2 foi altamente expresso em sementes em desenvolvimento mas não foi detectada nenhuma expressão em folhas. Estes dados são consistentes com o perfil de actividade enzimática da linoleato A12-epoxigenase de C. palaestina nestes tecidos. EXEMPLO 4Although membrane bound fatty acid desaturase genes show limited sequence homologies, all contain three conserved histidine rich motif regions as follows: (i) His- (Xaa) 3-4-His; (ii) His- (Xaa) 2-3-His-His; and (iii) His- (Xaa) 2-3-His-His, wherein His denotes histidine, Xaa designates any naturally occurring amino acid residue as shown in Table 1, the complete (Xaa) 34 entity refers to an amino acid sequence comprising three or four Xaa repeats, and the complete (Xaa) 2-3 refers to an amino acid sequence comprising two or three Xaa repeats. It is suggested that these histidine rich regions are a part of the active site of the enzyme (Shanklin et al., 1994). The amino acid sequence encoded by the Cpal2 cDNA comprises three histidine rich motifs similar but not identical to the histidine rich motifs of the Al2-desaturases enzymes. These data suggest that the Cpal2 cDNA encodes an enzyme belonging to the mixed function monooxygenase class of the enzymes. Analysis of the fatty acids shown in Example 1 above indicated that vernolic acid was at least present in the seeds of Crepis palaestin. This enzyme may indeed be present exclusively in the seeds of C. palaestina. Expression of the Cpal2 gene was examined using the 3 'untranslated region of the Cpal2 cDNA clone as a hybridization probe in Northern blots of mRNA derived from developing seeds and C. palaestina leaves. As shown in Figure 3, the Cpal2 gene was highly expressed in developing seeds but no expression was detected in leaves. These data are consistent with the enzymatic activity profile of C. palaestina A12-epoxygenase linoleate in these tissues. EXAMPLE 4

Estratégia para clonagem de genes de epoxigenase de Euphorbia lagascae A clonagem dos genes de epoxigenase de Euphorbia lagascae baseou-se nas caracteristicas das enzimas de E. lagascae como descritas no Exemplos precedentes.Strategy for Cloning Euphorbia lagascae Epoxygenase Genes The cloning of Euphorbia lagascae epoxygenase genes was based on the characteristics of the E. lagascae enzymes as described in the preceding Examples.

Numa abordagem realizada para clonar os genes de epoxigenase de Euphorbia lagascae, foi recolhido ARN a partir de embriões imaturos de Euphorbia lagascae obtidos numa fase de síntese 73 activa de ácido vernólico e utilizados para construir uma biblioteca de ADNc. A biblioteca de ADNc foi construída no vector Lambda Zap II (Stratagene) como descrito no Exemplo precedente, com a excepção de que as inserções de ADNc foram clonadas de um modo direccional em sitios EcoRI-Xhol do vector plasmidico embutido no vector lambda. O iniciador de PCR degenerado apresentado na Figura 4 (SEQ ID N°: 18) foi sintetizado e utilizado para amplificar sequências de nucleótidos que codificam sequências de enzimas P450 a partir da biblioteca de ADNc de Euphorbia lagascae. Para as reacções de amplificação de PCR, uma fracção de 100 pL da biblioteca de ADNc foi extraida com fenol [1:1 (v/v)] e o ADN foi precipitado por adição de 2 volumes de etanol e ressuspenso finalmente em 100 pL de água. Uma fracção (1 pL) do ADN ressuspenso foi utilizada como molde na reacção de amplificação por PCR. As reacções de PCR foram realizadas em 10 pL de tampão de polimerase Taql contendo 200 pM de cada dNTP, 10 pmol do iniciador degenerado, 1 pmol do iniciador do promotor da polimerase T7 e 0,4 unidades da polimerase Taql.In an approach performed to clone the Euphorbia lagascae epoxygenase genes, RNA was harvested from immature embryos of Euphorbia lagascae obtained in a phase of active synthesis of vernolic acid and used to construct a cDNA library. The cDNA library was constructed in the Lambda Zap II vector (Stratagene) as described in the preceding Example, except that the cDNA inserts were cloned in a directional manner at EcoRI-Xhol sites of the plasmid vector embedded in the lambda vector. The degenerate PCR primer shown in Figure 4 (SEQ ID NO: 18) was synthesized and used to amplify nucleotide sequences encoding P450 enzyme sequences from the Euphorbia lagascae cDNA library. For PCR amplification reactions, a 100æL fraction of the cDNA library was extracted with phenol [1: 1 (v / v)] and the DNA was precipitated by the addition of 2 volumes of ethanol and finally resuspended in 100æl of Water. A fraction (1æl) of the resuspended DNA was used as template in the PCR amplification reaction. PCR reactions were performed in 10 æl of TaqI polymerase buffer containing 200 æM of each dNTP, 10 æmol of the degenerate primer, 1 æmol of the T7 polymerase promoter primer and 0.4 æl of the Taq1 polymerase.

As condições de amplificação foram 2 min a 94 °C, e cinco ciclos, cada ciclo compreendendo 1 min a 48 °C, seguido por 2 min a 72 °C, seguido por 30 segundos a 93 °C, depois 28 ciclos, cada ciclo compreendendo 30 segundos a 55 °C, seguido por 90 segundos a 72 °C, seguido por 30 segundos a 93 °C, e finalmente um ciclo compreendendo 30 segundos a 55 °C, seguido por 10 min a 72 °C, seguido por 1 min a 25 °C.The amplification conditions were 2 min at 94 ° C, and five cycles, each cycle comprising 1 min at 48 ° C, followed by 2 min at 72 ° C, followed by 30 seconds at 93 ° C, then 28 cycles, each cycle comprising 30 seconds at 55Â ° C, followed by 90 seconds at 72Â ° C, followed by 30 seconds at 93Â ° C, and finally a cycle comprising 30 seconds at 55Â ° C, followed by 10 min at 72Â ° C, followed by 1 min at 25 ° C.

Os produtos de PCR foram purificados e digeridos utilizando EcoRI e Xhol, e depois sub-clonados no vector Bluescript para caracterização da sequência. Verificou-se que um dos clones de PCR codifica uma sequência de P450 e foi utilizado como uma sonda para isolar um clone de ADNc de tamanho total. Esta 74 sequência de nucleótidos é apresentada em SEQ ID N°: 19. A SEQ ID N°: 19 tinha similaridade com outros membros da família 2C de genes P450. Em particular, a SEQ ID N°: 19 mostra em média uma identidade de 40% com as sequências de epoxigenase de araquidónico de humano e rato, utilizando o programa BLAST.The PCR products were purified and digested using EcoRI and Xhol, and then subcloned into the Bluescript vector for sequence characterization. One of the PCR clones was found to encode a P450 sequence and was used as a probe to isolate a full-length cDNA clone. This nucleotide sequence is shown in SEQ ID NO: 19. SEQ ID NO: 19 had similarity to other members of the 2C family of P450 genes. In particular, SEQ ID NO: 19 shows an average of 40% identity with the human and mouse arachidonic epoxygenase sequences using the BLAST program.

Adicionalmente, foi mostrado que o transcripto de SEQ ID N°: 19 é expresso em sementes de Euphorbia lagascae mas não em raízes ou folhas (Figura 5B). O transcripto de SEQ ID N°: 19 foi detectado nas sementes em desenvolvimento de Vernonia galamensis mas não nas de E. ciparissis. ou linho, duas espécies que não produzem ácidos gordos epoxi (Figuras 5A e 5B).Additionally, it has been shown that the transcript of SEQ ID NO: 19 is expressed on Euphorbia lagascae seeds but not on roots or leaves (Figure 5B). The transcript of SEQ ID NO: 19 was detected in the developing seeds of Vernonia galamensis but not those of E. ciparissis. or flax, two species that do not produce epoxy fatty acids (Figures 5A and 5B).

Numa abordagem alternativa realizada para clonar genes de epoxigenase de Euphorbia lagascae, foi utilizada uma estratégia de hibridação subtractiva para isolar genes que são especificamente expressos num organismo que produz níveis elevados de ácidos gordos epoxi.In an alternative approach to clone Euphorbia lagascae epoxygenase genes, a subtractive hybridization strategy was used to isolate genes that are specifically expressed in an organism that produces high levels of epoxy fatty acids.

Em particular, o método de hibridação subtractiva descrito na Figura 6 foi utilizado para isolar genes de epoxigenase que são expressos especificamente em Euphorbia lagascae, que produz níveis elevados do ácido gordo epoxi, ácido vernólico (Exemplo 1), e não nas espécies intimamente relacionadas de Euphorbia ciparissus, que não produz ácido vernólico.In particular, the subtractive hybridization method described in Figure 6 was used to isolate epoxygenase genes that are specifically expressed in Euphorbia lagascae, which produces high levels of epoxy fatty acid, vernolic acid (Example 1), and not in the closely related species of Euphorbia ciparissus, which does not produce vernolic acid.

De acordo com o exposto, foi isolado ARNm a partir de embriões em desenvolvimento de Euphorbia lagascae numa fase em que sintetizam activamente ácido vernólico, e utilizados para produzir o denominado ADNc "tester". Adicionalmente, foi isolado ARNm a partir de embriões em desenvolvimento de E. ciparissis (numa fase semelhante de desenvolvimento relativamente a E. lagascae) e utilizado para produzir o denominado ADNc "dríver". 75 0 processo de hibridação subtractiva conduziu a uma biblioteca que foi enriquecida para sequências expressas exclusivamente em Euphorbia lagascae. Foram sequenciados clones desta biblioteca e, pelo menos, duas sequências foram identificadas como codificando proteínas P450 com base na similaridade com outras sequências de P450 na base de dados. Estes dois clones de PCR de P450 foram utilizados como sondas para isolar os clones de ADNc de tamanho total correspondentes a partir da biblioteca de ADNc referida anteriormente.Accordingly, mRNA was isolated from developing embryos of Euphorbia lagascae at a stage where they actively synthesize vernolic acid, and used to produce the so-called " tester " cDNA. In addition, mRNA was isolated from developing embryos of E. ciparissis (at a similar stage of development relative to E. lagascae) and used to produce the so-called " dríver " cDNA. The subtractive hybridization process led to a library that was enriched for sequences expressed exclusively in Euphorbia lagascae. Clones of this library were sequenced and at least two sequences were identified as encoding P450 proteins based on similarity to other P450 sequences in the database. These two P450 PCR clones were used as probes to isolate the corresponding full-length cDNA clones from the above-referenced cDNA library.

Um dos ADNc isolados de P450, compreendendo a sequência de nucleótidos apresentada em SEQ ID N°: 20, pareceu ser expresso em tecidos de Euphorbia lagascae (Figura 7B) e não foram detectados transcriptos homólogos em tecido de semente de E. ciparrisus ou linho, duas espécies que não produzem ácidos gordos epoxi. A sequência de aminoácidos deduzida de SEQ ID N°: 20 indica que o clone de ADNc é de tamanho total e codifica uma enzima de P450. Estes dados sugerem que o ADNc exemplificado por SEQ ID N°: 20 pode codificar uma expoxigenase, por exemplo, a linoleato A12-epoxigenase que converte ácido linoleico em ácido vernólico. EXEMPLO 5One of the cDNAs isolated from P450, comprising the nucleotide sequence shown in SEQ ID NO: 20, appeared to be expressed in Euphorbia lagascae tissues (Figure 7B) and no homologous transcripts were detected in E. ciparrisus or flax seed tissue, two species that do not produce epoxy fatty acids. The deduced amino acid sequence of SEQ ID NO: 20 indicates that the cDNA clone is full size and encodes a P450 enzyme. These data suggest that the cDNA exemplified by SEQ ID NO: 20 may encode an expoxygenase, for example, to L12-epoxygenase linoleate which converts linoleic acid to vernolic acid. EXAMPLE 5

Demonstração da actividade de epoxigenase A confirmação de que os clones de ADNc, exemplificando a invenção, codificam actividades de epoxigenase foi obtida por transformação de Arabidopsis thaliana, que não produz ácidos gordos epoxi, em particular ácido vernólico, com cada clone candidato individual e examinando o tecido transformado para a 76 presença de ácidos gordos epoxigenados que de outra forma não produziriam, ou para ácidos gordos hidroxi que podem ser formados a partir do metabolismo de um ácido gordo epoxigenado por acção de epóxido hidrolases endógenas (Blee e Schuber, 1990) . O ADNc de epoxigenase compreendendo SEQ ID N°: 1 foi clonado na construção do vector Binário apresentada na Figura 8. Resumidamente, a sequência de ADN foi sub-clonada a partir do plasmideo pCpal2 (Figura 1) no plasmideo binário, por digestão de pCpal2 com FcoRI e preenchendo extremidades do fragmento de restrição utilizando a enzima T4 DNA polimerase. O vector Binário (Figura 8) foi linearizado utilizando BamRI e também preenchendo extremidades utilizando T4 DNA polimerase. Para as reacções de preenchimento de extremidades, foi ressuspenso 1 pg de inserção de ADNc ou ADN do vector Binário linearizado em 50 pL de tampão de T4 DNA polimerase (33 mM de Tris-acetato pH 7,9, 66 mM de acetato do potássio, 10 mM de acetato de magnésio e 5 mM de DDT) suplementado com 100 mM de cada dNTP e 0,1 mg/mL de BSA e 3 unidades da T4 DNA polimerase, e incubado durante 6 min de incubação a 37 °C. A reacção foi parada por aquecimento a 75 °C durante 10 min. O ADN de extremidades rombas e o ADN do vector Binário foram ligados utilizando T4 DNA ligase e condições padrão de ligação como recomendadas pela Promega. Foram seleccionados clones em que a sequência de SEQ ID N°: 1 foi introduzida atrás do promotor napin, na orientação de sentido, permitindo assim a expressão do polipéptido de epoxigenase. O plasmideo Binário abrigando SEQ ID N°: 1, na orientação de sentido, operacionalmente sob controlo do promotor napin truncado, é representado esquematicamente na Figura 9. O plasmideo Binário apresentado na Figura 9 foi transformado na estirpe AGLI de Agrobacterium utilizando electroporação e 77 utilizado para transformar Arabidopsis thaliana. Foram obtidas plantas de A. thaliana transgénicas de acordo com o método descrito por Valvekens et al. (1988) e Dolferus et al. (1994).Demonstration of epoxygenase activity Confirmation that the cDNA clones exemplifying the invention encode epoxygenase activities was obtained by transforming Arabidopsis thaliana, which produces no epoxy fatty acids, in particular vernolic acid, with each individual candidate clone and examining the transformed tissue for the presence of epoxygen fatty acids which would otherwise not produce, or for hydroxy fatty acids which can be formed from the metabolism of an epoxygen fatty acid by the action of endogenous epoxide hydrolases (Blee and Schuber, 1990). The epoxygenase cDNA comprising SEQ ID NO: 1 was cloned into the Binary vector construct shown in Figure 8. Briefly, the DNA sequence was subcloned from plasmid pCpal2 (Figure 1) into the binary plasmid by digestion of pCpal2 with FcoRI and filling ends of the restriction fragment using the enzyme T4 DNA polymerase. The Binary vector (Figure 8) was linearized using BamRI and also filling ends using T4 DNA polymerase. For end-filling reactions, 1æg of cDNA or DNA insert from the linearized Binary vector was resuspended in 50æl of T4 DNA polymerase buffer (33mM Tris-acetate pH 7.9, 66mM potassium acetate, 10 mM magnesium acetate and 5 mM DDT) supplemented with 100 mM of each dNTP and 0.1 mg / ml BSA and 3 units of T4 DNA polymerase, and incubated for 6 min incubation at 37 ° C. The reaction was stopped by heating at 75 ° C for 10 min. Blunt-ended DNA and Binary vector DNA were ligated using T4 DNA ligase and standard binding conditions as recommended by Promega. Clones were selected in which the sequence of SEQ ID NO: 1 was introduced behind the napin promoter in the sense orientation, thus allowing expression of the epoxygenase polypeptide. The Binary plasmid harboring SEQ ID NO: 1, in the sense orientation, operably under control of the truncated napin promoter, is shown schematically in Figure 9. The Binary plasmid shown in Figure 9 was transformed into Agrobacterium AGLI strain using electroporation and used to transform Arabidopsis thaliana. Transgenic A. thaliana plants were obtained according to the method described by Valvekens et al. (1988) and Dolferus et al. (1994).

As plantas transgénicas e as plantas não transformadas (i. e., de controlo) foram cultivadas até à maturidade. Uma semente madura de cada planta foi analisada para a composição em ácidos gordos através de técnicas convencionais. Foram estabelecidas plantas transformantes primárias (To) e a semente TI foi recolhida a partir de cada planta e analisada para a composição de ácidos gordos através de cromatografia gasosa. Foi mostrado que doze plantas T0 continham ácido vernólico nos seus lipidos de semente TI a concentrações variando de 0,9% a 15,8% do total de ácidos gordo, enquanto que as plantas não transformadas de controlo não continham nenhum ácido vernólico (Tabela 5) . A linha vegetal de mais alta expressão foi Cpal-17, para a qual os perfis de eluição de GLC (a partir de análise de coluna empacotada e coluna capilar) são apresentados na Figura 10. O perfil de eluição de GLC a partir de coluna empacotada para o controlo não transformado é também mostrado na Figura 10. TABELA 5Transgenic plants and untransformed (i.e., control) plants were grown to maturity. One mature seed from each plant was analyzed for the composition in fatty acids by conventional techniques. Primary transformants (To) were established and the TI seed was harvested from each plant and analyzed for the fatty acid composition by gas chromatography. Twelve T0 plants were shown to contain vernolic acid in their TI seed lipids at concentrations ranging from 0.9% to 15.8% of the total fatty acids, while the non-transformed control plants did not contain any vernolic acid (Table 5 ). The highest expression plant line was Cpal-17, for which the GLC elution profiles (from packed column analysis and capillary column) are shown in Figure 10. The GLC elution profile from packed column for the untransformed control is also shown in Figure 10. TABLE 5

Niveis de ácido Vernólico em linhas transgénicas de A. thaliana expressando SEQ ID N°: 1 Planta T0 N° Ácido Vernólico (% em peso de ácidos gordos totais da semente) Cpal-4 1,4 Cpal-5 1,1 Cpal-8 2,7 Cpal-9 0, 9 Cpal-13 0, 9 78Levels of Vernolic Acid in transgenic lines of A. thaliana expressing SEQ ID NO: 1 Plant T0 No. Vernolic Acid (% by weight of total fatty acids of the seed) Cpal-4 1.4 Cpal-5 1.1 Cpal-8 2.7 Cpal-9 0.9 Cpal-13 0.9 78

Cpal-15 1,1 Cpal-17 15, 8 Cpal-21 1,3 Cpal-23 1,4 Cpal-24 1,0 Cpal-25 CM V \—1 Cpal-2 6 1,1 linha de controlo 0,0 não transformadaCpal-15 1.1 Cpal-17 15.8 Cpal-21 1.3 Cpal-23 1.4 Cpal-24 1.0 Cpal-25 CM V 1 Cpal-2 6 1.1 control line 0, 0 untransformed

Alternativamente, ou adicionalmente, as sequências putativas de epoxigenase de ácidos gordos aqui descritas são cada uma transformada em Linum usitatissimum (linho) e Arabidopsis thaliana sob o controlo do promotor napin específico de semente. As plantas transgénicas de linho e Arabidopsis thaliana são examinadas para a presença de ácidos gordos epoxi em óleos de semente em desenvolvimento. Trabalho precedente mostrou que se se fornecer ácidos gordos epoxi a embriões de linho em desenvolvimento, estes são incorporados em triglicéridos (Exemplo 10) .Alternatively, or in addition, the putative fatty acid epoxygenase sequences described herein are each transformed into Linum usitatissimum (flax) and Arabidopsis thaliana under the control of the seed specific napin promoter. Flax and Arabidopsis thaliana transgenic plants are examined for the presence of epoxy fatty acids in developing seed oils. Previous work has shown that if epoxy fatty acids are supplied to developing flax embryos, they are incorporated into triglycerides (Example 10).

Alternativamente, são também transformadas leveduras com os clones de epoxigenase da invenção e ensaiadas para a produção de ácidos gordos epoxi. EXEMPLO 6Alternatively, yeasts are also transformed with the epoxygenase clones of the invention and assayed for the production of epoxy fatty acids. EXAMPLE 6

Confirmação por espectroscopia de massa de ácidos gordos epoxi em semente Ti de Arabidopsis nascida em plantas transgénicas primárias T0 79 A cromatografia gasosa de ésteres metilicos preparados a partir de lipidos de semente, da semente TI de plantas de Arabidopsis thaliana transformadas com Cpal2 (Exemplo 5) revelou a presença de dois ácidos gordos adicionais comparativamente aos controlos não transformados. 0 primeiro destes compostos tinha um tempo de retenção equivalente àquele de um padrão de ácido vernólico. 0 segundo composto tinha um tempo de uma retenção mais longo e foi putativamente identificado como ácido 12,13-epoxi-9,15-octadecadienóico, um derivado esperado do ácido vernólico, resultando da dessaturação na posição A 15 pela A15-dessaturase de Arabidopsis thaliana endógena. A confirmação da identidade exacta dos dois picos foi obtida através de espectroscopia de massa de dióis que foram preparados a partir da fracção de ácido gordo epoxi derivada a partir de plantas transformadas com Cpal2. Os dióis foram adicionalmente convertidos em éteres trimetilsilílicos e analisados por GC-MS DB23 numa coluna capilar de silica fundida (Hewlett-packard 5890 II GC acoplado a um Hewlett Packard 5989A MS trabalhando em impacto electrónico a 70eV15). O cromatograma iónico total mostrou dois picos como se seguem: (i) O primeiro pico de eluição tinha iões proeminentes de massa 73, 172, 275 e 299, indicando que o grupo epoxi foi posicionado a C-12 de um ácido gordo C18 e que uma ligação dupla ocorreu entre o grupo epoxi e o terminal carboxilo. Este espectro de massa foi idêntico ao espectro de um derivado de éter trimetilsililico de dióis preparados a partir de ácido vernólico puro (ácido 12,13-epoxi-9-octadecenóico); e (ii) O segundo pico de eluição tinha iões proeminentes de massa 73, 171, 273 e 299, indicando a presença de duas ligações duplas e de um grupo epoxi posicionado a C-12 de um 80 ácido gordo C18, consistente com o espectro de massa para o ácido 12,13-epoxi-9,15-octadecadienóico . EXEMPLO 7Confirmation by Mass Spectroscopy of Arabidopsis Ti Seed Epoxy Fatty Acids Born in T0 Primary Transgenic Plants 79 Gas chromatography of methyl esters prepared from seed lipids from the TI seed of Cpal2-transformed Arabidopsis thaliana plants (Example 5) revealed the presence of two additional fatty acids compared to the untransformed controls. The first of these compounds had a retention time equivalent to that of a vernolic acid standard. The second compound had a longer retention time and was putatively identified as 12,13-epoxy-9,15-octadecadienoic acid, an expected derivative of vernolic acid, resulting from desulfurization at position A 15 by Arabidopsis thaliana A15-desaturase endogenous. Confirmation of the exact identity of the two peaks was obtained by mass spectroscopy of diols which were prepared from the fraction of epoxy fatty acid derived from plants transformed with Cpal2. The diols were further converted to trimethylsilyl ethers and analyzed by GC-MS DB23 on a fused silica capillary column (Hewlett-Packard 5890 II GC coupled to a Hewlett Packard 5989A MS working on electronic impact at 70eV15). The total ion chromatogram showed two peaks as follows: (i) The first elution peak had prominent mass ions 73, 172, 275 and 299, indicating that the epoxy group was positioned at C-12 of a C18 fatty acid and that a double bond has occurred between the epoxy group and the carboxyl terminus. This mass spectrum was the same as the spectrum of a trimethylsilyl ether derivative of diols prepared from pure vernolic acid (12,13-epoxy-9-octadecenoic acid); and (ii) The second elution peak had prominent mass ions 73, 171, 273 and 299, indicating the presence of two double bonds and a C-12 positioned epoxy group of a C18 fatty acid consistent with the mass for 12,13-epoxy-9,15-octadecadienoic acid. EXAMPLE 7

Análise de ácidos gordos de plantas de Arabidopsis transgénicas Cpal2 A semente Tl derivada a partir de plantas de Arabidopsis thaliana transformadas que expressam o clone de ADNc Cpal2 sob controlo do promotor napin foi germinada e foram estabelecidas plantas Tl a partir de cinco linhas T0 (Nos 4, 8, 13, 17 & 21 na Tabela 5). A semente T2 foi recolhida a partir de cada planta Tl e analisada para a composição de ácidos gordos. A progenia dos transf ormantes Nos 4, 8, 13 e 21 (Tabela 5) segregados como esperado para a presença de ácido vernólico, com aquelas plantas contendo ácido vernólico variando até 3,1% (Tabela 6).Fatty acid analysis of Cpal2 transgenic Arabidopsis plants Tl seed derived from transformed Arabidopsis thaliana plants expressing the Cpal2 cDNA clone under control of the napin promoter was germinated and T1 plants were established from five T0 lines (Nos. 4 , 8, 13, 17 & 21 in Table 5). The T2 seed was harvested from each T1 plant and analyzed for the fatty acid composition. The progeny of the transformants Nos. 4, 8, 13 and 21 (Table 5) were segregated as expected for the presence of vernolic acid, with those plants containing vernolic acid varying up to 3.1% (Table 6).

Todas as plantas Tl que continham ácido vernólico (i. e., 18:1 epoxi na Tabela 6) também continham ácido 12,13-epoxi-9,15-octadecadienóico (i. e., 18:2 epoxi na Tabela 6; ver tambémAll Tl plants which contained vernolic acid (i.e., 18: 1 epoxy in Table 6) also contained 12,13-epoxy-9,15-octadecadienoic acid (i.e., 18: 2 epoxy in Table 6;

Figura 11), indicando que algum do ácido vernólico sintetizado pela epoxigenase Cpal2 foi subsequentemente dessaturado pela A15-dessaturase endógena. TABELA 6Figure 11), indicating that some of the vernolic acid synthesized by the Cpal2 epoxygenase was subsequently desaturated by the endogenous A15-desaturase. TABLE 6

Composição de ácidos gordos de sementes puras nascidas em plantas Ti derivadas de cinco transformantes Cpal2 primários de Arabidopsis thalianaComposition of pure seed fatty acids born in Ti plants derived from five primary Cpal2 transformants of Arabidopsis thaliana

PlantPlant

Acido gordo 81 Ácidos Ácidos gordos não epoxi gordos epoxi 16 .0 18:0 18:1 18:2 18:3 20:0 20:1 22:0 22:1 18:1 18:2 4-1 8, 3 3,9 15,5 23,9 20,6 2,8 16,5 1,7 1,6 — — 4-2 7, 6 4,1 20,3 17,8 18,0 3,4 19,7 1,8 2,0 0,82 0, 63 4-3 8 , 4 4,3 26, 0 13,5 16,1 2,8 19, 0 1,8 1,6 2,03 0,72 4-4 7, 6 4,0 25,2 14,3 16, 0 2,8 19, 8 2,1 1,7 1, 99 0, 92 4-5 7, 2 3,6 15,6 23,1 19,9 3,1 19,7 1,6 2,1 - - 4-6 7, 0 3,7 19,2 17,8 18,4 3,2 20,3 1,9 2,1 0,87 0,33 4-8 7, 4 3,9 16, 0 23,6 20,1 3,1 18,7 1,6 1,8 — — 4-9 7, 6 4,0 24,8 13,4 15,9 2,8 20,4 2,3 1,8 2,30 1,07 4-10 7, 6 4,2 24,0 13,5 16,2 3,1 20,4 1,9 1,8 1, 97 0,83 4-11 7, 4 3,9 15,0 23,2 20,4 3,3 18,8 1,7 2,0 — — 4-12 8, 7 4,0 20,7 17,0 17,5 2,6 17,2 1,7 1,5 1,38 0,74 4-13 7, 2 4,1 21,9 16,4 17, 7 3,2 21,0 1,7 1,9 1, 14 0,45 8-1 8, 1 3,9 26, 1 15,0 16, 0 2,6 19,5 2,0 1,6 1,79 0,82 (continuação)Fatty acid 81 Acids Fatty non-fatty epoxy epoxy 16: 0 18: 0 18: 1 18: 2 20: 1 20: 1 22: 1 18: 1 18: 1 18-1: , 9 15.5 23.9 20.6 2.8 16.5 1.7 1.6 - - 4-2 7, 6 4.1 20.3 17.8 18.0 3.4 19.7 1 , 8 2.0 0.82 0.63 4-3 8.4 4.3 26.0 13.5 16.1 2.8 19.0 0 1.8 1.6 2.03 0.72 4-4 7, 6 4.0 25.2 14.3 16, 0 2.8 19, 8 2.1 1.7 1.99 0.92 4-5 7, 2 3.6 15.6 23.1 19, 9 3.1 19.7 1.6 2.1 - - 4-6 7, 0 3.7 19.2 17.8 18.4 3.2 20.3 1.9 2.1 0.87 0, 33 4-8 7, 4 3.9 16.0 23.6 20.1 3.1 18.7 1.6 1.8 - - 4-9 7, 6 4.0 24.8 13.4 15, 9 2.8 20.4 2.3 1.8 2.30 1.07 4-10 7, 6 4.2 24.0 13.5 16.2 3.1 20.4 1.9 1.8 1 , 97 0.83 4-11 7, 4 3.9 15.0 23.2 20.4 3.3 18.8 1.7 2.0 - - 4-12 8, 7 4.0 20.7 17 , 0 17.5 2.6 17.2 1.7 1.5 1.38 0.74 4-13 7, 2 4.1 21.9 16.4 17.7 7 3.2 21.0 1.7 1.9 1, 14 0.45 8-1 8, 1 3.9 26, 1 15.0 16, 0 2.6 19.5 2.0 1.6 1.79 0.82 (continued)

Composição de ácidos gordos de sementes puras nascidas em plantas Ti derivadas de cinco transformantes Cpal2 primários de Arabidopsis thalianaComposition of pure seed fatty acids born in Ti plants derived from five primary Cpal2 transformants of Arabidopsis thaliana

Plant Ácido gordo a N° Ácidos Ácidos gordos não epoxi gordos epoxi 16.0 18:0 18:1 18:2 18:3 20:0 20:1 22:0 22:1 18:1 18:2 8-3 8,7 4,2 31,6 11,5 14,0 2,2 18,5 1,9 1,4 2,38 1,13 1 00 8,5 4,1 27,2 15,1 16,1 2,5 18,9 1,8 1,4 1,70 0,84 LO 1 00 9,1 4,2 27,7 14, 7 16,2 2,4 18,3 1,7 1,5 1,70 0,82 co 1 &lt;y\ 9,8 4,0 26, 0 17,2 17,2 2,3 16,9 1,6 1,2 1,36 0,71 8-7 10,0 3,5 15,2 25,3 22,3 2,3 14, 4 1,7 1,7 — — 00 1 00 8,4 4,3 32,2 10,7 13,3 2,5 20,3 1,6 1,5 1,92 0,82 1 00 9,8 3,6 15,9 25,3 22,0 2,4 14,5 1,6 1,3 — — 82 8-10 7,5 3,9 24,4 15,9 15,8 2,8 20,2 2,2 1,8 1,70 0,82 8-11 7,6 3,8 15,4 23,6 19, 8 2,9 19,4 1,5 1,8 — — 8-12 9, 4 3,7 24,2 16,7 16,7 2,2 17, 6 0,9 1,2 1,46 0, 65 8-13 10,3 4,3 25,3 17, 1 17, 9 2,2 16,0 1,8 1,3 1,48 0,73 13-1 7,0 4,3 33,3 8,1 11, 1 2,7 23,1 1,7 1,6 2,42 1,26 13-2 7,2 4,3 30,4 9, 6 12,7 2,8 22,0 1,8 1,6 2,48 1,37 13-3 7,6 3,9 15,6 23,6 19,7 3,0 19,1 1,7 1,8 — — 13-4 7,7 4,0 15,2 22,5 19,3 3,1 18,0 1,6 1,7 — — 13-5 8,0 4,2 16,3 22,2 17,5 4,4 19,4 2,0 2,0 — — 13-6 7,9 4,4 25,7 14, 7 15,8 2,9 21,2 1,6 1,7 1,56 0, 63 13-7 7,9 4,0 16, 0 23,3 19,6 3,0 19,1 1,6 1,8 — — 13-9 8,0 4,0 16, 1 23,6 20,0 2,9 18,7 1,6 1,6 — — 13-10 8,7 4,2 34,6 9, 6 12,5 2,2 19,1 1,5 1,2 2,21 1,01 13-11 8,7 4,0 17, 6 24,3 18,9 2,8 17, 1 1,6 1,4 — — 13-12 8,9 4,2 26, 4 14, 6 16, 0 2,5 17,5 1,6 1,2 1,62 0,74 13-13 9, 0 4,4 27,9 14,4 15,3 2,5 18,9 1,5 1,4 1,30 0,77 (continuação)Plant Fatty Acid N ° Acids Fatty Epoxy Fatty Epoxy 16.0 18: 0 18: 1 18: 1 18: 3 20: 1 20: 1 22: 1 18: 1 18: 4.2 31.6 11.5 14.0 2.2 18.5 1.9 1.4 2.38 1.13 1 00 8.5 4.1 27.2 15.1 16.1 2.5 18.9 1.8 1.4 1.70 0.84 LO 1 00 9.1 4.2 27.7 14.7 16.2 2.4 18.3 1.7 1.5 1.70 0, 82 co 1 <9.8 4.0 26.0 17.2 17.2 2.3 16.9 1.6 1.2 1.36 0.71 8-7 10.0 3.5 15 , 2 25.3 22.3 2.3 14, 4 1.7 1.7 - - 00 1 00 8.4 4.3 32.2 10.7 13.3 2.5 20.3 1.6 1 , 5 1.92 0.82 1.00 9.8 3.6 15.9 25.3 22.0 2.4 14.5 1.6 1.3 - - 82 8-10 7.5 3.9 24 , 4 15.9 15.8 2.8 20.2 2.2 1.8 1.70 0.82 8-11 7.6 3.8 15.4 23.6 19.8 8 2.9 19.4 1.5 1.8 - - 8-12 9.4 4 3.7 24.2 16.7 16.7 2.2 17.6 6.9 1.2 1.46 0.65 8-13 10.3 4.3 25.3 17.1 17.9 2.2 16.0 1.8 1.3 1.48 0.73 13-1 7.0 4.3 33.3 8.1 11.22, 7 23.1 1.7 1.6 2.42 1.26 13-2 7.2 4.3 30.4 9.6 12.7 2.8 22.0 1.8 1.6 2.48 1 , 37 13-3 7.6 3.9 15.6 23.6 19.7 3.0 19.1 1.7 1.8 - - 13-4 7.7 4.0 15.2 22.5 19 , 3 3.1 18.0 1.6 1, 7 - - 13-5 8.0 4.2 16.3 22.2 17.5 4.4 19.4 2.0 2.0 - - 13-6 7.9 4.4 25.7 14.7 15.8 2.9 21.2 1.6 1.7 1.56 0.63 13-7 7.9 4.0 16.0 23.3 19.6 3.0 19.1 1.6 1, 8 - - 13-9 8.0 4.0 16, 1 23.6 20.0 2.9 18.7 1.6 1.6 - - 13-10 8.7 4.2 34.6 9.6 12.5 2.2 19.1 1.5 1.2 2.21 1.01 13-11 8.7 4.0 17.6 24.3 18.9 2.8 17.1 11.1 1, 4 - - 13-12 8.9 4.2 26.4 14.6 16.0 0 2.5 17.5 1.6 1.2 1.62 0.74 13-13 9.4 4.4, 9 14.4 15.3 2.5 18.9 1.5 1.4 1.30 0.77 (continued)

Composição de ácidos gordos de sementes puras nascidas em plantas Ti derivadas de cinco transformantes Cpal2 primários de Arabidopsis thaliana Plant a N° Ácido gordo Ácidos gordos não epoxi Ácidos gordos epoxi 16.0 18:0 18:1 18:2 18:3 20:0 20:1 22:0 22:1 18:1 18:2 13-14 9,2 4,2 17,2 23,8 18,8 2,7 17,9 1,7 1,5 — — 13-15 8,4 4,2 19,7 20,9 18,6 2,7 17, 7 1,4 1,5 0,40 0,16 13-16 8,2 4,3 23,0 17, 1 17,3 2,8 19,3 1,5 1,5 0,97 0,42 13-17 8,3 4,1 15,7 23,9 19,9 2,8 17, 6 1,6 1,9 — — 17-1 7,6 4,1 15,8 23,7 19, 6 2,6 20,3 1,7 1,7 — — 17-2 8,3 4,1 16,4 24,4 20,1 2,3 16, 8 1,5 1,4 — — 83 17-3 8,1 4,1 16, 4 24,3 20,0 2,5 17,6 1,6 1,4 — 21-1 8,1 4,3 26, 9 14,5 15,0 2,9 19, 9 1,5 1,5 1 ,64 0, 63 21-2 8,2 4,0 27,9 11,8 13,2 2,5 19, 8 1,7 1,5 2 ,18 0, 91 21-3 8,8 3,7 16, 4 24,4 20,6 2,5 17,3 1,7 1,4 — 21-4 7,9 3,9 19, 6 19, 8 17,8 2,7 18,7 1,7 1,7 0 , 66 0,46 21-5 7,2 4,2 26,5 12,9 14,4 3,0 21,5 0,9 1,8 1 ,78 0,84 21-6 8,3 4,2 27,4 13,9 15,4 2,6 19, 9 1,7 1,5 1 , 66 0, 65 21-7 7,2 4,2 26, 8 13,5 13,4 3,0 21,9 1,7 1,8 1 ,74 0,80 21-8 7,4 3,8 16,3 23,6 19, 4 3,2 19,2 1,7 1,9 21-9 7,2 4,0 28,1 11,8 13,5 3,0 22,5 1,9 1,9 2 ,15 1,05 21-10 7,2 4,2 26, 1 13,8 14,6 3,0 22,3 1,7 1,8 1 ,64 0,82 21-11 7,1 4,2 29,2 11,5 12,7 3,0 22,5 1,8 1,8 2 ,20 1,09 21-12 7,2 4,1 26,2 13,6 14,2 3,1 22,4 1,8 1,9 1 ,71 0,80 21-13 7,1 4,3 33,7 7,1 10,0 2,7 24,1 2,0 1,8 3 , 05 1,47 21-14 7,4 3,7 16, 9 21,9 19, 6 3,1 19,2 1,8 2,0 0 ,29 vg 21-15 7,7 3,6 15,6 24,3 20,2 2,9 18,1 1,8 1,8 EXEMPLO 8Composition of pure seed fatty acids born in Ti plants derived from five primary Cpal2 transformants of Arabidopsis thaliana Plant a Fatty acid non-epoxy Fatty acids epoxy 16.0 18: 0 18: 1 18: 3 20: 0 20 : 1 22: 0 22: 1 18: 1 18: 2 13-14 9.2 4.2 17.2 23.8 18.8 2.7 17.9 1.7 1.5 - - 13-15 8 , 4 4.2 19.7 20.9 18.6 2.7 17.7 7 1.4 1.5 0.40 0.16 13-16 8.2 4.3 23.0 17.1 17.3 2.8 19.3 1.5 1.5 0.97 0.42 13-17 8.3 4.1 15.7 23.9 19.9 2.8 17.6 1.6 1.6 - - 17-1 7.6 4.1 15.8 23.7 19.6 2.6 20.3 1.7 1.7 - - 17-2 8.3 4.1 16.4 24.4 20.1 2.3 16.8 8 1.5 1.4 - - 83 17-3 8.1 4.1 16.4 24.3 20.0 2.5 17.6 1.6 1.4 - 21-1 8 , 1 4.3 26.9 9 14.5 15.0 2.9 19.9 9 1.5 1.5 1, 64 0, 63 21-2 8.2 4.0 27.9 11.8 13.2 2.5 19.8 8 1.7 1.5 2, 18 0, 91 21-3 8.8 3.7 16.4 24.4 20.6 2.5 17.3 1.7 1.4-21 -4 7.9 3.9 19.6 19.8 8 17.8 2.7 18.7 1.7 1.7 0.66 0.46 21-5 7.2 4.2 26.5 12.9 14.4 3.0 21.5 0.9 1.8 1.78 0.84 21-6 8.3 4.2 27.4 13.9 15.4 2.6 19.9 1.7 1.5 1, 66 0, 65 21-7 7.2 4.2 26.8 13.5 13.4 3.0 21.9 1.7 1.8 1.74 0.80 21- 8 7.4 3.8 16.3 23.6 19.4 4 3.2 19.2 1.7 1.9 21-9 7.2 4.0 28.1 11.8 13.5 3.0 22 , 5 1.9 1.9 2, 15 1.05 21-10 7.2 4.2 26.1 13.8 14.6 3.0 22.3 1.7 1.8 1.64 0.82 21-11 7.1 4.2 29.2 11.5 12.7 3.0 22.5 1.8 1.8 2, 20 1.09 21-12 7.2 4.1 26.2 13, 6 14.2 3.1 22.4 1.8 1.9 1, 71 0.80 21-13 7.1 4.3 33.7 7.1 10.0 2.7 24.1 2.0 1 , 8 3, 05 1.47 21-14 7.4 3.7 16.9 9 21.9 19.6 13.1 19.2 1.8 2.0 0.29 vg 21-15 7.7 3, 6 15.6 24.3 20.2 2.9 18.1 1.8 1.8 EXAMPLE 8

Análise de ácidos gordos de plantas de Linola transgénica Cpal2 A construção de plasmídeo binário descrita acima compreendendo o clone de ADNc Cpal2 (Figura 9) foi transformada na estirpe AGLl de Agrobacterium tumefaciens, utilizando electroporação. 0 A. tumefaciens transformado foi utilizado para infectar explantes de Linum usitatissimum var. Eyre como descrito por Lawrence et al. (1989), excepto que foi utilizado meio MS como o meio basal para a indução de raízes no material de rebento regenerado. 84Fatty Acid Analysis of Calla 2 Transgenic Linola Plants The above described binary plasmid construct comprising the Cpal2 cDNA clone (Figure 9) was transformed into Agrobacterium tumefaciens AGL1 strain, using electroporation. The transformed A. tumefaciens was used to infect explants of Linum usitatissimum var. Eyre as described by Lawrence et al. (1989), except that MS medium was used as the basal medium for root induction in the regenerated shoot material. 84

Dois transformantes de Linola primários (plantas TO) designados AP20 e AP21 foram confirmados como sendo transgénicos por PCR utilizando iniciadores dirigidos contra o gene Cpal2 e mostrando que estas plantas eram resistentes à canamicina. Dez sementes TI de cada planta foram analisadas individualmente para a composição de ácidos gordos utilizando técnicas convencionais.Two primary Linola transformants (TO plants) designated AP20 and AP21 were confirmed to be transgenic by PCR using primers directed against the Cpal2 gene and showing that these plants were resistant to kanamycin. Ten TI seeds from each plant were individually analyzed for the fatty acid composition using standard techniques.

Como mostrado na Tabela 7, a semente de AP20 segregada em 3 classes, compreendidas de três sementes sem ácido vernólico, duas que têm mais que 0,7% de ácido vernólico, e cinco que têm niveis intermédios (0,13-0,47%) de ácido vernólico.As shown in Table 7, the AP20 seed secreted into 3 classes, comprised of three seeds without vernolic acid, two having more than 0.7% of vernolic acid, and five having intermediate levels (0.13-0.47 %) of vernolic acid.

Do mesmo modo, sementes de AP21 segregadas em 3 classes compreendidas de cinco sementes sem ácido vernólico, duas que têm mais que 0,25% de ácido vernólico e três que têm um nivel intermédio (0,09-0,14%) de ácido vernólico (Tabela 8).Likewise, AP21 seeds secreted into 3 classes comprised of five seeds without vernolic acid, two having more than 0.25% vernolic acid and three having an intermediate level (0.09-0.14%) of (Table 8).

Assim, foi obtido um total de doze sementes que continham ácido vernólico. Oito das doze sementes de AP20 e AP21 contendo ácido vernólico continham também ácido 12,13-epoxi-9,15-octadecadienóico TABELA 7Thus, a total of twelve seeds containing vernolic acid were obtained. Eight of the twelve seeds of AP20 and AP21 containing vernolic acid also contained 12,13-epoxy-9,15-octadecadienoic acid

Composição de ácidos gordos de transformante primário 10 sementes Tl individuais do Cpal2 de Linola ΆΡ20 Sement e Ti Ácidos gordos não epoxi Ácidos gordos epoxi 16:0 18:0 18:1 18:2 18:3 20:0 20:1 22:0 22:1 18:1 18:2 1 6,4 3, 6 17,8 68,1 2,0 0,2 - 0,6 — — 2 6, 0 3,5 25,4 60,8 1,4 0,2 0,2 0,70 0,23 3 6, 0 3,9 20,4 64,6 2,1 0,3 0, 6 - “ — — 85 4 6,3 3,5 28,3 57,3 1,3 0,2 0,2 1,4 - 0,34 0,28 5 5,2 4,8 24,9 61,2 1,6 0,3 0,2 ο,ι - 0,37 — 6 5,8 4,1 23,3 63,1 1,9 0,2 0,2 0,2 - 0,47 - 7 5,9 4,3 21,7 64,1 2,2 0,2 0,2 0,2 - 0,13 0,12 8 5,9 3,3 22,3 65,2 2,0 0,2 0,2 ο,ι 0,2 - - 9 5,6 4,0 25,2 61,4 1,7 0,2 0,2 ο,ι - 0,84 - 10 6,2 4,4 27,4 57,9 1,7 0,2 0,2 0,2 - 0,54 — TABELA 8Composition of primary transformant fatty acids 10 individual Tl seeds of Linola Cpal2 ΆΡ20 Sement and Ti Fatty acids not epoxy Epoxy fatty acids 16: 0 18: 1 18: 1 18: 2 18: 3 20: 0 20: 1 22: 0 22: 1 18: 1 18: 2 1 6.4 3, 6 17.8 68.1 2.0 0.2 - 0.6 - 2 6, 0 3.5 25.4 60.8 1.4 0.2 0.2 0.70 0.23 3 6, 0 3.9 20.4 64.6 2.1 0.3 0.6 - 85 4 6.3 3.5 28.3 57 , 3 1.3 0.2 0.2 1.4 - 0.34 0.28 5 5.2 4.8 24.9 61.2 1.6 0.3 0.2 ο, - 0.37 - 6 5.8 4.1 23.3 63.1 1.9 0.2 0.2 0.2 - 0.47 - 7 5.9 4.3 21.7 64.1 2.2 0.2 0.2 0.2 - 0.13 0.12 8 5.9 3.3 22.3 65.2 2.0 0.2 0.2 ο, ι 0.2 - - 9 5.6 4.0 25.2 61.4 1.7 0.2 0.2 ο, ι - 0.84 - 10 6.2 4.4 27.4 57.9 1.7 0.2 0.2 0.2 - 0 , 54 - TABLE 8

Composição de ácidos gordos de transformante primário 10 sementes Tl individuais do Cpal2 de Linola AP21 Sement e Ti Ácidos gordos não epoxi Ácidos gordos epoxi 16:0 18:0 18:1 18:2 18:3 20:0 20:1 22:0 22:1 18:1 18:2 1 6,1 4,2 35,2 50,8 1,3 - - - 2,0 - - 2 5,7 5,0 32,9 53,3 1,4 0,2 0,2 0,2 0,14 0,21 3 5,9 4,0 35,1 50,8 1,3 0,2 0,2 0,1 1,5 - - 4 7,5 4,1 38,8 45,5 1,2 0,2 0,3 - 1,7 - - 5 5,8 5,0 28,8 57,3 1,3 0,2 0,2 0,1 - 0,37 0,06 6 5,8 5,0 44, 1 41, 4 1,4 0,2 0,2 0,2 - - - 7 6,5 4,5 27,9 58,6 1,3 0,2 0,1 0,1 - - - 8 6, 9 4, 6 37,6 48,1 1,2 - - - - 0,10 0,19 9 6,2 4,7 33,7 52,1 1,3 0,2 0,2 0,2 - 0,09 0,07 10 6,1 4,8 29, 7 5 6,6 1,3 0,2 0,2 0,1 - 0,25 0,04 86Composition of primary transformant fatty acids 10 individual Tl seeds of Linola Cpal2 AP21 Sement and Ti Epoxy fatty acids Epoxy 16: 0 18: 0 18: 1 18: 2 18: 3 20: 0 20: 1 22: 0 22: 1 18: 1 18: 2 1 6.1 4.2 35.2 50.8 1.3 - - - 2.0 - - 2 5.7 5.0 32.9 53.3 1.4 0 , 2 0.2 0.2 0.14 0.21 3 5.9 4.0 35.1 50.8 1.3 0.2 0.2 0.1 1.5 - - 4 7.5 4, 1 38.8 45.5 1.2 0.2 0.3 - 1.7 - - 5 5.8 5.0 28.8 57.3 1.3 0.2 0.2 0.1 - 37 0.06 6 5.8 5.0 44, 1 41, 4 1.4 0.2 0.2 0.2 - - - 7 6.5 4.5 27.9 58.6 1.3, 2 0.1 0.1 - - - 8 6, 9 4, 6 37.6 48.1 1.2 - - - - 0.10 0.19 9 6.2 4.7 33.7 52.1 1 , 3 0.2 0.2 0.2 - 0.09 0.07 10 6.1 4.8 29.76 6.6 1.3 0.2 0.2 0.1 - 0.25 0, 04 86

Quatro plantas TI foram estabelecidas a partir de plântulas resistentes à canamicina de AP20. Todas as quatro plantas foram subsequentemente mostradas produzir ácido vernólico na sua semente T2 (Tabela 9). Os niveis de ácidos gordos epoxi 18:2 não foram analisados nestas sementes T2. TABELA 9Four TI plants were established from kanamycin resistant seedlings of AP20. All four plants were subsequently shown to produce vernolic acid in their T2 seed (Table 9). The levels of 18: 2 epoxy fatty acids were not analyzed in these T2 seeds. TABLE 9

Composição de progenia ácidos gordos de sementes Cpa.12 Tl de Linola de ΆΡ20 T2 da Sement e T2 Ácidos gordos não epoxi Ácidos gordos epoxi 16:0 18:0 18:1 18:2 18:3 20:0 20:1 22:0 22:1 18:1 A 3,4 3,0 27,4 65,5 0, 6 na na na Na 0,06 B 3,5 3,1 30,2 62,6 0, 6 na na na na 0,07 C 3,6 2,7 33,3 59, 8 0, 6 na na na na 0,07 D 3,4 3,1 28,2 64,6 0, 6 na na na na na = não analisado EXEMPLO 9Composition of progeny fatty acids from seeds Cpa.12 Linola T1 from ΆΡ20 T2 from T2E and T2 Fatty acids from epoxy 18: 0 22: 1 18: 1 A 3.4 3.0 27.4 65.5 0.6 na na na Na 0.06 B 3.5 3.1 30.2 62.6 0.6 na na na 0.07 C 3.6 2.7 33.3 59.86 na na na na 0.07 D 3.4 3.1 28.2 64.6 0.6 na na na na na = not analyzed EXAMPLE 9

Produção de ácidos gordos epoxi em organismos transgénicos 87 A produção de um óleo rico em ácido vernólico foi conseguida por transformação do gene de epoxigenase aqui descrito, em particular SEQ ID N°: 1, em Arabidopsis thaliana, como descrito nos Exemplos precedentes. Como mostrado na Tabela 5, a linha transgénica de A. thaliana expressando SEQ ID N°: produz niveis elevados de ácido vernólico nas suas sementes relativamente a outros ácidos gordos. Em particular, numa linha transgénica (Cpal-17), o ácido vernólico produzido é tanto quanto 15,2% (p/p) do conteúdo total de ácidos gordos da semente. A produção de um óleo rico em ácido vernólico é também conseguida por transformação do gene de epoxigenase aqui descrito, em qualquer uma de SEQ ID Nos: 1, 3, 5, 19 ou 20 e, de um modo preferido, qualquer uma de SEQ ID Nos: 1 ou 3 ou 5, em qualquer organismo acumulador de óleo que tem normalmente niveis muito elevados de ácido linoleico e actividades mínimas de outras enzimas competitivas capazes de utilizar ácido linoleico como um substrato. As sequências genéticas da invenção são colocadas operacionalmente sob o controlo de um promotor que produza nível elevado de expressão em semente oleaginosa, por exemplo, o promotor napin específico de semente.Production of an oil rich in vernolic acid was achieved by transforming the epoxygenase gene described herein, in particular SEQ ID NO: 1, into Arabidopsis thaliana, as described in the foregoing Examples. As shown in Table 5, the A. thaliana transgenic line expressing SEQ ID NO: produces high levels of vernolic acid in its seeds relative to other fatty acids. In particular, in a transgenic line (Cpal-17), the produced vernolic acid is as much as 15.2% (w / w) of the total fatty acid content of the seed. The production of an oil rich in vernolic acid is also achieved by transformation of the epoxygenase gene described herein, in any one of SEQ ID Nos: 1, 3, 5, 19 or 20, and preferably any of SEQ ID NO: Nos: 1 or 3 or 5 in any oil accumulating organism which normally has very high levels of linoleic acid and minimum activities of other competitive enzymes capable of using linoleic acid as a substrate. The genetic sequences of the invention are placed operably under the control of a promoter which produces high level of oleaginous seed expression, for example, the seed specific napin promoter.

Numa abordagem alternativa à transformação de A. thaliana, são transformados com a epoxigenase da invenção genótipos de elevado linoleico de linho, girassol, milho ou cártamo. Os níveis elevados de ácido vernólico são produzidos pelas plantas transgénicas durante a síntese de óleo de semente, quando o gene de epoxigenase é expresso em níveis elevados.In an alternative approach to the transformation of A. thaliana, high linoleic genotypes of flax, sunflower, corn or safflower are transformed with the epoxygenase of the invention. Elevated levels of vernolic acid are produced by transgenic plants during seed oil synthesis when the epoxygenase gene is expressed at high levels.

Alternativamente, o linho Linola® (=ácido linolénico baixo) é transformado com a epoxigenase da invenção. São produzidos niveis elevados de ácido vernólico pelas plantas transgénicas de linho Linola® durante a síntese de óleo de semente, quando o gene de epoxigenase é expresso em níveis elevados.Alternatively Linola® (= low linolenic acid) is transformed with the epoxygenase of the invention. Elevated levels of vernolic acid are produced by Linola® linseed transgenic plants during seed oil synthesis, when the epoxygenase gene is expressed at high levels.

Adicionalmente, os requerentes mostraram que ácido vernólico marcado fornecido a sementes de linho em desenvolvimento não é degradado mas é incorporado em lípidos de armazenamento em todas as três posições da molécula de triglicérido (ver Exemplo 10) . Consistente com estes dados, são prontamente depositados niveis elevados de ácido vernólico sintetizado pela epoxigenase introduzida, nos triglicéridos do óleo de semente desta espécie. EXEMPLO 10In addition, applicants have shown that labeled vernolic acid supplied to developing flax seeds is not degraded but is incorporated into storage lipids at all three positions of the triglyceride molecule (see Example 10). Consistent with these data, high levels of vernolic acid synthesized by the introduced epoxygenase are readily deposited into the triglycerides of the seed oil of this species. EXAMPLE 10

Incorporação de ácido oleico e ácido vernólico nos lipidos de cotilédones de linhaça em desenvolvimentoIncorporation of oleic acid and vernolic acid in the lipids of developing linseed cotyledons

Os cotilédones de linhaça em desenvolvimento destacados (seis pares em cada incubação, incubação em duplicado) na fase intermédia de desenvolvimento da semente (20 dias após floração) foram incubados com 10 nmol dos sais de amónio quer de ácido [1—14C]vernólico (actividade especifica de 3000 d.p.m./nmol) ou ácido [1 — 14C]oleico (actividade especifica de 5000 d.p.m./nmol) em 0,2 mL de tampão fosfato pH 7,2 durante 30 min a 30 °C. Os cotilédones foram depois lavados três vezes com 1 mL de água destilada e imediatamente extraídos numa Ultra Turrax de acordo com Bligh e Dyer (1959) ou incubados ainda em 0,5 m. de tampão fosfato a 0,1 M pH 7,2 durante 90 ou 270 min antes da extracção. Uma fracção dos lípidos na fase de clorofórmio foi metilada e separada em placas de TLC de sílica gel em n-hexano/dietiléter/ácido acético (85:15:1). O resto dos lípidos na fase de clorofórmio de cada amostra foi aplicado em duas 89 placas separadas de TLC de sílica gel e as placas foram reveladas em clorofórmio/metanol/ácido acético/água (85:15:10:3,5 em vol) para separação de lípidos polares e em n-hexano/dietiléter/ácido acético (60:40:1,5) para separação de lípidos neutros. As áreas lipídicas com migração correspondente a padrões autênticos foram removidas e a radioactividade em cada lípido foi quantificada por contagem de cintilação líquida. A recuperação da marcação de 14C na fase de clorofórmio é descrita na Figura 12. Um tanto mais do que metade da radioactividade adicionada, tanto de ácido [14C]oleico e ácido [14C]vernólico foi incorporada pelos cotilédones e recuperada como substâncias lipofílicas após a marcação em pulso de 30 min. Esta quantidade permaneceu virtualmente inalterada durante os 270 min adicionais de incubação com ambos os substratos. A separação dos ésteres metílicos radioactivos dos lípidos mostrou que a maioria da radioactividade (92%) do ácido [14C]vernólico fornecido às experiências residiu em compostos com a mesma migração que vernoleato de metilo indicando que o grupo epoxi permaneceu intacto nos cotilédones de linhaça ao longo da incubação de 270 min.The prominent developing linseed cotyledons (six pairs in each incubation, duplicate incubation) at the intermediate seed development stage (20 days after flowering) were incubated with 10 nmol of the ammonium salts of either [1-14C] vernolic acid ( specific activity of 3000 dpm / nmol) or [1-114 C] oleic acid (specific activity of 5000 dpm / nmol) in 0.2 ml of phosphate buffer pH 7.2 for 30 min at 30 ° C. The cotyledons were then washed three times with 1 mL of distilled water and immediately extracted in an Ultra Turrax according to Bligh and Dyer (1959) or incubated further at 0.5 m. of 0.1 M phosphate buffer pH 7.2 for 90 or 270 min prior to extraction. A fraction of the lipids in the chloroform phase was methylated and separated on silica gel TLC plates in n-hexane / diethyl ether / acetic acid (85: 15: 1). The remainder of the lipids in the chloroform phase of each sample was applied to two separate silica gel TLC plates and the plates were developed in chloroform / methanol / acetic acid / water (85: 15: 10: 3.5 in vol) for separation of polar lipids and in n-hexane / diethyl ether / acetic acid (60: 40: 1.5) for separation of neutral lipids. The lipid areas with migration corresponding to authentic standards were removed and the radioactivity in each lipid was quantified by liquid scintillation counting. Recovery of the 14C labeling in the chloroform phase is described in Figure 12. [0009] More than half of the added radioactivity of both [14 C] oleic acid and [14 C] vernolic acid was incorporated by the cotyledons and recovered as lipophilic substances after 30 minute pulse marking. This amount remained virtually unchanged for the additional 270 min of incubation with both substrates. Separation of the radioactive methyl esters from the lipids showed that the majority of radioactivity (92%) of the [14C] vernolic acid provided to the experiments resided in compounds having the same migration as methyl veroleate indicating that the epoxy group remained intact on the linseed cotyledons at incubation time of 270 min.

Cerca de 28% da actividade do fornecimento de ácido [14C]vernólico que estava presente na fase de clorofórmio residiu na fosfatidilcolina após 30 min e a radioactividade diminuiu para apenas 5% em 300 min de incubação (Figura 13).About 28% of the [14C] vernolic acid supply activity that was present in the chloroform phase resided in phosphatidylcholine after 30 min and the radioactivity decreased to only 5% in 300 min incubation (Figure 13).

Cerca de 22% da actividade do fornecimento de ácido [14C]oleico que estava presente na fase de clorofórmio residiu na fosfatidilcolina após 30 min e a radioactividade diminuiu para cerca de 11% em 300 min de incubação (Figura 13).About 22% of the [14 C] oleic acid supply activity that was present in the chloroform phase resided in phosphatidylcholine after 30 min and the radioactivity decreased to about 11% at 300 min incubation (Figure 13).

Cerca de 32% da actividade do fornecimento de ácido [14C]vernólico que estava presente na fase de clorofórmio residiu 90 em triacilgliceróis após 30 min e a radioactividade aumentou para mais de 60% em 300 min de incubação (Figura 14) . Os diacilgliceróis continham cerca de 24% da actividade nas experiências de fornecimento de ácido [14C]vernólico e esta guantidade permaneceu praticamente constante durante os períodos de incubação.About 32% of the [14 C] vernolic acid supply activity that was present in the chloroform stage resided 90 in triacylglycerols after 30 min and radioactivity increased to over 60% in 300 min incubation (Figure 14). The diacylglycerols contained about 24% of the activity in the [14 C] vernolic acid feed experiments and this amount remained practically constant during the incubation periods.

Cerca de 5% da actividade do fornecimento de ácido [14C]oleico gue estava presente na fase de clorofórmio residiu em triacilgliceróis após 30 min e a radioactividade aumentou para 18% em 300 min de incubação (Figura 14) . Os diacilgliceróis continham cerca de 19% da actividade após 30 min nas experiências de fornecimento de ácido [14C]oleico e esta quantidade permaneceu praticamente constante durante os períodos de incubação. A experiência acima mostra que os cotilédones de linhaça não metabolizam o grupo epoxi do ácido vernólico, em grande extensão. Adicionalmente, mostra que os cotilédones de linhaça possuem mecanismos para remover eficientemente ácido vernólico a partir de lípidos de membrana e incorpora-los em triacilgliceróis. EXEMPLO 11About 5% of the [14 C] oleic acid supply activity that was present in the chloroform phase resided in triacylglycerols after 30 min and radioactivity increased to 18% in 300 min incubation (Figure 14). The diacylglycerols contained about 19% of the activity after 30 min in the [14 C] oleic acid feed experiments and this amount remained practically constant during the incubation periods. The above experiment shows that flax cotyledons do not metabolize the epoxy group of vernolic acid to a great extent. Additionally, it shows that flax cotyledons have mechanisms to efficiently remove vernolic acid from membrane lipids and incorporate them into triacylglycerols. EXAMPLE 11

Clonagem de genes de A12-epoxigenase a partir de outras espécies contendo ácido epoxiCloning of A12-epoxygenase genes from other species containing epoxy acid

Os homólogos do gene de Al2-epoxigenase Cpal2 são obtidos a partir de outras espécies que são ricas em ácidos gordos epoxi, por clonagem dos membros da família génica de monooxigenases de função mista A12 que são altamente expressas em sementes em desenvolvimento e comparando a sua sequência de aminoácidos com 91 àquelas de sequências conhecidas de A12-dessaturase e A12-epoxigenase. Esses genes são clonados quer por rastreio de bibliotecas de ADNc de sementes em desenvolvimento com sondas genética baseadas quer no gene Cpal2 (SEQ ID N°: 1) ou no fragmento D12V (SEQ ID N°: 7), ou por amplificação de fragmentos de PCR utilizando iniciadores concebidos contra sequências conservadas das monooxigenases de função mista A12 vegetais, como aqui descrito. As sequências putativas de A12-epoxigenase mostram uma identidade de sequência global superior para com as sequências de A12-epoxigenase aqui divulgadas, do que para as sequências conhecidas de A12-dessaturase.Al2-epoxygenase-Cp2 gene homologs are obtained from other species that are rich in epoxy fatty acids by cloning members of the gene family of A12 mixed function monooxygenases which are highly expressed in developing seeds and comparing their sequence of amino acids with 91 to those of known sequences of A12-desaturase and A12-epoxygenase. Such genes are cloned either by screening of seed cDNA libraries in development with gene based probes either in the Cpal2 gene (SEQ ID NO: 1) or in the D12V fragment (SEQ ID NO: 7), or by amplification of fragments of PCR using primers designed against conserved sequences of plant A12 mixed function monooxygenases, as described herein. The putative A12-epoxygenase sequences show superior overall sequence identity to the A12-epoxygenase sequences disclosed herein, than to the known A12-desaturase sequences.

Num exemplo desta abordagem, foi obtida uma sequência de tipo A12-epoxigenase de tamanho total a partir de uma Crepis sp. não identificada contendo niveis elevados de ácido vernólico nos seus óleos de semente e conhecida por não ser Crepis palaestina. Foi isolado ARN poli(A)+ a partir de sementes em desenvolvimento desta Crepis sp. utilizando um kit de purificação de ARNm QuickPrep Micro (Pharmacia Biotechnology) e utilizado para sintetizar um ADNc de cadeia dupla iniciado com oligosacárido d(T) . O ADNc de cadeia dupla assim obtido foi depois ligado a adaptadores EcoRl/Notl (Pharmacia Biotechnology) e foi construída uma biblioteca de ADNc utilizando o kit de clonagem ZAP-cDNA Gigapack (Stratagene). A biblioteca de ADNc em filtros membranares Hybond N+ (Amersham) foi rastreada com o fragmento D12V marcado aleatoriamente (SEQ ID N°: 7) derivado de Crepis alpina como prescrito pelo fabricante, utilizando condições de hibridação padrão. Isto resultou na purificação de um bacteriófago recombinante designado CrepX. A sequência de nucleótidos do ADNc de CrepX foi determinada e é apresentada em SEQ ID N°: 3. A sequência de aminoácidos deduzida de CrepX (SEQ ID N°: 4) compreende uma proteína de 374 92 aminoácidos que tem 97% de identidade com a sequência de A12-epoxigenase Cpal2, mas apenas 57% de identidade com a sequência de Δ12-dessaturase de Arabidopsis thaliana L26296. Isto demonstra claramente a presença de um gene noutra Crepis sp. que tem um conteúdo elevado de ácido vernólico, cujo gene é altamente homólogo com o gene de A12-epoxigenase Cpal2 e não é claramente um gene de dessaturase.In one example of this approach, a full length A12-epoxygenase sequence was obtained from a Crepis sp. unidentified strain containing high levels of vernolic acid in its seed oils and known to be non-crepis palaestin. Poly (A) + RNA was isolated from developing seeds of this Crepis sp. using a QuickPrep Micro mRNA purification kit (Pharmacia Biotechnology) and used to synthesize a d (T) oligosaccharide-initiated double strand cDNA. The thus obtained double-stranded cDNA was then ligated into EcoRI / Notl adapters (Pharmacia Biotechnology) and a cDNA library was constructed using the Gigapack ZAP-cDNA cloning kit (Stratagene). The cDNA library on Hybond N + membrane filters (Amersham) was screened with the randomly labeled D12V fragment (SEQ ID NO: 7) derived from Crepis alpina as prescribed by the manufacturer, using standard hybridization conditions. This resulted in the purification of a recombinant bacteriophage called CrepX. The nucleotide sequence of the CrepX cDNA was determined and is shown in SEQ ID NO: 3. The deduced amino acid sequence of CrepX (SEQ ID NO: 4) comprises a 374 92 amino acid protein having 97% identity with the A12-epoxygenase sequence Cpal2, but only 57% identity to the Δ12-desaturase sequence of Arabidopsis thaliana L26296. This clearly demonstrates the presence of one gene in another Crepis sp. which has a high content of vernolic acid, whose gene is highly homologous with the A12-epoxygenase gene Cpal2 and is not clearly a desaturase gene.

Num segundo exemplo desta abordagem, uma sequência de tipo A12-epoxigenase parcial foi obtida a partir da espécie contendo ácido vernólico Vernonia galamensis. Foram preparados moldes de ADNc de primeira cadeia a partir de ARN total isolado de sementes em desenvolvimento de V. galamensis, utilizando processos convencionais.In a second example of this approach, a partial A12-epoxygenase-like sequence was obtained from the species containing Vernonia galamensis vernolic acid. First strand cDNA templates were prepared from total RNA isolated from developing seeds of V. galamensis, using standard procedures.

Um fragmento de PCR (550 nucleótidos em comprimento), designado como Vgall, foi obtido por amplificação do ADNc de cadeia simples utilizando iniciadores derivados a partir da sequência de aminoácidos deduzida de monooxigenases de função mista vegetais. A sequência de nucleótidos do ADN amplificado foi determinada utilizando processos convencionais e é apresentada em SEQ ID N°: 5. O alinhamento da sequência de aminoácidos deduzida do fragmento de PCR Vgall (SEQ ID N°: 6) com a sequência total deA PCR fragment (550 nucleotides in length), designated Vgall, was obtained by amplification of the single stranded cDNA using primers derived from the deduced amino acid sequence of plant mixed function monooxygenases. The nucleotide sequence of the amplified DNA was determined using standard procedures and is shown in SEQ ID NO: 5. Alignment of the deduced amino acid sequence of the Vgall PCR fragment (SEQ ID NO: 6) to the total sequence of

A12-epoxigenase Cpal2 e a A12-dessaturase de Arabidopsis thaliana L26296 (Figura 2) demonstra que a sequência Vgall amplificada codifica uma sequência de aminoácidos que corresponda à região que cobre os residuos de aminoácidos 103-285 do polipéptido Cpal2. Dentro desta região, a sequência de Vgall mostrou uma maior identidade de aminoácidos com a sequência de Al2-epoxigenase Cpal2 (67%) do que com a sequência de A12-dessaturase de A. thaliana (60%), sugerindo que o ADN 93 amplificado corresponde a uma sequência de epoxigenase em vez de dessaturase.A12-epoxygenase Cpal2 and Arabidopsis thaliana A12-desaturase L26296 (Figure 2) demonstrates that the amplified Vgall sequence encodes an amino acid sequence that corresponds to the region covering amino acid residues 103-285 of the Cpβ2 polypeptide. Within this region, the Vgall sequence showed a higher amino acid identity with the Al2-epoxyigenase sequence Cpal2 (67%) than with the A. thaliana A12-desaturase sequence (60%), suggesting that the amplified DNA 93 corresponds to an epoxygenase sequence instead of desaturase.

Os especialistas na técnica estarão cientes que a presente invenção é submetida a variações e modificações diferentes daquelas aqui especificamente descritas. É para ser compreendido que a invenção inclui todas essas variações e modificações. A invenção também inclui todos esses passos, características, composições e compostos referidos ou indicados nesta descrição, individualmente ou colectivamente, e qualquer uma e todas as combinações de quaisquer dois ou mais dos referidos passos ou caracteristicas.Those skilled in the art will appreciate that the present invention is subject to variations and modifications other than those specifically disclosed herein. It is to be understood that the invention includes all such variations and modifications. The invention also includes all such steps, features, compositions and compounds referred to or indicated in this disclosure, individually or collectively, and any and all combinations of any two or more of said steps or features.

REFERÊNCIAS 1. An et al. (1985) EMBO J. 4:277-284. 2. Ausubel, F. M., Brent, R., Kingston, RE, Moore, D.D., Seidman, J.G., Smith, J.A., e Struhl, K. (1987). Em: Current Protocols in Molecular Biology. Wiley Interscience (ISBN 047150338). 3. Badami, R.C., e Patil, K.B. (1981) Progress in Lipid Research, 19, 119-53. 4. Bafor, M., Smith, M.A., Jonsson, L., Stobart, K. eREFERENCES 1. An et al. (1985) EMBO J. 4: 277-284. 2. Ausubel, F.M., Brent, R., Kingston, RE, Moore, D.D., Seidman, J.G., Smith, J.A., and Struhl, K. (1987). In: Current Protocols in Molecular Biology. Wiley Interscience (ISBN 047150338). 3. Badami, R.C., and Patil, K.B. (1981) Progress in Lipid Research, 19, 119-53. 4. Bafor, M., Smith, M.A., Jonsson, L., Stobart, K. and

Stymne, S. (1993) Arch. Biochem. Biophys. 303, 145-151. 5. Bafor, M., Banas, A., Wiberg, E., Lenman, M., Stahl, U. eStymne, S. (1993) Arch. Biochem. Biophys. 303, 145-151. 5. Bafor, M., Banas, A., Wiberg, E., Lenman, M., Stahl, U. and

Stymne, S. (1997) Em: Williams, J.P., Mobasher, K.U., Lem, N.W. (eds) Physiology, biochemistry and molecular biology of plant lipids. Kluwer Academic Publisher, Dordrecht. Em impressão. 6. Blee and Schuber (1990) J. Biol. Chem. 265, 12887-12894. 94 7. Blee, E., Wilcox, A.L., Marnett, J.M., Schuber, F. (1993) J. Biol. Chem. 268, 1798-1715. 8. Blee, E., Stahl, S., Schuber, F. e Stymne, S. (1994) Biochem. Biophys. Res. Comm. 197, 778-784 9. Bligh, E.G. e Dyer, W.J. (1959) Can. J. Biochem. Physiol. 230, 379-288. 10. Bozak, K.R., Yu, H., Sirevag, R. e Christoffersen, R.E. (1990) Proc. Natl. Acad. Sei. USA 87, 3904-3908. 11. Christou, P., McCabe, D.E., Swain, W.F. (1988). Plant Physiol 87, 671-674. 12. Crossway et al. (1986) Mol. Gen. Genet. 202,179-185. 13. Devereux, J., Haeberli, P. e Smithies, O. (1984) . Nucl. Acids Res. 12, 387-395. 14. Dolferus et al. Plant Physiol. (1994) 105, 1075-1087. 15. Engeseth, N. &amp; Stymne, S. (1996) Planta 198, 238-245 16. Fromm et al. (1985) Proc. Natl. Acad Sei. (USA) 82, 5824-5828. 17. Haseloff, J. e Gerlach, W.L. (1988). Nature 334, 586-594. 18. Herrera-Estrella et al. (1983a) Nature 303, 209-213. 19. Herrera-Estrella et al. (1983b) EMBO J. 2, 987-995. 95 20. Herrera-Estrella et al. (1985) Em: Plant GeneticStymne, S. (1997) In: Williams, J.P., Mobasher, K.U., Lem, N.W. (eds) Physiology, biochemistry and molecular biology of plant lipids. Kluwer Academic Publisher, Dordrecht. In print. 6. Blee and Schuber (1990) J. Biol. Chem. 265, 12887-12894. 7. Blee, E., Wilcox, A.L., Marnett, J. M., Schuber, F. (1993) J. Biol. Chem. 268, 1798-1715. 8. Blee, E., Stahl, S., Schuber, F. and Stymne, S. (1994) Biochem. Biophys. Comm. 197, 778-784. 9. Bligh, E.G. and Dyer, W.J. (1959) Can. J. Biochem. Physiol. 230, 379-288. 10. Bozak, K.R., Yu, H., Sirevag, R. and Christoffersen, R.E. (1990) Proc. Natl. Acad. Know. USA 87, 3904-3908. 11. Christou, P., McCabe, D.E., Swain, W.F. (1988). Plant Physiol 87, 671-674. 12. Crossway et al. (1986) Mol Gen Genet. 202, 179-185. 13. Devereux, J., Haeberli, P. and Smithies, O. (1984). Nucl. Acids Res. 12, 387-395. 14. Dolferus et al. Plant Physiol. (1994) 105, 1075-1087. 15. Engeseth, N. &amp; Stymne, S. (1996) Plant 198, 238-245 16. Fromm et al. (1985) Proc. Natl. Acad Sci. (USA) 82, 5824-5828. 17. Haseloff, J. and Gerlach, W.L. (1988). Nature 334, 586-594. 18. Herrera-Estrella et al. (1983a) Nature 303, 209-213. 19. Herrera-Estrella et al. (1983b) EMBO J. 2, 987-995. 95 20. Herrera-Estrella et al. (1985) In: Plant Genetic

Engineering, Cambridge University Press, NY, pp 63-93. 21. Kohn, G., Hartmann, E., Stymne, S. &amp; Beutelmann, P. (1994) J. Plant Physiol. 144, 265-271 22. Krens, F.A., Molendijk, L., Wullems, G.J. eEngineering, Cambridge University Press, NY, pp 63-93. 21. Kohn, G., Hartmann, E., Stymne, S. &amp; Beutelmann, P. (1994) J. Plant Physiol. 144, 265-271 22. Krens, F.A., Molendijk, L., Wullems, G.J.

Schilperoort, R.A. (1982). Nature 296, 72-74. 23. Lawrence, G.J., Ellis, J.G., Finnegan, E.J., Dennis, E.S. e Peacock, W. J. (1989) em: Breeding Research: The Key to Survival of the Earth (Iyama, S. e Takeda, G. eds) 6th International Congress of SABRAO. pp 535-538. 24. Lazo, G.R., Stein, P.A. e Ludwig, R.A. (1991).Schilperoort, R.A. (1982). Nature 296, 72-74. 23. Lawrence, G.J., Ellis, J.G., Finnegan, E.J., Dennis, E.S. and Peacock, W. J. (1989) in: Breeding Research: The Key to Survival of the Earth (Iyama, S. and Takeda, G. eds) 6th International Congress of SABRAO. pp 535-538. 24. Lazo, G.R., Stein, P.A. and Ludwig, R.A. (1991).

Bio/technology 9, 963-967. 25. Needleman e Wunsch (1970) J. Mol. Biol. 48, 443-453. 26. Pazkowski et al. (1984) EMBO J. 3, 2717-2722. 27. Pietrzak, M., Shillito, R.D., Hohn, T. e Potrykus, I. (1986). Nucl. Acids Res. 14,5857-5868. 28. Sanger, F., Nicklin, S. e Coulson, A.R. (1977).Proc. Natl. Acad. Sei. (USA) 72, 5463-5467. 29. Shanklin, J., Whittle, E. e Fox, B.G. (1994) Biochemistry 33, 12787-12794. 30. Valvekens et al. (1988) Proc. Natl Acad. Sei. (USA) 85, 5536-5540. 96 LISTAGEM DE SEQUÊNCIAS (1) INFORMAÇÃO GERAL: (i) REQUERENTE: Commonwealth Scientific and Industrial Research Organisation AND Sten StymneBio / technology 9, 963-967. 25. Needleman and Wunsch (1970) J. Mol. Biol. 48, 443-453. 26. Pazkowski et al. (1984) EMBO J. 3, 2717-2722. 27. Pietrzak, M., Shillito, R.D., Hohn, T. and Potrykus, I. (1986). Nucl. Acids Res. 14, 857-5868. 28. Sanger, F., Nicklin, S. and Coulson, A.R. (1977). Natl. Acad. Know. (USA) 72, 5463-5467. 29. Shanklin, J., Whittle, E. and Fox, B.G. (1994) Biochemistry 33, 12787-12794. 30. Valvekens et al. (1988) Proc. Natl Acad. Know. (USA) 85, 5536-5540. 96 SEQUENCE LISTING (1) GENERAL INFORMATION: (i) APPLICANT: Commonwealth Scientific and Industrial Research Organization AND Sten Stymne

(ii) TÍTULO DA INVENÇÃO: GENES DE EPOXIGENASE DE ÁCIDO GORDO VEGETAL E SUAS UTILIZAÇÕES (iii) NUMERO DE SEQUÊNCIAS: 20 (iv) ENDEREÇO DE CORRESPONDÊNCIA:(ii) TITLE OF INVENTION: EPOXYGENASE GENES OF VEGETABLE FATTY ACID AND ITS UTILIZATIONS (iii) NUMBER OF SEQUENCES: 20 (iv) CORRESPONDENCE ADDRESS:

(A) DESTINATÁRIO: DAVIES COLISON CAVEARN(A) ADDRESSEE: DAVIES COLISON CAVEARN

(B) RUA: 1 LITTLE COLINS STREET(B) STREET: 1 LITTLE COLINS STREET

(C) CIDADE: MELBOURNE(C) CITY: MELBOURNE

(D) ESTADO: VICTORIA(D) STATE: VICTORIA

(E) PAÍS: AUSTRÁLIA (F) CÓDIGO POSTAL: 3000 (v) FORMA DE LEITURA POR COMPUTADOR: (A) TIPO DE MEIO: Disquete (B) COMPUTADOR: IBM PC compatível 97(E) COUNTRY: AUSTRALIA (F) POSTAL CODE: 3000 (v) COMPUTER READING FORM: (A) MEDIUM TYPE: Floppy disk (B) COMPUTER: IBM Compatible PC 97

(C) SISTEMA OPERATIVO: PC-DOS/MS-DOS (D) SOFTWARE: Patent In Release #1.0, Versão #1.25 (vi) DADOS DO PRESENTE PEDIDO: (A) NÚMERO DO PEDIDO: (B) DATA DE PEDIDO: (vii) DADOS DE PEDIDOS ANTERIORES: (A) NÚMERO DO PEDIDO: AU P06223 (B) DATA DE PEDIDO: 15-ABR-1997 (vii) DADOS DE PEDIDOS ANTERIORES: (A) NÚMERO DO PEDIDO: AU P06226 (B) DATA DE PEDIDO: 15-ABR-1997 (vii) DADOS DE PEDIDOS ANTERIORES: (A) NÚMERO DO PEDIDO: US 60/043706 (B) DATA DE PEDIDO: 16-ABR-1997 (vii) DADOS DE PEDIDOS ANTERIORES: (A) NÚMERO DO PEDIDO: US 60/050403 (B) DATA DE PEDIDO: 20-JUN-1997 (viii) INFORMAÇÃO DO MANDATÁRIO/AGENTE:(D) SOFTWARE: Patent In Release # 1.0, Version # 1.25 (vi) DATA OF THIS APPLICATION: (A) ORDER NUMBER: (B) ORDER DATE: ( vii) PREVIOUS ORDER DATA: (A) ORDER NUMBER: AU P06223 (B) ORDER DATE: APR 15, 1997 (vii) PREVIOUS ORDER DATA: (A) ORDER NUMBER: AU P06226 (B) DATE OF APPLICATION (Vii) PREVIOUS ORDERS: (A) APPLICATION NUMBER: US 60/043706 (B) ORDER DATE: APRIL 16, 1997 (vii) PREVIOUS ORDER DATA: (A) NUMBER OF ORDERS: ORDER FORM: US 60/050403 (B) ORDER DATE: JUN 20, 1997 (viii) INFORMATION BY THE MANDATORY / AGENT:

(A) NOME: HUGHES, DR. E JOHN L(A) NAME: HUGHES, DR. E JOHN L

(C) REFERÊNCIA/NÚMERO DE REGISTO: MRO/EJH/JMC 98 (ix) INFORMAÇÃO DE TELECOMUNICAÇÕES: (A) TELEFONE: +61 3 9254 2777 (B) TELEFAX: +61 3 9254 2770 (C) TELEX: AA 31787 (2) INFORMAÇÃO PARA SEQ ID N°: 1: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1358 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (ix) CARACTERÍSTICA:(C) TELECOMMUNICATIONS INFORMATION: (A) TELEPHONE: +61 3 9254 2777 (B) TELEFAX: +61 3 9254 2770 (C) TELEX: AA 31787 (C) 2) INFORMATION FOR SEQ ID NO: 1: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 1358 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: simple (D) TOPOLOGY: linear ) TYPE OF MOLECULE: DNA (ix) CHARACTERISTICS:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 30..1151 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 1 99 53(A) NAME / KEY: CDS (B) LOCATION: 30..1151 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 1 99 53

GAGAAGTTGA CCATAAATCA TTTATCAAC ATG GGT GCC GGC GGT CGT GGT CGG Met Gly Ala Gly Gly Arg Gly Arg 1 5 ACA TCG GAA AAA TCG GTC ATG GAA CGT GTC TCA GTT GAT CCA GTA ACC Thr Ser Glu Lys Ser Vai Met Glu Arg Vai Ser Vai Asp Pro Vai Thr 10 15 20 TTC TCA CTG AGT GAA TTG AAG CAA GCA ATC CCT CCC CAT TGC TTC CAG 100GAGAAGTTGA CCATAAATCA TTTATCAAC ATG GGT GCC GGC GGT CGT GGT CGG Met Gly Ala Gly Gly Arg Gly Arg 1 ACA TCG GAA AAA TCG GTC ATG GAA CGT GTC TCA GTT GAT CCA GTA ACC Thr Ser Glu Lys Ser Vai Met Glu Arg Will Go Asp Pro Go Thr 10 15 20 TTC TCA CTG AGT GAA TTG AAG CAA GCA ATC CCT CCC CAT TGC TTC CAG 100

Phe Ser Leu Ser Glu Leu Lys Gin Ala Ile Pro Pro His Cys Phe Gin 25 30 35 40 AGA TCT GTA ATC CGC TCA TCT TAC TAT GTT GTT CAA GAT CTC ATT ATT 197 Arg Ser Vai Ile Arg Ser Ser Tyr Tyr Vai Vai Gin Asp Leu Ile Ile 45 50 55 GCC TAC ATC TTC TAC TTC CTT GCC AAC ACA TAT ATC CCT ACT CTT CCT 245 Ala Tyr Ile Phe Tyr Phe Leu Ala Asn Thr Tyr ile Pro Thr Leu Pro 60 65 70 ACT AGT CTA GCC TAC TTA GCT TGG CCC GTT TAC TGG TTC TGT CAA GCT 293 Thr Ser Leu Ala Tyr Leu Ala Trp Pro Vai Tyr Trp Phe Cys Gin Ala 75 80 85 AGC GTC CTC ACT GGC TTA TGG ATC CTC GGC CAC GAA TGT GGT CAC CAT 341 Ser Vai Leu Thr Gly Leu Trp Ile Leu Gly His Glu Cys Gly His His 90 * 95 100 GCC TTT AGC AAC TAC ACA TGG TTT GAC GAC ACT GTG GGC TTC ATC CTC 389 Ala Phe Ser Asn Tyr Thr Trp Phe Asp Asp Thr Vai Gly Phe Ile Leu ‘105 110 115 120 CAC TCA TTT CTC CTC ACC CCG TAT TTC TCT TGG AAA TTC AGT CAC CGG 437 His Ser Phe Leu Leu Thr Pro Tyr Phe Ser Trp Lys Phe Ser His Arg 125 130 135 AAT CAC CAT TCC AAC ACA AGT TCG ATT GAT AAC GAT GAA GTT TAC ATT 485 Asn His His Ser Asn Thr Ser Ser lie Asp Asn Asp Glu Vai Tyr Ile 140 145 150 CCG AAA AGC AAG TCC AAA CTC GCG CGT ATC TAT AAA CTT CTT AAC AAC 533 Pro Lys Ser Lys Ser Lys Leu Ala Arg Ile Tyr Lys Leu Leu Asn Asn 155 160 165 CCA CCT GGT CGG CTG TTG GTT TTG ATT ATC ATG TTC ACC CTA GGA TTT 581 Pro Pro Gly Arg Leu Leu Vai Leu Ile Ile Met Phe Thr Leu Gly Phe 170 175 180 CCT TTA TAC CTC TTG ACA AAT ATT TCC GGC AAG AAA TAC GAC AGG TTT 629 101Phe Ser Leu Ser Glu Leu Lys Gin Ala Ile Pro Pro His Cys Phe Gin 25 30 35 40 AGA TCT GTA ATC CGC TCA TCT TAC TAT GTT GTT CAA GAT CTC ATT ATT 197 Arg Ser Vai Ile Arg Ser Ser Tyr Tyr Vai Vai Gin Asp Leu Ile Ile 45 50 55 GCC TAC ATC TTC TAC TTC CTT GCC AAC ACA TAT ATC CCT ACT CTT CCT 245 Wing Tyr Ile Phe Tyr Phe Leu Ala Asn Thr Tyr ile Pro Thr Leu Pro 60 65 70 ACT AGT CTA GCC TAC TTA GCT TGG CCC GTT TAC TGG TTC TGT CAA GCT 293 Thr Ser Leu Ala Tyr Leu Ala Trp Pro Vai Tyr Trp Phe Cys Gin Ala 75 80 85 AGC GTC CTC ACT GGC TTA TGG ATC CTC GGC CAC GAA TGT GGT CAC CAT 341 Ser Vai Leu Thr Gly Leu Trp Ile Leu Gly His Glu Cys Gly His His 90 * 95 100 GCC TTT AGC AAC TAC ACA TGG TTT GAC GAC ACT GTG GGC TTC ATC CTC 389 Ala Phe Ser Asn Tyr Thr Trp Phe Asp Asp Thr Val Gly Phe Ile Leu '105 110 115 120 CAC TCA TTT CTC CTC ACC CCG TAT TTC TCT TGG AAA TTC AGT CAC CGG 437 His Ser Phe Leu Leu Thr Pro Tyr P he Ser Trp Lys Phe Ser His Arg 125 130 135 AAT CAC CAT TCC AAC ACA AGT TCG ATT GAT AAC GAT GAA GTT TAC ATT 485 Asn His His Ser Asn Thr Ser Ser lie Asp Asn Asp Glu Val Tyr Ile 140 145 150 CCG AAA AGC AAG TCC AAA CTC GCG CGT ATC TAT AAA CTT CTT AAC AAC 533 Pro Lys Ser Lys Ser Lys Leu Ala Arg Ile Tyr Lys Leu Leu Asn Asn 155 160 165 CCA CCT GGT CGG CTG TTG GTT TTG ATT ATC ATG TTC ACC CTA GGA TTT 581 Pro Pro Gly Arg Leu Leu Leu Ile Ile Met Phe Thr Leu Gly Phe 170 175 180 CCT TTA TAC CTC TTG ACA AAT ATT TCC GGC AAG AAA TAC GAC AGT TTT 629 101

Pro Leu Tyr Leu Leu Thr Asn Ile Ser Gly Lys Lys 185 190 195Pro Leu Tyr Leu Leu Thr Asn Ile Ser Gly Lys Lys 185 190 195

Tyr Asp Arg Phe 200 GCC AAC CAC TTC GAC CCC ATG AGT CCA ATT TTC AAA GAA CGT GAG CGG 677 Ala Asn His Phe Asp Pro Met Ser Pro Ile Phe Lys Glu Arg Glu Arg 205 210 215 TTT CAG GTC TTC CTT TCG GAT CTT GGT CTT CTT GCC GTG TTT TAT GGA 725 Phe Gin Vai Phe Leu Ser Asp Leu Gly Leu Leu Ala Vai Phe Tyr Gly 220 225 230 ATT AAA GTT GCT GTA GCA AAT AAA GGA GCT GCT TGG GTA GCG TGC ATG 773 Ile Lys Vai Ala Vai Ala Asn Lys Gly Ala Ala Trp Vai Ala Cys Met 235 240 245 TAT GGA GTT CCG GTA TTA GGC GTA TTT ACC TTT TTC GAT GTG ATC ACC 821 Tyr Gly Vai Pro Vai Leu Gly Vai Phe Thr Phe Phe Asp Vai Ile Thr 250 255 260 TTC TTG CAC CAC ACC CAT CAG TCG TCG CCT CAT TAT GAT TCA ACT GAA 869 Phe Leu His His Thr His Gin Ser Ser Pro His Tyr Asp Ser Thr Glu 265 270 275 280 TGG AAC TGG ATC AGA GGG GCC TTG TCA GCA ATC GAT AGG GAC TTT GGA 917 Trp Asn Trp Ile Arg Gly Ala Leu Ser Ala Ile Asp Arg Asp Phe Gly 285 290 295 TTC CTG AAT AGT GTT TTC CAT GAT GTT ACA CAC ACT CAT GTC ATG CAT 965 Phe Leu Asn Ser Vai Phe His Asp Vai Thr His Thr His Vai Met His 300 305 310 CAT TTG TTT TCA TAC ATT CCA CAC TAT CAT GCA AAG GAG GCA AGG GAT 1013 His Leu Phe Ser Tyr Ile Pro His Tyr His Ala Lys Glu Ala Arg Asp 315 320 325 GCA ATC AAG CCA ATC TTG GGC GAC TTT TAT ATG ATC GAC AGG ACT CCA 1061 Ala Ile Lys Pro Ile Leu Gly Asp Phe Tyr Met Ile Asp Arg Thr Pro 330 335 340 ATT TTA AAA GCA ATG TGG AGA GAG GGC AGG GAG TGC ATG TAC ATC GAG 1109 102 1151Tyr Asp Arg Phe 200 GCC AAC CAC TTC GAC CCC ATG AGT CCA ATT TTC AAA GAA CGT GAG CGG 677 Wing Asn His Phe Asp Pro Met Ser Pro Ile Phe Lys Glu Arg Glu Arg 205 210 215 TTT CAG GTC TTC CTT TCG GAT CTT GGT CTT CTT GCC GTG TTT TAT GGA 725 Phe Gin Go Phe Leu Ser Asp Leu Gly Leu Leu Ala Go Phe Tyr Gly 220 225 230 ATT AAA GTT GCT GTA GCA AAT AAA GGA GCT GCT TGG GTA GCG TGC ATG 773 Ile Lys Go Ala Go Ala Asn Lys Gly Ala Ala Trp Go Ala Cys Met 235 240 245 TAT GGA GTT CCG GTA TTA GGC GTA TTT ACC TTT TTC GAT GTG ATC ACC 821 Tyr Gly Vai Pro Go Leu Gly Go Phe Thr Phe Phe Asp Go Ile Thr 250 255 260 TTC TTG CAC CAC ACC CAT CAG TCG TCG CCT CAT TAT GAT TCA ACT GAA 869 Phe Leu His His Thr His His Ser Ser Pro His Tyr Asp Ser Thr Glu 265 270 275 280 TGG AAC TGG ATC AGA GGG GCC TTG TCA GCA ATC GAT AGG GAC TTT GGA 917 Trp Asn Trp Ile Arg Gly Ala Leu Ser Ala Ile Asp Arg Asp Phe Gly 285 290 295 TTC C TG AAT AGT GTT TTC CAT GAT GTT ACA CAC ACT CAT GTC ATG CAT 965 Phe Leu Asn Ser Go Phe His Asp Go His Thr His Go His Met His 300 305 310 CAT TTG TTT TCA TAC ATT CCA CAC TAT CAT GCA AAG GAG GCA AGG GAT 1013 His Leu Phe Ser Tyr Ile Pro His Tyr His Ala Lys Glu Ala Arg Asp 315 320 325 GCA ATC AAG CCA ATC TTG GGC GAC TTT TAT ATG ATC GAC AGG ACT CCA 1061 Ala Ile Lys Pro Ile Leu Gly Asp Phe Tyr Met Ile Asp Arg Thr Pro 330 335 340 ATT TTA AAA GCA ATG TGG AGA GAG GGC AGG GAG TGC ATG TAC ATC GAG 1109 102 1151

Ile Leu Lys Ala Met Trp Arg Glu Gly Arg Glu Cys Met Tyr Ile Glu 345 350 355 360Ile Leu Lys Ala Met Trp Arg Glu Gly Arg Glu Cys Met Tyr Ile Glu 345 350 355 360

CCT GAT AGC AAG CTC AAA GGT GTT TAT TGG TAT CAT AAA TTGCCT GAT AGC AAG CTC AAA GGT GTT TAT TGG TAT CAT AAA TTG

Pro Asp Ser Lys Leu Lys Gly Vai Tyr Trp Tyr His Lys Leu 365 370 1211 1271 1331 1358Pro Asp Ser Lys Leu Lys Gly Vai Tyr Trp Tyr His Lys Leu 365 370 1211 1271 1331 1358

TGATCATATG CAAAATGCAC ATGCATTTTC AAACCCTCTA GTTACGTTTG TTCTATGTAT AATAAACCGC CGGTCCTTTG GTTGACTATG CCTAAGCCAG GCGAAACAGT TAAATAATAT CGGTATGATG TGTAATGAAA GTATGTGGTT GTCTGGTTTT GTTGCTATGA AAGAAAGTAT GTGGTTGTCG GTCAAAAAAA AAAAAAA (2) INFORMAÇÃO PARA SEQ ID N°: 2: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 374 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 2:TGATCATATG CAAAATGCAC ATGCATTTTC AAACCCTCTA GTTACGTTTG TTCTATGTAT AATAAACCGC CGGTCCTTTG GTTGACTATG CCTAAGCCAG GCGAAACAGT TAAATAATAT CGGTATGATG TGTAATGAAA GTATGTGGTT GTCTGGTTTT GTTGCTATGA AAGAAAGTAT GTGGTTGTCG GTCAAAAAAA AAAAAAA (2) INFORMATION FOR SEQ ID NO: 2: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 374 amino acids (B) TYPE: amino acid (D) TOPOLOGY: linear (ii) MOLECULE TYPE: protein (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 2:

Met Gly Ala Gly Gly Arg Gly Arg Thr Ser Glu Lys Ser Vai Met Glu 15 10 15Met Gly Ala Gly Gly Arg Gly Arg Thr Ser Glu Lys Ser Vai Met Glu 15 10 15

Arg Val Ser Vai Asp Pro Vai Thr Phe Ser Leu Ser Glu Leu Lys Gin 20 25 30Arg Val Ser Go Asp Pro Go Thr Phe Ser Leu Ser Glu Leu Lys Gin 20 25 30

Ala Ile Pro Pro His Cys Phe Gin Arg Ser Val Ile Arg Ser Ser Tyr 35 40 45Ala Ile Pro Pro His Cys Phe Gin Arg Ser Val Ile Arg Ser Ser Tyr 35 40 45

Tyr Val Val Gin Asp Leu Ile Ile Ala Tyr Ile Phe Tyr Phe Leu Ala 50 55 60 103Tyr Val Val Gin Asp Leu Ile Ile Ala Tyr Ile Phe Tyr Phe Leu Ala 50 55 60 103

Asn Thr Tyr Ile Pro Thr Leu Pro Thr Ser Leu Ala Tyr Leu Ala Trp 65 70 75 80Asn Thr Tyr Ile Pro Thr Leu Pro Thr Ser Leu Ala Tyr Leu Ala Trp 65 70 75 80

Pro Vai Tyr Trp Phe Cys Gin Ala Ser Vai Leu Thr Gly Leu Trp Ile 85 90 95Pro Vai Tyr Trp Phe Cys Gin Ala Ser Vai Leu Thr Gly Leu Trp Ile 85 90 95

Leu Gly His Glu Cys Gly His His Ala Phe Ser Asn Tyr Thr Trp Phe 100 105 110Leu Gly His Glu Cys Gly His His Ala Phe Ser Asn Tyr Thr Trp Phe 100 105 110

Asp Asp Thr Vai Gly Phe Ile Leu His Ser Phe Leu Leu Thr Pro Tyr 115 120 125Asp Asp Thr Val Gly Phe Ile Leu His Ser Phe Leu Leu Thr Pro Tyr 115 120 125

Phe Ser Trp Lys Phe Ser His Arg Asn His His Ser Asn Thr Ser Ser 130 135 140Phe Ser Trp Lys Phe Ser His Arg Asn His His Ser Asn Thr Ser Ser 130 135 140

Ile Asp Asn Asp Glu Vai Tyr Ile Pro Lys Ser Lys Ser Lys Leu Ala 145 150 155 160Ile Asp Asn Asp Glu Vai Tyr Ile Pro Lys Ser Lys Ser Lys Leu Ala 145 150 155 160

Arg Ile Tyr Lys Leu Leu Asn Asn Pro Pro Gly Arg Leu Leu Vai Leu 165 170 175Arg Ile Tyr Lys Leu Leu Asn Asn Pro Pro Gly Arg Leu Leu Vai Leu 165 170 175

Ile Ile Met Phe Thr Leu Gly Phe Pro Leu Tyr Leu Leu Thr Asn Ile 1B0 185 190Ile Ile Met Phe Thr Leu Gly Phe Pro Leu Tyr Leu Leu Thr Asn Ile 1B0 185 190

Ser Gly Lys Lys Tyr Asp Arg Phe Ala Asn His Phe Asp Pro Met Ser 195 200 205Ser Gly Lys Lys Tyr Asp Arg Phe Ala Asn His Phe Asp Pro Met Ser 195 200 205

Pro Ile Phe Lys Glu Arg Glu Arg Phe Gin Vai Phe Leu Ser Asp Leu 210 215 220Pro Ile Phe Lys Glu Arg Glu Arg Phe Gin Phe Leu Ser Asp Leu 210 215 220

Gly Leu Leu Ala Vai Phe Tyr Gly Ile Lys Vai Ala Vai Ala Asn Lys 225 230 235 240Gly Leu Leu Ala Go Phe Tyr Gly Ile Lys Go Wing Go Wing Asn Lys 225 230 235 240

Gly Ala Ala Trp Vai Ala Cys Met Tyr Gly Vai Pro Vai Leu Gly Vai 245 250 255Gly Ala Ala Trp Go Ala Cys Met Tyr Gly Go Pro Go Go Leu Gly Go 245 250 255

Phe Thr Phe Phe Asp Vai Ile Thr Phe Leu His His Thr His Gin Ser 260 265 270 104Phe Thr Phe Phe Asp Ile Ile Thr Phe Leu His His Thr His Gin Ser 260 265 270 104

Ser Pro His Tyr Asp Ser Thr Glu Trp Asn Trp Ile Arg Gly Ala Leu 275 280 285Ser Pro His Tyr Asp Ser Thr Glu Trp Asn Trp Ile Arg Gly Ala Leu 275 280 285

Ser Ala Ile Asp Arg Asp Phe Gly Phe Leu Asn Ser Vai Phe His Asp 290 295 300Be Ala Ile Asp Arg Asp Phe Gly Phe Leu Asn Ser Vai Phe His Asp 290 295 300

Vai Thr His Thr His Vai Met His His Leu Phe Ser Tyr Ile Pro His 305 310 315 320Go Thr His Thr His Go His His His Leu Phe Ser Tyr Ile Pro His 305 310 315 320

Tyr His Ala Lys Glu Ala Arg Asp Ala Ile Lys Pro Ile Leu Gly Asp 325 330 335Tyr His Ala Lys Glu Ala Arg Asp Ala Ile Lys Pro Ile Leu Gly Asp 325 330 335

Phe Tyr Met Ile Asp Arg Thr Pro Ile Leu Lys Ala Met Trp Arg Glu 340 345 350Phe Tyr Met Ile Asp Arg Thr Pro Ile Leu Lys Ala Met Trp Arg Glu 340 345 350

Gly Arg Glu Cys Met Tyr Ile Glu Pro Asp Ser Lys Leu Lys Gly Vai 355 360 365Gly Arg Glu Cys Met Tyr Ile Glu Pro Asp Ser Lys Leu Lys Gly Vai 355 360 365

Tyr Trp Tyr His Lys Leu 370 (2) INFORMAÇÃO PARA SEQ ID N°: 3: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1312 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (vi) FONTE ORIGINAL: (A) ORGANISMO: Crepis sp. 105Tyr Trp Tyr His Lys Leu 370 (2) INFORMATION FOR SEQ ID NO: 3: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 1312 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: simple (D) TOPOLOGY: linear (ii) TYPE OF MOLECULE: DNA (vi) ORIGINAL SOURCE: (A) ORGANISM: Crepis sp. 105

(ix) CARACTERISTICA(ix) CHARACTERISTICS

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 26..1147 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 3: TGTTGACCAT AAATCATCTA TCAAC ATG GGT GCC GGC GGC CGT GGT CGG ACA 52 Met Gly Ala Gly Gly Arg Gly Arg Thr 1 5 TCG GAA AAG TCG GTC ATG GAA CGT GTC TCA GTT GAT CCA GTA ACC TTC 100 Ser Glu Lys Ser Vai Met Glu Arg Vai Ser Vai Asp Pro Vai Thr Phe 10 15 20 25 TCA CTG AGT GAT TTG AAG CAA GCA ATC CCT CCA CAT TGC TTC CAG CGA 148 Ser Leu Ser Asp Leu Lys Gin Ala Ile Pro Pro His Cys Phe Gin Arg 30 35 40 TCT GTC ATC CGT TCA TCT TAT TAC GTT GTT CAG GAT CTC ATA ATT GCC 196 Ser Vai Ile Arg Ser Ser Tyr Tyr Vai Vai Gin Asp Leu Ile Ile Ala 45 50 55 TAC ATC TTC TAC TTC CTT GCC AAC ACA TAT ATC CCT AAT CTC CCT CAT 244 Tyr Ile Phe Tyr Phe Leu Ala Asn Thr Tyr Ile Pro Asn Leu Pro His 60 65 70 CCT CTA GCC TAC TTA GCT TGG CCG CTT TAC TGG TTC TGT CAA GCT AGC 292 Pro Leu Ala Tyr Leu Ala Trp Pro Leu Tyr Trp Phe Cys Gin Ala Ser 75 80 85 GTC CTC ACT GGG TTA TGG ATC CTC GGC CAT GAA TGT GGT CAC CAT GCC 340 Vai Leu Thr Gly Leu Trp Ile Leu Gly His Glu Cys Gly His His Ala 90 95 100 105 TAT AGC AAC TAC ACA TGG GTT GAC GAC ACT GTG GGC TTC ATC ATC CAT 388 Tyr Ser Asn Tyr Thr Trp Vai Asp Asp Thr Vai Gly Phe Ile lie His 110 115 120 TCA TTT CTC CTC ACC CCG TAT TTC TCT TGG AAA TAC AGT CAC CGG AAT 436 Ser Phe Leu Leu Thr Pro Tyr Phe Ser Trp Lys Tyr Ser His Arg Asn 125 130 135 106 484 CAC CAT TCC AAC ACA AGT His His Ser Asn Thr Ser 140 AAA AGC AAG TCC AAA CTC Lys Ser Lys Ser Lys Leu 155 CCT GGT CGA CTG TTG GTT Pro Gly Arg Leu Leu Vai 170 175 TTA TAC CTC TTG ACA AAT Leu Tyr Leu Leu Thr Asn 190 AAC CAC TTC GAC CCC ATG Asn His Phe Asp Pro Met 205 CAG GTC TTC CTT TCG GAT Gin Vai Phe Leu Ser Asp 220 AAA GTT GCT GTA GCA AAT Lys Vai Ala Vai Ala Asn 235 GGA GTT CCG GTG CTA GGC Gly Vai Pro Vai Leu Gly 250 255 TTA CAC CAC ACC CAT CAG Leu His His Thr His Gin 270 AAC TGG ATC AGA GGG GCT Asn Trp Ile Arg Gly Ala 285 TCG ATT GAT AAC GAT GAA Ser Ile Asp Asn Asp Glu 145 AAG CGT ATC TAT AAA CTT Lys Arg Ile Tyr Lys Leu ieo 165 TTG GTT ATC ATG TTC ACC Leu Vai Ile Met Phe Thr 180 ATT TCC GGC AAG AAA TAC Ile Ser Gly Lys Lys Tyr 195 AGT CCA ATT TTC AAA GAA Ser Pro Ile Phe Lys Glu 210 CTT GGT CTT CTT GCT GTG Leu Gly Leu Leu Ala Vai 225 AAA GGA GCT GCT TGG GTG Lys Gly Ala Ala Trp Vai 240 245 GTA TTT ACC TTT TTC GAT Vai Phe Thr Phe Phe Asp 260 TCG TCG CCT CAT TAT GAT Ser Ser Pro His Tyr Asp 275 TTG TCA GCA ATC GAT AGN Leu Ser Ala Ile Asp Arg 290 GTT TAC ATT CCG vai Tyr ile Pro 150 CTT AAC AAC CCA 532 Leu Asn Asn Pro CTA GGA TTT CCT 580 Leu Gly Phe Pro 185 GAT AGG TTT GCC 628 Asp Arg Phe Ala 200 CGT GAG CGG TTT 676 Arg Glu Arg Phe 215 TTT TAT GGA ATT 724 Phe Tyr Gly Ile 230 GCG TGC ATG TAT 772 Ala Cys Met Tyr GTG ATC ACG TTC 820 Vai Ile Thr Phe 265 TCA ACT GAA TGG 868 Ser Thr Glu Trp 280 GAC TTT GGG TTC 916 Asp Phe Gly Phe 295 107 CTG AAT AGT GTT TTC CAT GAT GTN ACA CAC ACT CAC GTC ATG CAT CAT 964 Leu Asn Ser Vai Phe His Asp Vai Thr His Thr His Vai Met His His 300 305 310 TTG TTT TCA TAC ATT CCA CAC TAT CAT GCA AAG GAA GCA AGG GAT GCA 1012 Leu Phe Ser Tyr Ile Pro His Tyr His Ala Lys Glu Ala Arg Asp Ala 315 320 325 ATC AAA CCG ATC TTG GGC GAC TTT TAT ATG ATC GAT AGG ACT CCA ATT 1060 Xle Lys Pro Ile Leu Gly Asp Phe Tyr Met Ile Asp Arg Thr Pro Ile 330 335 340 345 TTA AAA GCA ATG TGG AGA GAG GGC AGG GAA TGC ATG TAC ATC GAG CCT 1108 Leu Lys Ala Met Trp Arg Glu Gly Arg Glu Cys Met Tyr Ile Glu Pro 350 355 360 GAT AGC AAG CTC AAA GGT GTT TAT TGG TAT CAT AAA TTG TGATCATATG 1157 Asp Ser Lys Leu Lys Gly Vai Tyr Trp Tyr His Lys Leu 365 370 CAAAATGCAC ATGCATTTTC AAACCCTCTA GTTACCTTTG TTCTATGTAT AATAAGACCG 1217 CCGGTCCTAT GGTTTTCTAT GCCTAAGCCA GGCGAAATAG TTAAATAATA TCGGTATGAT 1277 GTAATGAAAG TATGTGGTTG TCTAAAAAAA AAAAA 1312 (2) INFORMAÇÃO PARA SEQ ID N°: 4: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 374 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 4: 108(A) NAME / KEY: CDS (B) LOCATION: 26..1147 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 3: TGTTGACCAT AAATCATCTA TCAAC ATG GGT GCC GGC GGC CGT GGT CGG ACA 52 Met Gly Ala Gly Gly Arg Gly Arg Thr 1 5 TCG GAA AAG TCG GTC ATG GAA CGT GTC TCA GTT GAT CCA GTA ACC TTC 100 Ser Glu Lys Ser Vai Met Glu Arg Will Be Go Asp Pro Go Thr Phe 10 15 20 25 TCA CTG AGT GAT TTG AAG CAA GCA ATC CCT CCA CAT TGC TTC CAG CGA 148 Ser Leu Ser Asp Leu Lys Gin Ile Ile Pro Pro His Cys Phe Gin Arg 30 35 40 TCT GTC ATC CGT TCA TCT TAT TAC GTT GTT CAG GAT CTC ATA ATT GCC 196 Ser Vai Ile Arg Ser Ser Tyr Tyr Go Go Gin Asp Leu Ile Ile Ala 45 50 55 TAC ATC TTC TAC TTC CTT GCC AAC ACA TAT ATC CCT AAT CTC CCT CAT 244 Tyr Ile Phe Tyr Phe Leu Ala Asn Thr Tyr Ile Pro Asn Leu Pro His 60 65 70 CCT CTA GCC TAC TTA GCT TGG CCG CTT TAC TGG TTC TGT CAA GCT AGC 292 Pro Leu Ala Tyr Leu Ala Trp Pro Leu Tyr Trp Phe Cys Gin Ala Ser 75 80 85 GTC CTC ACT GGG TTA TGG ATC CTC GGC CAT GAA TGT GGT CAC CAT GCC 340 Go Leu Thr Gly Leu Trp Ile Leu Gly His Glu Cys Gly His His Ala 90 95 100 105 TAT AGC AAC TAC ACA TGG GTT GAC GAC ACT GTG GGC TTC ATC ATC CAT 388 Tyr Ser Asn Tyr Thr Trp Go Asp Asp Thr Go Gly Phe Ile Ile His 110 115 120 TCA TTT CTC CTC ACC CCG TAT TTC TCT TGG AAA TAC AGT CAC CGG AAT 436 Ser Phe Leu Leu Thr Pro Tyr Phe Ser Trp Lys Tyr Ser His Arg Asn 125 130 135 106 484 CAC CAT TCC AAC ACA AGT His His Ser Asn Thr Ser 140 AAA AGC AAG TCC AAA CTC Lys Ser Lys Ser Lys Leu 155 CCT GGT CGA CTG TTG GTT Pro Gly Arg Leu Leu Vai 170 175 TTA TAC CTC TTG ACA AAT Leu Tyr Leu Leu Thr Asn 190 AAC CAC TTC GAC CCC ATG Asn His Phe Asp Pro Met 205 CAG GTC TTC CTT TCG GAT Gin Phe Leu Ser Asp 220 AAA GTT GCT GTA GCA AAT Lys Go Ala Goa Wing Asn 235 GGA GTT CCG GTG CTA GGC Gly Go Pro Go Leu Gly 250 255 TTA CAC CAC ACC CAT CAG Leu His His Thr His Gin 270 AAC TGG ATC AGA GGG GCT Asn Trp Ile Arg Gly Ala 285 TCG ATT GAT AAC GAT GAA Ser Ile Asp Asn Asp Glu 145 AAG CGT ATC TAT AAA CTT Lys Arg Ile Tyr Lys Leu ile 165 TTG GTT ATC ATG TTC ACC Leu Ile Ile Phe Thr 180 ATT TCC GGC AAG AAA TAC Ile Ser Gly Lys Lys Tyr 195 AGT CCA ATT TTC AAA GAA Ser Pro Ile Phe Lys Glu 210 CTT GGT CTT CTT GCT GTG Leu Gly Leu Leu Ala Go 225 AAA GGA GCT GCT TGG GTG Lys Gly Ala Ala Trp Go 240 245 GTA TTT ACC TTT TTC GAT Go Phe Thr Phe Phe Asp 260 TCG TCG CCT CAT TAT GAT Ser Ser Pro His Tyr Asp 275 TTG TCA GCA ATC GAT AGN Leu Ser Ala Ile Asp Arg 290 GTT TAC ATT CCG is Tyr ile Pro 150 CTT AAC AAC CCA 532 Leu Asn Asn Pro CTA GGA TTT CCT 580 Leu Gly Phe Pro 185 GAT AGG TTT GCC 628 Asp Arg Phe Ala 200 CGT GAG CGG TTT 676 Arg Glu Arg Phe 215 TTT TAT GGA ATT 724 Phe Tyr Gly Ile 230 GCG TGC ATG TAT 772 Wing Cys Met Tyr GTG ATC ACG TTC 820 Vai Ile Thr Phe 265 TCA ACT GAA TGG 868 Ser Thr Glu Trp 280 GAC TTT GGG TTC 916 Asp Phe Gly Phe 295 107 CTG AAT AGT GTT TTC CAT GAT GTN ACA CAC ACT CAC GTC ATG CAT CAT 964 Leu Asn Ser Go To His His Asp Go His Thr His To His Met His His 300 305 310 TTG TTT TCA TAC ATT CCA CAC TAT CAT GCA AAG GAA GCA AGG GAT GCA 1012 Leu Phe Ser Tyr Ile Pro His Tyr His Ala Lys Glu Ala Arg Asp Ala 315 320 325 ATC AAA CCG ATC TTG GGC GAC TTT TAT ATG ATC GAT AGG ACT CCA ATT 1060 Xle Lys Pro Ile Leu Gly Asp Phe Tyr Met Ile Asp Arg Thr Pro Ile 330 335 340 345 TTA AAA GCA ATG TGG AGA GAG GGC AGG GAA TGC ATG TAC ATC GAG CCT 1108 Leu Lys Ala Met Trp Arg Glu Gly Arg Glu Cys Met Tyr Ile Glu Pro 350 355 360 GAT AGC AAG CTC AAA GGT GTT TAT TGG TAT CAT AAA TTG TGATCATATG 1157 Asp Ser Lys Leu Lys Gly Vai Tyr Trp Tyr His Lys Leu 365 370 CAAAATGCAC ATGCATTTTC AAACCCTCTA GTTACC TTTG TTCTATGTAT AATAAGACCG 1217 CCGGTCCTAT GGTTTTCTAT GCCTAAGCCA GGCGAAATAG TTAAATAATA TCGGTATGAT 1277 GTAATGAAAG TATGTGGTTG TCTAAAAAAA AAAAA 1312 (2) INFORMATION FOR SEQ ID NO: 4: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 374 amino acids (B) TYPE: amino acid (D ) TOPOLOGY: linear (ii) MOLECULE TYPE: protein (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 4: 108

Met Gly Ala Gly Gly Arg Gly Arg Thr Ser Glu Lys Ser Vai Met Glu 15 10 15Met Gly Ala Gly Gly Arg Gly Arg Thr Ser Glu Lys Ser Vai Met Glu 15 10 15

Arg Vai Ser Vai Asp Pro Vai Thr Phe Ser Leu Ser Asp Leu Lys Gin 20 25 30Arg Will Go Asp Pro Will Thr Phe Be Leu Ser Asp Leu Lys Gin 20 25 30

Ala Ile Pro Pro His Cys Phe Gin Arg Ser Vai Ile Arg Ser Ser Tyr 35 40 45Ala Ile Pro Pro His Cys Phe Gin Arg Ser Vai Ile Arg Ser Ser Tyr 35 40 45

Tyr Vai Vai Gin Asp Leu Ile Ile Ala Tyr Ile Phe Tyr Phe Leu Ala 50 55 60Tyr Go Vai Gin Asp Leu Ile Ile Ala Tyr Ile Phe Tyr Phe Leu Ala 50 55 60

Asn Thr Tyr Ile Pro Asn Leu Pro His Pro Leu Ala Tyr Leu Ala Trp 65 70 75 80Asn Thr Tyr Ile Pro Asn Leu Pro His Pro Leu Ala Tyr Leu Ala Trp 65 70 75 80

Pro Leu Tyr Trp Phe Cys Gin Ala Ser Vai Leu Thr Gly Leu Trp Ile 85 90 95Pro Leu Tyr Trp Phe Cys Gin Ala Ser Vai Leu Thr Gly Leu Trp Ile 85 90 95

Leu Gly His Glu Cys Gly His His Ala Tyr Ser Asn Tyr Thr Trp Vai 100 105 110Leu Gly His Glu Cys Gly His His Ala Tyr Ser Asn Tyr Thr Trp Val 100 105 110

Asp Asp Thr Vai Gly Phe Ile Ile His Ser Phe Leu Leu Thr Pro Tyr 115 120 125Asp Asp Thr Val Gly Phe Ile Ile His Phe Leu Leu Thr Pro Tyr 115 120 125

Phe Ser Trp Lys Tyr Ser His Arg Asn His His Ser Asn Thr Ser Ser 130 135 140Phe Ser Trp Lys Tyr Ser His Arg Asn His His Ser Asn Thr Ser Ser 130 135 140

Ile Asp Asn Asp Glu Vai Tyr Ile 145 150Ile Asp Asn Asp Glu Vai Tyr Ile 145 150

Arg Ile Tyr Lys Leu Leu Asn Asn 165Arg Ile Tyr Lys Leu Leu Asn Asn 165

Vai Ile Met Phe Thr Leu Gly Phe 180Go Ile Met Phe Thr Leu Gly Phe 180

Ser Gly Lys Lys Tyr Asp Arg Phe 195 200Ser Gly Lys Lys Tyr Asp Arg Phe 195 200

Pro Ile Phe Lys Glu Arg Glu Arg 210 215Pro Ile Phe Lys Glu Arg Glu Arg 210 215

Pro Lys Ser Lys Ser Lys Leu Lys 155 160Pro Lys Ser Lys Ser Lys Leu Lys 155 160

Pro Pro Gly Arg Leu Leu Vai Leu 170 175Pro Pro Gly Arg Leu Leu Vai Leu 170 175

Pro Leu Tyr Leu Leu Thr Asn Ile 185 190Pro Leu Tyr Leu Leu Thr Asn Ile 185 190

Ala Asn His Phe Asp Pro Met Ser 205Ala Asn His Phe Asp Pro Met Ser 205

Phe Gin Vai Phe Leu Ser Asp Leu 220 109Phe Gin Vai Phe Leu Ser Asp Leu 220 109

Gly Leu Leu Ala Vai Phe Tyr Gly 225 230Gly Leu Leu Ala Go Phe Tyr Gly 225 230

Gly Ala Ala Trp Vai Ala Cys Met 245Gly Ala Ala Trp Go Ala Cys Met 245

Phe Thr Phe Phe Asp Vai Ile Thr 260Phe Thr Phe Phe Asp Val Ile Thr 260

Ser Pro His Tyr Asp Ser Thr Glu 275 280Ser Pro His Tyr Asp Ser Thr Glu 275 280

Ser Ala Ile Asp Arg Asp Phe Gly 290 295Ser Ala Ile Asp Arg Asp Phe Gly 290 295

Ile Lys Vai Ala Vai Ala Asn Lys 235 240Ile Lys Goes Ala Goes Ala Asn Lys 235 240

Tyr Gly Vai Pro Vai Leu Gly Vai 250 255Tyr Gly Go Pro Go Go Leu Gly Go 250 255

Phe Leu His His Thr His Gin Ser 265 270Phe Leu His His Thr His Gin Ser 265 270

Trp Asn Trp Ile Arg Gly Ala Leu 285Trp Asn Trp Ile Arg Gly Ala Leu 285

Phe Leu Asn Ser Vai Phe His Asp 300Phe Leu Asn Ser Go Phe His Asp 300

Vai Thr His Thr His Vai Met His His Leu Phe Ser Tyr Ile Pro His 305 310 315 320Go Thr His Thr His Go His His His Leu Phe Ser Tyr Ile Pro His 305 310 315 320

Tyr His Ala Lys Glu Ala Arg Asp Ala Ile Lys Pro Ile Leu Gly Asp 325 330 335Tyr His Ala Lys Glu Ala Arg Asp Ala Ile Lys Pro Ile Leu Gly Asp 325 330 335

Phe Tyr Met Ile Asp Arg Thr Pro Ile Leu Lys Ala Met Trp Arg Glu 340 345 350Phe Tyr Met Ile Asp Arg Thr Pro Ile Leu Lys Ala Met Trp Arg Glu 340 345 350

Gly Arg Glu Cys Met Tyr Ile Glu Pro Asp Ser Lys Leu Lys Gly Vai 355 360 365Gly Arg Glu Cys Met Tyr Ile Glu Pro Asp Ser Lys Leu Lys Gly Vai 355 360 365

Tyr Trp Tyr His Lys Leu 370 (2) INFORMAÇÃO PARA SEQ ID N°: 5: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 550 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear 110 (ii) TIPO DE MOLÉCULA: ADN (vi) FONTE ORIGINAL: (A) ORGANISMO: Vernonia galamensis (ix) CARACTERÍSTICA:Tyr Trp Tyr His Lys Leu 370 (2) INFORMATION FOR SEQ ID NO: 5: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 550 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: simple (D) TOPOLOGY: linear 110 (ii) MOLECULE TYPE: DNA (vi) ORIGINAL SOURCE: (A) ORGANISM: Vernonia galamensis (ix) CHARACTERISTICS:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..549 (xi) DESCRIÇÃO DE SEQUÊNCIA: SEQ ID N°: 5: CAT CAC GCC TTC AGT GAC TAT CAA TGG ATA GAC GAC ACT GTG GGC TTC 48 His His Ala Phe Ser Asp Tyr Gin Trp Ile Asp Asp Thr Vai Gly Phe 1 5 10 15 ATC CTT CAC TTT GCA CTC TTC ACC CCT TAT TTC TCT TGG AAA TAC AGT 96 Ile Leu His Phe Ala Leu Phe Thr Pro Tyr Phe Ser Trp Lys Tyr Ser 20 25 30 CAC CGT AAT CAC CAT GCC AAC ACA AAC TCT CTT GTA ACC GAT GAA GTA 144 His Arg Asn His His Ala Asn Thr Asn Ser Leu Vai Thr Asp Glu Vai 35 40 45 TAC ATC CCT AAA GTT AAA TCC AAG GTC AAG ATT TAT TCC AAA ATC CTT 192 Tyr lie Pro Lys Vai Lys Ser Lys Vai Lys Ile Tyr Ser Lys Ile Leu 50 55 60 AAC AAC CCT CCT GGT CGC GTT TTC ACC TTG GCT TTC AGA TTG ATC GTG 240 Asn Asn Pro Pro Gly Arg Vai Phe Thr Leu Ala Phe Arg Leu Ile Vai 65 70 75 B0 GGT TTT CCT TTA TAC CTT TTC ACC AAT GTT TCA GGC AAG AAA TAC GAA 288 Gly Phe Pro Leu Tyr Leu Phe Thr Asn Vai Ser Gly Lys Lys Tyr Glu 85 90 95 CGT TTT GCC AAC CAT TTT GAT CCC ATG AGT CCC ATT TTC ACC GAG CGT 336 Arg Phe Ala Asn His Phe Asp Pro Met Ser Pro Ile Phe Thr Glu Arg 100 105 110 111 GAG CAT GTA CAA GTC TTG CTT TCT GAT TTT GGT CTC ATA GCA GTT GCT 384 Glu His Vai Gin Vai Leu Leu Ser Asp Phe Gly Leu Ile Ala Vai Ala 115 120 125 TAC GTG GTT CGT CAA GCT GTA CTG GCT ΑΆΑ GGA GGT GCT TGG GTG ATG 432 Tyr Vai Vai Arg Gin Ala Vai Leu Ala Lys Gly Gly Ala Trp Vai Met 130 135 140 TGC ATT TAC GGA GTT CCT GTG CTG GCC GTA AAC GCA TTC TTT GTT TTA 480 Cys Ile Tyr Gly Vai Pro Vai Leu Ala Vai Asn Ala Phe Phe Vai Leu 145 150 155 160 ATC ACT TAT CTT CAC CAC ACG CAT CTC TCA CTG CCC CAC TAT GAT AGC 528 Ile Thr Tyr Leu His His Thr His Leu Ser Leu Pro His Tyr Asp Ser 1C5 170 175 TCA GAA TGG GAC TGG CTA CGA G 550 Ser Glu Trp Asp Trp Leu Arg 180 (2) INFORMAÇÃO PARA SEQ ID N° : 6 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 183 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DE SEQUÊNCIA: SEQ ID N°: 6: 112(A) NAME / KEY: CDS (B) LOCATION: 1..549 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 5: CAT CAC GCC TTC AGT GAC TAT CAA TGG ATA GAC GAC ACT GTG GGC TTC 48 His His Ala Phe Ser Asp Tyr Gin Trp Ile Asp Asp Thr Val Gly Phe 1 5 10 15 ATC CTT CAC TTT GCA CTC TTC ACC CCT TAT TTC TCT TGG AAA TAC AGT 96 Ile Leu His Phe Ala Leu Phe Thr Pro Tyr Phe Ser Trp Lys Tyr Ser 20 25 30 CAC CGT AAT CAC CAT GCC AAC ACA AAC TCT CTT GTA ACC GAT GAA GTA 144 His Arg Asn His His Wing Asn Thr Asn Ser Leu Go Thr Asp Glu Vai 35 40 45 TAC ATC CCT AAA GTT AAA TCC AAG GTC AAG ATT TAT TCC AAA ATC CTT 192 Tyr lie Pro Lys Go Lys Ser Lys Go Lys Ile Tyr Ser Lys Ile Leu 50 55 60 AAC AAC CCT CCT GGT CGC GTT TTC ACC TTG GCT TTC AGA TTG ATC GTG 240 Asn Asn Pro Pro Gly Arg Go Phe Thr Leu Ala Phe Arg Leu Ile Val 65 65 75 B0 GGT TTT CCT TTA TAC CTT TTC ACC AAT GTT TCA GGC AAG AAA TAC GAA 288 Gly Phe Pro Leu Tyr Leu Phe Thr Asn Will Be Gly Lys Lys Tyr Glu 85 90 95 CGT TTT GCC AAC CAT TTT GAT CCC ATG AGT CCC ATT TTC ACC GAG CGT 336 Arg Phe Ala Asn His Phe Asp Pro Met Ser Pro Ile Phe Thr Glu Arg 100 105 110 111 GAG CAT GTA CAA GTC TTG CTT TCT GAT TTT GGT CTC ATA GCA GTT GCT 384 Glu His Vai Gin Vai Leu Leu Ser Asp Phe Gly Leu Ile Ala Vai Ala 115 120 125 TAC GTG GTT CGT CAA GCT GTA CTG GCT GGA GGT GCT TGG GTG ATG 432 Tyr Go Go Arg Gin Ala Go Leu Ala Lys Gly Gly Ala Trp Go Met 130 135 140 TGC ATT TAC GGA GTT CCT GTG CTG GCC GTA AAC GCA TTC TTT GTT TTA 480 Cys Ile Tyr Gly Vai Pro Go Leu Ala Go Asn Ala Phe Phe Go Leu 145 150 155 160 ATC ACT TAT CTT CAC CAC ACG CAT CTC TCA CTG CCC CAC TAT GAT AGC 528 Ile Thr Tyr Leu His His Thr His Leu Ser Leu Pro His Tyr Asp Ser 1C5 170 175 TCA GAA TGG GAC TGG CTA CGA G 550 Ser Glu Trp Asp Trp Leu Arg 180 (2) INFORMATION FOR SEQ ID NO: (I) SEQUENCE CHARACTERISTICS: (A) LENGTH: 183 amino acids (B) TYPE: amino acid (D) TOPOLOGY: linear (ii) MOLECULE TYPE: protein (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 6: 112

His His Ala Phe Ser Asp Tyr Gin Trp Ile Asp Asp Thr Vai Gly Phe 15 10 15His His Ala Phe Ser Asp Tyr Gin Trp Ile Asp Asp Thr Val Gly Phe 15 10 15

Ile Leu His Phe Ala Leu Phe Thr Pro Tyr Phe Ser Trp Lys Tyr Ser 20 25 30Ile Leu His Phe Ala Leu Phe Thr Pro Tyr Phe Ser Trp Lys Tyr Ser 20 25 30

His Arg Asn His His Ala Asn Thr Asn Ser Leu Vai Thr Asp Glu Vai 35 40 45His Arg Asn His His Wing Asn Thr Asn Ser Leu Go Thr Asp Glu Go 35 40 45

Tyr Ile Pro Lys Vai Lys Ser Lys Vai Lys Ile Tyr Ser Lys Ile Leu 50 55 60Tyr Ile Pro Lys Go Lys Ser Lys Go Lys Ile Tyr Ser Lys Ile Leu 50 55 60

Asn Asn Pro Pro Gly Arg Vai Phe Thr Leu Ala Phe Arg Leu Ile Vai 65 70 75 80Asn Asn Pro Pro Gly Arg Go Phe Thr Leu Ala Phe Arg Leu Ile Go 65 70 75 80

Gly Phe Pro Leu Tyr Leu Phe Thr Asn Vai Ser Gly Lys Lys Tyr Glu 85 90 95Gly Phe Pro Leu Tyr Leu Phe Thr Asn Will Be Gly Lys Lys Tyr Glu 85 90 95

Arg Phe Ala Asn His Phe Asp Pro 100Arg Phe Ala Asn His Phe Asp Pro 100

Glu His Vai Gin Vai Leu Leu Ser 115 120Glu His Vai Gin Vai Leu Leu Ser 115 120

Tyr Vai Vai Arg Gin Ala Vai Leu 130 135Tyr Go Go Go Arg Gin Goes Leu 130 135

Cys Ile Tyr Gly Vai Pro Vai Leu 145 150Cys Ile Tyr Gly Vai Pro Vai Leu 145 150

Ile Thr Tyr Leu His His Thr His 165Ile Thr Tyr Leu His His Thr His 165

Met Ser Pro Ile Phe Thr Glu Arg 105 110Met Ser Pro Ile Phe Thr Glu Arg 105 110

Asp Phe Gly Leu Ile Ala Vai Ala 125Asp Phe Gly Leu Ile Ala Goa Ala 125

Ala Lys Gly Gly Ala Trp Vai Met 140Ala Lys Gly Gly Ala Trp Vai Met 140

Ala Vai Asn Ala Phe Phe Vai Leu 155 160Ala Vai Asn Ala Phe Phe Vai Leu 155 160

Leu Ser Leu Pro His Tyr Asp Ser 170 175Leu Ser Leu Pro His Tyr Asp Ser 170 175

Ser Glu Trp Asp Trp Leu Arg 180 (2) INFORMAÇÃO PARA SEQ ID N°: 7: (i) CARACTERÍSTICAS DA SEQUÊNCIA: 113 (A) COMPRIMENTO: 177 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (vi) FONTE ORIGINAL: (A) ORGANISMO: Crepis alpina (ix) CARACTERÍSTICA:SEQ ID NO: 7: (i) SEQUENCE CHARACTERISTICS: 113 (A) LENGTH: 177 base pairs (B) TYPE: nucleic acid (C) STRAND TYPE (ix) TYPE OF MOLECULE: DNA (vi) ORIGINAL SOURCE: (A) ORGANISM: Crepis alpina (ix) CHARACTERISTICS:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..177 (xi) DESCRIÇÃO DE SEQUÊNCIA: SEQ ID N°: 7: GAA TGC GGT CAC CAT GCC TTC AGC GAC TAC CAG TGG GTT GAC GAC AAT 48 Glu Cys Gly His His Ala Phe Ser Asp Tyr Gin Trp Val Asp Asp Asn 1 5 10 15 GTG GGC TTC ATC CTC CAC TCG TTT CTC ATG ACC CCG TAT TTC TCC TGG 96 Vai Gly Phe Ile Leu His Ser Phe Leu Met Thr Pro Tyr Phe Ser Trp 20 25 30 AAA TAC AGC CAC CGG AAC CAC CAT GCC AAC ACA AAT TCG CTT GAC AAC 144 Lys Tyr Ser His Arg Asn His His Ala Asn Thr Asn Ser Leu Asp Asn 35 40 45 GAT GAA GTT TAC ATC CCC AAA AGC AAG GCC AAA 177 Asp Glu Vai Tyr Ile Pro Lys Ser Lys Ala Lys 50 55 (2) INFORMAÇÃO PARA SEQ ID N°: 8: 114 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 59 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DE SEQUÊNCIA: SEQ ID N°: 8:(A) NAME / KEY: CDS (B) LOCATION: 1..177 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 7: GAA TGC GGT CAC CAT GCC TTC AGC GAC TAC CAG TGG GTT GAC GAC AAT 48 Glu Cys Gly His His Ala Phe Ser Asp Tyr Gin Trp Val Asp Asp Asn 1 5 10 15 GTG GGC TTC ATC CTC CAC TCG TTT CTC ATG ACC CCG TAT TTC TCC TGG 96 Go Gly Phe Ile Leu His Ser Phe Leu Met Thr Pro Tyr Phe Ser Trp 20 25 30 AAA TAC AGC CAC CGG AAC CAC CAT GCC AAC ACA AAT TCG CTT GAC AAC 144 Lys Tyr Ser His Arg Asn His His Wing Asn Thr Asn Ser Leu Asp Asn 35 40 45 GAT GAA GTT TAC ATC CCC AAA AGC AAG GCC (I) SEQUENCE CHARACTERISTICS: (A) LENGTH: 59 amino acids (B) TYPE: amino acid (D) (SEQ ID NO: 8) ) TOPOLOGY: linear (ii) MOLECULE TYPE: protein (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 8:

Glu Cys Gly His His Ala Phe Ser Asp Tyr Gin Trp Vai Asp Asp Asn 15 10 15Glu Cys Gly His His Ala Phe Ser Asp Tyr Gin Trp Go Asp Asp Asn 15 10 15

Vai Gly Phe Ile Leu His Ser Phe Leu Met Thr Pro Tyr Phe Ser Trp 20 25 30Go Gly Phe Ile Leu His Phe Leu Met Thr Pro Tyr Phe Ser Trp 20 25 30

Lys Tyr Ser His Arg Asn His His Ala Asn Thr Asn Ser Leu Asp Asn 35 40 45Lys Tyr Ser His Arg Asn His His Wing Asn Thr Asn Ser Leu Asp Asn 35 40 45

Asp Glu Vai Tyr Ile Pro Lys Ser Lys Ala Lys 50 55 (2) INFORMAÇÃO PARA SEQ ID N°: 9: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 383 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (vi) FONTE ORIGINAL: 115 (A) ORGANISMO: Arabidopsis thaliana (xi) DESCRIÇÃO DE SEQUÊNCIA: SEQ ID N°: 9:Asp Glu Vai Tyr Ile Pro Lys Ser Lys Ala Lys 50 55 (2) INFORMATION FOR SEQ ID NO: 9: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 383 amino acids (B) TYPE: amino acid (C) TYPE OF CHEMISTRY: simple (D) TOPOLOGY: linear (ii) MOLECULE TYPE: protein (vi) ORIGINAL SOURCE: 115 (A) ORGANISM: Arabidopsis thaliana (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 9:

Met Gly Ala Gly Gly Arg Met Pro Vai Pro Thr Ser Ser Lys Lys Ser 15 10 15Met Gly Ala Gly Gly Arg Met Pro Go Pro Thr Ser Ser Lys Lys Ser 15 10 15

Glu Thr Asp Thr Thr Lys Arg Vai Pro Cys Glu Lys Pro Pro Phe Ser 20 25 30 val Gly Asp Leu Lys Lys Ala Ile Pro Pro His Cys Phe Lys Arg Ser 35 40 45Glu Thr Asp Thr Thr Lys Arg Val Pro Cys Glu Lys Pro Pro Phe Ser 20 25 30 Val Gly Asp Leu Lys Lys Ala Ile Pro Pro His Cys Phe Lys Arg Ser 35 40 45

Ile Pro Arg Ser Phe Ser Tyr Leu Ile Ser Asp Ile Ile Ile Ala Ser 50 55 60Ile Pro Arg Ser Phe Ser Tyr Leu Ile Ser Asp Ile Ile Ile Ala Ser 50 55 60

Cys Phe Tyr Tyr Val Ala Thr Asn Tyr Phe Ser Leu Leu Pro Gin Pro 65 70 75 80Cys Phe Tyr Tyr Val Ala Thr Asn Tyr Phe Ser Leu Pro Pro Gin 65 70 75 80

Leu Ser Tyr Leu Ala Trp Pro Leu Tyr Trp Ala Cys Gin Gly Cys Val 85 90 95Leu Ser Tyr Leu Ala Trp Pro Leu Tyr Trp Ala Cys Gin Gly Cys Val 85 90 95

Leu Thr Gly Ile Trp Val Ile Ala His Glu Cys Gly His His Ala Phe 100 105 HOLeu Thr Gly Ile Trp Val Ile Ala His Glu Cys Gly His His Ala Phe 100 105 HO

Ser Asp Tyr Gin Trp Leu Asp Asp Thr Val Gly Leu Ile Phe His Ser 115 120 125Ser Asp Tyr Gin Trp Leu Asp Asp Thr Val Gly Leu Ile Phe His Ser 115 120 125

Phe Leu Leu Val Pro Tyr Phe Ser Trp Lys Tyr Ser His Arg Arg His 130 135 140Phe Leu Leu Val Pro Tyr Phe Ser Trp Lys Tyr Ser His Arg Arg His 130 135 140

His Ser Asn Thr Gly Ser Leu Glu Arg Asp Glu Val Phe Val Pro Lys 145 150 155 160His Ser Asn Thr Gly Ser Leu Glu Arg Asp Glu Val Phe Val Pro Lys 145 150 155 160

Gin Lys Ser Ala Ile Lys Trp Tyr Gly Lys Tyr Leu Asn Asn Pro Leu 165 170 175 116Gin Lys Ser Ala Ile Lys Trp Tyr Gly Lys Tyr Leu Asn Asn Pro Leu 165 170 175 116

Gly Arg Ile Met Met Leu Thr Vai Gin Phe Vai Leu Gly Trp Pro Leu 180 185 190Gly Arg Ile Met Met Leu Thr Vai Gin Phe Go Leu Gly Trp Pro Leu 180 185 190

Tyr Leu Ala Phe Asn Vai Ser Gly Arg Pro Tyr Asp Gly Phe Ala Cys 195 200 205Tyr Leu Ala Phe Asn Will Be Gly Arg Pro Tyr Asp Gly Phe Ala Cys 195 200 205

His Phe Phe Pro Asn Ala Pro Ile Tyr Asn Asp Arg Glu Arg Leu Gin 210 215 220His Phe Phe Pro Asn Ala Pro Ile Tyr Asn Asp Arg Glu Arg Leu Gin 210 215 220

Ile Tyr Leu Ser Asp Ala Gly Ile Leu Ala Vai Cys Phe Gly Leu Tyr 225 230 235 240Ile Tyr Leu Ser Asp Ala Gly Ile Leu Ala Vai Cys Phe Gly Leu Tyr 225 230 235 240

Arg Tyr Ala Ala Ala Gin Gly Met Ala Ser Met Ile Cys Leu Tyr Gly 245 250 255Arg Tyr Ala Ala Ala Gin Gly Met Ala Ser Met Ile Cys Leu Tyr Gly 245 250 255

Vai Pro Leu Leu Ile Vai Asn Ala Phe Leu Vai Leu Ile Thr Tyr Leu 260 265 270Go Pro Leu Leu Ile Go Asn Ala Phe Leu Go Leu Ile Thr Tyr Leu 260 265 270

Gin His Thr His Pro Ser Leu Pro His Tyr Asp Ser Ser Glu Trp Asp 275 280 285Gin His Thr His Pro Ser Leu Pro His Tyr Asp Ser Ser Glu Trp Asp 275 280 285

Trp Leu Arg Gly Ala Leu Ala Thr Vai Asp Arg Asp Tyr Gly Ile Leu 290 295 300Trp Leu Arg Gly Ala Leu Ala Thr Go Asp Arg Asp Tyr Gly Ile Leu 290 295 300

Asn Lys Vai Phe His Asn Ile Thr Asp Thr His Vai Ala His His Leu 305 310 315 320Asn Lys Will Phe His Asn Ile Thr Asp Thr His Will Ala His Hisu 305 310 315 320

Phe Ser Thr Met Pro His Tyr Asn Ala Met Glu Ala Thr Lys Ala Ile 325 330 335Phe Ser Thr Met Pro His Tyr Asn Ala Met Glu Ala Thr Lys Ala Ile 325 330 335

Lys Pro Ile Leu Gly Asp Tyr Tyr Gin Phe Asp Gly Thr Pro Trp Tyr 340 345 350Lys Pro Ile Leu Gly Asp Tyr Tyr Gin Phe Asp Gly Thr Pro Trp Tyr 340 345 350

Vai Ala Met Tyr Arg Glu Ala Lys Glu Cys Ile Tyr Vai Glu Pro Asp 355 360 365Go Ala Met Tyr Arg Glu Ala Lys Glu Cys Ile Tyr Go Glu Pro Asp 355 360 365

Arg Glu Gly Asp Lys Lys Gly Vai Tyr Trp Tyr Asn Asn Lys Leu 370 375 380 117 (2) INFORMAÇÃO PARA SEQ ID N°: 10: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 384 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (vi) FONTE ORIGINAL: (A) ORGANISMO: Brassica juncea (xi) DESCRIÇÃO DE SEQUÊNCIA: SEQ ID N°: 10:(2) SEQUENCE CHARACTERISTICS: (A) LENGTH: 384 amino acids (B) TYPE: (a) LENGTH: 384 amino acids (B) TYPE: amino acid (C) CHAIN TYPE: simple (D) TOPOLOGY: linear (ii) TYPE OF MOLECULE: protein (vi) ORIGINAL SOURCE: (A) ORGANISM: Brassica juncea (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 10:

Met Gly Ala Gly Gly Arg Met Gin Vai Ser Pro Ser Pro Lys Lys Ser 15 10 15Met Gly Ala Gly Gly Arg Met Gin Will Be Pro Pro Lys Lys Ser 15 10 15

Glu Thr Asp Thr Leu Lys Arg Vai Pro Cys Glu Thr Pro Pro Phe Thr 20 25 30Glu Thr Asp Thr Leu Lys Arg Pro Cys Glu Thr Pro Pro Phe Thr 20 25 30

Vai Gly Glu Leu Lys Lys Ala Ile Pro Pro His Cys Phe Lys Arg Ser 35 40 45Go Gly Glu Leu Lys Lys Ala Ile Pro Pro His Cys Phe Lys Arg Ser 35 40 45

Ile Pro Arg Ser Phe Ser Tyr Leu Ile Trp Asp Ile Ile Vai Ala Ser 50 55 60Ile Pro Arg Ser Phe Ser Tyr Leu Ile Trp Asp Ile Ile Val Ile 50 55 60

Cys Phe Tyr Tyr Vai Ala Thr Thr Tyr Phe Pro Leu Leu Pro His Pro 65 70 75 80Cys Phe Tyr Tyr Go Ala Thr Thr Tyr Phe Pro Leu Leu Pro His Pro 65 70 75 80

Leu Ser Tyr Vai Ala Trp Pro Leu Tyr Trp Ala Cys Gin Gly Vai Vai 85 90 95 118Leu Ser Tyr Go Ala Trp Pro Leu Tyr Trp Ala Cys Gin Gly Go Go 85 90 95 118

Leu Thr Gly Vai Trp Vai Ile Ala His Glu Cys Gly His His Ala Phe 100 105 110Leu Thr Gly Go Trp Go Ile Ala His Glu Cys Gly His His Ala Phe 100 105 110

Ser Asp Tyr Gin Trp Leu Asp Asp Thr Vai Gly Leu Ile Phe His Ser 115 120 125Ser Asp Tyr Gin Trp Leu Asp Asp Thr Go Gly Leu Ile Phe His Ser 115 120 125

Phe Leu Leu Vai Pro Tyr Phe Ser Trp Lys Tyr Ser His Arg Arg His 130 135 140Phe Leu Leu Go Pro Tyr Phe Ser Trp Lys Tyr Ser His Arg Arg His 130 135 140

His Ser Asn Thr Gly Ser Leu Glu Arg Asp Glu Vai Phe Vai Pro Lys 145 150 155 160His Ser Asn Thr Gly Ser Leu Glu Arg Asp Glu Go Phe Go Pro Lys 145 150 155 160

Lys Lys Ser Asp Ile Lys Trp Tyr Gly Lys Tyr Leu Asn Asn Pro Leu 165 170 175Lys Lys Ser Asp Ile Lys Trp Tyr Gly Lys Tyr Leu Asn Asn Pro Leu 165 170 175

Gly Arg Thr Vai Met Leu Thr Vai Gin Phe Thr Leu Gly Trp Pro Leu 180 185 190Gly Arg Thr Vai Met Leu Thr Go Gin Phe Thr Leu Gly Trp Pro Leu 180 185 190

Tyr Trp Ala Phe Asn Vai Ser Gly Arg Pro Tyr Pro Glu Gly Phe Ala 195 200 205Tyr Trp Ala Phe Asn Will Be Gly Arg Pro Tyr Pro Glu Gly Phe Ala 195 200 205

Cys His Phe His Pro Asn Ala Pro Ile Tyr Asn Asp Arg Glu Arg Leu 210 215 220Cys His Phe His Pro Asn Ala Pro Ile Tyr Asn Asp Arg Glu Arg Leu 210 215 220

Gin Ile Tyr Vai Ser Asp Ala Gly Ile Leu Ala Vai Cys Tyr Gly Leu 225 230 235 240Gin Ile Tyr Will Be Asp Ala Gly Ile Leu Ala Go Cys Tyr Gly Leu 225 230 235 240

Tyr Arg Tyr Ala Ala Ala Gin Gly Vai Ala Ser Met Vai Cys Leu Tyr 245 250 255Tyr Arg Tyr Ala Ala Ala Gin Gly Vai Ala Ser Met Vai Cys Leu Tyr 245 250 255

Gly Vai Pro Leu Leu Ile Vai Asn Ala Phe Leu Vai Leu Ile Thr Tyr 260 265 270Gly Go Pro Leu Leu Ile Go Asn Ala Phe Leu Go Leu Ile Thr Tyr 260 265 270

Leu Gin His Thr His Pro Ser Leu Pro His Tyr Asp Ser Ser Glu Trp 275 280 285Leu Gin His Thr His Pro Ser Leu Pro His Tyr Asp Ser Ser Glu Trp 275 280 285

Asp Trp Leu Arg Gly Ala Leu Ala Thr Vai Asp Arg Asp Tyr Gly Ile 290 295 300 119Asp Trp Leu Arg Gly Ala Leu Ala Thr Go Asp Arg Asp Tyr Gly Ile 290 295 300 119

Leu Asn Lys Vai Phe His Asn Ile Thr Asp Thr His Vai Ala His His 305 310 315 320Leu Asn Lys Will Phe His Asn Ile Thr Asp Thr His Will Ala His His 305 310 315 320

Leu Phe Ser Thr Met Pro His Tyr His Ala Met Glu Vai Thr Lys Ala 325 330 335Leu Phe Ser Thr Met Pro His Tyr His Ala Met Glu Vai Thr Lys Ala 325 330 335

Ile Lys Pro Ile Leu Gly Asp Tyr Tyr Gin Phe Asp Gly Thr Pro Trp 340 345 350Ile Lys Pro Ile Leu Gly Asp Tyr Tyr Gin Phe Asp Gly Thr Pro Trp 340 345 350

Vai Lys Ala Met Trp Arg Glu Ala Lys Glu Cys Ile Tyr Vai Glu Pro 355 360 365Go Lys Ala Met Trp Arg Glu Ala Lys Glu Cys Ile Tyr Go Glu Pro 355 360 365

Asp Arg Gin Gly Glu Lys Lys Gly Vai Phe Trp Tyr Asn Asn Lys Leu 370 375 380 (2) INFORMAÇÃO PARA SEQ ID N°: 11: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 383 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (vi) FONTE ORIGINAL: (A) ORGANISMO: Glycine max (xi) DESCRIÇÃO DE SEQUÊNCIA: SEQ ID N°: 11: 120(A) LENGTH: 383 amino acids (B) TYPE: (a) LENGTH: 383 amino acids (B) TYPE: (a) LENGTH: amino acid (C) CHAIN TYPE: simple (D) TOPOLOGY: linear (ii) TYPE OF MOLECULE: protein (vi) ORIGINAL SOURCE: (A) ORGANISM: Glycine max (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 11: 120

Met Gly Ala Gly Gly Arg Thr Asp Vai Pro Pro Ala Asn Arg Lys Ser 1 S 10 15Met Gly Ala Gly Gly Arg Thr Asp Go Pro Pro Ala Asn Arg Lys Ser 1 S 10 15

Glu Vai Asp Pro Leu Lys Arg Vai Pro Phe Glu Lys Pro Gin Phe Ser 20 25 30Glu Go Asp Pro Leu Lys Arg Go Pro Phe Glu Lys Pro Gin Phe Ser 20 25 30

Leu Ser Gin Ile Lys Lys Ala Ile Pro Pro His Cys Phe Gin Arg Ser 35 40 45Leu Ser Gin Ile Lys Lys Ala Ile Pro Pro His Cys Phe Gin Arg Ser 35 40 45

Vai Leu Arg Ser Phe Ser Tyr Vai Vai Tyr Asp Leu Thr Ile Ala Phe 50 55 60Go Leu Arg Be Phe Be Tyr Go Go Tyr Asp Leu Thr Ile Ala Phe 50 55 60

Cys Leu Tyr Tyr Vai Ala Thr His Tyr Phe His Leu Leu Pro Gly Pro 65 70 75 80Cys Leu Tyr Tyr Go Ala Thr His Tyr Phe His Leu Leu Pro Gly Pro 65 70 75 80

Leu Ser Phe Arg Gly Met Ala Ile Tyr Trp Ala Vai Gin Gly Cys Ile 85 90 95Leu Ser Phe Arg Gly Met Ala Ile Tyr Trp Ala Go Gin Gly Cys Ile 85 90 95

Leu Thr Gly Vai Trp Vai Ile Ala His Glu Cys Gly His His Ala Phe 100 105 110Leu Thr Gly Go Trp Go Ile Ala His Glu Cys Gly His His Ala Phe 100 105 110

Ser Asp Tyr Gin Leu Leu Asp Asp Ile Vai Gly Leu Ile Leu His Ser 115 120 125Ser Asp Tyr Gin Leu Leu Asp Asp Ile Go Gly Leu Ile Leu His Ser 115 120 125

Ala Leu Leu Vai Pro Tyr Phe Ser Trp Lys Tyr Ser His Arg Arg His 130 135 140Ala Leu Leu Pro V Tyr Phe Ser Trp Lys Tyr Ser His Arg Arg His 130 135 140

His Ser Asn Thr Gly Ser Leu Glu Arg Asp Glu Vai Phe Vai Pro Lys 145 ISO 155 160His Ser Asn Thr Gly Ser Leu Glu Arg Asp Glu Go Phe Go Pro Lys 145 ISO 155 160

Gin Lys Ser Cys Ile Lys Trp Tyr Ser Lys Tyr Leu Asn Asn Pro Pro 165 170 175Gin Lys Ser Cys Ile Lys Trp Tyr Ser Lys Tyr Leu Asn Asn Pro Pro 165 170 175

Gly Arg Vai Leu Thr Leu Ala Vai Thr Leu Thr Leu Gly Trp Pro Leu 180 185 190Gly Arg Go Leu Thr Leu Ala Go Thr Leu Thr Leu Gly Trp Pro Leu 180 185 190

Tyr Leu Ala Leu Asn Vai Ser Gly Arg Pro Tyr Asp Arg Phe Ala Cys 195 200 205 121Tyr Leu Ala Leu Asn Will Be Gly Arg Pro Tyr Asp Arg Phe Ala Cys 195 200 205 121

His Tyr Asp Pro Tyr Gly Pro Ile Tyr Ser Asp Are Glu Arg Leu Gin 210 215 220His Tyr Asp Pro Tyr Gly Pro Ile Tyr Ser Asp Are Glu Arg Leu Gin 210 215 220

Ile Tyr Ile Ser Asp Ala Gly Vai Leu Ala Vai Vai Tyr Gly Leu Phe 225 230 235 240Ile Tyr Ile Ser Asp Ala Gly Vai Leu Ala Vai Vai Tyr Gly Leu Phe 225 230 235 240

Arg Leu Ala Met Ala Lys Gly Leu Ala Trp Vai Vai Cys Vai Tyr Gly 245 250 255Arg Leu Ala Met Ala Lys Gly Leu Ala Trp Vai Vai Cys Vai Tyr Gly 245 250 255

Vai Pro Leu Leu Vai Vai Asn Gly Phe Leu Vai Leu Ile Thr Phe Leu 260 265 270Go Pro Leu Leu Go Go Asn Gly Phe Leu Go Leu Ile Thr Phe Leu 260 265 270

Gin His Thr His Pro Ala Leu Pro His Tyr Thr Ser Ser Glu Trp Asp 275 280 285Gin His Thr His Pro Ala Leu Pro His Tyr Thr Ser Ser Glu Trp Asp 275 280 285

Trp Leu Arg Gly Ala Leu Ala Thr Vai Asp Arg Asp Tyr Gly Ile Leu 290 295 300Trp Leu Arg Gly Ala Leu Ala Thr Go Asp Arg Asp Tyr Gly Ile Leu 290 295 300

Asn Lys Vai Phe His Asn Ile Thr Asp Thr His Vai Ala His His Leu 305 310 315 320Asn Lys Will Phe His Asn Ile Thr Asp Thr His Will Ala His Hisu 305 310 315 320

Phe Ser Thr Met Pro His Tyr His Ala Met Glu Ala Thr Lys Ala Ile 325 330 335Phe Ser Thr Met Pro His Tyr His Ala Met Glu Ala Thr Lys Ala Ile 325 330 335

Lys Pro Ile Leu Gly Glu Tyr Tyr Arg Phe Asp Glu Thr Pro Phe Vai 340 345 350Lys Pro Ile Leu Gly Glu Tyr Tyr Arg Phe Asp Glu Thr Pro Phe Vai 340 345 350

Lys Ala Met Trp Arg Glu Ala Arg Glu Cys Ile ’yr Vai Glu Pro Asp 355 360 365Lys Ala Met Trp Arg Glu Ala Arg Glu Cys Ile 'yr Vai Glu Pro Asp 355 360 365

Gin Ser Thr Glu Ser Lys Gly Vai Phe Trp Tyr Asn Asn Lys Leu 370 375 380 (2) INFORMAÇÃO PARA SEQ ID N°: 12: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 383 aminoácidos (B) TIPO: aminoácido 122 (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (vi) FONTE ORIGINAL: (A) ORGANISMO: Solanum commersonii (xi) DESCRIÇÃO DE SEQUÊNCIA: SEQ ID N°: 12:(2) INFORMATION FOR SEQ ID NO: 12: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 383 amino acids (B) TYPE: amino acid (A) LENGTH: 383 amino acids 122 (C) STRANDEDNESS: simple (D) TOPOLOGY: linear (ii) MOLECULE TYPE: protein (vi) ORIGINAL SOURCE: (A) ORGANISM: Solanum commersonii (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 12:

Met Gly Ala Gly Gly Arg Met Ser Ala Pro Asn Gly Glu Thr Glu Vai 15 10 15Met Gly Ala Gly Gly Arg Met Ser Ala Pro Asn Gly Glu Thr Glu Val 15 10 15

Lys Arg Asn Pro Leu Gin Lys Vai Pro Thr Ser Lys Pro Pro Phe Thr 20 25 30Lys Arg Asn Pro Leu Gin Lys Go Pro Thr Ser Lys Pro Pro Phe Thr 20 25 30

Vai Gly Asp Ile Lys Lys Ala Ile Pro Pro His Cys Phe Gin Arg Ser 35 40 45Go Gly Asp Ile Lys Lys Ala Ile Pro Pro His Cys Phe Gin Arg Ser 35 40 45

Leu Ile Arg Ser Phe Ser Tyr Vai Vai Tyr Asp Leu Ile Leu Vai Ser 50 55 60Leu Ile Arg Ser Phe Ser Tyr Will Go Tyr Asp Leu Ile Leu Will Be 50 55 60

Ile Met Tyr Tyr Vai Ala Asn Thr Tyr Phe His Leu Leu Pro Ser Pro 65 70 75 80Ile Met Tyr Tyr Go Ala Asn Thr Tyr Phe His Leu Leu Pro Ser Pro 65 70 75 80

Tyr Cys Tyr Ile Ala Trp Pro Ile Tyr Trp Ile Cys Gin Gly Cys Vai 85 90 95Tyr Cys Tyr Ile Ala Trp Pro Ile Tyr Trp Ile Cys Gin Gly Cys Go 85 90 95

Cys Thr Gly Ile Trp Vai Asn Ala His Glu Cys Gly His His Ala Phe 100 105 110Cys Thr Gly Ile Trp Val Asn Ala His Glu Cys Gly His His Ala Phe 100 105 110

Ser Asp Tyr Gin Trp Vai Asp Asp Thr Vai Gly Leu Ile Leu His Ser 115 120 125Ser Asp Tyr Gin Trp Go Asp Asp Thr Go Gly Leu Ile Leu His Ser 115 120 125

Ala Leu Leu Vai Pro Tyr Phe Ser Trp Lys Tyr Ser His Arg Arg His 130 135 140 123Ala Leu Leu Go Pro Tyr Phe Ser Trp Lys Tyr Ser His Arg Arg His 130 135 140 123

His Ser Asn Thr Gly Ser Leu Glu Arg Asp Glu Vai Phe Vai Pro Lys 145 150 155 160His Ser Asn Thr Gly Ser Leu Glu Arg Asp Glu Go Phe Go Pro Lys 145 150 155 160

Pro Lys Ser Gin Leu Gly Trp Tyr Ser Lys Tyr Leu Asn Asn Pro Pro 165 170 175Pro Lys Ser Gin Leu Gly Trp Tyr Ser Lys Tyr Leu Asn Asn Pro Pro 165 170 175

Gly Arg Vai Leu Ser Leu Thr Ile Thr Leu Thr Leu Gly Trp Pro Leu 180 185 190Gly Arg Go Leu Ser Leu Thr Ile Thr Leu Thr Leu Gly Trp Pro Leu 180 185 190

Tyr Leu Ala Phe Asn Vai Ser Gly Arg Pro Tyr Asp Arg Phe Ala Cys 195 200 205Tyr Leu Ala Phe Asn Will Be Gly Arg Pro Tyr Asp Arg Phe Ala Cys 195 200 205

His Tyr Asp Pro Tyr Gly Pro Ile Tyr Asn Asn Arg Glu Arg Leu Gin 210 215 220His Tyr Asp Pro Tyr Gly Pro Ile Tyr Asn Asn Arg Glu Arg Leu Gin 210 215 220

Ile Phe Ile Ser Asp Ala Gly Vai Leu Gly Vai Cys Tyr Leu Leu Tyr 225 230 235 240Ile Phe Ile Ser Asp Ala Gly Vai Leu Gly Vai Cys Tyr Leu Leu Tyr 225 230 235 240

Arg Ile Ala Leu Vai Lys Gly Leu Ala Trp Leu Vai Cys Vai Tyr Gly 245 250 255Arg Ile Ala Leu Go Lys Gly Leu Ala Trp Leu Go Cys Go Tyr Gly 245 250 255

Vai Pro Leu Leu Vai Vai Asn Gly Phe Leu Vai Leu Ile Thr Tyr Leu 260 265 270Go Pro Leu Leu Go Go Asn Gly Phe Leu Go Leu Ile Thr Tyr Leu 260 265 270

Gin His Thr His Pro Ser Leu Pro His Tyr Asp Ser Thr Glu Trp Asp 275 280 285Gin His Thr His Pro Ser Leu Pro His Tyr Asp Ser Thr Glu Trp Asp 275 280 285

Trp Leu Arg Gly Ala Leu Ala Thr Cys Asp Arg Asp Tyr Gly Vai Leu 290 295 300Trp Leu Arg Gly Ala Leu Ala Thr Cys Asp Arg Asp Tyr Gly Vai Leu 290 295 300

Asn Lys Vai Phe His Asn Ile Thr Asp Thr His Vai Vai His His Leu 305 310 315 320Asn Lys Will Phe His Asn Ile Thr Asp Thr His Will Will His Hisu 305 310 315 320

Phe Ser Thr Met Pro His Tyr Asn Ala Met Glu Ala Thr Lys Ala Vai 325 330 335Phe Ser Thr Met Pro His Tyr Asn Ala Met Glu Ala Thr Lys Ala Go 325 330 335

Lys Pro Leu Leu Gly Asp Tyr Tyr Gin Phe Asp Gly Thr Pro Ile Tyr 340 345 350 124Lys Pro Leu Leu Gly Asp Tyr Tyr Gin Phe Asp Gly Thr Pro Ile Tyr 340 345 350 124

Lys Glu Met Trp Arg Glu Ala Lys Glu Cys Leu Tyr Vai Glu Lys Asp 355 360 365Lys Glu Met Trp Arg Glu Ala Lys Glu Cys Leu Tyr Go Glu Lys Asp 355 360 365

Glu Ser Ser Gin Gly Lys Gly Vai Phe Trp Tyr Lys Asn Lys Leu 370 375 380 (2) INFORMAÇÃO PARA SEQ ID N°: 13: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 387 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (vi) FONTE ORIGINAL: (A) ORGANISMO: Glycine max (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 13:(I) SEQUENCE CHARACTERISTICS: (A) LENGTH: 387 amino acids (B) TYPE: amino acid (B) TYPE: amino acid (A) LENGTH: 387 amino acids (C) CHAIN TYPE: simple (D) TOPOLOGY: linear (ii) MOLECULE TYPE: protein (vi) ORIGINAL SOURCE: (A) ORGANISM: Glycine max (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 13:

Met Gly Leu Ala Lys Glu Thr Thr Met Gly Gly Arg Gly Arg Vai Ala 15 10 15Met Gly Leu Ala Lys Glu Thr Thr Met Gly Gly Arg Gly Arg Val Ala 15 10 15

Lys Vai Glu Vai Gin Gly Lys Lys Pro Leu Ser Arg Vai Pro Asn Thr 20 25 30Lys Go Glu Go Gin Gly Lys Lys Pro Leu Ser Arg Go Pro Asn Thr 20 25 30

Lys Pro Pro Phe Thr Vai Gly Gin Leu Lys Lys Ala Ile Pro Pro His 35 40 45 125Lys Pro Pro Phe Thr Go Gly Gin Leu Lys Lys Ala Ile Pro Pro His 35 40 45 125

Cys Phe Gin Arg Ser Leu Leu Thr Ser Phe Ser Tyr Vai Vai Tyr Asp 50 55 60Cys Phe Gin Arg Ser Leu Leu Thr Ser Phe Ser Tyr Go Vai Tyr Asp 50 55 60

Leu Ser Phe Ala Phe Ile Phe Tyr 65 70 Leu Pro Gin Pro Phe Ser Leu Ile 85 Gin Gly Cys Leu Leu Thr Gly Vai 100 His His Ala Phe Ser Lys Tyr Gin 115 120 Thr Leu His Ser Thr Leu Leu Vai 130 135Leu Ser Phe Ala Phe Ile Phe Tyr 65 70 Leu Pro Gin Pro Phe Ser Leu Ile 85 Gin Gly Cys Leu Leu Thr Gly Val 100 His His Phe Ser Lys Tyr Gin 115 120 Thr Leu His Ser Thr Leu Leu Val 130 135

Ile Ala Thr Thr Tyr Phe His Leu 75 80Ile Ala Thr Thr Tyr Phe His Leu 75 80

Ala Trp Pro Ile Tyr Trp Vai Leu 90 95Ala Trp Pro Ile Tyr Trp Vai Leu 90 95

Trp Vai Ile Ala His Glu Cys Gly 105 110Trp Ile Ile His Glu Cys Gly 105 110

Trp Vai Asp Asp Vai Vai Gly Leu 125Trp Go Asp Asp Go Go Gly Leu 125

Pro Tyr Phe Ser Trp Lys Ile Ser 140Pro Tyr Phe Ser Trp Lys Ile Ser 140

His Arg Arg His His Ser Asn Thr Gly Ser Leu Asp Arg Asp Glu Vai 145 150 155 160His Arg Arg His His Asn Thr Gly Ser Leu Asp Arg Asp Glu Val 145 150 155 160

Phe Vai Pro Lys Pro Lys Ser Lys Vai Ala Trp Phe Ser Lys Tyr Leu 165 170 175Phe Go Pro Lys Pro Lys Ser Lys Go Ala Trp Phe Ser Lys Tyr Leu 165 170 175

Asn Asn Pro Leu Gly Arg Ala Vai Ser Leu Leu Vai Thr Leu Thr Ile 180 185 190Asn Asn Pro Leu Gly Arg Ala Will Be Leu Leu Will Thr Leu Thr Ile 180 185 190

Gly Trp Pro Met Tyr Leu Ala Phe Asn Vai Ser Gly Arg Pro Tyr Asp 195 200 205Gly Trp Pro Met Tyr Leu Ala Phe Asn Will Be Gly Arg Pro Tyr Asp 195 200 205

Ser Phe Ala Ser His Tyr His Pro Tyr Ala Pro Ile Tyr Ser Asn Arg 210 215 220Ser Phe Ala His His Tyr His Pro Tyr Ala Pro Ile Tyr Ser Asn Arg 210 215 220

Glu Arg Leu Leu Ile Tyr Vai Ser Asp Vai Ala Leu Phe Ser Vai Thr 225 230 235 240Glu Arg Leu Leu Ile Tyr Will Be Asp Go Ala Leu Phe Be Go Thr 225 230 235 240

Tyr Ser Leu Tyr Arg Vai Ala Thr Leu Lys Gly Leu Vai Trp Leu Leu 245 250 255 126Tyr Ser Leu Tyr Arg Go Ala Thr Leu Lys Gly Leu Go Trp Leu Leu 245 250 255 126

Cys Vai Tyr Gly Vai Pro Leu Leu Ile Vai Asn Gly Phe Leu Vai Thr 260 265 270Cys Go Tyr Gly Go Pro Leu Leu Ile Go Asn Gly Phe Leu Go Thr 260 265 270

Ile Thr Tyr Leu Gin His Thr His Phe Ala Leu Pro His Tyr Asp Ser 275 280 285Ile Thr Tyr Leu Gin His Thr His Phe Ala Leu Pro His Tyr Asp Ser 275 280 285

Ser Glu Trp Asp Trp Leu Lys Gly Ala Leu Ala Thr Met Asp Arg Asp 290 295 300Ser Glu Trp Asp Trp Leu Lys Gly Ala Leu Ala Thr Met Asp Arg Asp 290 295 300

Tyr Gly Ile Leu Asn Lys Vai Phe His His Ile Thr Asp Thr His Vai 305 310 315 320Tyr Gly Ile Leu Asn Lys Go Phe His His Ile Thr Asp Thr His Go 305 310 315 320

Ala His His Leu Phe Ser Thr Met Pro His Tyr His Ala Met Glu Ala 325 330 335Ala His Hisu Phe Ser Thr Met Pro His Tyr His Ala Met Glu Ala 325 330 335

Thr Asn Ala Ile Lys Pro Ile Leu Gly Glu Tyr Tyr Gin Phe Asp Asp 340 345 350Thr Asn Ala Ile Lys Pro Ile Leu Gly Glu Tyr Tyr Gin Phe Asp Asp 340 345 350

Thr Pro Phe Tyr Lys Ala Leu Trp Arg Glu Ala Arg Glu Cys Leu Tyr 355 360 365Thr Pro Phe Tyr Lys Ala Leu Trp Arg Glu Ala Arg Glu Cys Leu Tyr 355 360 365

Vai Glu Pro Asp Glu Gly Thr Ser Glu Lys Gly Vai Tyr Trp Tyr Arg 370 375 380Go Glu Pro Asp Glu Gly Thr Ser Glu Lys Gly Vai Tyr Trp Tyr Arg 370 375 380

Asn Lys Tyr 385 (2) INFORMAÇÃO PARA SEQ ID N°: 14: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 387 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína 127 (vi) FONTE ORIGINAL: (A) ORGANISMO: Ricinus communis (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 14:Asn Lys Tyr 385 (2) INFORMATION FOR SEQ ID NO: 14: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 387 amino acids (B) TYPE: amino acid (C) STRANDEDNESS: simple (ii) TYPE OF MOLECULE: protein 127 (vi) ORIGINAL SOURCE: (A) ORGANISM: Ricinus communis (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 14:

Met Gly Gly Gly Gly Arg Met Ser Thr Vai Ile Thr Ser Asn Asn Ser 15 10 15Met Gly Gly Gly Gly Arg Met Ser Thr Val Ile Ile Thr Ser Asn Asn Ser 15 10 15

Glu Lys Lys Gly Gly Ser Ser His Leu Lys Arg Ala Pro His Thr Lys 20 25 30Glu Lys Lys Gly Gly Ser Ser His Leu Lys Arg Ala Pro His Thr Lys 20 25 30

Pro Pro Phe Thr Leu Gly Asp Leu Lys Arg Ala Ile Pro Pro His Cys 35 40 45Pro Pro Phe Thr Leu Gly Asp Leu Lys Arg Ala Ile Pro Pro His Cys 35 40 45

Phe Glu Arg Ser Phe Vai Arg Ser Phe Ser Tyr Vai Ala Tyr Asp Vai 50 55 60Phe Glu Arg Ser Phe Go Arg Arg Ser Phe Ser Tyr Go Ala Tyr Asp Go 50 55 60

Cys Leu Ser Phe Leu Phe Tyr Ser Ile Ala Thr Asn Phe Phe Pro Tyr 65 70 75 80Cys Leu Ser Phe Leu Phe Tyr Ser Ile Ala Thr Asn Phe Phe Pro Tyr 65 70 75 80

Ile Ser Ser Pro Leu Ser Tyr Vai 85Ile Ser Ser Pro Leu Ser Tyr Go 85

Gin Gly Cys Ile Leu Thr Gly Leu 100Gin Gly Cys Ile Leu Thr Gly Leu 100

His His Ala Phe Ser Glu Tyr Gin 115 120His His Wing Phe Ser Glu Tyr Gin 115 120

Ile Vai His Ser Ala Leu Leu Vai 130 135Ile Goes His Being Lea Leu Leu Goes 130 135

His Arg Arg His His Ser Asn Ile 145 150His Arg Arg His His Be Asn Ile 145 150

Ala Trp Leu Vai Tyr Trp Leu Phe 90 95Ala Trp Leu Vai Tyr Trp Leu Phe 90 95

Trp Vai Ile Gly His Glu Cys Gly 105 110Trp Ile Ile Gly His Glu Cys Gly 105 110

Leu Ala Asp Asp Ile Vai Gly Leu 125Leu Wing Asp Asp Ile Go Gly Leu 125

Pro Tyr Phe Ser Trp Lys Tyr Ser 140Pro Tyr Phe Ser Trp Lys Tyr Ser 140

Gly Ser Leu Glu Arg Asp Glu Vai 155 160Gly Ser Leu Glu Arg Asp Glu Val 155 160

Phe Vai Pro Lys Ser Lys Ser Lys Ile Ser Trp Tyr Ser Lys Tyr Ser 165 170 175 128Phe Vai Pro Lys Ser Lys Ser Lys Ile Ser Trp Tyr Ser Lys Tyr Ser 165 170 175 128

Asn Asn Pro Pro Gly Arg Vai Leu Thr Leu Ala Ala Thr Leu Leu Leu 180 185 190Asn Asn Pro Pro Gly Arg Vai Leu Thr Leu Ala Ala Thr Leu Leu Leu 180 185 190

Gly Trp Pro Leu Tyr Leu Ala Phe Asn Vai Ser Gly Arg Pro Tyr Asp 195 200 205Gly Trp Pro Leu Tyr Leu Ala Phe Asn Will Be Gly Arg Pro Tyr Asp 195 200 205

Arg Phe Ala Cys His Tyr Asp Pro Tyr Gly Pro Ile Phe Ser Glu Arg 210 215 220Arg Phe Ala Cys His Tyr Asp Pro Tyr Gly Pro Ile Phe Ser Glu Arg 210 215 220

Glu Arg Leu Gin Ile Tyr Ile Ala Asp Leu Gly Ile Phe Ala Thr Thr 225 230 235 240Glu Arg Leu Gin Ile Tyr Ile Ala Asp Leu Gly Ile Phe Ala Thr Thr 225 230 235 240

Phe Vai Leu Tyr Gin Ala Thr Met Ala Lys Gly Leu Ala Trp Vai Met 245 250 255Phe Vai Leu Tyr Gin Ala Thr Met Ala Lys Gly Leu Ala Trp Vai Met 245 250 255

Arg Ile Tyr Gly Vai Pro Leu Leu Ile Vai Asn Cys Phe Leu Vai Met 260 265 270Arg Ile Tyr Gly Go Pro Leu Leu Ile Go Asn Cys Phe Leu Vai Met 260 265 270

Ile Thr Tyr Leu Gin His Thr His Pro Ala Ile Pro Arg Tyr Gly Ser 275 280 285Ile Thr Tyr Leu Gin His Thr His Pro Ala Ile Pro Arg Tyr Gly Ser 275 280 285

Ser Glu Trp Asp Trp Leu Arg Gly Ala Met Vai Thr Vai Asp Arg Asp 290 295 300Ser Glu Trp Asp Trp Leu Arg Gly Ala Met Vai Thr Vai Asp Arg Asp 290 295 300

Tyr Gly Vai Leu Asn Lys Vai Phe His Asn Ile Ala Asp Thr His Vai 305 310 315 320Tyr Gly Go Leu Asn Lys Go Phe His Asn Ile Ala Asp Thr His Go 305 310 315 320

Ala His His Leu Phe Ala Thr Vai Pro His Tyr His Ala Met Glu Ala 325 330 335Ala His Hisu Phe Ala Thr Go Pro His Tyr His Ala Met Glu Ala 325 330 335

Thr Lys Ala Ile Lys Pro Ile Met Gly Glu Tyr Tyr Arg Tyr Asp Gly 340 345 350Thr Lys Ala Ile Lys Pro Ile Met Gly Glu Tyr Tyr Arg Tyr Asp Gly 340 345 350

Thr Pro Phe Tyr Lys Ala Leu Trp Arg Glu Ala Lys Glu Cys Leu Phe 355 360 365 129Thr Pro Phe Tyr Lys Ala Leu Trp Arg Glu Ala Lys Glu Cys Leu Phe 355 360 365 129

Vai Glu Pro Asp Glu Gly Ala Pro Thr Gin Gly Vai Phe Trp Tyr Arg 370 375 380Go Glu Pro Asp Glu Gly Ala Pro Thr Gin Gly Go Phe Trp Tyr Arg 370 375 380

Asn Lys Tyr 385 (2) INFORMAÇÃO PARA SEQ ID N°: 15: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 6 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 15:Asn Lys Tyr 385 (2) INFORMATION FOR SEQ ID NO: 15: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 6 amino acids (B) TYPE: amino acid (C) STRANDEDNESS: simple (ii) TYPE OF MOLECULE: peptide (v) TYPE OF FRAGMENT: internal (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 15:

His Glu Cys Gly His His 1 5 (2) INFORMAÇÃO PARA SEQ ID N°: 16: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 5 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido 130 (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 16(A) LENGTH: 5 amino acids (B) TYPE: amino acid (C) STRANDEDNESS: (D) STRANDEDNESS: (A) LENGTH: 5 amino acids ) TOPOLOGY: linear (ii) MOLECULE TYPE: peptide 130 (v) TYPE OF FRAGMENT: internal (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 16

His Arg Asn His His 1 5 (2) INFORMAÇÃO PARA SEQ ID N°: 17: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 5 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 17(A) LENGTH: 5 amino acids (B) TYPE: amino acid (C) STRANDEDNESS: simple (D) TOPOLOGY: linear (ii) MOLECULE TYPE: peptide (v) TYPE OF FRAGMENT: internal (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 17

His Vai Met His His 1 5 (2) INFORMAÇÃO PARA SEQ ID N°: 18: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 29 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear 131 (ii) TIPO DE MOLÉCULA: oligonucleótido (xi) DESCRIÇÃO DE SEQUÊNCIA: SEQ ID N°: 18: TGGAATTCCY TBMGNNNNYT SGGNHTBGG 29 (2) INFORMAÇÃO PARA SEQ ID N°: 19: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1610 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (vi) FONTE ORIGINAL: (A) ORGANISMO: Euforbia lagascae (ix) CARACTERÍSTICA:SEQ ID NO: 18: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 29 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: simple (D) TOPOLOGY: linear 131 (ii) MOLECULE TYPE: oligonucleotide (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 18: TGGAATTCCY TBMGNNNNYT SGGNHTBGG 29 (2) INFORMATION FOR SEQ ID NO: 19: (i) CHARACTERISTICS OF SEQUENCE: (A) LENGTH: 1610 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: simple (D) TOPOLOGY: linear (ii) TYPE OF MOLECULE: DNA (vi) ORIGINAL SOURCE: (A) ORGANISM : Euforbia lagascae (ix) CHARACTERISTICS:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 8..1546 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 19: AGTAACA ATG AAC ACT AAG GAG AAG AAG AAG AAG AAC AGG GTT TCT AAC 49(A) NAME / KEY: CDS (B) LOCATION: 8..1546 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 19: AGATACA ATG AAC ACT AAG GAG AAG AAG AAG AAG AAC AGG GTT TCT AAC 49

Met Asn Thr Lys Glu Lys Lys Lys Lys Asn Arg Vai Ser Asn 15 10 ATG TCT ATT CTT CTT TGC TTC CTT TGC CTT CTT CCA GTT TTC CTT GTT 97Met Asn Thr Lys Glu Lys Lys Lys Lys Asn Arg Will Be Asn 15 10 ATG TCT ATT CTT CTT TGC TTC CTT TGC CTT CTT CCA GTT TTC CTT GTT 97

Met Ser Ile Leu Leu Cys Phe Leu Cys Leu Leu Pro Vai Phe Leu Vai 15 20 25 30 132 145 TCT CTT TCT ATT CTT TCT AAG AGG CTT AAG Ser Leu Ser Ile Leu Ser Lys Arg Leu Lys 35 40 CCA CCA GGA CCA AAG ACT CTT CCA ATT ATT Pro Pro Gly Pro Lys Thr Leu Pro Ile Ile 50 55 AGG CAA GAT CCA GAG GCT TCT CTT TCT CAA Arg Gin Asp Pro Glu Ala Ser Leu Ser Gin 65 70 CCA GTT GTT CAT TGC GAG AAG CTT GAG TCT Pro Vai Vai His Cys Glu Lys Leu Glu Ser 80 85 ATT AAG GTT GGA CAT TAT GAT AAG AAC TGC Ile Lys Vai Gly His Tyr Asp Lys Asn Cys 95 100 GGA GAT GAG CTT CTT GGA AAG CCA TCT CCA Gly Asp Glu Leu Leu Gly Lys Pro Ser Pro 115 120 ACT GGA GGA TAT GGA CTT GAG AGG m^rp AAG Thr Gly Gly Tyr Gly Leu Glu Arg Ser Lys 130 135 AAG GAG ACT TGG TCT GCT TTC AGG CAA TAT Lys Glu Thr Trp Ser Ala Phe Arg Gin Tyr 145 150 GGA ATG GGA GGA AGG TCT TTC GAG CTT ATG Gly Met Gly Gly Arg Ser Phe Glu Leu Met 160 165 TGC CTT GTT GAT GGA TAT GTT TCT AGG AAG Cys Leu Vai Asp Gly Tyr Vai Ser Arg Lys 175 180 CCA TCT AAG TGG AAG CTT Pro Ser Lys Trp Lys Leu 45 GGA AAC CTT CAA GAT GAG 193 Gly Asn Leu Gin Asp Glu 60 GGA CAT ATT GCT AGG GGA 241 Gly His Ile Ala Arg Gly 75 TTC GGA ACT CAA CCA ACT 289 Phe Gly Thr Gin Pro Thr 90 GCT CTT CTT CAT GGA GCT 337 Ala Leu Leu His Gly Ala 105 110 CCA AAC GAT GCT TGG GAT 385 Pro Asn Asp Ala Trp Asp 125 AAC GAG AGG TGG AAG GAG 433 Asn Glu Arg Trp Lys Glu 140 AGG ACT CTT AGG GCT TTC 481 Arg Thr Leu Arg Ala Phe 155 AGG TGG CAA GAG GCT CAT 529 Arg Trp Gin Glu Ala His 170 GCT TCT GGA ACT GAT CCA 577 Ala Ser Gly Thr Asp Pro 185 190 133 625 ACT AAG GAT CTT GAG GAT TCT AGG TTC AAC ATT ATT ATG GGA GCT.ACT Thr Lys Asp Leu Glu Asp Ser Arg Phe Asn Ile Ile Met Gly Ala Thr 195 200 205 TTC AAC CAA GGA CTT GAT TAT AAG ATT AAG ACT TTC CTT GAT AGG CAT 673 Phe Asn Gin Gly Leu Asp Tyr Lys Ile Lys Thr Phe Leu Asp Arg His 210 215 220 GAG AGG AGG AAC TTC CAA TTC AAC AAC GTT GAT GCT GTT TAT CAT CAA 721 Glu Arg Arg Asn Phe Gin Phe Asn Asn Vai Asp Ala Vai Tyr His Gin 225 230 235 ATG AAG GAT GCT GAG AGG GGA TTC GTT GAT TCT AGG GGA TGG CAA GAT 769 Met Lys Asp Ala Glu Arg Gly Phe Vai Asp Ser Arg Gly Trp Gin Asp 240 245 250 GAG TTC GGA ATT GCT CTT CAA CAA GTT GTT GCT CAA ATT CTT GAT AAG 817 Glu Phe Gly Ile Ala Leu Gin Gin Vai Vai Ala Gin Ile Leu Asp Lys 255 260 265 270 CCA CTT GAT CAT CAA AAG GCT CTT GAG AGG TGG CAA CCA AGG GAT TCT 865 Pro Leu Asp His Gin Lys Ala Leu Glu Arg Trp Gin Pro Arg Asp Ser 275 280 285 CTT AAC CAT TTC ATT GGA GCT AGG GAT GAT GAG ATG GTT CAA ATT AAG 913 Leu Asn His Phe Ile Gly Ala Arg Asp Asp Glu Met Vai Gin Ile Lys 290 295 300 TAT GAT TTC TGC AAG GAT GCT CTT AGG ATG TTC GAT ACT GGA ATT CTT 961 Tyr Asp Phe Cys Lys Asp Ala Leu Arg Met Phe Asp Thr Gly .Ile Leu 305 310 315 GCT GCT GAT CTT CAA TCT TCT ACT TCT TCT ATT AGG TGG GAG CCA ATT 1009 Ala Ala Asp Leu Gin Ser Ser Thr Ser Ser Ile Arg Trp Glu Pro Ile 320 325 330 GTT GTT ATG CTT CAA GCT GAG GTT AAG GGA GAG ATT TGC GAG GAG CTT 1057 Vai Vai Met Leu Gin Ala Glu Vai Lys Gly Glu Ile Cys Glu Glu Leu 335 340 345 350 134 GAT AGG GTT ATT GCT AGG CAT CAA AGG CCA TCT ATG AAG GAT AAG ATG 1105 Asp Arg Vai Ile Ala Arg His Gin Arg Pro Ser Met Lys Asp Lys Met 355 360 365 GTT AAG AGG TAT ACT GCT GCT GTT GTT TGC GAG CTT GAT AGG TAT GCT 1153 Vai Lys Arg Tyr Thr Ala Ala Vai Vai Cys Glu Leu Asp Arg Tyr Ala 370 375 380 AAG CTT CTT CCA TCT TCT CTT AGG TGC GTT GCT GCT GAT GAG TGG AAG 1201 Lys Leu Leu Pro Ser Ser Leu Arg Cys Vai Ala Ala Asp Glu Trp Lys 385 390 395 TTC AGG GAG TAT CTT ATT CCA GTT GGA ATG ACT GTT GGA AAC CTT AAG 1249 Phe Arg Glu Tyr Leu Ile Pro Vai Gly Met Thr Vai Gly Asn Leu Lys 400 405 410 ACT ACT GTT ATG CTT GAT CAA AAG GAT CCA GTT GAT CCA GAG CTT TTC 1297 Thr Thr Vai Met Leu Asp Gin Lys Asp Pro Vai Asp Pro Glu Leu Phe 415 420 425 430 GAT GGA ATG TAT GGA CTT GAT GCT GAG GTT CAT TTC GAT AAG ACT GAT 1345 Asp Gly Met Tyr Gly Leu Asp Ala Glu Vai His Phe Asp Lys Thr Asp 435 440 445 AGG TTC ATG CCA CCA TTC TCT GCT GGG AGG ATT GCC TGC GCT GGA CAA 1393 Arg Phe Met Pro Pro Phe Ser Ala Gly Arg Ile Ala Cys Ala Gly Gin 450 455 460 CTT CTT GCT GCT TAT GAG CTT TTC CTT TTC TTC TGG ACT ATT GCT GAT 1441 Leu Leu Ala Ala Tyr Glu Leu Phe Leu Phe Phe Trp Thr Ile Ala Asp 465 470 475 GTT TTC CAA ATT TTC TCT CTT GCT CAA TTC AAG GAG GGA CAT TGC ACT 1489 Vai Phe Gin Ile Phe Ser Leu Ala Gin Phe Lys Glu Gly His Cys Thr 480 485 490 GCT GTT ACT CTT ATT ATT GAT TGC CTT GCT GTT AGG TAT GAT CTT TGC 1537 Ala Vai Thr Leu Ile Ile Asp Cys Leu Ala Vai Arg Tyr Asp Leu Cys 495 500 505 510 135 1586 1610 CTT GCT AGG TAGGGACCTT TACCGTTTGT GTGACCGTGT CAATGCTTGC Leu Ala Arg AATGGGCTTT TAATAATATT ATTA (2) INFORMAÇÃO PARA SEQ ID N°: 20: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1698 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (ix) CARACTERÍSTICA:Met Ser Ile Leu Leu Cys Phe Leu Cys Leu Leu Pro Go Phe Leu Go 15 20 25 30 132 145 TCT CTT TCT ATT CTT TCT AAG AGG CTT AAG Ser Leu Ser Ile Leu Ser Lys Arg Leu Lys 35 40 CCA CCA GGA CCA AAG ACT CTT CCA ATT Pro Pro Gly Pro Lys Thr Leu Pro Ile Ile 50 55 AGG CAA GAT CCA GAG GCT TCT CTT TCT CAA Arg Gin Asp Pro Glu Ala Ser Leu Ser Gin 65 70 CCA GTT GTT CAT TGC GAG AAG CTT GAG TCT Pro Go Glycine Glycerol Glycerol Glycerol Glycogen Glycerol Glycogen Glycogen Glycogen Glycogen Glycogen Glycerol Glycogen Glycogen Glycogen Glycogen Glycogen Glycogen Glycogen Glycogen Glycogen Gly Gly Gly Gly Lys Ser Pro 115 120 ACT GGA GGA TAT GGA CTT GAG AGG AAG Thr Gly Gly Tyr Gly Leu Glu Arg Ser Lys 130 135 AAG GAG ACT TGG TCT GCT TTC AGG CAA TAT Lys Glu Thr Trp Ser Ala Phe Arg Gin Tyr 145 150 GGA ATG GGA GGA AGG TCT TTC GAG CTT ATG Gly Met Gly Gly Arg Ser Phe Glu Leu Met 160 165 TGC CTT GTT GAT GGA TAT GTT TCT AGG AAG Cys Leu Vai Asp Gly Tyr Will Be Arg Lys 175 180 CCA TCT AAG TGG AAG CTT Pro Ser Lys Trp Lys Leu 45 GGA AAC CTT CAA GAT GAG 193 Gly Asn Leu Gin Asp Glu 60 GGA CAT ATT GCT AGG GGA 241 Gly His Ile Ala Arg Gly 75 TTC GGA ACT CAA CCA ACT 289 Phe Gly Thr Gin Pro Thr 90 GCT CTT CTT CAT GGA GCT 337 Leu Leu His Gly Ala 105 110 CCA AAC GAT GCT TGG GAT 385 Pro Asn Asp Ala Trp Asp 125 AAC GAG AGG TGG AAG GAG 433 Asn Glu Arg Trp Lys Glu 140 AGG ACT CTT AGG GCT TTC 481 Arg Thr Leu Arg Ala Phe 155 AGG TGG CAA GAG GCT CAT 529 Arg Trp Gin Glu Ala His 170 GCT TCT GGA ACT GAT CCA 577 Ala Ser Gly Thr Asp Pro 185 190 133 625 ACT AAG GAT CTT GAG GAT TCT AGG TTC AAC ATT ATT ATG GGA GCT.ACT Thr Lys Asp Leu Glu Asp Ser Arg Phe Asn Ile Ile Met Gly Ala Thr 195 200 205 TTC AAC CAA GGA CTT GAT TAT AAG ATT AAG ACT TTC CTT GAT AGG CAT 673 Phe Asn Gin Gly Leu Asp Tyr Lys Ile Lys Thr Phe Leu Asp Arg His 210 215 220 GAG AGG AGG AAC TTC CAA TTC AAC AAT GTT GAT GCT GTT TAT CAT CAA 721 Glu Arg Arg Asn Phe Gin Phe Asn Asn Asp Ala Vai Tyr His Gin 225 230 235 ATG AAG GAT GCT GAG AGG GGA TTC GTT GAT TCT AGG GGA TGG CAA GAT 769 Met Lys Asp Ala Glu Arg Gly Phe Go Asp Ser Arg Gly Trp Gin Asp 240 245 250 GAG TTC GGA ATT GCT CTT CAA CAA GTT GTT GCT CAA ATT CTT GAT AAG 817 Glu Phe Gly Ile Ala Leu Gin Gin Go Vai Ala Gin Ile Leu Asp Lys 255 260 265 270 CCA CTT GAT CAT CAA AAG GCT CTT GAG AGG TGG CAA CCA AGG GAT TCT 865 Pro Leu Asp His Gin Lys Ala Leu Glu Arg Trp Gin Pro Arg Asp Ser 275 280 285 CTT AAC CAT TTC ATT GGA GCT AGG GAT GAT GAG ATG GTT CAA ATT AAG 913 Leu Asn His Phe Ile Gly Ala Arg Asp Asp Glu Met Vai Gin Ile Lys 290 295 300 TAT TGT TGC AAG GAT GCT CTT AGG ATG TTC GAT ACT GGA ATT CTT 961 Tyr Asp Phe Cys Lys Asp Ala Leu Arg Met Phe Asp Thr Gly .I Leu 305 310 315 GCT GCT GAT CTT CAA TCT TCT ACT TCT TCT ATT AGG TGG GAG CCA ATT 1009 Ala Ala Asp Leu Gin Ser Ser Thr Ser Ser Arg Ile Trp Glu Pro Ile 320 325 330 GTT GTT ATG CTT CAA GCT GAG GTT AAG GGA GAG ATT TGC GAG GAG CTT 1057 Vai Vai Met Leu Gin Ala Glu Vai Lys Gly Glu Ile Cys Glu Glu Leu 335 340 345 350 134 GAT AGG GTT ATT GCT AGG CAT CAA AGG CCA TCT ATG AAG GAT AAG ATG 1105 Asp Arg Ile Ile Ala Arg His Gin Arg Pro Ser Met Lys Asp Lys Met 355 360 365 GTT AAG AGG TAT ACT GCT GCT GTT GTT TGC GAG CTT GAT AGG TAT GCT 1153 Go Lys Arg Tyr Thr Ala Ala Goa Cys Glu Leu Asp Arg Tyr Ala 370 375 380 AAG CTT CTT CCA TCT TCT CTT AGG TGC GTT GCT GCT GAT GAG TGG AAG 1201 Lys Leu Leu Pro Ser Ser Leu Arg Cys Go Ala Ala Asp Glu Trp Lys 385 390 395 TTC AGG GAG TAT CTT ATT CCA GTT GGA ATG ACT GTT GGA AAC CTT AAG 1249 Phe Arg Glu Tyr Leu Ile Pro Go Gly Met Thr Go Gly Asn Leu Lys 400 405 410 ACT ACT GTT ATG CTT GAT CAA AAG GA T CCA GTT GAT CCA GAG CTT TTC 1297 Thr Thr Go Met Leu Asp Gin Lys Asp Pro Go Asp Pro Glu Leu Phe 415 420 425 430 GAT GGA ATG TAT GGA CTT GAT GCT GAG GTT CAT TTC GAT AAG ACT GAT 1345 Asp Gly Met Tyr Gly Leu Asp Ala Glu His Phe Asp Lys Thr Asp 435 440 445 AGG TTC ATG CCA CCA TTC TCT GCT GGG AGG ATT GCC TGC GCT GGA CAA 1393 Arg Phe Met Pro Pro Phe Ser Ala Gly Arg Ile Ala Cys Ala Gly Gin 450 455 460 CTT CTT GCT GCT GCT CTT TTC CTT TTC TTC TGT ACT ATT GCT GAT 1441 Leu Leu Wing Ala Tyr Glu Leu Phe Leu Phe Phe Trp Thr Ile Ala Asp 465 470 475 GTT TCA CAA ATT TTC TCT CTT GCT CAA TTC AAG GAG GGA CAT TGC ACT 1489 Go Phe Gin Ile Phe Ser Leu Ala Gin Phe Lys Glu Gly His Cys Thr 480 485 490 GCT GTT ACT CTT ATT ATT GAT TGC CTT GCT GTT AGG TAT GAT CTT TGC 1537 Ala Vai Thr Leu Ile Ile Asp Cys Leu Ala Go Arg Tyr Asp Leu Cys 495 500 505 510 135 1586 1610 CTT GCT AGG TAGGGACCTT TACCGTTTGT GTGA CCGTGT CAATGCTTGC Leu Ala Arg AATGGGCTTT TAATAATATT ATTA (2) INFORMATION FOR SEQ ID NO: 20: (i) SEQUENCE CHARACTERISTICS: (A) LENGTH: 1698 base pairs (B) TYPE: nucleic acid (C) STRANDEDNESS: simple (D) TOPOLOGY: linear (ii) TYPE OF MOLECULE: DNA (ix) CHARACTERISTICS:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 8..1504 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 20: GAGAACA ATG GCA CAA TTC GGC ACG AGG GAA ATT CTA GTC TCA CTC TTT 49 Met Ala Gin Phe Gly Thr Arg Glu Ile Leu Vai Ser Leu Phe 1 5 10 CTC TTT CTA ATA CTA ATA AAG TTC ACA TTT TTA AAA CTC AAA ACC CCC 97 Leu Phe Leu Ile Leu Ile Lys Phe Thr Phe Leu Lys Leu Lys Thr Pro 15 20 25 30 CAA AAC CTC CCC CCA TCA CCA CCA TCT TTT CCA ATC ACC GGC CAT CTC 145 Gin Asn Leu Pro Pro Ser Pro Pro Ser Phe Pro Ile Thr Gly His Leu 35 40 45 136 193 CAT CTC CTA AAA CAA CCA ATC CAC AGA ACT CTC CAC CAA ATC GCC ACC HiS Leu Leu Lys Gin Pro Ile His Arg Thr Leu His Gin Ile Ala Thr 50 55 60 AAG TAC GGG GAC ATC TTA TTC CTC CGA TTC GGA ACA CGA AAA GTC CTA Lys Tyr Gly Asp Ile Leu Phe Leu Arg Phe Gly Thr Arg Lys Vai Leu 65 70 75 GTC ATC TCC TCT CTC CCC GCC GTA CAA GAA TGT TTC ACT ATA AAC GAC Vai Ile Ser Ser Leu Pro Ala Vai Gin Glu Cys Phe Thr Ile Asn Asp 80 B5 90 ATC ATT TTC GCT AAC CGC CCA ACA ATT CTC GCC GGG AAG CAC CTC AAT Ile Ile Phe Ala Asn Arg Pro Thr Ile Leu Ala Gly Lys His Leu Asn 95 100 105 110 TAC AAT TCC ACC ACC ATG GGA TTC GCC TCC TAT GGC GAT CAC TGG CGT 385 Tyr Asn Ser Thr Thr Met Gly Phe Ala Ser Tyr Gly Asp His Trp Arg 115 120 125 CAT CTC CGA CGA CTC ACA ACA ATT GAG CTC TTC TCT GCA AAT CGT GTT 433 His Leu Arg Arg Leu Thr Thr Ile Glu Leu Phe Ser Ala Asn Arg Vai 130 135 140 GCC ATG TTT TCC GGG TTC CGG GCC GAT GAA AGT ACA GCT TTT TAT CAA 481 Ala Met Phe Ser Gly Phe Arg Ala Asp Glu Ser Thr Ala Phe Tyr Gin 145 150 155 ACA GTT GTT CCA GGA AAT CGG GAT TCG GGA AAG ATA GTA ACT TTG ACA 529 Thr Vai Vai Pro Gly Asn Arg Asp Ser Gly Lys Ile Vai Thr Leu Thr 160 165 170 TCG AAA CTG ATG GAG CTT ACA CTG AAT AAC ATA ATG AGA ATG GCT GCC 577 Ser Lys Leu Met Glu Leu Thr Leu Asn Asn Ile Met Arg Met Ala Ala 175 180 185 190 GGA AAA CGG TTT TAC GGG AAA GAA GTG AAG GAT GAA GAA GGT GAG TTG 625 Gly Lys Arg Phe Tyr Gly Lys Glu Vai Lys Asp Glu Glu Gly Glu Leu 195 200 205 137 673 TTG CAG GAT CTT ATG AAG AAA ATG GAG GCG CTC CGG GGG AAT TCA ACG Leu Gin Asp Leu Met Lys Lys Met Glu Ala Leu Arg Gly Asn Ser Thr 210 215 220 GTG AAA CGA GAT TAT TTT CCA GTA TTG CAG TGG ATT GAT ΤΑΓ CAG GGA Vai Lys Arg Asp Tyr Phe Pro Vai Leu Gin Trp Ile Asp Tyr Gin Gly 225 230 235 GTA AAG AAG AAG ATG AGG AAC CTG ATG AAG AAA ATG GAC GGG TTC TTG Vai Lys Lys Lys Met Arg Asn Leu Met Lys Lys Met Asp Gly Phe Leu 240 245 250 CAA AAT CTC ATT GAT GAA CAC CGA AAC ACG ACG TTG TGG ATC AAT CAA Gin Asn Leu Ile Asp Glu His Arg Asn Thr Thr Leu Trp Ile Asn Gin 255 260 265 270 721 769 817 GTT CGA GCA ACT CGG ACA AAA AGA GGA ACT TGG ACA CTG GTA GAT GTT Vai Arg Ala Thr Arg Thr Lys Arg Gly Thr Trp Thr Leu Vai Asp Vai 275 2Θ0 285 ATG TTG AAT CTT AAA AAG ACA CAA CCT GAC TTC TAC ACT GAT CTA ACT Met Leu Asn Leu Lys Lys Thr Gin Pro Asp Phe Tyr Thr Asp Leu Thr 290 295 300 ATC AAA GGT GTC ATT CAG ACA ACA CTG ACT GCA GGA TCT CAA ACG TCA Ile Lys Gly Vai Ile Gin Thr Thr Leu Thr Ala Gly Ser Gin Thr Ser 305 310 315 GCA GTT ACA CTA GAA TGG GCG CTG TCA CTT CTT CTC AAC CAT CCT CAA Ala Vai Thr Leu Glu Trp Ala Leu Ser Leu Leu Leu Asn His Pro Gin 320 325 330 GTA ATG CAC AAA GCT TAT GCC GAA ATA GAG GCG ATT GTC GGG ACC AAC Vai Met His Lys Ala Tyr Ala Glu Ile Glu Ala Ile Vai Gly Thr Asn 335 340 345 350 CGC TTA TTA AAC GAA GCC GAC TTA CCA CAT CTA AGC TAT TTA CAA AAC Arg Leu Leu Asn Glu Ala Asp Leu Pro His Leu Ser Tyr Leu Gin Asn 355 360 365 865 913 961 1009 1057 138 1105 1153 ATA ATC ACC GAG ACA TTT CGA CTC TTC CCA CCA GTA CCA CTT TTA CTA Ile Ile Thr Glu Thr Phe Arg Leu Phe Pro Pro Vai Pro Leu Leu Leu 370 375 380 ccc CAT AAA TCA TCA GCA GAT TGC ATA GTT TCC GGG TTT CAC ATA CCA 1201 Pro His Lys Ser Ser Ala Asp Cys Ile Vai Ser Gly Phe His Ile Pro 385 390 395 CGG GGC ACA ATG TTG CTA GTG AAC ACA TGG AGC ATG AAT AGA AAT CCA 1249 Arg Gly Thr Met Leu Leu Vai Asn Thr Trp Ser Met Asn Arg Asn Pro 400 405 410 AGA TTA TGG AAG GAA CCA GAG AAA TTC ATA CCA GAA AGA TTT GAA GGA 1297 Arg Leu Trp Lys Glu Pro Glu Lys Phe Ile Pro Glu Arg Phe Glu Gly 415 420 425 430 GGA GAA AAT ACT GAA GGG TGT AAC TAT AAA TTG CTT CCT TTC GGT GCA 1345 Gly Glu Asn Thr Glu Gly Cys Asn Tyr Lys Leu Leu Pro Phe Gly Ala 435 440 445 GGA AGG CGG GCT TGT CCG GGG GCC GGT GTG GCG AAA CGA ATG GTA GGA 1393 Gly Arg Arg Ala Cys Pro Gly Ala Gly Vai Ala Lys Arg Met Vai Gly 450 455 460 CTC ACT TTA GGT GCA TTG ATT CAG TGT TTT GAG TGG GAA AGA ATT GGG 1441 Leu Thr Leu Gly Ala Leu Ile Gin Cys Phe Glu Trp Glu Arg Ile Gly 465 470 4 5 GAA GAA GAA ATA GAT TTG AGT GAA GGA ACA GGT CTT ACT ATG CCA AAA 1489 Glu Glu Glu Ile Asp Leu Ser Glu Gly Thr Gly Leu Thr Met Pro Lys 480 485 490 GAT TTC CTT TGG AAG TAATATGCAA ACCTCGGCAA AACATGATTA ACTTTCTTTC 1544(A) NAME / KEY: CDS (B) LOCATION: 8..1504 (xi) SEQUENCE DESCRIPTION: SEQ ID NO: 20: GAGAACA ATG GCA CAA TTC GGC ACG AGG GAA ATT CTA GTC TCA CTC TTT 49 Met Ala Gin Phe Gly Thr Arg Glu Ile Leu Will Be Leu Phe 1 5 10 CTC TTT CTA ATA CTA ATA AAG TTC ACA TTT TTA AAA CTC AAA ACC CCC 97 Leu Phe Leu Ile Leu Ile Lys Phe Thr Phe Leu Lys Leu Lys Thr Pro 15 20 25 30 CAA AAC CTC CCC CCA TCA CCA CCA TCT TTT CCA ATC ACC GGC CAT CTC 145 Gin Asn Leu Pro Pro Ser Pro Pro Ser Phe Pro Ile Thr Gly His Leu 35 40 45 136 193 CAT CTC CTA AAA CAA CCA ATC CAC AGA ACT CTC CAC CAA ATC GCC ACC HiS Leu Leu Lys Gin Pro Ile His Arg Thr Leu His Gin Ile Ala Thr 50 55 60 AAG TAC GGG GAC ATC TTA TTC CTC CGA TTC GGA ACA CGA AAA GTC CTA Lys Tyr Gly Asp Ile Leu Phe Leu Arg Phe Gly Thr Arg Lys Vai Leu 65 70 75 GTC ATC TCC TCT CTC CCC GCC GTA CAA GAA TGT TTC ACT ATA AAC GAC Go Ile Ser Ser Leu Pro Ala Go Gin Glu Cys Phe Thr Ile Asn Asp 80 B5 90 ATC ATT TTC GCT AAC CGC CCA ACA ATT CTC GCC GGG AAG CAC CTC AAT Ile Ile Phe Ala Asn Arg Pro Thr Ile Leu Ala Gly Lys His Leu Asn 95 100 105 110 TAC AAT TCC ACC ACC ATG GGA TTC GCC TCC TAT GGC GAT CAC TGG CGT 385 Tyr Asn Ser Thr Met Gly Phe Ala Ser Tyr Gly Asp His Trp Arg 115 120 125 CAT CTC CGA CGA CTC ACA ACA ATT GAG CTC TTC TCT GCA AAT CGT GTT 433 His Leu Arg Arg Leu Thr Thr Ile Glu Leu Phe Ser Ala Asn Arg Val 130 135 140 GCC ATG TTT TCC GGG TTC CGG GCC GAT GAA AGA ACA GCT TTT TAT CAA 481 Ala Met Phe Ser Gly Phe Arg Ala Asp Glu Ser Thr Ala Phe Tyr Gin 145 150 155 ACA GTT GTT CCA GGA AAT CGG GAT TCG GGA AAG ATA GTA ACT TTG ACA 529 Thr Go Go Pro Gly Asn Arg Asp Ser Gly Lys Ile Go Thr Leu Thr 160 165 170 TCG AAA CTG ATG GAG CTT ACA CTG AAT AAC ATA ATG AGA ATG GCT GCC 577 Ser Lys Leu Met Glu Leu Thr Leu Asn Asn Ile Met Arg Met Ala Ala 175 180 185 190 GG A AAA CGG TTT TAC GGG AAA GAA GTG AAG GAT GAA GGT GAG TTG 625 Gly Lys Arg Phe Tyr Gly Lys Glu Vai Lys Asp Glu Glu Gly Glu Leu 195 200 205 137 673 TTG CAG GAT CTT ATG AAG AAA ATG GAG GCG CTC CGG GGG AAT TCA ACG Leu Gin Asp Leu Met Lys Lys Met Glu Ala Leu Arg Gly Asn Ser Thr 210 215 220 GTG AAA CGA GAT TAT TTT CCA GTA TTG CAG TGG ATT GAT ΤΑΓ CAG GGA ΤΑΓ CAG GGA V Lys Arg Asp Tyr Phe Pro V Leu Gin Trp Ile Asp Tyr Gin Gly 225 230 235 GTA AAG AAG AAG ATG AGG AAC CTG ATG AAG AAA ATG GAC GGG TTC TTG Go Lys Lys Lys Met Arg Asn Leu Met Lys Lys Met Asp Gly Phe Leu 240 245 250 CAA AAT CTC ATT GAT GAA CAC CGA AAC ACG ACG TTG TGG ATC AAT CAA Gin Asn Leu Ile Asp Glu His Arg Asn Thr Thr Leu Trp Ile Asn Gin 255 260 265 270 721 769 817 GTT CGA GCA ACT CGG ACA AAA AGA GGA ACT TGG ACA CTG GTA GAT GTT Go Arg Ala Thr Arg Thr Lys Arg Gly Thr Trp Thr Leu Va Asp Va 275 2Θ0 285 ATG TTG AAT CTT AAA AAG ACA CAA CCT GAC TTC TAC ACT GAT CTA ACT Met Leu Asn Leu Lys Lys Thr Gin Pro Asp Phe Tyr Thr Asp Leu Thr 290 295 300 ATC AAA GGT GTC ATT CAG ACA ACA CTG ACT GCA GGA TCT CAA ACG TCA Ile Lys Gly Ile Ile Gin Thr Thr Leu Thr Ala Gly Ser Gin Thr Ser 305 310 315 GCA GTT ACA CTA GAA TGG GCG CTG TCA CTT CTT CTC AAC CAT CCT CAA Ala Vai Thr Leu Glu Trp Ala Leu Ser Leu Leu Leu Asu His Pro Gin 320 325 330 GTA ATG CAC AAA GCT TAT GCC GAA ATA GAG GCG ATT GTC GGG ACC AAC Go Met His Lys Ala Tyr Ala Glu Ile Glu Ala Ile Go Gly Thr Asn 335 340 345 350 CGC TTA TTA AAC GAA GCC GAC TTA CCA CAT CTA AGC TAT TTA CAA AAC Arg Leu Leu Asn Glu Ala Asp Leu Pro His Leu Ser Tyr Leu Gin Asn 355 360 365 865 913 961 1009 1057 138 1105 1153 ATA ATC ACC GAG ACA TTT CGA CTC TTC CCA CCA GTA CCA CTT TTA CTA Ile Ile Thr Glu Thr Phe Arg Leu Phe Pro Pro Go Pro Leu Leu Leu 370 375 380 ccc CAT AAA TCA TCA GCA GAT TGC ATA GTT TCC GGG TTT CAC ATA CCA 1201 Pro His Lys Ser Ser Al Asp Cys Ile Will Be Gly Phe His Ile Pro 385 390 395 CGG GGC ACA ATG TTG CTA GTG AAC ACA TGG AGC ATG AAT AGA AAT CCA 1249 Arg Gly Thr Met Leu Leu Will Asn Thr Trp Ser Met Asn Arg Asn Pro 400 405 410 AGA TTA TGG AAG GAA CCA GAG AAA TTC ATA CCA GAA AGA TTT GAA GGA 1297 Arg Leu Trp Lys Glu Pro Glu Lys Phe Ile Pro Glu Arg Phe Glu Gly 415 420 425 430 GGA GAA AAT ACT GAA GGG TGT AAC TAT AAA TTG CTT CCT TTC GGT GCA 1345 Gly Glu Asn Thr Glu Gly Cys Asn Tyr Lys Leu Leu Pro Phe Gly Ala 435 440 445 GGA AGG CGG GCT TGT CCG GGG GCC GGT GTG GCG AAA CGA ATG GTA GGA 1393 Gly Arg Arg Ala Cys Pro Gly Ala Gly Va Ala Lys Arg Met Val Gly 450 455 460 CTC ACT TTA GGT GCA TTG ATT CAG TGT TTT GAG TGG GAA AGA ATT GGG 1441 Leu Thr Leu Gly Ala Leu Ile Cys Phe Glu Trp Glu Arg Ile Gly 465 470 4 5 GAA GAA GAA ATA GAT TTG AGT GAA GGA ACA GGT CTT ACT ATG CCA AAA 1489 Glu Glu Glu Ile Asp Leu Ser Glu G ly Thr Gly Leu Thr Met Pro Lys 480 485 490 GAT TTC CTT TGG AAG TAATATGCAA ACCTCGGCAA AACATGATTA ACTTTCTTTC 1544

Asp Phe Leu Trp Lys 495 TACATTGTTA TAAAAGGTGG GTTTCTTTGC AGGTGCCAAC CCTAATTCAA ATATCGCATT 1604 TTTTCCCTGC AACCCAGCTG CTAACCAAAT ATCACTGTTT CTCATTATTC CTTATATAAA 1664 139Asp Phe Leu Trp Lys 495 TACATTGTTA TAAAAGGTGG GTTTCTTTGC AGGTGCCAAC CCTAATTCAA ATATCGCATT 1604 TTTTCCCTGC AACCCAGCTG CTAACCAAAT ATCACTGTTT CTCATTATTC CTTATATAAA 1664 139

ACCTTAAAGC ACTATTTGCC TCCTAAAAAA AAAA 1698ACCTTAAAGC ACTATTTGCC TCCTAAAAAA AAAA 1698

Lisboa, 14 de Dezembro de 2006 140Lisbon, 14 December 2006

Claims (34)

REIVINDICAÇÕES 1. Molécula de ácido nucleico isolada que codifica ou é complementar a uma molécula de ácido nucleico isolada que codifica uma epoxigenase que é um polipéptido de monooxigenase de função mista que é capaz de catalizar a epoxigenação de uma ligação de carbono numa molécula de ácido gordo, em que a referida epoxigenase compreende uma sequência de aminoácidos que tem os três motivos ricos em histidina: (i) His-(Xaa) 3-4-His; (ii) His-(Xaa) 2-3-His-His/ e (iii) His-(Xaa) 2-3_His-His .An isolated nucleic acid molecule encoding or complementary to an isolated nucleic acid molecule encoding an epoxygenase which is a mixed function monooxygenase polypeptide which is capable of catalyzing the epoxygenation of a carbon bond in a fatty acid molecule , wherein said epoxygenase comprises an amino acid sequence having the three histidine rich motifs: (i) His- (Xaa) 3-4-His; (ii) His- (Xaa) 2-3-His-His / e (iii) His- (Xaa) 2-3 His-His. 2. Molécula de ácido nucleico isolada de acordo com a reivindicação 1, em que a ligação de carbono é uma ligação dupla numa molécula de ácido gordo insaturado.An isolated nucleic acid molecule according to claim 1, wherein the carbon bond is a double bond on an unsaturated fatty acid molecule. 3. Molécula de ácido nucleico isolada de acordo com as reivindicações 1 ou 2, em que a referida epoxigenase é uma enzima Δβ-epoxigenase, uma enzima A9-epoxigenase, uma enzima A12-epoxigenase ou uma Al5-epoxigenase.An isolated nucleic acid molecule according to claims 1 or 2, wherein said epoxygenase is an Δβ-epoxygenase enzyme, an A9-epoxygenase enzyme, an A12-epoxygenase enzyme or an Al5-epoxygenase. 4. Molécula de ácido nucleico isolada de acordo com qualquer uma das reivindicações 1 a 3, derivada de uma planta.An isolated nucleic acid molecule according to any one of claims 1 to 3, derived from a plant. 5. Molécula de ácido nucleico isolada de acordo com a reivindicação 4, em que a planta é seleccionada da lista compreendendo Crepis spp.r Euphorbia spp., Chrysanthemum spp. e Vernonia spp. 1The isolated nucleic acid molecule according to claim 4, wherein the plant is selected from the list comprising Crepis spp. Euphorbia spp., Chrysanthemum spp. and Vernonia spp. 1 6. Molécula de ácido nucleico isolada de acordo com a reivindicação 4, em que a planta produz niveis elevados de ácido vernólico.The isolated nucleic acid molecule according to claim 4, wherein the plant produces high levels of vernolic acid. 7. Molécula de ácido nucleico isolada de acordo com a reivindicação 5, em que a planta é seleccionada da lista compreendendo Crepis biennis, Crepis aurea, Crepis conyzaefolia, Crepis intermédia, Crepis occidentalis, Crepis palaestina, Crepis vesicaria, Crepis xacintha e Vernonia galamensis.The isolated nucleic acid molecule according to claim 5, wherein the plant is selected from the list comprising Crepis biennis, Crepis aurea, Crepis conyzaefolia, Crepis intermédia, Crepis occidentalis, Crepis palaestina, Crepis vesicaria, Crepis xacintha and Vernonia galamensis. 8. Molécula de ácido nucleico isolada de acordo com qualquer uma das reivindicações 1 a 7, compreendendo uma sequência de nucleótidos que é, pelo menos, cerca de 65% idêntica a qualquer uma de SEQ ID Nos: 1, 3 ou 5 ou uma sua sequência complementar.An isolated nucleic acid molecule according to any one of claims 1 to 7, comprising a nucleotide sequence that is at least about 65% identical to any one of SEQ ID Nos: 1, 3 or 5 or a sequence thereof. sequence. 9. Molécula de ácido nucleico isolada de acordo com qualquer uma das reivindicações 1 a 8 capaz de hibridar sob, pelo menos, condições de restringência moderada com, pelo menos, 20 nucleótidos contíguos contidos dentro de qualquer uma de SEQ ID Nos: 1, 3 ou 5 ou uma sua sequência complementar.An isolated nucleic acid molecule according to any one of claims 1 to 8 capable of hybridizing under at least moderate stringency conditions to at least 20 contiguous nucleotides contained within any of SEQ ID Nos: 1,3 or 5 or a complementary sequence thereof. 10. Molécula de ácido nucleico isolada de acordo com qualquer uma das reivindicações 1 a 9, compreendendo a sequência de nucleótidos apresentada em SEQ ID Nos: 1, 3 ou 5, ou uma sua sequência de nucleótidos complementar ou, pelo menos, 20 nucleótidos contíguos à mesma.An isolated nucleic acid molecule according to any one of claims 1 to 9, comprising the nucleotide sequence shown in SEQ ID Nos: 1, 3 or 5, or a complementary nucleotide sequence thereof, or at least 20 contiguous nucleotides the same. 11. Construção genética que compreende a molécula de ácido nucleico isolada de acordo com qualquer uma das reivindicações 1 a 10, ligada operacionalmente a uma sequência promotora, em que a referida molécula de ácido 2 nucleico é capaz de ser transcrita na orientação de sentido ou anti-sentido relativamente à direcção de transcrição in vivo de um gene de epoxigenase monooxigenase de função mista de ocorrência natural.A genetic construct comprising the isolated nucleic acid molecule according to any one of claims 1 to 10, operably linked to a promoter sequence, wherein said nucleic acid molecule is capable of being transcribed in the sense or anti-sense orientation -sense relative to the in vivo transcription direction of a naturally occurring mixed function epoxygenase monooxygenase gene. 12. Método de alteração do nivel de ácidos gordos epoxi numa célula, tecido, órgão, organismo não humano, ou microrganismo, compreendendo o referido método a introdução de uma molécula de sentido, anti-sentido, ribozima ou co-supressão compreendendo a molécula de ácido nucleico isolada de acordo com qualquer uma das reivindicações 1 a 10 numa célula, tecido, órgão ou num organismo não humano e a incubação da referida célula durante um período de tempo e sob condições suficientes para ocorrer a expressão da referida molécula de sentido, anti-sentido, ribozima ou co-supressão.A method of altering the level of epoxy fatty acids in a cell, tissue, organ, non-human organism, or microorganism, said method comprising introducing a sense, antisense, ribozyme or co-suppression molecule comprising the nucleic acid according to any one of claims 1 to 10 in a cell, tissue, organ or a non-human organism and the incubation of said cell for a period of time and under conditions sufficient to occur the expression of said sense molecule, sense, ribozyme or co-suppression. 13. Método de acordo com a reivindicação 12, em que o passo de introdução da molécula de sentido, anti-sentido, ribozima ou co-supressão compreende a transformação estável da célula, tecido, órgão ou organismo não humano com a molécula de sentido, anti-sentido, ribozima ou co-supressão.A method according to claim 12, wherein the step of introducing the sense, antisense, ribozyme or co-suppression molecule comprises the stable transformation of the non-human cell, tissue, organ or organism to the sense molecule, antisense, ribozyme or co-suppression. 14. Método de produção de um polipéptido de epoxigenase monooxigenase de função mista enzimaticamente activo recombinante numa célula, compreendendo o referido método o cultivo de uma célula que compreende a molécula de ácido nucleico isolada de acordo com qualquer uma das reivindicações 1 a 10 durante um período de tempo e sob condições suficientes para ocorrer a expressão.A method of producing a recombinantly enzyme-linked mixed function epoxygenase polypeptide in a cell, said method comprising culturing a cell comprising the isolated nucleic acid molecule according to any one of claims 1 to 10 for a period of time and under conditions sufficient for expression to occur. 15. Método de acordo com a reivindicação 14, compreendendo o primeiro passo adicional de transformar a célula com a molécula de ácido nucleico isolada. 3A method according to claim 14, comprising the further first step of transforming the cell with the isolated nucleic acid molecule. 3 16. Método de produção de um polipéptido de epoxigenase monooxigenase de função mista enzimaticamente activo recombinante numa célula, compreendendo o referido método os passos de: (i) produção de uma construção genética que compreende a molécula de ácido nucleico isolada de acordo com qualquer uma das reivindicações 1 a 10, colocada operacionalmente sob o controlo de um promotor capaz de conferir expressão na referida sequência genética na referida célula, e opcionalmente um elemento de intensificação de expressão; (ii) transformação da referida construção genética na referida célula; e (iii) selecção de transformantes que expressam uma epoxigenase funcional codificada pela sequência genética a um nivel elevado.A method of producing a recombinantly enzyme-linked mixed function epoxygenase polypeptide in a cell, said method comprising the steps of: (i) producing a genetic construct comprising the isolated nucleic acid molecule according to any one of claims 1 to 10, operably placed under the control of a promoter capable of conferring expression on said gene sequence in said cell, and optionally an expression enhancing element; (ii) transforming said genetic construct into said cell; and (iii) selection of transformants expressing a functional epoxygenase encoded by the genetic sequence at a high level. 17. Método de produção de um polipéptido de epoxigenase monooxigenase de função mista enzimaticamente activo recombinante numa planta transgénica compreendendo os passos de: (i) produção de uma construção genética que compreende a molécula de ácido nucleico isolada de acordo com qualquer uma das reivindicações 1 a 10 colocada operacionalmente sob o controlo de um promotor especifico de semente e opcionalmente um elemento de intensificação de expressão, em que a referida sequência genética é também colocada a montante de uma sequência terminadora de transcrição; (ii) transformação da referida construção genética numa célula ou tecido da referida planta; e 4 (iii) selecção de transformantes que expressam uma epoxigenase funcional codificada pela sequência genética a um nivel elevado em sementes.A method of producing a recombinantly enzyme-linked mixed function epoxygenase polypeptide in a transgenic plant comprising the steps of: (i) producing a genetic construct comprising the isolated nucleic acid molecule according to any one of claims 1 to 10 operably placed under the control of a specific seed promoter and optionally an expression enhancement element, wherein said gene sequence is also placed upstream of a transcription terminator sequence; (ii) transforming said genetic construct into a cell or tissue of said plant; and (iii) selection of transformants that express a functional epoxigenase encoded by the genetic sequence at a high seed level. 18. Método de acordo com a reivindicação 17, em que a planta é uma espécie de semente oleaginosa que produz normalmente niveis elevados de ácido linoleico.A method according to claim 17, wherein the plant is a kind of oleaginous seed which normally produces high levels of linoleic acid. 19. Método de acordo com as reivindicações 17 ou 18, em que a planta é seleccionada da lista compreendendo linho Linola®, colza de semente oleaginosa, girassol, cártamo, soja, linhaça, sésamo, semente de algodão, amendoim, azeitona ou palmeira-de-azeite.A method according to claim 17 or 18, wherein the plant is selected from the list comprising Linola® flax, oilseed rape, sunflower, safflower, soybean, flaxseed, sesame, cottonseed, peanut, olive or palm- of-olive oil. 20. Polipéptido de epoxigenase monooxigenase de função mista recombinante produzido de acordo com o método de acordo com qualquer uma das reivindicações 14 a 19.A recombinant mixed function epoxygenase monooxygenase polypeptide produced according to the method according to any one of claims 14 to 19. 21. Polipéptido de epoxigenase monooxigenase de função mista recombinante de acordo com a reivindicação 20, que compreende uma sequência de aminoácidos apresentada em qualquer uma de SEQ ID Nos: 2, 4 ou 6 ou que é, pelo menos, cerca de 50% idêntica à mesma.A recombinant mixed function epoxygenase monooxygenase polypeptide according to claim 20, which comprises an amino acid sequence shown in any one of SEQ ID Nos: 2, 4 or 6 or which is at least about 50% identical to it. 22. Método de produção de um ácido gordo epoxigenado numa célula, tecido, órgão, organismo não humano, ou microrganismo, compreendendo o referido método a incubação de uma célula, tecido, órgão ou organismo não humano que expressa o polipéptido recombinante de acordo com as reivindicações 20 ou 21 com um substrato de ácido gordo durante um período de tempo e sob condições suficientes para, pelo menos, uma ligação de carbono do referido substrato seja convertida num grupo epoxi. 5A method of producing an epoxygenated fatty acid in a cell, tissue, organ, non-human organism, or microorganism, said method comprising incubating a non-human cell, tissue, organ or organism which expresses the recombinant polypeptide according to the invention. claims 20 or 21 with a fatty acid substrate for a period of time and under conditions sufficient for at least one carbon bond of said substrate to be converted into an epoxy group. 5 23. Método de acordo com a reivindicação 22, em que o substrato de ácido gordo é um ácido gordo insaturado e a ligação de carbono do referido substrato que é epoxigenada é uma ligação dupla de carbono.A method according to claim 22, wherein the fatty acid substrate is an unsaturated fatty acid and the carbon bonding of said substrate which is epoxygenated is a carbon double bond. 24. Método de acordo com as reivindicações 22 ou 23, em que o substrato de ácido gordo é seleccionado da lista compreendendo ácido palmitoleico, ácido oleico, ácido linoleico, ácido linolénico, ácido 9,15-octadecadienóico e ácido araquidónico.A method according to claims 22 or 23, wherein the fatty acid substrate is selected from the list comprising palmitoleic acid, oleic acid, linoleic acid, linolenic acid, 9,15-octadecadienoic acid and arachidonic acid. 25. Método de acordo com qualquer uma das reivindicações 22 a 24, em que a ligação de carbono que é epoxigenada é uma ligação de carbono Δ6 ou uma ligação de carbono Δ9 ou uma ligação de carbono Δ12 ou uma ligação de carbono Δ15.A method according to any one of claims 22 to 24, wherein the carbon bond which is epoxygen is a Δ 6 carbon bond or a Δ 9 carbon bond or a Δ 12 carbon bond or a Δ 15 carbon bond. 26. Método de acordo com qualquer uma das reivindicações 22 a 25, em que o ácido gordo epoxigenado que é produzido é ácido vernólico.A method according to any one of claims 22 to 25, wherein the epoxygenated fatty acid which is produced is vernolic acid. 27. Método de acordo com qualquer uma das reivindicações 22 a 26, compreendendo o primeiro passo adicional de transformar ou transfectar a célula, tecido, órgão ou organismo não humano com uma molécula de ácido nucleico que codifica a epoxigenase monooxigenase de função mista recombinante.A method according to any one of claims 22 to 26, comprising the first further step of transforming or transfecting the non-human cell, tissue, organ or organism with a nucleic acid molecule encoding recombinant mixed-function epoxygenase monooxygenase. 28. Método de acordo com qualquer uma das reivindicações 22 a 27, em que célula, órgão, tecido ou organismo não humano em que a epoxigenase monooxigenase de função mista recombinante é expressa, é derivada a partir de bactéria, levedura, fungo, bolor, insecto, planta, pássaro ou mamifero não humano. 6A method according to any one of claims 22 to 27, wherein the cell, organ, tissue or non-human organism in which the recombinant mixed function epoxygenase monooxygenase is expressed is derived from bacteria, yeast, fungus, mold, insect, plant, bird or mammal. 6 29. Método de acordo com a reivindicação 28, em que a levedura, planta, fungo ou bolor é uma levedura, planta, fungo ou bolor oleaginoso.A method according to claim 28, wherein the yeast, plant, fungus or mold is a yeast, plant, fungus or oil mold. 30. Método de acordo com a reivindicação 29, em que a planta é uma planta de semente oleaginosa que não expressa normalmente a epoxigenase monooxigenase de função mista recombinante a um nivel elevado.A method according to claim 29, wherein the plant is an oleaginous seed plant which does not normally express the recombinant mixed function epoxygenase monooxygenase at a high level. 31. Método de acordo com a reivindicação 30, em que a planta de semente oleaginosa é seleccionada da lista compreendendo linho Linola®, colza de semente oleaginosa, girassol, cártamo, soja, linhaça, sésamo, semente de algodão, amendoim, azeitona ou palma-de-azeite.A method according to claim 30, wherein the oleaginous seed plant is selected from the list comprising Linola® flax, oleaginous seed rape, sunflower, safflower, soybean, flaxseed, sesame, cottonseed, peanut, olive or palm of olive oil. 32. Planta transformada com a molécula de ácido nucleico isolada de acordo com qualquer uma das reivindicações 1 a 10 ou uma célula, tecido ou órgão dai derivada ou a progenia da referida planta que também compreende a referida molécula de ácido nucleico.A plant transformed with the isolated nucleic acid molecule according to any one of claims 1 to 10 or a derivative cell, tissue or organ thereof or the progeny of said plant which also comprises said nucleic acid molecule. 33. Planta transformada que é capaz de expressar o polipéptido recombinante de acordo com as reivindicações 20 ou 21 ou uma célula, tecido ou órgão dai derivado ou a progenia da referida planta que é também capaz de expressar o referido polipéptido recombinante.A transformed plant which is capable of expressing the recombinant polypeptide according to claim 20 or 21 or a derivative cell, tissue or organ thereof or the progeny of said plant which is also capable of expressing said recombinant polypeptide. 34. Planta ou uma célula, tecido ou órgão dai derivado ou a sua progenia de acordo com as reivindicações 32 ou 33, que é ou é derivada de linho Linola®, colza de semente oleaginosa, girassol, cártamo, soja, linhaça, sésamo, semente de algodão, amendoim, azeitona ou palma-de-azeite. 7 Planta ou uma célula, tecido ou órgão daí derivado ou a sua progenia, de acordo com as reivindicações 32 ou 33, que é ou é derivada de Arabidopsis thaliana ou Linum usitatissimum. Lisboa, 14 de Dezembro de 2006A plant or a cell, tissue or organ thereof or the progeny thereof according to claim 32 or 33, which is or is derived from Linola® flax, oilseed rape, sunflower, safflower, soybean, flaxseed, sesame, cotton seed, peanut, olive or olive oil. The plant or a cell, tissue or organ thereof derived therefrom or its progeny according to claim 32 or 33, which is or is derived from Arabidopsis thaliana or Linum usitatissimum. Lisbon, December 14, 2006
PT98913438T 1997-04-15 1998-04-09 Plant fatty acid epoxygenase genes and uses therefor PT975765E (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
AUPO6223A AUPO622397A0 (en) 1997-04-15 1997-04-15 Plant fatty acid epoxygenase genes and uses therefor Ia
AUPO6226A AUPO622697A0 (en) 1997-04-15 1997-04-15 Plant fatty acid epoxygenase genes and uses therefor IIa
US4370697P 1997-04-16 1997-04-16
US5040397P 1997-06-20 1997-06-20

Publications (1)

Publication Number Publication Date
PT975765E true PT975765E (en) 2007-01-31

Family

ID=42676768

Family Applications (1)

Application Number Title Priority Date Filing Date
PT98913438T PT975765E (en) 1997-04-15 1998-04-09 Plant fatty acid epoxygenase genes and uses therefor

Country Status (1)

Country Link
PT (1) PT975765E (en)

Similar Documents

Publication Publication Date Title
CA2286895C (en) Plant fatty acid epoxygenase genes and uses therefor
US7834248B2 (en) Plant seed comprising vernolic acid
MXPA99009476A (en) Plant fatty acid epoxygenase genes and uses therefor
AU2002310891B2 (en) New elongase gene and production of delta9-polyunsaturated fatty acids
US6884921B2 (en) ω-3 fatty acid desaturase
EP1656449B1 (en) Fatty acid desaturases from primula
AU2002310891A1 (en) New elongase gene and production of delta9-polyunsaturated fatty acids
JP2005526496A (en) Novel elongase gene and method for producing highly unsaturated fatty acids
JP2003518369A (en) A moss gene from Fiscomitrera patens encodes a protein involved in the synthesis of polyunsaturated fatty acids and lipids
AU734232B2 (en) Plant fatty acid epoxygenase genes and uses therefor
PT975765E (en) Plant fatty acid epoxygenase genes and uses therefor
US20050170478A1 (en) Expression of phospholipid:diacylglycerine acyltranssferase (pdat) for the production of plant storage lipids with polyunsaturated fatty acids
US20210317467A1 (en) Improved method for the production of high levels of pufa in plants
CN112996915A (en) Improved methods for producing high levels of PUFAs in plants
Napier et al. New Elongase Gene And Production Of Delta-9-polyunsaturated Fatty Acids (Patent EP 1373519 B1)
Napier et al. Novel Method For The Production Of Polyunsaturated Fatty Acids (Patent WO 2004/057001 A2)
WO2000003006A1 (en) Sucrose biosynthesis genes and uses therefor
AU4762499A (en) Sucrose biosynthesis genes and uses therefor