BRPI0720759A2

BRPI0720759A2 - Produção de plantas com conteúdo alterado de óleos, proteínas ou fibras

Info

Publication number: BRPI0720759A2
Application number: BRPI0720759-0A
Authority: BR
Inventors: John P Davies; Hein Tsoeng Medard Ng
Original assignee: Agrinomics Llc
Priority date: 2006-12-15
Filing date: 2007-12-13
Publication date: 2014-01-21
Also published as: CN101600340A; WO2008076831A3; MX2009006462A; AR064371A1; EP2120531A2; WO2008076831A2; US7851672B2; US20080160158A1; EP2120531A4

Description

Relatório Descritivo da Patente de Invenção para "PRODUÇÃO DE PLANTAS COM CONTEÚDO ALTERADO DE ÓLEOS, PROTEÍNAS OU FIBRAS".

REFERÊNCIA CRUZADA A PEDIDO(S) DE PATENTE(S) RELACIONA- DO(S)

Este pedido de patente reivindica o benefício do Pedido de Pa- tente U.S. Provisório N- 60/870.345, depositado em 15 de dezembro de 2006, cuja totalidade é incorporada aqui como referência.

CAMPO DA DESCRIÇÃO

A presente invenção refere-se a plantas modificadas com conte- údo alterado de óleos, proteínas e/ou fibras, assim como a métodos de pro- dução de plantas modificadas que possuem conteúdo modificado de óleos, proteínas e/ou fibras partindo de tais plantas.

ANTECEDENTES

A capacidade de manipular a composição de sementes de plan- tas de cultivo, particularmente o conteúdo e a composição de óleo e de pro- teína das sementes, assim como a energia metabolizável disponível ("AME") na farinha de sementes no gado, possui aplicações importantes nas indús- trias agrícolas, em relação tanto a óleos para alimentos processados quanto a produtos alimentícios para animais. As sementes de plantas de cultivo a- grícolas contêm uma variedade de constituintes valiosos, incluindo óleo, pro- teína e amido. O processamento industrial pode separar parte ou todos es- tes constituintes para venda individual em aplicações específicas. Por exem- plo, quase 60% da plantação de soja nos Estados Unidos da América são triturados pela indústria de processamento da soja. O processamento da soja produz óleo purificado, que é vendido com alto valor, enquanto que o restante da farinha das sementes é vendido para a alimentação de gado (U.S. Soybean Board, 2001 Soy Stats). A semente de canola também é tritu- rada para produzir óleo e o co-produto farinha de canola (Canola Council of Canada). A farinha de canola contém uma alta porcentagem de proteína e um bom equilíbrio de aminoácidos, mas devido ao fato de que possui um alto teor de fibras e fitato, não é facilmente digerida pelo gado (Slominski, B.A. e outros, 1999 Proceedings of the 10th International Rapeseed Con- gress, Canberra, Austrália) e possui um valor inferior ao da farinha de soja.

Mais de 55% do milho produzido nos EUA são utilizados como produto alimentício para animais (lowa milho Growers Association). O valor do milho está diretamente relacionado com sua capacidade de ser digerido pelo gado. Assim, é desejável maximixar tanto o conteúdo de óleo das se- mentes quanto a AME da farinha. Para as sementes oleosas processadas tais como soja e canola, o aumento do conteúdo absoluto de óleo da semen- te aumentará o valor de tais grãos, enquanto que o aumento da AME da fa- rinha aumentará seu valor. Para o milho processado, um aumento ou um decréscimo no conteúdo de óleo pode ser desejado, dependendo de como os outros constituintes principais serão utilizados. A diminuição de óleo pode aumentar a qualidade do amido isolado através da redução de sabores inde- sejados associados com a oxidação do óleo. Alternativamente, quando o amido é utilizado para a produção de etanol, quando o sabor não é importan- te, o aumento do conteúdo de óleo pode aumentar o valor geral.

Em muitos grãos para alimentação, tais como milho e trigo, é desejável aumentar o conteúdo de óleo das sementes, porque o óleo possui maior conteúdo de energia que os outros constituintes da semente tal como 20 o carboidrato. O processamento de sementes oleosas, como a maior parte dos negócios de processamento de grãos, é um negócio de capital intensivo; assim pequenas alterações na distribuição dos produtos dos componentes de menor valor para o componente de óleo de alto valor podem ter impactos econômicos substanciais para os processadores de grãos. Em adição, o 25 aumento da AME da farinha através do ajuste do conteúdo e da composição de proteínas e de fibras das sementes, sem diminuir o conteúdo de óleo das sementes, pode aumentar o valor do produto alimentício para animais.

A manipulação biotecnológica de óleos tem mostrado fornecer alteração na composição e aumento do rendimento dos óleos. As alterações na composição incluem óleo de soja e de milho com alto conteúdo de ácido oleico (Patentes U.S. N— 6.229.033 e 6.248.939) e sementes contendo Iau- rato (Patente U.S. N2 5.639.790), entre outros. O trabalho na alteração da composição se concentrou predominantemente em sementes oleosas pro- cessadas, mas pode ser facilmente estendido a plantas de cultivo sem ser semente oleosa, incluindo milho. Embora haja interesse considerável no aumento do conteúdo de óleo, a única biotecnologia praticada atualmente 5 nesta área é a tecnologia High-Oil Corn (HOC) (Dupont, Patente U.S. Ns 5.704.160). HOC emprega polinizadores de alto conteúdo de óleo desenvol- vidos atravé do cruzamento por seleção clássico com fêmeas híbridas de elite (estéreis em relação ao sexo masculino) em um sistema de produção referido como TopCross. O sistema TopCross High Oil aumenta o conteúdo 10 de óleo no grão colhido no milho de aproximadamente 3,5% até aproxima- damente 7%, aumentando o conteúdo de energia do grão.

Embora este tenha sido produtivo, o sistema de produção HOC possui limitações inerentes. Em primeiro lugar, o sistema de ter uma baixa porcentagem de polinizadores responsáveis por um conjunto inteiro de se- 15 mentes do campo contém riscos inerentes, particularmente em anos de se- ca. Em segundo lugar, o conteúdo de óleo nos campos de HOC atuais não foi capaz de atingir um conteúdo de óleo de semente acima de 9%. Final- mente, o milho com alto conteúdo de óleo não é primariamente uma altera- ção bioquímica, mas ao invés disso um mutante anatômico (tamanho de 20 embrião maior) que possui o resultado indireto de aumentar o conteúdo de óleo. Por estas razões, uma estratégia de alto conteúdo de óleo alternativa, particularmente uma que deriva de um produto bioquímico alterado, seria especialmente valiosa.

A manipulação da composição das sementes identificou vários 25 componentes que aumentam a qualidade nutritiva, a digestibilidade e a AME na farinha de semente. O aumento do conteúdo de Iisina na canola e na soja (Falco e outros, 1995 Bio/Technology 13:577-582) aumenta a disponibilidade deste aminoácido essencial e diminui a necessidade de suplementos nutri- cionais. Foi mostrado que variedades de soja com maior proteína na semen- 30 te contêm consideravelmente mais energia metabolizável que as variedades convencionais (Edwards e outros, 1999, Poultry Sei. 79:525-527). Foi mos- trado que a diminuição do conteúdo de fitato da semente de milho aumenta a disponibilidade biológica de aminoácidos nos produtos alimentícios para animais (Douglas e outros, 2000, Poultry Sei. 79:1586-1591) e a diminuição do conteúdo de oligossacarídeos na farinha de soja aumenta a energia me- tabolizável na farinha (Parsons e outros, 2000, Poultry Sei. 79:1127-1131).

5 A soja e a canola são as plantas de cultivo alvos mais óbvias

para os mercados de óleo processado e de farinha de semente uma vez que ambas as plantas de cultivo são trituradas para óleo e a farinha remanescen- te é vendida para a alimentação de animais. Um grande grupo de trabalho comercial (por exemplo, Patente U.S. N2 5.952.544; Pedido de Patente PCT 10 N2 W09411516) demonstra que Arabidopsis é um modelo excelente para o metabolismo de óleo nestas plantas de cultivo. Verificações bioquímicas da composição do óleo das sementes identificaram genes de Arabidopsis para muitas enzimas biossintéticas críticas e levaram à identificação de ortólogos de genes importantes para a agronomia. Por exemplo, verificações utilizando 15 populações mutagenizadas quimicamente identificaram mutantes lipídicos cujas sementes exibem composição alterada de ácidos graxos (Lemieux e outros, 1990, Theor. Appi Genet. 80: 234-240; James e Dooner, 1990, The- or. Appi Genet. 80: 241-245). Verificações de mutagênese por T-DNA (Feldmann e outros, 1989, Science 243: 1351-1354) que detectaram compo- 20 sição alterada de ácidos graxos identificaram os genes da ômega 3 dessatu- rase (FAD3) e da delta-12 dessaturase (FAD2) (Patente U.S. N2 5952544; Yadav e outros, 1993, Plant Physioi 103: 467-476; Okuley e outros, 1994, Plant Cell 6(1): 147-158). Uma verificação que se concentrou no conteúdo de óleo ao invés de na qualidade do óleo, analisou mutantes induzidos quimi- 25 camente em relação a sementes enrugadas ou à densidade alterada de se- mentes, cujo conteúdo alterado de óleo da semente foi inferido (Focks e Benning, 1998, Plant Physioi 118:91-101).

Uma outra verificação, planejada para identificar enzimas envol- vidas na produção de ácidos graxos de cadeia muito longa, identificou uma mutação no gene que codifica uma diacilglicerol aciltransferase (DGAT) co- mo sendo responsável pelo acúmulo reduzido de triacil glicerol nas semen- tes (Katavic V e outros, 1995, Plant Physiol. 108(1):399-409). Foi também mostrado que a superexpressão específica à semente do cDNA de DGAT estava associada com o maior conteúdo de óleo na semente (Jako e outros, 2001, Plant Physioi 126(2):861-74). Arabidopsis é também um modelo para o entendimento do acúmulo dos componentes da semente que afetam a 5 qualidade da farinha. Por exemplo, Arabidopsis contém as proteínas de ar- mazenamento de semente albumina e globulina encontradas em muitas plantas dicotiledôneas incluindo canola e soja (Shewry 1995, Plant Cell 7:945-956). As vias bioquímicas para a síntese de componentes de fibra, tais como celulose e lignina, são conservadas dentro das plantas vasculares e 10 mutantes de Arabidopsis que afetam estes componentes foram isolados (re- visado em Chapei e Carpita 1998, Current Opinion in Plant Biology 1:179- 185).

A marcação por ativação em plantas refere-se a um método de produção de mutações aleatórias através da inserção de uma constructos de ácido nucleico heterólogo que compreende seqüências reguladoras (por e- xemplo, um intensificador) no genoma de uma planta. As seqüências regula- doras podem atuar para aumentar a transcrição de um ou mais genes vege- tais nativos; consequentemente, a marcação por ativação é um método pro- dutivo para a produção de mutantes de ganho de função, geralmente domi- nantes (ver, por exemplo, Hayashi e outros, 1992, Science 258: 1350-1353; Weigel D e outros, 2000, Plant Physiology, 122:1003-1013). O constructo inserido fornece uma marcação molecular para a identificação rápida da planta nativa cuja expressão errada causa o fenótipo mutante. A marcação por ativação também pode causar fenótipos de perda de função. A inserção pode resultar na interrupção de um gene vegetal nativo, em cujo caso o fe- nótipo é geralmente recessivo.

A marcação por ativação foi utilizada em várias espécies, inclu- indo tabaco e Arabidopsis, para a identificação de muitos tipos diferentes de fenótipos mutantes e os genes associados com estes fenótipos (Wilson e 30 outros, 1996, Plant Cell 8: 659-671; Schaffer e outros, 1998, Cell 93: 1219- 1229; Fridborg e outros, 1999, Plant Cell 11: 1019-1032; Kardailsky e outros, 1999, Science 286: 1962-1965; e Christensen S e outros, 1998, 9th Internati- onal Conference on Arabidopsis Research, Univ. of Wisconsin-Madison, 24- 28 de junho, Resumo 165).

SUMÁRIO

São fornecidas aqui plantas modificadas que possuem um fenó- tipo alterado. As plantas modificadas com um fenótipo alterado podem incluir um fenótipo de quantidade maior de óleo e/ou de melhor qualidade de fari- nha. O fenótipo alterado em uma planta modificada pode também incluir con- teúdo de óleos, proteínas e/ou fibras alterado em qualquer parte da planta modificada, por exemplo, nas sementes. Em algumas modalidades de uma planta modificada, o fenótipo alterado é um aumento no conteúdo de óleo da semente (um fenótipo de alto conteúdo de óleo). Em outras modalidades, o fenótipo alterado pode ser um aumento no conteúdo de proteínas na semen- te e/ou um decréscimo no conteúdo de fibras da semente. É também forne- cida uma farinha de semente derivada das sementes de plantas modifica- das, em que as sementes possuem conteúdo alterado de proteínas e/ou conteúdo alterado de fibras. É também fornecido um óleo derivado das se- mentes de plantas modificadas, em que as sementes possuem conteúdo de óleo alterado. Qualquer uma destas alterações pode levar a um aumento na AME da semente ou da farinha da semente das plantas modificadas, em relação às plantas de controle ou do tipo selvagem. É também fornecida aqui uma farinha, um produto alimentício ou um alimento produzido partindo de qualquer parte da planta modificada com um fenótipo alterado.

Em certas modalidades, as plantas modificadas descritas inclu- em plantas transgênicas que possuem um vetor de transformação que com- 25 preende uma seqüência de nucleotídeos de HIO (ou pseudônimo do gene HIO) que codifica ou é complementar a uma seqüência que codifica um poli- peptídeo "HIO". Em modalidades particulares, a expressão de um polipeptí- deo de HIO em uma planta transgênica causa um conteúdo alterado de óleo, um conteúdo alterado de proteínas e/ou um conteúdo alterado de fibras na 30 planta transgênica. Em modalidades preferidas, a planta transgênica é sele- cionada do grupo que consiste em plantas das espécies de Brassica, inclu- indo canola e semente de colza, soja, milho, girassol, algodão, cacau, aça- froa, dendezeiro, coqueiro, linho, mamona, amendoim, trigo, aveia e arroz. É também fornecido um método de produção de óleo ou de farinha de semen- te, que compreende o cultivo da planta transgênica e a recuperação do óleo e/ou da farinha da semente da dita planta. A descrição fornece ainda produto 5 alimentício, farinha, grão ou semente que compreende uma seqüência de ácido nucleico que codifica um polipeptídeo de HIO. A descrição fornece a- inda produto alimentício, farinha, grão ou semente que compreende o poli- peptídeo de HIO ou um ortólogo ou um parálogo do mesmo.

Os exemplos da planta transgênica descrita são produzidos a- través de um método que compreende a introdução nas células progenitoras da planta de um vetor de transformação de planta que compreende uma se- qüência de nucleotídeos de HIO que codifica, ou é complementar a uma se- qüência que codifica, um polipeptídeo de HIO e o crescimento das células progenitoras transformadas para produzir uma planta transgênica, em que a seqüência de polinucleotídeo de HIO é expressa, causando um fenótipo alte- rado na planta transgênica. Em alguns exemplos não Iimitantes específicos, o método produz plantas transgênicas em que a expressão do polipeptídeo de HIO causa um fenótipo de alto conteúdo (maior) de óleos, de alto conteú- do (maior) de proteínas e/ou de baixo conteúdo (menor) de fibras na planta transgênica, em relação às plantas não transgênicas ou do tipo selvagem de controle.

São descritos aqui métodos adicionais de produção Ed uma planta que possui um fenótipo alterado, em que é identificado que uma plan- ta possui uma mutação ou um alelo em sua seqüência de ácido nucleico de 25 HIO que resulta em um fenótipo alterado, comparada a plantas que não pos- suem a mutação ou o alelo. A planta mutada pode ser gerada utilizando um ou mais agentes mutagênicos, por exemplo, um agente mutagênico químico, radiação ou Iuz ultravioleta. Em algumas modalidades do método, a planta é cruzada para gerar progênie que herda o alelo e expressa o fenótipo altera- 30 do. Em modalidades particulares do método, o método emprega a metodo- logia de gene/QTL candidato ou a metodologia de TILLING.

É também fornecida aqui uma célula vegetal modificada que possui um fenótipo alterado. Em algumas modalidades, a célula vegetal mo- dificada inclui um vetor de transformação que compreende uma seqüência de nucleotídeos de HIO que codifica ou é complementar a uma seqüência que codifica um polipeptídeo de HIO. Em modalidades preferidas, a célula 5 vegetal transgênica é selecionada do grupo que consiste em plantas das espécies de Brassica, incluindo canola e semente de colza, soja, milho, gi- rassol, algodão, cacau, açafroa, dendezeiro, coqueiro, linho, mamona, a- mendoim, trigo, aveia e arroz. Em outras modalidades, a célula vegetal é uma semente, um pólen, um propágulo ou uma célula embrionária. A descri- 10 ção fornece ainda células vegetais provenientes de uma planta que é a pro- gênie direta ou a progênie indireta de uma planta crescida partindo das ditas células progenitoras.

DESCRIÇÃO DETALHADA Termos

A não ser que seja indicado de outra maneira, todos os termos

técnicos e científicos utilizados aqui possuem o mesmo significado que teri- am para um versado na técnica da presente descrição. Os profissionais se direcionam particularmente a Sambrook e outros (Molecular Cloning: A La- boratory Manua\ (Segunda Edição), Cold Spring Harbor Press, Plainview, 20 N.Y., 1989) e Ausubel FM e outros (Current Protocols in Molecular Biology, John Wiley & Sons, Nova York, N.Y., 1993) para definições e termos da téc- nica. Deve ser entendido que esta descrição não está limitada à metodologi- a, aos protocolos e aos reagentes particulares descritos, uma vez que estes podem variar.

Como utilizado aqui, o termo "fenótipo alterado" refere-se a plan-

tas ou a qualquer parte de uma planta (por exemplo, sementes ou farinha produzida partindo de sementes), com um conteúdo de óleos, proteínas e/ou fibras alterado (fenótipo). Como fornecido aqui, conteúdo de óleos, de prote- ínas (por exemplo, proteína que pode ser digerida) e/ou de fibras alterado 30 inclui um nível maior ou menor de conteúdo de óleos, de proteínas (por e- xemplo, proteína que pode ser digerida) e/ou de fibras nas plantas, nas se- mentes ou na farinha de sementes. Qualquer combinação destas alterações pode levar a um fenótipo alterado. Por exemplo, em um exemplo não- Iimitante específico, um fenótipo alterado pode se referir ao conteúdo maior de óleos e menor de fibras. Em um outro exemplo não Iimitante específico, um fenótipo alterado pode se referir ao conteúdo inalterado de proteínas e menor de fibras. Em um outro exemplo não Iimitante específico, um fenótipo alterado pode se referir ao conteúdo maior de óleos e de proteínas e menor de fibras. Ainda em outros exemplos não limitantes, um fenótipo alterado pode se referir ao conteúdo maior de óleos e de proteínas e inalterado de fibras; ao conteúdo inalterado de óleos, maior de proteínas e menor de fi- bras; ou ao conteúdo maior de óleos, maior de proteínas e menor de fibras. É também fornecido que qualquer combinação destas alterações pode levar a um aumento na AME (energia metabolizável disponível) da semente ou farinha gerada partindo da semente. Um fenótipo alterado também inclui um fenótipo de maior qualidade de semente (ISQ) ou um fenótipo de maior qua- Iidade de farinha da semente.

Como utilizado aqui, o termo "energia metabolizável disponível" (AME) refere-se à quantidade de energia no produto alimentício que é capaz de ser extraída através da digestão em um animal e está correlacionada com a quantidade de proteínas que podem ser digeridas e de óleo na farinha pa- 20 ra animais. A AME é determinada através da estimativa da quantidade de energia no produto alimentício antes da alimentação e da medida da quanti- dade de energia nos excrementos do animal após o consumo do produto alimentício. Em um exemplo não Iimitante específico, uma planta modificada com um aumento na AME inclui plantas modificadas com conteúdo alterado 25 de óleo da semente, de proteínas que podem ser digeridas, de proteína total e/ou de fibras, resultando em um aumento no valor do produto alimentício para animais derivado da semente.

Como utilizado aqui, o termo "conteúdo" refere-se ao tipo e à quantidade relativa de, por exemplo, um componente da semente ou de fari- nha da semente.

Como utilizado aqui, o termo "óleo da semente" refere-se à quantidade total de óleo dentro da semente. Como utilizado aqui, o termo "fibra da semente" refere-se aos componentes que não podem ser digeridos da semente da planta incluindo componentes celulares tais como celulose, hemicelulose, pectina, Iignina e compostos fenólicos.

5 Como utilizado aqui, o termo "farinha" refere-se aos componen-

tes da semente remanescentes após a extração de óleo da semente. Os exemplos de componentes de farinha incluem proteína e fibra.

Como utilizado aqui, o termo "proteína total da semente" refere- se à quantidade total de proteína dentro da semente.

Como utilizado aqui, o termo "proteína que pode ser digerida da

semente" refere-se à proteína da semente que é capaz de ser digerida por enzimas no trato digestivo de um animal. É um subconjunto do conteúdo de proteína total.

Como utilizado aqui, o termo "vetor" refere-se a um constructo 15 de ácido nucleico planejado para a transferência entre células hospedeiras diferentes. Um "vetor de expressão" refere-se a um vetor que possui a capa- cidade de incorporar e expressar fragmentos de DNA heterólogos em uma célula estranha. Muitos vetores de expressão procarióticos e eucarióticos estão disponíveis comercialmente. A seleção de vetores de expressão apro- 20 priados está dentro do conhecimento dos versados na técnica.

Um constructo ou uma seqüência de ácido nucleico "heteróloga" possui uma parte da seqüência que não é nativa à célula vegetal em que é expressa. Heteróloga, em relação a uma seqüência de controle refere-se a uma seqüência de controle (isto é, promotor ou intensificador) que não fun- 25 ciona na natureza para regular o mesmo gene cuja expressão é, no momen- to, de regulação. Geralmente, seqüências de ácidos nucleicos heterólogas não são endógenas à célula ou à parte do genoma em que estão presentes e foram adicionadas na célula por infecção, transfecção, microinjeção, ele- troporação ou similar. Um constructo de ácido nucleico "heterólogo" pode 30 conter uma combinação de seqüência de controle/seqüência codificadora de DNA que é a mesma que ou diferente de, uma combinação de seqüência de controle/seqüência codificadora de DNA encontrada na planta nativa. Os exemplos não Iimitantes específicos de uma seqüência de ácido nucleico heteróloga incluem uma seqüência de ácido nucleico de HIO ou um frag- mento, um derivado (variação) ou um ortólogo ou um parálogo da mesma.

Como utilizado aqui, o termo "gene" significa o segmento de 5 DNA envolvido na produção de uma cadeia de polipeptídeo, que pode ou não incluir regiões que precedem e que sucedem a região codificadora, por exemplo, seqüências não- traduzidas a 5' (5' UTR) ou "líderes" e seqüências 3' UTR ou "trailers", assim como seqüências que se estendem (íntrons) entre segmentos codificadores individuais (éxons) e seqüências reguladoras não 10 transcritas.

O termo "homólogo" refere-se a qualquer gene que está relacio- nado a um gene de referência por herança de uma seqüência de DNA an- cestral comum. O termo "ortólogo" refere-se a homólogos em espécies dife- rentes que evoluíram partindo de um gene ancestral comum através da es- 15 peciação. Tipicamente, os ortólogos mantêm a mesma ou uma função simi- lar apesar das diferenças em sua estrutura primária (mutações). O termo "parálogo" refere-se a homólogos na mesma espécie que evoluíram através da duplicação genética de um gene ancestral comum. Em muitos casos, os parálogos exibem funções relacionadas (mas nem sempre idênticas). Como 20 utilizado aqui, o termo homólogo abrange tanto ortólogos quanto parálogos. Até a extensão que uma espécie particular desenvolveu vários genes rela- cionados partindo de uma seqüência de DNA ancestral compartilhada com uma outra espécie, o termo ortólogo pode abranger o termo parálogo.

Como utilizado aqui, "recombinante" inclui referência a uma célu- 25 Ia ou um vetor, que foi modificado através da introdução de uma seqüência de ácido nucleico heteróloga ou que a célula é derivada de uma célula modi- ficada dessa maneira. Assim, por exemplo, as células recombinantes ex- pressam genes que não são encontrados na forma idêntica dentro da forma nativa (não recombinante) da célula ou expressam genes nativos que são de 30 outra maneira expressos de forma anormal, subexpressos ou não expressos de forma alguma como um resultado da intervenção humana deliberada.

Como utilizado aqui, o termo "expressão gênica" refere-se ao processo através do qual um polipeptídeo é produzido com base na seqüên- cia de ácido nucleico de um gene. O processo inclui tanto transcrição quanto tradução; consequentemente, "expressão" pode se referir a uma seqüência de polinucleotídeos ou de polipeptídeos ou ambas. Algumas vezes, a ex- 5 pressão de uma seqüência de polinucleotídeos não levará à tradução de proteínas. "Superexpressão" refere-se à maior expressão de uma seqüência de polinucleotídeos e/ou de polipeptídeos em relação a sua expressão em uma planta do tipo selvagem (ou outra de referência [por exemplo, não- transgênica]) e pode se referir a uma seqüência que ocorre naturalmente ou 10 que não ocorre naturalmente. "Expressão ectópica" refere-se à expressão em um momento, local e/ou maior nível que não ocorre naturalmente na planta não modificada ou do tipo selvagem. "Subexpressão" refere-se à me- nor expressão de uma seqüência de polinucleotídeos e/ou de polipeptídeos, geralmente de um gene endógeno, em relação a sua expressão em uma 15 planta do tipo selvagem. Os termos "expressão errada" e "expressão altera- da" abrangem superexpressão, subexpressão e expressão ectópica.

O termo "introduzida" no contexto de inserir uma seqüência de ácido nucleico em uma célula, inclui "transfecção", "transformação" e "trans- dução" e inclui referência à incorporação de uma seqüência de ácido nuclei- 20 co em uma célula eucariótica ou procariótica em que a seqüência de ácido nucleico pode ser incorporada no genoma da célula (por exemplo, DNA cro- mossômico, plasmideal, de plastídeo ou mitocondrial), convertida em um replicon autônomo ou expressa de forma transitória (por exemplo, mRNA transfectado).

Como utilizado aqui, uma "célula vegetal" refere-se a qualquer

célula derivada de uma planta, incluindo células de tecido não diferenciado (por exemplo, calo), assim como de sementes, pólen, propágulos e embriões de plantas.

Como utilizado aqui, os termos "nativa" e "do tipo selvagem" re- Iativos a uma certa característica ou fenótipo da planta referem-se à forma em que tal característica ou fenótipo é encontrado na mesma variedade de planta na natureza. Em uma modalidade, uma planta do tipo selvagem ou nativa é também uma planta de controle. Em uma outra modalidade, uma planta do tipo selvagem ou nativa é uma planta não-transgênica ou não- mutada. Ainda em uma outra modalidade, uma planta do tipo selvagem ou nativa é uma planta não modificada.

5 Como utilizado aqui, o termo "modificada" em relação a uma

planta, refere-se a uma planta com um fenótipo alterado (por exemplo, uma planta gerada através de métodos de engenharia genética, de mutagênese ou de cruzamento). Uma planta engenheirada geneticamente também pode ser uma planta transgênica. Em modalidades particulares, as plantas modifi- 10 cadas geradas através de métodos de cruzamento são primeiramente muta- genizadas utilizando qualquer um de uma variedade de agentes mutagêni- cos, tal como um agente mutagênico químico, radiação ou Iuz ultravioleta. As plantas modificadas podem ter qualquer combinação de um conteúdo alterado de óleos, um conteúdo alterado de proteínas e/ou um conteúdo alte- 15 rado de fibras em qualquer parte da planta transgênica, por exemplo, nas sementes, em relação a uma planta não modificada similar.

Como utilizado aqui, o termo "alterada" refere-se a uma modifi- cação (um aumento ou um decréscimo) de uma característica ou de um fe- nótipo da planta (por exemplo, conteúdo de óleos, conteúdo de proteínas e/ou conteúdo de fibras) em uma planta modificada, em relação uma planta não modificada similar. Em um exemplo não Iimitante específico, uma planta modificada com uma característica alterada inclui uma planta com um maior conteúdo de óleos, maior conteúdo de proteínas e/ou menor conteúdo de fibras em relação a uma planta não modificada similar. Em um outro exem- pio não Iimitante específico, uma planta modificada com uma característica alterada inclui conteúdo de óleos inalterado, maior conteúdo de proteínas e/ou menor conteúdo de fibras em relação a uma planta não modificada si- milar. Ainda em um outro exemplo não Iimitante específico, uma planta modi- ficada com uma característica alterada inclui um maior conteúdo de óleos, um maior conteúdo de proteínas e/ou um conteúdo inalterado de fibras em relação a uma planta não modificada similar.

Um "fenótipo interessante (característica)" com referência a uma planta modificada refere-se a um fenótipo que pode ser observado ou medi- do demonstrado por uma T1 e/ou uma planta de geração subsequente, que não é exibido pela planta não modificada correspondente (isto é, uma planta similar genotipicamente que foi crescida ou analisada sob condições simila- 5 res). Um fenótipo interessante pode representar uma melhoria na planta (por exemplo, maior conteúdo de óleos, maior conteúdo de proteínas e/ou menor conteúdo de fibras nas sementes da planta) ou pode fornecer um meio para produzir melhorias em outras plantas. Uma "melhoria" é uma característica que pode aumentar a utilidade de uma espécie ou variedade de planta atra- 10 vés do fornecimento à planta de um fenótipo ou uma qualidade exclusiva e/ou nova. Tais plantas modificadas podem ter um fenótipo melhorado, tal como um fenótipo de óleo, proteína e/ou fibra alterado. A farinha gerada par- tindo de sementes de uma planta modificada com um fenótipo melhorado pode ter melhor (maior) qualidade de farinha. Em um exemplo não Iimitante 15 específico de farinha com um fenótipo de melhor (maior) qualidade, a farinha é gerada partindo de uma semente de uma planta modificada, em que a se- mente possui maior conteúdo de proteínas e/ou menor conteúdo de fibras, em relação a uma planta não modificada similar.

A expressão "fenótipo de conteúdo alterado de óleos" refere-se a um fenótipo que pode ser medido de uma planta modificada, em que a planta exibe um aumento ou um decréscimo estatisticamente significativo no conteúdo total de óleos (isto é, a porcentagem de massa da semente que é óleo), quando comparada à planta similar, mas não modificada (por exem- plo, uma não transgênica ou uma não mutada). Um fenótipo de alto conteú- do de óleos refere-se a um aumento no conteúdo total de óleos. Um aumen- to no conteúdo de óleos inclui, em várias modalidades, um aumento de a- proximadamente 1,0%, 1,5%, 2,0%, 2,5%, 3,0%, 3,5%, 4,0%, 4,5%, 5,0%, 7,5%, 10% ou mais no conteúdo de óleos. Similarmente, um decréscimo no conteúdo de óleos inclui um decréscimo de aproximadamente 1,0%, 1,5%, 2,0%, 2,5%, 3,0%, 3,5%, 4,0%, 4,5%, 5,0%, 7,5%, 10% ou mais no conteúdo de óleos, em várias modalidades.

A expressão "fenótipo de conteúdo alterado de proteínas" refere- se ao fenótipo que pode ser medido de uma planta modificada, em que a planta exibe um aumento ou um decréscimo estatisticamente significativo no conteúdo total de proteínas (isto é, a porcentagem de massa da semente que é proteína), quando comparada à planta similar, mas não modificada 5 (por exemplo, não transgênica ou não mutada). Um fenótipo de alto conteú- do de proteínas refere-se a um aumento no conteúdo total de proteínas. Um aumento no conteúdo de proteínas inclui, em várias modalidades, um au- mento de aproximadamente 1,0%, 1,5%, 2,0%, 2,5%, 3,0%, 3,5%, 4,0%, 4,5%, 5,0%, 7,5%, 10% ou mais no conteúdo total de proteínas. Similarmen- 10 te, um aumento no conteúdo de proteínas que podem ser digeridas inclui, em várias modalidades, um aumento de aproximadamente 1,0%, 1,5%, 2,0%, 2,5%, 3,0%, 3,5%, 4,0%, 4,5%, 5,0%, 7,5%, 10% ou mais no conteúdo de proteínas que podem ser digeridas. Um decréscimo no conteúdo de pro- teínas inclui um decréscimo de aproximadamente 1,0%, 1,5%, 2,0%, 2,5%, 15 3,0%, 3,5%, 4,0%, 4,5%, 5,0%, 7,5%, 10% ou mais no conteúdo total de pro- teínas, em várias modalidades. Similarmente, um decréscimo no conteúdo de proteínas que podem ser digeridas inclui, em várias modalidades, um de- créscimo de aproximadamente 1,0%, 1,5%, 2,0%, 2,5%, 3,0%, 3,5%, 4,0%, 4,5%, 5,0%, 7,5%, 10% ou mais no conteúdo de proteínas que podem ser 20 digeridas. A expressão "fenótipo de conteúdo alterado de fibras" refere-se ao fenótipo que pode ser medido de uma planta modificada, em que a planta exibe um aumento ou um decréscimo estatisticamente significativo no con- teúdo total de fibras (isto é, a porcentagem de massa da semente que é fi- bra), quando comparada à planta similar, mas não modificada (por exemplo, 25 não transgênica ou não mutada). Um fenótipo de baixo conteúdo de fibras refere-se à diminuição no conteúdo total de fibras. Um aumento no conteúdo de fibras inclui um aumento de aproximadamente 1,0%, 1,5%, 2,0%, 2,5%, 3,0%, 3,5%, 4,0%, 4,5%, 5,0%, 7,5%, 10% ou mais no conteúdo de fibras. Similarmente, um decréscimo no conteúdo de fibras inclui um decréscimo de 30 aproximadamente 1,0%, 1,5%, 2,0%, 2,5%, 3,0%, 3,5%, 4,0%, 4,5%, 5,0%, 7,5%, 10% ou mais no conteúdo de fibras.

Como utilizado aqui, uma seqüência de polinucleotídeos ou um gene "mutante" ou "mutado" difere da seqüência de polinucleotídeos ou do gene do tipo selvagem correspondente em termos de seqüência ou de ex- pressão, em que a diferença contribui para um fenótipo ou uma característi- ca alterada da planta. Em relação a uma planta ou uma linhagem de planta, 5 o termo "mutante" ou "mutada" refere-se a uma planta ou uma linhagem de planta que possui um fenótipo ou uma característica alterada da planta, em que o fenótipo ou a característica alterada está associada com a expressão alterada de uma seqüência de polinucleotídeos ou um gene do tipo selva- gem. A seqüência de polinucleotídeos ou o gene mutado pode ser gerado 10 através de métodos de engenharia genética (tal como marcação por ativa- ção ou transformação), através da utilização de um ou mais agentes muta- gênicos (por exemplo, agentes mutagênicos químicos, radiação ou Iuz ultra- violeta) ou através da utilização de métodos para alterar uma seqüência de DNA (por exemplo, PCR propensa a erros, cruzamento molecular com em- 15 baralhamento de DNA, mutagênese direcionada ao sítio ou introdução do gene em um organismo que induz mutagênese tal E. coli ou cepas de leve- duras que são deficientes em relação à atividade de reparo do DNA).

Como utilizado aqui, o termo "T1" refere-se à geração de plantas partindo da semente de plantas TO. A geração T1 é o primeiro conjunto de plantas modificadas que pode ser selecionado através da aplicação de um agente de seleção, por exemplo, um antibiótico ou um herbicida, para o qual a planta modificada contém o gene de resistência correspondente. O termo "T2" refere-se à geração de plantas através de autofertilização de flores de plantas T1, previamente selecionadas como sendo modificadas. As plantas T3 são geradas partindo de plantas T2 etc. Como utilizado aqui, a "progênie direta" de uma certa planta deriva da semente (ou, algumas vezes, outro tecido) de tal planta e está na geração imediatamente subsequente; por e- xemplo, para uma certa linhagem, uma planta T2 é a progênie direta de uma planta Tl. A "progênie indireta" de uma certa planta deriva da semente (ou outro tecido) da progênie direta de tal planta ou da semente (ou outro tecido) de gerações subsequentes em tal linhagem; por exemplo, uma planta T3 é a progênie indireta de uma planta T1. Como utilizado aqui, o termo "parte da planta" inclui qualquer órgão ou tecido da planta, incluindo, sem limitação, sementes, embriões, regiões meristemáticas, tecido de calo, folhas, raízes, brotos, gametófitos, esporófitos, pólen e micrósporos. As células vegetais podem ser obtidas par- 5 tindo de qualquer órgão ou tecido da planta e culturas preparadas partindo do mesmo. É fornecida aqui uma célula vegetal modificada que possui um fenótipo alterado. Em modalidades particulares, a célula vegetal modificada é uma célula vegetal transgênica. A célula vegetal transgênica inclui um ve- tor de transformação que compreende uma seqüência de nucleotídeos de 10 HIO que codifica ou é complementar a uma seqüência que codifica um poli- peptídeo de HIO. Em modalidades preferidas, a célula vegetal transgênica é selecionada do grupo que consiste em plantas das espécies de Brassica, incluindo canola e semente de colza, soja, milho, girassol, algodão, cacau, açafroa, dendezeiro, coqueiro, linho, mamona, amendoim, trigo, aveia e ar- 15 roz. Em outras modalidades, a célula vegetal é uma semente, um pólen, um propágulo ou uma célula embrionária. A descrição fornece ainda células ve- getais de uma planta que é a progênie direta ou a progênie indireta de uma planta crescida partindo das ditas células progenitoras. A classe de plantas que pode ser utilizada nos métodos da presente invenção é geralmente tão 20 ampla quanto a classe de plantas superiores sensíveis às técnicas de trans- formação, incluindo tanto plantas monocotiledôneas quanto dicotiledôneas.

Como utilizado aqui, "planta transgênica" inclui uma planta que compreende dentro de seu genoma um polinucleotídeo heterólogo. O poli- nucleotídeo heterólogo pode estar integrado de forma estável no genoma ou 25 pode ser extracromossômico. Preferencialmente, o polinucleotídeo da pre- sente invenção está integrado de forma estável no genoma de forma que o polinucleotídeo é passado a diante para gerações sucessivas. Uma célula, um tecido, um órgão vegetal ou uma planta na qual os polinucleotídeos hete- rólogos foram introduzidos é considerada "transformada", "transfectada" ou 30 "transgênica". As progênies diretas e indiretas de plantas ou células vegetais transformadas que também contêm o polinucleotídeo heterólogo também são consideradas transgênicas. São descritas aqui plantas modificadas que possuem um fenóti- po alterado. As plantas modificadas com um fenótipo alterado podem incluir uma quantidade melhorada (maior) de óleos e/ou uma qualidade melhor (maior) de farinha, quando comparadas à planta similar, mas não modificada 5 (por exemplo, não transgênica ou não mutada). As plantas modificadas com um fenótipo alterado podem inclui conteúdo alterado de óleos, proteínas e/ou fibras em qualquer parte da planta modificada, por exemplo, nas se- mentes, quando comparadas à planta similar, mas não modificada (por e- xemplo, não transgênica ou não mutada). Em algumas modalidades de uma 10 planta modificada, por exemplo, em plantas com um fenótipo de conteúdo melhorado ou maior de óleos, o fenótipo alterado inclui um aumento no con- teúdo de óleos da semente (um fenótipo de alto conteúdo de óleos) da plan- ta, quando comparado ao da planta similar, mas não modificada (não trans- gênica ou não mutada). Um aumento no conteúdo de óleos inclui, em várias 15 modalidades, um aumento de aproximadamente 1,0%, 1,5%, 2,0%, 2,5%, 3,0%, 3,5%, 4,0%, 4,5%, 5,0%, 7,5%, 10% ou mais no conteúdo de óleos. O fenótipo alterado pode ser um aumento em um ou mais ácidos graxos, tal como ácido oleico, com um decréscimo concomitante em outros ácidos gra- xos tais como os ácidos Iinoleicos ou linolínicos. Uma alteração no conteúdo 20 de ácidos graxos inclui um aumento de aproximadamente 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100% ou mais em um ácido graxo específico. Em outras modalidades de uma planta modificada, por exemplo, em plantas com um fenótipo de qualidade melhorada ou maior de farinha, o fenótipo alterado pode ser um aumento no conteúdo de proteínas na semen- 25 te e/ou um decréscimo no conteúdo de fibras da semente. Um aumento no conteúdo de proteínas inclui um aumento de aproximadamente 1,0%, 1,5%, 2,0%, 2,5%, 3,0%, 3,5%, 4,0%, 4,5%, 5,0%, 7,5%, 10% ou mais no conteúdo de proteínas, por exemplo, no conteúdo total de proteínas ou no conteúdo de proteínas que podem ser digeridas. Esta alteração no conteúdo de proteínas 30 da semente pode ser o resultado de quantidades alteradas de proteínas de armazenamento da semente tais como albuminas, globulinas prolaminas e glutelinas. Um decréscimo no conteúdo de fibras inclui um decréscimo de aproximadamente 1,0%, 1,5%, 2,0%, 2,5%, 3,0%, 3,5%, 4,0%, 4,5%, 5,0%, 7,5%, 10% ou mais no conteúdo de fibras. Esta alteração no conteúdo de fibras pode ser o resultado de quantidades alteradas de componentes fibro- sos tais como celulose, hemicelulose, Iignina e pectinas.

5 É também fornecida farinha de semente derivada das sementes

de plantas modificadas, em que as sementes possuem conteúdo alterado (por exemplo, maior) de proteínas (por exemplo, que pode ser digerida) e/ou conteúdo alterado (por exemplo, menor) de fibras. É adicionalmente forneci- do óleo derivado das sementes de plantas modificadas, em que as sementes 10 possuem conteúdo alterado de óleos. Qualquer uma destas alterações pode levar a um aumento na AME da semente ou da farinha da semente de plan- tas modificadas, em relação a plantas de controle, não transgênicas ou do tipo selvagem. Um aumento na AME inclui um aumento de aproximadamen- te 1,0%, 1,5%, 2,0%, 2,5%, 3,0%, 3,5%, 4,0%, 4,5%, 5,0%, 7,5%, 10% ou 15 mais na AME na semente ou na farinha da semente, em várias modalidades. É também fornecida aqui farinha, produto alimentício ou alimento produzido partindo de qualquer parte da planta modificada com um fenótipo alterado.

Em certas modalidades, as plantas transgênicas descritas com- preendem um vetor de transformação que compreende uma seqüência de nucleotídeos de HIO que codifica ou é complementar a uma seqüência que codifica um polipeptídeo de "HIO". Em modalidades particulares, a expres- são de um polipeptídeo de HIO em uma planta transgênica causa um conte- údo alterado de óleos, um conteúdo alterado de proteínas e/ou um conteúdo alterado de fibras na planta transgênica. Em modalidades preferidas, a plan- ta transgênica é selecionada do grupo que consiste em plantas das espécies de Brassica, incluindo canola e semente de colza, soja, milho, girassol, algo- dão, cacau, açafroa, dendezeiro, coqueiro, linho, mamona, amendoim, trigo, aveia e arroz. É também fornecido um método de produção de óleo ou fari- nha da semente, que compreende o cultivo da planta transgênica e a recu- peração do óleo e/ou da farinha da semente da dita planta. A descrição for- nece ainda produto alimentício, farinha, grão ou semente que compreende uma seqüência de ácido nucleico que codifica um polipeptídeo de HIO. A descrição fornece ainda produto alimentício, farinha, grão ou semente que compreende o polipeptídeo de HIO ou um ortólogo ou um parálogo do mes- mo.

Vários métodos para a introdução de uma seqüência de polinu- 5 cleotídeos desejada que codifica a proteína desejada nas células vegetais estão disponíveis e são conhecidos pelos versados na técnica e incluem, mas não estão limitados a: (1) métodos físicos tais como microinjeção, ele- troporação e fornecimento mediado por microprojéteis (biolística ou tecnolo- gia de pistola gênica); (2) métodos de fornecimento mediado por vírus; e (3) 10 métodos de transformação mediada por Agrobacterium.

Os métodos mais comumente utilizados para a transformação de células vegetais são o processo de transferência de DNA mediada por Agro- bacterium e o processo de biolística ou mediado por bombardeio de micro- projéteis (isto é, a pistola gênica). Tipicamente, a transformação nuclear é 15 desejada, mas quando é desejável transformar especificamente plastídeos, tais como cloroplastos ou amiloplastos, os plastídeos vegetais podem ser transformados utilizando um fornecimento mediado por microprojéteis do polinucleotídeo desejado.

A transformação mediada por Agrobacterium é conseguida atra- 20 vés do uso de uma bactéria do solo engenheirada geneticamente que per- tence ao gênero Agrobaeterium. Um número de cepas do tipo selvagem e desarmadas de Agrobaeterium tumefaeiens e Agrobaeterium rhizogenes por- tando os plasmídeos Ti ou Ri pode ser utilizado para a transferência de ge- nes para as plantas. A transferência de genes é feita através da transferên- 25 cia de um DNA específico conhecido como "T-DNA" que pode ser engenhei- rado geneticamente para carregar qualquer pedaço desejado de DNA para dentro de muitas espécies de plantas.

A transformação genética de plantas mediada por Agrobaeterium envolve várias etapas. A primeira etapa, na qual o Agrobaeterium virulento e as células vegetais são primeiramente colocados em contato um com o ou- tro, é geralmente chamada de "inoculação". Após a inoculação, é permitido que o Agrobaeterium e as células/tecidos vegetais sejam cultivados juntos durante um período de várias horas até vários dias ou mais sob condições adequadas para crescimento e para transferência do T-DNA. Esta etapa é denominada de "co-cultura". Após a co-cultura e o fornecimento do T-DNA1 as células vegetais são tratadas com agentes bactericidas ou bacteriostáti- 5 cos para matar ou limitar o crescimento do Agrobacterium remanescente em contato com o explante e/ou no recipiente contendo o explante. Se isto for realizado na ausência de quaisquer agentes seletivos para promover o cres- cimento preferencial de células vegetais transgênicas versus não transgêni- cas, então esta é tipicamente referida como a etapa de "retardo". Se for rea- 10 Iizada na presença de pressão seletiva favorecendo as células vegetais transgênicas, então é referida como uma etapa de "seleção". Quando um "retardo" é utilizado, este é tipicamente seguido por uma ou mais etapas de "seleção".

Em relação ao bombardeio de microprojéteis (Patente U.S. N2 15 5.550.318; Patente U.S. N2 5.538.880. Patente U.S. N2 5.610.042; e Publi- cação PCT WO 95/06128; das quais cada uma é especificamente incorpora- da aqui como referência em sua totalidade), as partículas são revestidas com ácidos nucleicos e fornecidas para dentro das células através de uma força de propulsão. Os exemplos de partículas incluem as compreendidas de 20 tungstênio, platina e preferencialmente, ouro.

Uma modalidade ilustrativa de um método para o fornecimento de DNA para dentro das células vegetais através da aceleração é o Biolistics Particle Delivery System (BioRad, Hercules, CA), que pode ser utilizado para empurrar partículas revestidas com DNA ou células através de uma tela, tal 25 como uma tela de aço inoxidável ou uma tela Nytex, sobre uma superfície de filtro coberta com células de plantas monocotiledôneas cultivadas em sus- pensão.

As técnicas de bombardeio de microprojéteis podem ser ampla- mente aplicadas e podem ser utilizadas para transformar virtualmente qual- quer espécie de planta. Os exemplos de espécies que foram transformadas através do bombardeio de microprojéteis incluem espécies de monocotiledô- neas tais como milho (Publicação PCT N2 WO 95/06128), cevada, trigo (Pa- tente U.S. Ns 5.563.055, incorporada aqui como referência em sua totalida- de), arroz, aveia, centeio, cana-de-açúcar e sorgo, assim como um número de dicotiledôneas incluindo tabaco, soja (Patente U.S. N- 5.322.783, incorpo- rada aqui como referência em sua totalidade), girassol, amendoim, algodão, 5 tomate e verduras em geral (Patente U.S. Ns 5.563.055, incorporada aqui como referência em sua totalidade).

Para selecionar ou classificar as células vegetais independente- mente da metodologia de transformação, o DNA introduzido na célula con- tém um gene que funciona em um tecido vegetal que pode ser regenerado 10 para produzir um composto que confere ao tecido vegetal resistência a um composto que seria de outra maneira tóxico. Os genes de interesse para uso como um marcador que pode ser selecionado, verificado ou classificado in- cluiriam, mas não estão limitados a GUS, proteína fluorescente verde (GFP), Iuciferase (LUX), genes de tolerância a antibióticos ou herbicidas. Os exem- 15 pios de genes de resistência a antibióticos incluem penicilinas, canamicina, neomicina, G418, bleomicina, metotrexato (e trimetoprim), cloranfenicol e tetraciclina. As moléculas de polinucleotídeos que codificam as proteínas envolvidas na tolerância a herbicidas são conhecidas na técnica e incluem, mas não estão limitadas a uma molécula de polinucleotídeo que codifica a 5- 20 enolpiruvilshikimato-3-fosfato sintase (EPSPS) descrita na Patente U.S. N- 5.627.061, na Patente U.S. Ns 5.633.435 e na Patente U.S. Ns 6.040.497 e aroA descrita na Patente U.S. Ns 5.094.945 para tolerância ao glifosato; uma molécula de polinucleotídeo que codifica bromoxinil nitrilase (Bxn) descrita na Patente U.S. Ns 4.810.648 para tolerância ao Bromoxinil; uma molécula 25 de polinucleotídeo que codifica fitoeno dessaturase (crtl) descrita em Misawa e outros, (Plant J. 4:833-840, 1993) e Misawa e outros, (Plant J. 6:481-489, 1994) para tolerância ao norflurazon; uma molécula de polinucleotídeo que codifica acetohidroxiácido sintase (AHAS, também conhecida como ALS) descrita em Sathasiivan e outros (Nucl. Acids Res. 18:2188-2193, 1990) pa- 30 ra tolerância a herbicidas de sulfoniluréia; e o gene bar descrito em DeBIock e outros, (EMBO J. 6:2513-2519, 1987) para tolerância ao glufosinato e ao bialaphos. A regeneração, o desenvolvimento e o cultivo de plantas partin- do de vários explantes são bem documentados na técnica. Este processo de regeneração e crescimento inclui tipicamente as etapas de seleção de célu- las transformadas e de cultivo de células individualizadas através dos está- 5 gios usuais de desenvolvimento embrionário até o estágio de planta jovem enraizada. Os embriões e as sementes transgênicos são similarmente rege- nerados. Os brotos enraizados transgênicos resultantes são depois disso plantados em um meio de cultivo de planta apropriado tal como solo. As cé- lulas que sobrevivem à exposição ao agente seletivo ou as células que tive- 10 ram classificação positiva em um ensaio de verificação, podem ser cultiva- das em meio que sustenta a regeneração de plantas. As plantas jovens em desenvolvimento são transferidas para o solo menos a mistura de cresci- mento de planta e estabilizadas, antes da transferência para uma estufa ou câmara de crescimento para maturação.

A presente invenção pode ser utilizada com qualquer célula ou

tecido que pode ser transformado. Como utilizado aqui, o que pode ser transformado é entendido como uma célula ou um tecido capaz de se pro- pagar adicionalmente para dar origem a uma planta. Os versados na técnica reconhecem que pode ser transformado um número de células ou tecidos 20 vegetais em que após a inserção do DNA exógeno e de condições de cultura apropriadas as células ou os tecidos vegetais podem ser formar em uma planta diferenciada. O tecido adequado para estas finalidades pode incluir, mas não está limitado a embriões imaturos, tecido escutelar, culturas de cé- lulas em suspensão, inflorescência imatura, meristema de broto, explantes 25 nodais, tecido de calo, tecido hipocotiledôneo, cotilédones, raízes e folhas.

Qualquer meio de cultura de planta adequado pode ser utilizado. Os exemplos de meios adequados incluiriam, mas não estão limitados a meios à base de MS (Murashige e Skoog, Physiol. Plant, 15:473-497, 1962) ou a meios à base de N6 (Chu e outros, Scientia Sinica 18:659, 1975) su- 30 plementados com reguladores de crescimento vegetal adicionais incluindo, mas não limitados a auxinas, citocininas, ABA e giberelinas. Os versados na técnica estão familiarizados com a variedade de meios de cultura de tecidos, que quando suplementados apropriadamente, sustentam o crescimento e o desenvolvimento do tecido vegetal e são adequados para a transformação e para a regeneração de plantas. Estes meios de cultura de tecidos podem ser obtidos na forma de uma preparação comercial ou preparados e modificados 5 pelo usuário. Os versados na técnica estão a par dos meios e dos suplemen- tos de meios tais como nutrientes e reguladores do crescimento para uso na transformação e na regeneração e outras condições de cultura tais como intensidade da Iuz durante a incubação, pH e temperaturas de incubação que podem ser otimizadas para a variedade particular de interesse.

Um versado na técnica considerará que, após um cassete de

expressão ser incorporado de forma estável em plantas transgênicas e con- firmado como sendo operacional, este pode ser introduzido em outras plan- tas através de cruzamento sexual. Qualquer uma de um número de técnicas de cruzamento padronizadas pode ser utilizada, dependendo da espécie que será cruzada.

Identificação de Plantas com um Fenótipo Alterado

Uma varredura de marcação por ativação com Arabidopsis (ACTTAG) foi utilizada para identificar a associação entre 1) linhagens de plantas ACTTAG com um conteúdo alterado de óleos, proteínas e/ou fibras 20 (ver as colunas 4, 5 e 6 respectivamente, da Tabela 1, a seguir) e 2) as se- qüências de ácidos nucleicos identificadas na coluna 3 das Tabelas 2 e 3, em que cada seqüência de ácido nucleico é fornecida dentro de um pseudô- nimo de gene ou uma denominação de HIO (HIO#; ver a coluna 1 nas Tabe- las 1, 2 e 3). A denominação de HIO é arbitrária e não se refere necessaria- 25 mente a uma planta que possui um fenótipo de alto conteúdo de óleos (HIO).

Sucintamente e como descrito adicionalmente nos Exemplos, um grande número de plantas de Arabidopsis foi mutado com o vetor pS- KI015, que compreende um T-DNA do plasmídeo Ti de Agrobacterium tumi- faciens, um elemento intensificador viral e um gene marcador que pode ser 30 selecionado (Weigel e outros, 2000, Plant Physiology, 122:1003-1013). Quando os insertos de T-DNA no genoma das plantas transformadas, o e- Iemento intensificador pode causar a regulação para mais dos genes na vizi- nhança, geralmente dentro de aproximadamente nove kilobases (kb) dos intensificadores. As plantas T1 foram expostas ao agente seletivo com a fi- nalidade de recuperar especificamente as plantas transformadas que ex- pressavam o marcador que pode ser selecionado e, portanto, carregavam as 5 inserções do T-DNA. Foi permitido que as plantas T1 crescessem até a ma- turidade, se autofertilizassem e produzissem semente. A semente T2 foi co- lhida, rotulada e armazenada. Para a amplificação dos estoques de semen- tes, aproximadamente dezoito T2 foram plantadas no solo e, após a germi- nação, expostas ao agente seletivo para recuperar as plantas T2 transfor- 10 madas. A semente T3 destas plantas foi colhida e agrupada. O conteúdo de óleos, proteínas e fibras da semente foi estimado utilizando Near Infrared Spectroscopy (NIR) como descrito nos Exemplos.

A associação de uma seqüência de ácido nucleico de HIO com um fenótipo alterado foi descoberta através da análise da seqüência de DNA genômico flanqueando a inserção do T-DNA na linhagem ACTTAG identifi- cada na coluna 3 da Tabela 1. Uma linhagem ACTTAG é uma família de plantas derivada de uma única planta que foi transformada com um elemen- to de T-DNA contendo quatro cópias em tandem dos intensificadores do 35S do CaMV. Consequentemente, as seqüências de ácidos nucleicos e/ou de polipeptídeos de HIO descritas podem ser empregadas no desenvolvimento de plantas transgênicas que possuem um fenótipo alterado, por exemplo, alto conteúdo de óleos. As seqüências de ácidos nucleicos de HIO podem ser utilizadas na produção de plantas transgênicas, tais como plantas de cultivo de sementes oleosas, que fornecem maior rendimento de óleo partin- do do processamento das sementes oleosas e resultam em um aumento na quantidade de óleo recuperado das sementes da planta transgênica. As se- qüências de ácidos nucleicos de HIO também podem ser utilizadas na pro- dução de plantas transgênicas, tais como plantas de cultivo de grãos para produto alimentício, que fornecem um fenótipo alterado resultando em maior energia para a alimentação de animais, por exemplo, sementes ou farinha da semente com um conteúdo alterado de proteínas e/ou de fibras, resultan- do em um aumento na AME. As seqüências de ácidos nucleicos de HIO po- dem ser adicionalmente utilizadas para aumentar o conteúdo de óleos de plantas de cultivo oleosas especiais, com a finalidade de aumentar o rendi- mento e/ou a recuperação de ácidos graxos não usuais desejados. Os e- xemplos não Iimitantes específicos de ácidos graxos não usuais são ácido 5 ricinoleico, ácido vernólico e os ácidos graxos poli-insaturados de cadeia muito longa ácido docosahexaenoico (DHA) e ácido eicosapentaenoico (E- PA). As plantas transgênicas que foram modificadas geneticamente para expressarem polipeptídeos de HIO podem ser utilizadas na produção de sementes, em que as plantas transgênicas são crescidas e o óleo e a farinha 10 da semente são obtidos de partes da planta (por exemplo, semente) utilizan- do métodos padronizados.

Ácidos Nucleicos e Polipeptídeos de HIO

A denominação de HIO para cada uma das seqüências de áci- dos nucleicos de HIO descobertas na verificação com a marcação por ativa- ção descrita aqui estão listadas na coluna 1 das Tabelas 1-3, a seguir. Os polipeptídeos de HIO descritos estão listados na coluna 4 das Tabelas 2 e 3, a seguir. A denominação de HIO é arbitrária e não se refere necessariamen- te a uma planta que possui um fenótipo de alto conteúdo de óleos (HIO). Como utilizado aqui, o pseudônimo de gene ou a denominação de HIO refe- re-se a qualquer seqüência de polipeptídeo (ou à seqüência de ácido nuclei- co que codifica a mesma) que quando expressa em uma planta causa um fenótipo alterado em qualquer parte da planta, por exemplo, nas sementes. Em uma modalidade, um polipeptídeo de HIO refere-se a uma proteína HIO de comprimento completo ou a um fragmento, um derivado (variação) ou um ortólogo ou um parálogo da mesma que é "funcionalmente ativo", de forma que o fragmento, o derivado ou o ortólogo ou o parálogo da proteína exibe uma ou mais ou as atividades funcionais associadas com um ou mais dos polipeptídeos de HIO de comprimento completo descritos, por exemplo, as seqüências de aminoácidos fornecidas na entrada do GenBank referida na coluna 4 das Tabelas 2 e 3 que correspondem às seqüências de aminoáci- dos apresentadas como a SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32 ou SEQ ID NO: 34 ou um ortólogo ou um parálogo da mesma. Em uma modalidade pre- ferida, um polipeptídeo de HIO funcionalmente ativo causa um fenótipo alte- 5 rado em uma planta transgênica. Em uma outra modalidade, um polipeptí- deo de HIO funcionalmente ativo causa um fenótipo de conteúdo alterado de óleos, proteínas e/ou fibras (por exemplo, um fenótipo de conteúdo alterado da farinha da semente) quando expresso de forma errada em uma planta. Em outras modalidades preferidas, a expressão errada do polipeptídeo de 10 HIO causa um fenótipo de alto conteúdo de óleos (tal como, mais óleo), de alto conteúdo de proteínas (tal como, maior conteúdo de proteína total ou de proteínas que podem ser digeridas) e/ou de baixo conteúdo de fibras (tal como, menos fibra) em uma planta. Ainda em outras modalidades preferidas, a expressão errada do polipeptídeo de HIO causa fenótipo inalterado de ó- 15 leos, de alto conteúdo de proteínas (tal como, maior conteúdo de proteína total ou de proteínas que podem ser digeridas) e/ou de baixo conteúdo de fibras (tal como, menos fibra) em uma planta. Em uma outra modalidade, a expressão errada do polipeptídeo de HIO causa uma maior AME da farinha. Ainda em uma outra modalidade, um polipeptídeo de HIO funcionalmente 20 ativo pode recuperar a atividade defeituosa do polipeptídeo de HIO endóge- no (incluindo deficiente) quando expresso em uma planta ou em células ve- getais; o polipeptídeo de recuperação pode ser proveniente da mesma ou de uma espécie diferente da espécie com a atividade defeituosa do polipeptí- deo. A descrição fornece ainda produto alimentício, farinha, grão, alimento 25 ou semente que compreende o polipeptídeo de HIO ou um fragmento, um derivado (variação) ou um ortólogo ou um parálogo do mesmo.

Em uma outra modalidade, um fragmento funcionalmente ativo de um polipeptídeo de HIO de comprimento completo (por exemplo, um fragmento funcionalmente ativo de um polipeptídeo nativo que possui a se- 30 quência de aminoácidos apresentada como a SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32 ou SEQ ID NO: 34 ou um ortólogo ou um parálogo que ocorre naturalmente da mesma) mantém uma ou mais das propriedades biológicas associadas com o polipeptídeo de HIO de comprimento completo, tal como atividade de 5 sinalização, atividade de ligação, atividade catalítica ou atividade de locali- zação celular ou extracelular. Um fragmento de HIO preferencialmente com- preende um domínio de HIO, tal como um domínio C- ou N-terminal ou cata- lítico, entre outros e compreende preferencialmente pelo menos 10, prefe- rencialmente pelo menos 20, mais preferencialmente pelo menos 25 e mais 10 preferencialmente pelo menos 50 aminoácidos contíguos de uma proteína HIO. Os domínios funcionais dos genes HIO estão listados na coluna 6 da Tabela 2 e podem ser identificados utilizando o programa PFAM (Bateman A e outros, 1999, Nucleic Acids Res. 27:260-262) ou o programa INTERPRO (Mulder e outros, 2003, Nueleic Aeids Res. 31, 315-318). As variações fun- 15 cionalmente ativas de polipeptídeos de HIO de comprimento completo ou fragmentos dos mesmos, incluem polipeptídeos com inserções, deleções ou substituições de aminoácidos que mantêm uma ou mais das propriedades biológicas associadas com o polipeptídeo de HIO de comprimento completo. Em alguns casos, são geradas variações que alteram o processamento pós- 20 tradução de um polipeptídeo de HIO. Por exemplo, as variações podem ter características alteradas de transporte de proteínas ou de localização de proteínas ou meia-vida alterada de proteínas, comparadas com o polipeptí- deo nativo.

Como utilizado aqui, o termo "ácido nucleico de HIO" refere-se a 25 qualquer polinucleotídeo que quando expresso em uma planta causa um fenótipo alterado em qualquer parte da planta, por exemplo, nas sementes. Em uma modalidade, um polinucleotídeo de HIO abrange ácidos nucleicos com a seqüência fornecida na ou complementar à entrada do GenBank refe- rida na coluna 3 das Tabelas 2 e 3, que correspondem às seqüências de 30 ácidos nucleicos apresentadas como SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31 ou SEQ ID NO: 33, assim como fragmentos, derivados ou ortólogos ou parálo- gos funcionalmente ativos das mesmas. Um ácido nucleico de HIO desta descrição pode ser DNA, derivado de DNA genômico ou cDNA ou RNA.

5 Em uma modalidade, um ácido nucleico de HIO funcionalmente

ativo codifica ou é complementar a um ácido nucleico que codifica um poli- peptídeo de HIO funcionalmente ativo. Um ácido nucleico de HIO funcional- mente ativo também inclui DNA genômico que serve como um molde para um produto da transcrição primária de RNA (isto é, um precursor de mRNA) 10 que requer processamento, tal como "splicing", antes de codificar o polipep- tídeo de HIO funcionalmente ativo. Um ácido nucleico de HIO pode incluir outras seqüências não codificadoras, que podem ou não ser transcritas; tais seqüências incluem 5' e 3' UTRs, sinais de poliadenilação e seqüências re- guladoras que controlam a expressão gênica, entre outros, que são conheci- 15 dos na técnica. Alguns polipeptídeos requerem eventos de processamento, tais como clivagem proteolítica, modificação covalente etc., com a finalidade de se tornarem completamente ativos. Consequentemente, os ácidos nuclei- cos funcionalmente ativos podem codificar o polipeptídeo de HIO maduro ou pré-processado ou uma forma intermediária. Um polinucleotídeo de HIO 20 também pode incluir seqüências codificadoras heterólogas, por exemplo, seqüências que codificam um marcador incluído para facilitar a purificação do polipeptídeo fundido ou um marcador de transformação. Em uma outra modalidade, um ácido nucleico de HIO funcionalmente ativo é capaz de ser utilizado na produção de fenótipos de HIO de perda de função, por exemplo, 25 através da supressão antissenso, da co-supressão, etc. A descrição fornece ainda produto alimentício, farinha, grão, alimento ou semente que compre- ende uma seqüência de ácido nucleico que codifica um polipeptídeo de HIO.

Em uma modalidade preferida, um ácido nucleico de HIO utiliza- do nos métodos descritos compreende uma seqüência de ácido nucleico que codifica ou é complementar a uma seqüência que codifica, um polipeptídeo de HIO que possui pelo menos 50%, 60%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98% ou 99% de identidade de seqüência em relação a uma seqüência de polipeptídeo de HIO descrita, por exemplo, a seqüência de aminoácidos apresentada como a SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID 5 NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32 ou SEQ ID NO: 34.

Em uma outra modalidade, um polipeptídeo de HIO compreende uma seqüência de polipeptídeo com pelo menos 50% ou 60% de identidade em relação a uma seqüência de polipeptídeo de HIO descrita (por exemplo, a seqüência de aminoácidos apresentada como a SEQ ID NO: 2, SEQ ID 10 NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO:

22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32 ou SEQ ID NO: 34) e pode ter pelo menos 70%, 80%, 85%, 90%, 95%, 97%, 98% ou 99% de identidade de seqüência em relação a uma se- 15 quência de polipeptídeo de HIO descrita. Em uma modalidade adicional, um polipeptídeo de HIO compreende 50%, 60%, 70%, 80%, 85%, 90%, 95%, 97%, 98% ou 99% de identidade de seqüência em relação a uma seqüência de polipeptídeo de HIO descrita e pode incluir um domínio de proteína con- servado do polipeptídeo de HIO (tal como o(s) domínio(s) listado(s) na colu- 20 na 6 da Tabela 2). Em uma outra modalidade, um polipeptídeo de HIO com- preende uma seqüência de polipeptídeo com pelo menos 50%, 60%, 70%, 80%, 85%, 90%, 95%, 97%, 98% ou 99% de identidade de seqüência em relação a um fragmento funcionalmente ativo do polipeptídeo referido na co- luna 4 da Tabela 2. Ainda em uma outra modalidade, um polipeptídeo de 25 HIO compreende uma seqüência de polipeptídeo com pelo menos 50%, 60 %, 70%, 80%, 90%, 95%, 97%, 98% ou 99% de identidade em relação à seqüência de polipeptídeo da entrada do GenBank referida na coluna 4 da Tabela 2 ao longo de todo seu comprimento e compreende um(ou mais) domínio(s) de proteína conservado(s) listado(s) na coluna 6 da Tabela 2.

Em um outro aspecto, uma seqüência de polinucleotídeo de HIO

é pelo menos 50% até 60% idêntica ao longo de seu comprimento inteiro a uma seqüência de ácido nucleico de HIO descrita, tal como a seqüência de ácido nucleico apresentada como SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO:

23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31 ou SEQ ID NO: 33 ou as seqüências de ácidos nucleicos que são complemen- tares a tal seqüência de HIO e pode compreender pelo menos 70%, 80%, 85%, 90%, 95%, 97%, 98% ou 99% de identidade de seqüência em relação à seqüência de HIO descrita ou a um fragmento funcionalmente ativo da mesma ou seqüências complementares. Em uma outra modalidade, um áci- do nucleico de HIO descrito compreende uma seqüência de ácido nucleico que é mostrada na SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31 ou SEQ ID NO: 33 ou seqüências de ácidos nucleicos que são complementares a tal seqüência de HIO e seqüências de ácidos nucleicos que possuem homologia de se- qüência substancial a tais seqüências de HIO. Como utilizado aqui, a ex- pressão "homologia de seqüência substancial" refere-se às seqüências de ácidos nucleicos que possuem variações de seqüência pequenas ou sem importância partindo de tais seqüências de HIO, isto é, as seqüências fun- cionam substancialmente da mesma maneira e codificam um polipeptídeo de HIO.

Como utilizado aqui, "porcentagem (%) de identidade de se- qüência" em relação a uma seqüência de objetivo especificada ou a uma 25 parte especificada da mesma, é definida como a porcentagem de nucleotí- deos ou de aminoácidos em uma seqüência identificada idêntica aos nucleo- tídeos ou aos aminoácidos na seqüência de objetivo (ou na parte especifica- da da mesma), após o alinhamento das seqüências e da introdução de es- paços, se necessário, para atingir uma porcentagem de identidade de se- 30 quência máxima, que é gerada através do programa WU-BLAST-2,0 a 19 (Altschul e outros, J. Mo!. Biol., 1990, 215:403-410) com parâmetros de bus- ca ajustados nos valores predeterminados. Os parâmetros HSP S e HSP S2 são valores dinâmicos e são estabelecidos pelo próprio programa depen- dendo da composição da seqüência particular e da composição do banco de dados particular contra o qual a seqüência de interesse será pesquisada. Um "valor de identidade percentual (%)" é determinado pelo número de combinações de nucleotídeos ou aminoácidos idênticos dividido pelo com- primento da seqüência para a qual a porcentagem de identidade está sendo relatada. A "porcentagem (%) de similaridade de seqüência de aminoácidos" é determinada realizando o mesmo cálculo que para a determinação da % de identidade de seqüência de aminoácidos, mas incluindo substituições conservativas de aminoácidos em adição a aminoácidos idênticos no cálcu- lo. Uma substituição conservativa de aminoácido é uma em que um aminoá- cido é substituído por um outro aminoácido que possui propriedades simila- res de forma que o dobramento ou a atividade da proteína não seja significa- tivamente afetada. Os aminoácidos aromáticos que podem ser substituídos por cada outro são fenilalanina, triptofano e tirosina; os aminoácidos hidrofó- bicos intercambiáveis são leucina, isoleucina, metionina e valina; os aminoá- cidos polares intercambiáveis são glutamina e asparagina; e os aminoácidos básicos intercambiáveis são arginina, Iisina e histidina; os aminoácidos áci- dos intercambiáveis são ácido aspártico e ácido glutâmico; e os aminoácidos pequenos intercambiáveis são alanina, serina, treonina, cisteína e glicina.

Moléculas de ácidos nucleicos derivadas das moléculas de áci- dos nucleicos de objetivo incluem seqüências que se hibridizam seletiva- mente às seqüências de ácidos nucleicos de HIO descritas (por exemplo, a seqüência de ácido nucleico apresentada como a SEQ ID NO: 1, SEQ ID 25 NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31 ou SEQ ID NO: 33). A estringência da hibridização pode ser con- trolada pela temperatura, pela força iônica, pelo pH e pela presença de a- 30 gentes desnaturantes tais como formamida durante a hibridização e a lava- gem. As condições utilizadas rotineiramente são bem-conhecidas (ver, por exemplo, Current Protocol in Molecular Biology, Vol. 1, Cap. 2,10, John Wi- Iey & Sons, Publishers (1994); Sambrook e outros, 1989, Molecular Cloning: A Laboratory Manual (Segunda Edição), Cold Spring Harbor Press, Plainvi- ew, N.Y.).

Em algumas modalidades, uma molécula de ácido nucleico da descrição é capaz de se hibridizar com uma molécula de ácido nucleico que contém a seqüência de nucleotídeos descrita sob condições de hibridização estringentes que são: pré-hibridização de filtros contendo ácido nucleico du- rante 8 horas até durante a noite a 65°C em uma solução que compreende 6X citrato de concentração simples (SSC) (1X SSC é 0,15 M de NaCI, 0,015 M de de citrato de Na; pH 7,0), 5X solução de Denhardt, 0,05% de pirofosfa- to de sódio e 100 pg/mL de DNA de esperma de arenque; hibridização du- rante 18-20 horas a 65° C em uma solução contendo 6X SSC, 1X solução de Denhardt, 100 pg/mL de tRNA de levedura e 0,05% de pirofosfato de sódio; e lavagem of filtros a 65° C durante 1 h em uma solução contendo 0,1 X SSC e 0,1% de SDS (dodecil sulfato de sódio). Em outras modalidades, são utili- zadas condições de hibridização de estringência moderada que são: pré- tratamento dos filtros contendo ácido nucleico durante 6 h a 40° C em uma solução contendo 35% de formamida, 5X SSC, 50 mM de Tris-HCI (pH 7,5), mM de EDTA, 0,1% de PVP, 0,1% de Ficoll, 1% de BSA e 500 pg/mL de DNA de esperma de salmão desnaturado; hibridização durante 18-20 h a 40° C em uma solução contendo 35% de formamida, 5X SSC, 50 mM de Tris-HCI (pH 7,5), 5 mM de EDTA, 0,02% de PVP, 0,02% de Ficoll, 0,2% de BSA, 100 pg/mL de DNA de esperma de salmão e 10% (p/vol) de sulfato de dextran; seguida pela lavagem duas vezes durante 1 hora a 55° C em uma solução contendo 2X SSC e 0,1% de SDS. Alternativamente, podem ser uti- lizadas condições de baixa estringência que compreendem: incubação du- rante 8 horas até durante a noite a 37° C em uma solução que compreende 20% de formamida, 5 x SSC, 50 mM de fosfato de sódio (pH 7,6), 5X solu- ção de Denhardt, 10% de sulfato de dextran e 20 Mg/mL de DNA de esperma de salmão cisalhado desnaturado; hibridização no mesmo tampão durante 18 até 20 horas; e lavagem dos filtros em 1 x SSC a aproximadamente 37° C durante 1 hora. Como um resultado da degeneração do código genético, pode ser produzido um número de seqüências de polinucleotídeos que codificam um polipeptídeo de HIO. Por exemplo, os códons podem ser selecionados para aumentar a taxa em que a expressão do polipeptídeo ocorre em uma 5 espécie hospedeira particular, de acordo com o uso ótimo de códons deter- minado pelo organismo hospedeiro particular (ver, por exemplo, Nakamura e outros, 1999, Nucleic Acids Res. 27:292). Tais variações de seqüências po- dem ser utilizadas nos métodos descritos aqui.

Os métodos descritos podem utilizar ortólogos (e/ou parálogos) de uma seqüência de ácido nucleico de HIO de Arabidopsis descrita. Os su- postos ortólogos (e/ou parálogos) representantes de cada um dos genes HIO de Arabidopsis descritos são identificados na coluna 5 da Tabela 3, a seguir. Os métodos de identificação dos ortólogos em outras espécies de plantas são conhecidos na técnica. Em geral, os ortólogos em espécies dife- rentes mantêm a mesma função, devido à presença de um ou mais motivos de proteína e/ou estruturas tridimensionais. Na evolução, quando um evento de duplicação gênica sucede a especiação, um único gene em uma espécie, tal como Arabidopsis, pode corresponder a vários genes (parálogos) em uma outra. Quando os dados das seqüências estão disponíveis para uma espécie de planta particular, os ortólogos são geralmente identificados através da análise de homologia de seqüência, tal como a análise de BLAST, geralmen- te utilizando seqüências de isca de proteínas. As seqüências são designa- das como um ortólogo potencial se a melhor coincidência de seqüência par- tindo do resultado de BLAST para frente recuperar a seqüência de busca original no BLAST inverso (Huynen MA e Bork P, 1998, Proe. Nati Aead. Sei., 95:5849-5856; Huynen MA e outros, 2000, Genome Research, 10:1204-1210).

Programas para alinhamento de várias seqüências, tal como CLUSTAL (Thompson JD e outros, 1994, Nucleic Acids Res. 22:4673-4680) podem ser utilizados para destacar regiões e/ou resíduos conservados de proteínas homólogas (ortólogas e/ou parálogas) e para gerar árvores filoge- néticas. Em uma árvore filogenética que representa várias seqüências ho- mólogas provenientes de espécies distintas (por exemplo, recuperadas atra- vés da análise de BLAST), as seqüências ortólogas de duas espécies ge- ralmente aparecem mais próximas na árvore em relação a todas as outras seqüências destas duas espécies. O "rosqueamento" estrutural ou outras 5 análises de dobramento das proteínas (por exemplo, utilizando o software da ProCeryon1 Biosciences, Salzburg, Áustria) podem também identificar ortó- logos potenciais. Os métodos de hibridização de ácidos nucleicos também podem ser utilizados para encontrar genes ortólogos e são preferidos quan- do os dados das seqüências não estão disponíveis. A PCR degenerada e a 10 verificação de bibliotecas de cDNA ou de DNA genômico são métodos co- muns para encontrar seqüências gênicas relacionadas e são bem- conhecidas na técnica (ver, por exemplo, Sambrook, 1989, Molecular Clo- ning: A Laboratory Manual (Segunda Edição), Cold Spring Harbor Press, Plainview, N.Y.; Dieffenbach e Dveksler, 1995, PCR Primer: A Laboratory 15 Manual, Cold Spring Harbor Laboratory Press, NY). Por exemplo, os méto- dos para gerar uma biblioteca de cDNA partindo da espécie de planta de interesse e submetendo a biblioteca a sondas com sondas de genes parci- almente homólogos são descritos em Sambrook e outros. Uma parte alta- mente conservada da seqüência codificadora de HIO de Arabidopsis pode 20 ser utilizada como uma sonda. Os ácidos nucleicos ortólogos de HIO podem se hibridizar ao ácido nucleico da SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31 ou SEQ ID 25 NO: 33, sob condições de estringência alta, moderada ou baixa. Após a am- plificação ou o isolamento de um segmento de um suposto ortólogo, tal segmento pode ser clonado e sequenciado através de técnicas padroniza- das e utilizado como uma sonda para isolar um clone completo de cDNA ou de DNA genômico.

Alternativamente, é possível iniciar um projeto de EST para ge-

rar um banco de dados de informação de seqüência para a espécie de plan- ta de interesse. Em uma outra abordagem, os anticorpos que se ligam espe- cificamente a polipeptídeos de HIO conhecidos são utilizados para o isola- mento de ortólogos (e/ou parálogos) (ver, por exemplo, Harlow e Lane, 1988, 1999, Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory Press, Nova York). A análise de Western blot pode determinar se um ortólo- 5 go de HIO (isto é, um ortólogo de proteína para um polipeptídeo de HIO des- crito) está presente em um extrato bruto de uma espécie de planta particular. Quando a reatividade é observada, a seqüência que codifica o ortólogo can- didato pode ser isolada através da verificação de bibliotecas de expressão que representam a espécie de planta particular. As bibliotecas de expressão 10 podem ser construídas em uma variedade de vetores disponíveis comerci- almente, incluindo Iambda gt11, como descrito em Sambrook e outros, 1989. Uma vez que o(s) ortólogo(s) candidato(s) é(são) identificado(s) através de qualquer um destes meios, as seqüências ortólogas candidatas são utiliza- das como isca (a "busca") para o BLAST inverso contra seqüências de Ara- 15 bidopsis ou de outras espécies em que as seqüências de ácidos nucleicos de HIO e/ou de polipeptídeos foram identificadas.

Os ácidos nucleicos e os polipeptídeos de HIO podem ser obti- dos através da utilização de qualquer método disponível. Por exemplo, as técnicas para o isolamento de seqüências de cDNA ou de DNA genômico de 20 interesse através da verificação de bibliotecas de DNA ou através da utiliza- ção da reação em cadeia da polímerase (PCR), como descrito anteriormen- te, são bem-conhecidas na técnica. Alternativamente, a seqüência de ácido nucleico pode ser sintetizada. Qualquer método conhecido, tal como a muta- gênese direcionada ao sítio (Kunkel TA e outros, 1991, Methods Enzymoi 25 204:125-39), pode ser utilizado para introduzir alterações desejadas em um ácido nucleico clonado.

Em geral, os métodos descritos aqui envolvem a incorporação da forma desejada do ácido nucleico de HIO em um vetor de expressão de planta para a transformação de células vegetais e o polipeptídeo de HIO é 30 expresso na planta hospedeira. As plantas e as células vegetais transforma- das que expressam um polipeptídeo de HIO expressam um fenótipo alterado e, em um exemplo não Iimitante específico, podem ter conteúdo alto (maior) de óleos, alto (maior) de proteínas e/ou baixo (menor) de fibras.

Uma molécula de ácido nucleico de HIO "isolada" é outra que na forma ou no ambiente em que é encontrada na natureza e é identificada e separada de pelo menos uma molécula de ácido nucleico contaminante com 5 a qual está comumente associada na fonte natural do ácido nucleico de HIO. Entretanto, uma molécula de ácido nucleico de HIO isolada inclui moléculas de ácidos nucleicos de HIO contidas nas células que expressam comumente o polipeptídeo de HIO quando, por exemplo, a molécula de ácido nucleico está em uma localização cromossômica diferente daquela das células natu- 10 rais.

Produção de Plantas Modificadas Geneticamente com um Fenótipo Alterado Os ácidos nucleicos e os polipeptídeos de HIO descritos podem ser utilizados na produção de plantas transgênicas que possuem um fenóti- po modificado ou alterado, por exemplo, um fenótipo de conteúdo alterado de óleos, proteínas e/ou fibras. Como utilizado aqui, um "conteúdo (fenótipo) alterado de óleos" pode se referir ao conteúdo alterado de óleos em qual- quer parte da planta. Em uma modalidade preferida, a expressão alterada do gene HIO em uma planta é utilizada para gerar plantas com um conteúdo (fenótipo) alto de óleos. Como utilizado aqui, um "conteúdo (fenótipo) altera- do de proteínas totais" ou um "conteúdo (fenótipo) alterado de proteínas que podem ser digeridas" pode se referir ao conteúdo alterado de proteínas (to- tais ou que podem ser digeridas) em qualquer parte da planta. Em uma mo- dalidade preferida, a expressão alterada do gene HIO em uma planta é utili- zada para gerar plantas com um conteúdo (fenótipo) alto (ou maior) de pro- teínas totais ou que podem ser digeridas. Como utilizado aqui, um "conteúdo (fenótipo) alterado de fibras" pode se referir ao conteúdo alterado de fibras em qualquer parte da planta. Em uma modalidade preferida, a expressão alterada do gene HIO em uma planta é utilizada para gerar plantas com um conteúdo (fenótipo) baixo (ou menor) de fibras. O conteúdo alterado de ó- leos, proteínas e/ou fibras é frequentemente observado nas sementes. Os exemplos de uma planta transgênica incluem plantas que compreendem um vetor de transformação de planta com uma seqüência de nucleotídeos que codifica ou é complementar a uma seqüência que codifica um polipeptídeo de HIO que possui a seqüência de aminoácidos que é apresentada na SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID 5 NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32 ou SEQ ID NO: 34 ou um ortólogo ou um parálogo da mesma.

As plantas transgênicas, tais como milho, soja e canola que con- têm as seqüências de ácidos nucleicos descritas, podem ser utilizadas na produção de óleo e farinha vegetal. O óleo vegetal é utilizado em uma varie- dade de produtos alimentícios, enquanto que a farinha da semente é utiliza- da como um produto alimentício para animais. Após a colheita da semente das plantas transgênicas, a semente é limpa para remover os talos da planta e outro material e então fendidas em lascas em um moinhos de rolo para quebrar as cascas. A semente triturada é aquecida a 75-100° C para desna- turar as enzimas hidrolíticas, Iisar as células não rompidas que contêm óleo e permitir que as pequenas gotículas de óleo se unam. A maior parte do óleo é então removida (e pode ser recuperada) através da pressão do material da semente em uma prensa de rosca. O restante do óleo é removido da torta da prensa através da extração com e solventes orgânicos, tal como hexano. O solvente é removido da farinha através do aquecimento da mesma a aproxi- madamente 100° C. Após a secagem, a farinha é então granulada em uma forma consistente. A farinha, contendo a proteína, o carboidrato que pode ser digerido e a fibra da semente, pode ser misturada com outros materiais antes de ser utilizada como um produto alimentício para animais.

Os métodos descritos aqui para a produção de plantas transgê- nicas podem ser geralmente aplicados a todas as plantas. Embora a marca- ção por ativação e a identificação gênica sejam realizadas em Arabidopsis, a seqüência de ácido nucleico de HIO (ou um ortólogo, um parálogo, uma va- 30 riação ou um fragmento da mesma) pode ser expressa em qualquer tipo de planta. Em uma modalidade preferida, as plantas que produzem óleo produ- zem e armazenam triacilglicerol em órgãos específicos, primariamente nas sementes. Tais espécies incluem soja (Glicine max), semente de colza e canola (incluindo Brassica napus, B. campestris), girassol (Helianthus an- nus), algodão (Gossypium hirsutum), milho (Zea mays), cacau (Theobroma cacao), açafroa (Carthamus tinctorius), dendezeiro (Elaeis guineensis), co- 5 queiro (Cocos nucifera), linho (Linum usitatissimum), mamona (Ricinus communis) e amendoim (Arachis hypogaea), assim como trigo, arroz e avei- a. As plantas que carregam frutos e verduras, as plantas que produzem grãos, as plantas que produzem nozes, as espécies de Brassica de ciclo rápido, alfalfa (Medieago sativa), tabaco (Nieotiana), turfa (família Poaceae), 10 outras plantas de cultivo de forragem e espécies selvagens também podem ser uma fonte de ácidos graxos exclusivos. Em outras modalidades, qual- quer planta que expressa a seqüência de ácido nucleico de HIO também pode expressar conteúdo maior de proteínas e/ou menor de fibras em uma parte ou um órgão específico da planta, tal como nas sementes.

O versado na técnica reconhecerá que exite uma ampla varie-

dade de técnicas de transformação na técnica e novas técnicas estão conti- nuamente se tornando disponíveis. Qualquer técnica que seja adequada pa- ra a planta hospedeira alvo pode ser empregada dentro do âmbito da pre- sente invenção. Por exemplo, os constructos podem ser introduzidos em 20 uma variedade de formas incluindo, mas não limitadas a, na forma de um filamento de DNA, em um plasmídeo ou em um cromossomo artificial. A in- trodução dos constructos nas células vegetais alvos pode ser realizada atra- vés de uma variedade de técnicas, incluindo, mas não limitadas a transfor- mação mediada por Agrobaeterium, eletroporação, microinjeção, bombar- 25 deio de microprojéteis, co-precipitação de DNA com fosfato de cálcio ou transformação mediada por Iipossomos de um ácido nucleico heterólogo. A transformação da planta é preferencialmente permanente, isto é, através da integração dos constructos de expressão introduzidas no genoma da planta hospedeira, de forma que os constructos introduzidos são passados para 30 gerações de plantas sucessivas. Dependendo do uso pretendido, um cons- tructo de ácido nucleico heteróloga que compreende um polinucleotídeo de HIO pode codificar a proteína inteira ou uma parte biologicamente ativa da mesma.

Em uma modalidade, sistemas de vetores binários baseados em Ti podem ser utilizados para transferir polinucleotídeos. Vetores binários pa- dronizados de Agrobacterium são conhecidos pelos versados na técnica e 5 muitos estão disponíveis comercialmente (por exemplo, pB1121 Clontech Laboratories, Palo Alto, CA). Um constructo ou um vetor pode incluir um promotor de planta para expressar a molécula de ácido nucleico de escolha. Em uma modalidade preferida, o promotor é um promotor de planta.

O procedimento ótimo para a transformação de plantas com ve- tores de Agrobacterium variará com o tipo de planta que será transformado. Os exemplos de métodos para a transformação mediada por Agrobaeterium incluem a transformação de explantes hipocotiledôneos, de extremidade do broto, de tecido do caule ou foliar, derivado de mudas e/ou plantas jovens esterilizadas. Tais plantas transformadas podem ser reproduzidas sexual- mente ou através da cultura de células ou de tecido. A transformação com Agrobaeterium foi descrita anteriormente para um grande número de tipos diferentes de plantas e os métodos para tal transformação podem ser encon- trados na literatura científica. São de relevância particular os métodos para a transformação de plantas de cultivo importantes comercialmente, tais como plantas das espécies de Brassiea, incluindo canola e semente de colza, (De Block e outros, 1989, Plant Physiol., 91:694-701), milho (Ishida e outros, 1996 Nature Bioteehnol. 14:745-750, Zhang e outros, 2002 Plante Cell Rep. 21:263-270), girassol (Everett e outros, 1987, Bio/Teehnology, 5:1201), soja (Christou e outros, 1989, Proe. Natl. Aead. Sei USA, 86:7500-7504; Kline e outros, 1987, Nature, 327:70), trigo, arroz e aveia.

A expressão (incluindo a transcrição e a tradução) de uma se- qüência de ácido nucleico de HIO pode ser regulada em relação ao nível de expressão, ao(s) tipo(s) de tecido(s) onde a expressão ocorre e/ou ao está- gio do desenvolvimento da expressão. Está disponível um número de se- 30 quências reguladoras heterólogas (por exemplo, promotores e intensificado- res) para o controle da expressão de um ácido nucleico de HIO. Estas inclu- em promotores constitutivos, que podem ser induzidos e que podem ser re- guiados, assim como promotores e intensificadores que controlam a expres- são de uma maneira específica ao tecido ou ao tempo. Os exemplos de promotores constitutivos incluem o promotor E4 da framboesa (Patentes U.S. N— 5.783.393 e 5.783.394), o promotor da nopalina sintase (NOS) (E- 5 bert e outros, Proc. Nati Acad. Sei. (U.S.A.) 84:5745-5749, 1987), o promo- tor da octopina sintase (OCS) (que é carregado nos plasmídeos indutores de tumor de Agrobacterium tumefaciens), os promotores de caulimovírus tais como o promotor 19S do vírus mosaico da couve-flor (CaMV) (Lawton e ou- tros, Plant Mol. Biol. 9:315-324, 1987) e o promotor 35S do CaMV (Odell e 10 outros, Nature 313:810-812, 1985 e Jones JD e outros, 1992, Transgenic Res., 1:285-297), o promotor 35S do vírus mosaico da escrofulária (Patente U.S. N2 5.378.619), o promotor que pode ser induzido pela Iuz da subunida- de pequena da ribulose-1,5-bis-fosfato carboxilase (ssRUBISCO), o promo- tor Adh (Walker e outros, Proc. Nati Acad. Sei. (U.S.A.) 84:6624-6628, 15 1987), o promotor da sacarose (Yang e outros, Proc. Natl. Acad. Sei. (U.S.A.) 87:4144-4148, 1990), o promotor do complexo do gene R (Chandler e outros, The Plant Cell 1Λ175-1183, 1989), o promotor do gene da proteína de ligação à clorofila a/b, o promotor do CsVMV (Verdaguer B e outros, 1998, Plant Mol Biol., 37:1055-1067) e o promotor da actina do melão (Pedi- 20 do de Patente PCT publicado W00056863). Os exemplos de promotores específicos ao tecido incluem os promotores E4 e E8 do tomate (Patente U.S. Ns 5.859.330) e o promotor do gene 2AII do tomate (Van Haaren MJJ e outros, 1993, PIantMoIBio., 21:625-640).

Em uma modalidade preferida, a expressão da seqüência de 25 ácido nucleico de HIO está sob o controle de seqüências reguladoras dos genes cuja expressão está associada com o desenvolvimento inicial da se- mente e/ou do embrião. Na verdade, em uma modalidade preferida, o pro- motor utilizado é um promotor intensificado na semente. Os exemplos de tais promotores incluem as regiões reguladoras a 5' de genes tais como da napi- 30 na (Kridl e outros, Seed Sei. Res. 1:209:219, 1991), da globulina (Belanger e Kriz, Genet., 129: 863-872, 1991, N0 de Acesso de GenBank L22295), da gama zeína Z 27 (Lopes e outros, Mol Gen Genet., 247:603-613, 1995), do promotor da L3 oleosina (Patente U.S. Ne 6,433,252), da faseolina (Bustos e outros, Plant Cell, 1(9):839-853, 1989), da arcelina5 (Pedido de Patente U.S. N2 2003/0046727), de um promotor 7S da soja, de um promotor 7Soc (Pedido de Patente U.S. Ns 2003/0093828), do promotor da 7Sa' beta conglicinina da soja, de um promotor 7Sa' (Beachy e outros, EMBO J., 4:3047, 1985; Schu- Ier e outros, Nucleic Acid Res., 10(24):8225-8244, 1982), inibidor da tripsina da soja (Riggs e outros, PIantCeI11(6):609-621, 1989), ACP (Baerson e ou- tros, Plant Mol. Biol., 22(2):255-267, 1993), da estearoil-ACP dessaturase (Slocombe e outros, Plant Physiol. 104(4):167-176, 1994), da subunidade a' da β-conglicinina da soja (Chen e outros, Proc. Natl. Acad. Sei. 83:8560- 8564, 1986), de USP de Vicia faba (P-Vf.Usp, SEQ ID NO: 1, 2 e 3 no (Pedi- do de Patente U.S. N2 2003/229918) e do promotor da L3 oleosina de Zea mays (Hong e outros, Plant Mol. Bioi, 34(3):549-555, 1997). São também incluídas as zeínas, que são um grupo de proteínas de armazenamento en- contradas no endosperma do milho. Clones genômicos para os genes da zeína foram isolados (Pedersen e outros, Cell, 29:1015-1026, 1982; e Rus- sell e outros, Transgenie Res. 6(2):157-168) e os promotores destes clones, incluindo 15 kD, 16 kD, 19 kD, 22 kD, 27 kD e os genes, podiam ser utiliza- dos. Outros promotores conhecidos como sendo funcionais, por exemplo, no milho incluem os promotores para os genes a seguir: waxy, Brittle, Shrunken

2, Enzimas de ramificação I e II, amido sintases, enzimas de desramificação, oleosinas, glutelinas e sacarose sintases. Os genes de verduras cujos pro- motores estão associados com o desenvolvimento inicial da semente e do embrião incluem Iegumin de V. faba (Baumlein e outros, 1991, Mol. Gen. 25 Genet. 225:121-8; Baumlein e outros, 1992, Plant J. 2:233-9), usp de V. faba (Fiedler e outros, 1993, Plant Moi Biol. 22:669-79), eonvicilin da ervilha (Bown e outros, 1988, Bioehem. J. 251:717-26), Ieetin da ervilha (dePater e outros, 1993, Plant Cell 5:877-86), beta phaseolin de P. vulgaris (Bustos e outros, 1991, EMBO J. 10:1469-79), DLEC2 e PHS de P. vulgaris [beta] 30 (Bobb e outros, 1997, Nueleic Aeids Res. 25:641-7) e beta-Conglieinin da soja, proteína 7S de armazenamento (Chamberland e outros, 1992, Plant Mol. Bioi 19:937-49). Os genes de cerais cujos promotores estão associados com o desenvolvimento inicial da semente e do embrião incluem glutelin do arroz ("GluA-3", Yoshihara e Takaiwa, 1996, Plant Cell Physioi 37:107-11; "GIuB- 1", Takaiwa e outros, 1996, Plant Mol. Biol. 30:1207-21; Washida e outros, 5 1999, Plant Mol. Biol. 40:1-12; "Gt3", Leisy e outros, 1990, Plant Moi Biol. 14:41-50), prolamin do arroz (Zhou & Fan, 1993, Transgenic Res. 2:141-6), prolamin do trigo (Hammond-Kosack e outros, 1993, EMBO J. 12:545-54), zein do milho (Z4, Matzke e outros, 1990, Plant Mol. Biol. 14:323-32) e B- hordeins da cevada (Entwistlee outros, 1991, Plant Mol. Biol. 17:1217-31).

Outros genes cujos promotores estão associados com o desen-

volvimento inicial da semente e do embrião incluem GL07A do dendezeiro (7S globulina, Morcillo e outros, 2001, Physiol. Plant 112:233-243), napin de Brassica napus, proteína de armazenamento 2S e gene napA (Josefsson e outros, 1987, J. Biol. Chem. 262:12196-201; Stalberg e outros, 1993, Plant 15 Mol. Biol. 1993 23:671-83; Ellerstrom e outros, 1996, Plant Mol. Biol. 32:1019-27), oleosin de Brassiea napus (Keddie e outros, 1994, Plant Mol. Biol. 24:327-40), oleosin de Arabidopsis (Plant e outros, 1994, Plant Mol. Biol. 25:193-205), FAE1 de Arabidopsis (Rossak e outros, 2001, Plant Mol. Biol. 46:717-25), conA de Canavalia gladiata (Yamamoto e outros, 1995, 20 Plant Mol. Biol. 27:729-41) e estrictosidina sintase de Catharanthus roseus (Str, Ouwerkerk e Memelink, 1999, Mol. Gen. Genet. 261:635-43). Em uma outra modalidade preferida, são utilizadas as seqüências reguladoras de ge- nes expressos durante a biossíntese de óleo (ver, por exemplo, a Patente U.S. Ns 5.952.544). Os promotores alternativos são de genes de proteínas 25 de armazenamento de plantas (Bevan e outros, 1993, Philos. Trans. R. Soe. Lond. B. Biol. Sei. 342:209-15). Os promotores adicionais que podem ser utilizados são descritos, por exemplo, nas Patentes U.S. N— 5.378.619; 5.391.725; 5.428.147; 5.447.858; 5.608.144; 5.608.144; 5.614.399; 5.633.441; 5.633.435; e 4.633.436.

Em uma outra modalidade, o gene HIO endógeno pode ser colo-

cado sob o controle de um fator de transcrição transgênico ou utilizado para planejar sítios de ligação que modulam sua expressão. Uma tal classe de fatores de transcrição é constituída das proteínas de dedo de zinco Cys2- H1S2 (ZFPs). As ZFPs são proteínas de ligação ao DNA comuns e podem ser planejadas para se ligarem especificamente a seqüências de DNA específi- cas (Beerli & Barbas, Nat Biotechnol., 2002, 20:135-141,; Gommans e ou- tros, J Mol Biol., 2005, 354:507-519). Os domínios de dedo de zinco indivi- duais são compostos de aproximadamente 30 aminoácidos, são estrutural- mente conservados e podem interagir com 3-4 pb de DNA. Pode ser sinteti- zado um polipeptídeo que contém vários dedos de zinco planejados para se ligarem a uma seqüência de DNA específica no promotor de um gene HIO. Os princípios para 0 planejamento dos domínios de dedo de zinco para a interação com seqüências de DNA específicas foram descritos em Segal e outros, (Segai e outros, Proc Natl Acad Sci U S A., 1999, 96:2758-2763), Dreier e outros (Dreier e outros, J Mol Biol., 2000, 303:489-502) e Beerli e Barbas (Beerli & Barbas, Nat Biotechnol., 2002, 20:135-141). Estes domínios de ligação ao DNA podem ser fundidos a domínios efetores para formar uma ZFP sintética que pode regular a transcrição de genes aos quais se liga. Os domínios efetores que podem ativar a transcrição incluem, mas não estão limitados à parte ácida da proteína VP16 do vírus herpes simplex (Sadowski e outros, Nature., 1988, 335:563-564) e da VP64 (Beerli e outros, Proc Natl Acad Sci U S A., 1998, 95:14628-14633) e o domínio p65 do fator de trans- crição do NF-κΒ (Bae e outros, Nat Biotechnol., 2003, 21:275-280, Liu e ou- tros, J Biol Chem., 2001, 276:11323-11334). Os domínios efetores que po- dem reprimir a transcrição incluem, mas não estão limitados a mSIN3 e KRAB (Ayer e outros, Mol Cell Biol., 1996, 16:5772-5781, Beerli & Barbas, Nat Biotechnol., 2002, 20:135-141, Beerli e outros, Proc Natl Acad Sci USA, 1998, 95:14628-14633, Margolin e outros, Proc Natl Acad Sci USA., 1994, 91:4509-4513). Foi mostrado que estas abordagens funcionam em plantas (Guan e outros, Proc Natl Acad Sci U S A., 2002, 99:13296-13301, Stege e outros, Plant J., 2002, 32:1077-1086, Van Eenennaam e outros, Metab Eng., 2004,6:101-108).

Ainda em um outro aspecto, em alguns casos pode ser desejá- vel inibir a expressão da seqüência de ácido nucleico de HIO endógena em uma célula hospedeira. Os exemplos de métodos para a prática deste as- pecto da invenção incluem, mas não estão limitados à supressão antissenso (Smith e outros, 1988, Nature, 334:724-726; van der Krol e outros, 1988, Bi- oTechniques, 6:958-976); co-supressão (Napoli e outros, 1990, Plant Cell, 2:279-289); ribozimas (Publicação PCT WO 97/10328); e combinações de senso e antissenso (Waterhouse e outros, 1998, Proc. Nati Acad. Sei. USA, 95:13959-13964). Os métodos para a supressão de seqüências endógenas em uma célula hospedeira empregam tipicamente a transcrição ou a trans- crição e a tradução de pelo menos uma parte da seqüência que deve ser suprimida. Tais seqüências podem ser homólogas às regiões codificadoras assim como não codificadoras da seqüência endógena. A inibição antissen- so pode utilizar a seqüência de cDNA inteira (Sheehy e outros, 1988, Proc. Nati Acad. Sei. USA, 85:8805-8809), uma seqüência de cDNA parcial inclu- indo fragmentos da seqüência codificadora a 5' (Cannon e outros, 1990, Plant Mol. Biol., 15:39-47) ou seqüências não codificadoras a 3' (Ch'ng e outros, 1989, Proc. Natl. Acad. Sei. USA, 86:10006-10010). As técnicas de co-supressão podem utilizar a seqüência de cDNA inteira (Napoli e outros, 1990, Plant Cell, 2:279-289; van der Krol e outros, 1990, Plant Cell, 2:291- 299) ou uma seqüência de cDNA parcial (Smith e outros, 1990, Mol. Gen. Genetics, 224:477-481).

Os testes moleculares e genéticos padronizados podem ser rea- lizados para analisar adicionalmente a associação entre uma seqüência de ácido nucleico e um fenótipo observado. Os exemplos de técnicas são des- critos a seguir.

1. Análise de DNA/RNA

Os padrões de expressão gênica específica ao estágio e ao te- cido em linhagens mutantes versus do tipo selvagem podem ser determina- dos, por exemplo, através da hibridização in situ. A análise da condição de metilação do gene, especialmente das regiões reguladoras flanqueadoras, 30 pode ser realizada. Outras técnicas adequadas incluem a superexpressão, a expressão ectópica, a expressão em outras espécies de plantas e o nocaute gênico (genética inversa, nocaute direcionado, silenciamento gênico induzi- do por vírus (VIGS; ver, Baulcombe D, 1999, Arch. Virol. Suppl. 15:189-201).

Em uma aplicação preferida, a obtenção de um perfil de expres- são, geralmente através da análise de microarranjos, é utilizada para medir simultaneamente diferenças ou alterações induzidas na expressão de vários 5 genes diferentes. As técnicas para a análise de microarranjo são bem- conhecidas na técnica (Schena M e outros, Science 1995 270:467-470; Baldwin D e outros, 1999, Cur. Opin. Plant Biol. 2(2):96-103; Dangond F, Physiol Genomics (2000) 2:53-58; van Hal NL e outros, J Biotechnol. (2000) 78:271-280; Richmond T e Somerville S, Curr. Opin. Plant Biol. 2000 3:108- 10 116). Pode ser realizada a obtenção do perfil de expressão de linhagens marcadas individuais. Tal análise pode identificar outros genes que são co- ordenadamente regulados como uma conseqüência da superexpressão do gene de interesse, que pode ajudar a colocar um gene desconhecido em uma via particular.

2. Análise dos Produtos Gênicos

A análise dos produtos gênicos pode incluir a expressão de pro- teínas recombinantes, a produção de antissoro, a imunolocalização, os en- saios bioquímicos para atividade catalítica ou outra, a análise da condição de fosforilação e a análise da interação com outras proteínas através de en- saios de duplo híbrido de levedura.

3. Análise das Vias

A análise das vias pode incluir a colocação de um gene ou de um produto gênico dentro de uma via bioquímica, metabólica ou de sinaliza- ção particular com base em seu fenótipo de expressão errada fenótipo ou 25 através da homologia de seqüência com genes relacionados. Alternativa- mente, a análise pode compreender cruzamentos genéticos com linhagens do tipo selvagem e outras linhagens mutantes (criando duplos mutantes) para ordenar o gene em uma via ou determinar o efeito de uma mutação sobre a expressão de genes "repórteres" a jusante em uma via.

Produção de Plantas Mutadas com um Fenótipo Alterado

São descritos aqui métodos adicionais de produção de uma planta que possui um fenótipo alterado, em que é identificada uma planta que possui uma mutação ou um alelo em sua seqüência de ácido nucleico de HIO que resulta em um fenótipo alterado, comparada a plantas que pos- suem a mutação ou o alelo. A planta mutada pode ser gerada utilizando um ou mais agentes mutagênicos, por exemplo, um agente mutagênico químico (tal como sulfonato de etilmetano, sulfonato de metil metano, dietilsulfato e nitrosoguanidina ou 5-bromo-deoxiuridina), radiação ou Iuz ultravioleta. Em algumas modalidades do método, a planta mutada pode ser cruzada para gerar progênie, que herda a mutação ou o alelo e possui um fenótipo altera- do. Por exemplo, é fornecido aqui um método de identificação de plantas que possui uma ou mais mutações na seqüência de ácido nucleico de HIO endógena que confere um fenótipo alterado e de produção de progênie des- tas plantas mutadas que possuem tal fenótipo que não é transgênica. As plantas mutadas com um fenótipo alterado podem ter um conteúdo alterado de óleos, proteínas e/ou fibras ou um conteúdo alterado de farinha da se- mente.

Em uma modalidade específica do método, chamado de "Tl L- LlNG" (para targeting induced local Iesions in genomes - direcionamento de lesões locais induzidas nos genomas), são induzidas mutações na semente de uma planta de interesse, por exemplo, utilizando tratamento com EMS 20 (sulfonato de etilmetano) tratamento. As plantas resultantes são crescidas e autofertilizadas e a progênie é utilizada para preparar amostras de DNA. A amplificação através da PCR e o sequenciamento da seqüência de ácido nucleico de HIO são utilizados para identificar se uma planta mutada possui uma mutação na seqüência de ácido nucleico de HIO. As plantas que pos- 25 suem mutações HIO podem ser então testadas em relação ao conteúdo alte- rado de óleos, proteínas e/ou fibras. Para confirmar se a mutação HIO causa o fenótipo modificado, podem ser realizados experimentos que correlacio- nam a presença do gene modificado e o fenótipo modificado através de cru- zamentos genéticos. O TILLING pode identificar mutações que alteram a 30 expressão de genes específicos ou a atividade de proteínas codificadas por estes genes (ver Colbert e outros, 2001, Plant Physioi 126:480-484; McCaI- Ium e outros, 2000, Nature Biotechnology 18:455-457). Em uma outra modalidade específica do método, uma aborda- gem de gene/Lócus de Característica Quantitativa (QTLs) candidato pode ser utilizada em um programa de cruzamento auxiliado por marcadores para identificar alelos de ou mutações na seqüência de ácido nucleico de HIO ou 5 ortólogos (e/ou parálogos) da seqüência de ácido nucleico de HIO que po- dem conferir conteúdo alterado de óleos, proteínas e/ou fibras (ver Bert e outros, Theor Appl Genet., 2003 Jun;107(1):181-9; e Lionneton e outros, Genome, 2002 Dez;45(6): 1203-15). Assim, em um aspecto adicional da des- crição, um ácido nucleico de HIO é utilizado para identificar se uma planta 10 que possui conteúdo alterado de óleos, proteínas e/ou fibras possui uma mutação em uma seqüência de ácido nucleico de HIO endógena ou possui um alelo particular que causa conteúdo alterado de óleos, proteínas e/ou fibras na planta.

Embora a descrição tenha sido descrita com referência a méto- 15 dos e modalidades específicos, será considerado que várias modificações e alterações podem ser feitas sem divergir da descrição. Todas as publicações citadas aqui são expressamente incorporadas aqui como referência com a finalidade de descrever e divulgar composições e metodologias que poderi- am ser utilizadas em associação com a descrição. Todas as patentes, os 20 pedidos de patentes e a informação de seqüências citados nos bancos de dados públicos referidos também são incorporados aqui como referência.

EXEMPLOS

EXEMPLO 1

Produção de Plantas com um Fenótipo HIO através da Transformação com um Constructo de Marcacão por Ativação

Este Exemplo descreve a produção de plantas transgênicas com conteúdo alterado de óleos, proteínas e/ou fibras.

Os mutantes foram gerados utilizando o vetor "ACTTAG" de marcação por ativação, pSKI015 (Gl#6537289; Weigel D e outros, 2000, Plant Physiology, 122:1003-1013). Métodos padronizados foram utilizados para a produção de plantas transgênicas de Arabidopsis e eram essencial- mente como descritos no pedido de patente publicado PCT W00183697. Sucintamente, plantas de Arabidopsis TO (CoI-O) foram transformadas com Agrobacterium carregando o vetor pSKI015, que compreende o T-DNA deri- vado do plasmídeo Ti de Agrobacterium, um gene marcador que pode ser selecionado de resistência a herbicida e o elemento intensificador 4X CaMV 5 35S. As plantas transgênicas foram selecionadas na geração T1 com base na resistência ao herbicida. A semente 12 (proveniente das plantas T1) foi colhida e plantada no solo. As plantas T2 foram expostas ao herbicida para matar as plantas que não possuem o vetor ACTTAG. As plantas T2 foram crescidas até a maturidade, permitidas que fossem autofertilizadas e produ- 10 zissem semente. A semente T3 (proveniente das plantas T2) foi colhida em grandes quantidades para cada linhagem.

A semente T3 foi analisada através de Near Infrared Spectros- copy (NIR) no momento da colheita. Os espectros de NIR foram capturados utilizando um espectrômetro perto do infravermelho Bruker 22. O Software 15 Bruker foi utilizado para estimar o conteúdo total de óleos da semente, o conteúdo total de proteínas da semente e o conteúdo total de fibras da se- mente utilizando os dados provenientes da análise de NIR e métodos de re- ferência de acordo com as instruções do fabricante. As calibrações que pre- vêm o conteúdo de óleos foram desenvolvidas seguindo o método geral do 20 AOCS Procedure Am1-92, Official Methods and Recommended Practices of the American Oil Chemists Society, 5â Ed., AOCS, Champaign, III. Uma cali- bração que prevê o conteúdo total de proteínas por NIR foi desenvolvida uti- lizando dados do conteúdo de nitrogênio total de amostras de sementes se- guindo o método geral do Dumas Procedure AOAC 968.06 (Official Methods 25 of Analysis of AOAC International 17â Edição AOAC, Gaithersburg, MD). Uma calibração que prevê o conteúdo de fibras por NIR foi desenvolvida uti- lizando os dados de conteúdo de fibras brutas de amostras de sementes seguindo o método geral do AOAC Official Method 962.09 (Official Methods of Analysis of AOAC International 17â Edição AOAC, Gaithersburg, MD). 30 Uma calibração que prevê o conteúdo de ácido oleico por NIR foi desenvol- vida utilizando os dados do conteúdo de ácido oleico de amostras de semen- te determinados seguindo o método de Browse e outros (1986 Anal. Bio- chem. 152:141-145). Foi desenvolvida uma curva de calibração de NIR para prever o conteúdo de proteínas que podem ser digeridas através da medida do conteúdo de proteínas que podem ser digeridas em um conjunto de a- mostras de sementes. O conteúdo total de proteínas em uma massa conhe- 5 cida de semente foi determinado através da medida do conteúdo de nitrogê- nio total da semente utilizando o método de Dumas (AOAC Official Method 968.06). A fibra da semente é extraída de uma amostra de semente separa- da utilizando o método de Honig e Rackis1 (1979, J. Agri. Food Chem., 27: 1262-1266). A proteína não digerida remanescente associada com a fibra é 10 medida através do método de Dumas (AOAC Official Method 968.06). O conteúdo de proteínas que podem ser digeridas é determinado através da subtração da quantidade de proteína não digerida associada com a fibra da quantidade total de proteína na semente.

As previsões de óleos, proteínas e fibras partindo dos espectros 15 de NIR foram comparadas para 82.274 linhagens ACTTAG individuais. Sub- sequente à análise da composição das sementes, a posição do elemento ACTTAG no genoma em cada linhagem foi determinada através da PCR inversa e do sequenciamento. 37.995 linhagens com seqüências flanquea- doras recuperadas foram consideradas nesta análise.

Os valores de óleos e de proteínas das sementes em 82.274

linhagens foram determinados através da espectroscopia por NIR e normali- zados para permitir a comparação dos valores dos componentes das semen- tes nas plantas crescidas em tempos diferentes. Os valores de óleos, proteí- nas e fibras foram normalizados através do cálculo dos valores médios de 25 óleos, proteínas e fibras na semente de todas as plantas plantadas no mes- mo dia (incluindo um grande número de outras plantas ACTTAG, incluindo plantas de controle, do tipo selvagem ou não transgênicas). Os componen- tes das sementes para cada linhagem foram expressos na forma de um "va- lor relativo percentual" que foi calculado através da divisão do valor do com- 30 ponente para cada linhagem pelo valor médio do componente para todas as linhagens plantadas no mesmo dia (que deve se aproximar ao valor nas plantas de controle, do tipo selvagem ou não transgênicas). A "porcentagem relativa de proteínas" e a "porcentagem relativa de fibras" foram calculadas similarmente.

A PCR inversa foi utilizada para recuperar o DNA genômico que flanqueia a inserção do T-DNA. O produto da PCR foi submetido à análise de seqüência e posicionado no genoma utilizando uma busca de BLASTN básica e/ou uma busca do banco de dados Information Resource (TAIR) de Arabidopsis (disponível no website disponível ao público). Geralmente, pro- motores dentro de 9 kb dos intensificadores no elemento ACTTAG são con- siderados como estando dentro do "espaço de ativação". Os genes com in- sertos de T-DNA dentro das seqüências codificadoras não foram considera- dos como estando dentro do "espaço de ativação". As linhagens ACTTAG identificadas estão listadas na coluna 3 da Tabela 1. Em alguns casos, mais de uma linhagem ACTTAG está associada com um gene. Os valores relati- vos de óleos, proteínas, fibras e ácido oleico nas colunas 4, 5, 6 e 7, respec- tivamente, são determinados através da comparação do componente da semente na planta identificado na coluna 3 em relação a outras plantas crescidas ao mesmo tempo e que não exibem a característica. TABELA 1 1. Pseudônimo 2. TAIR ID 3. ID da Planta 4. (%) Relativa 5. (%) Relativa 6. (%) Relativa 7. Ácido Oleico de Óleo de Proteína de Fibra Relativo HI02011 B At4g10540 IN081274 121,52 85,77 112,19 170,91 HI02022A At1g21160 IN070576 117,87 86,36 105,35 131,71 HI02022A At1g21160 IN081625 108,6 94,24 102,16 127,55 HI02024A At5g43820 IN078194 117,12 84,22 98,87 93,6 H102024A At5g43820 IN077533 110,52 97,43 97,63 101,01 HI02029 A At4g21880 IN040221 112,12 91,32 105,08 98,4 HI02036A At1g35610 IN003383 110,63 95,26 102,61 107,39 HI02044A At1g07200 IN085633 136,02 215,34 33,73 HI02044 A At1g07200 IN065584 110,22 94,36 107,98 109,02 HI02062 B At3g21530 IN075911 112,25 97,43 128,26 121,82 HI02062 B At3g21530 IN010283 105,43 87,91 103,95 102,14 HI02070 B At1g03230 IN051870 110,64 97,08 92,8 99,68 HI02070 B At1g03230 IN027452 106,6 95,11 104,3 103,25 HI02079 B At1g71420 IN083604 131,01 83,85 99,94 139,75 HI02079 B At1g71420 IN090912 111,54 94,45 102,28 121,4 TABELA 1 - continuação 1. Pseudônimo 2. TAIR ID 3. ID da Planta 4. (%) Relativa 5. (%) Relativa 6. (%) Relativa 7. Ácido Oleico de Óleo de Proteína de Fibra Relativo HI02084A At3g 12020 IN003802 115,88 86,87 92,23 35,51 HI02084A At3g 12020 IN090757 114,25 89,69 104,06 190,46 HI02091 B At1g09850 IN086447 139,97 124,86 65,1 HI02091 B At1g09850 IN056625 104,65 106,59 100,56 103,87 H102093 A At5g61370 IN088828 137,19 136,19 56,9 HI02093A At5g61370 IN013278 107,74 98,35 105,92 114,61 HI02093C At5g61390 IN088828 137,19 136,19 56,9 HI02093C At5g61390 IN000614 109,24 92,2 104,2 106,81 HI02094 C At3g 13224 IN090531 128,14 75,88 117,6 HI02094 C At3g 13224 IN041823 108,28 98,85 97,35 102,03 HI02094 D At3g 13227 IN090531 128,14 75,88 117,6 HI02094 D At3g13227 IN041823 108,28 98,85 97,35 102,03 HI02104 B At4g33900 IN067514 117,59 88,13 96,25 121,81 TABELA 2 1. Lócus 2. Tair ID 3. Seq. de ácido 4. Seq. de Poli- 5. Suposta função bioquími 6. Domínio conservado nucleicoGI# peptídeo Gl# ca/nome da proteína da proteína H102022A At1g21160 gi|42562216 gi|15218159 proteína da família do fator de iní¬ IPR000795 Fator de síntese de cio da tradução eucariótica proteína, ligação a GTP 2/proteína da família elF-2 IPR002917 proteína de ligação a GTP, relacionada a HSR1 IPR004161 Fator de alongamento Tu1 domain 2 IPR010528 ToIA IPR004130 Proteína de ligação a ATP hipotética conservada H102024A At5g43820 gi| 18422375 gi| 15239991 proteína contendo repetição de IPR002885 Repetição de pentatri¬ pentatricopeptídeo (PPR) copeptídeo HI02029 A At4g21880 gi|30685605 gi|30685606 proteína contendo repetição de IPR002885 Repetição de pentatri¬ pentatricopeptídeo (PPR) copeptídeo HI02036 A At1g35610 gi| 18399770 gi|15219660 Proteína contendo domínio DC1 IPR004146 DC1 IPR011424 similar a C1 TABELA 2 - continuação 1. Lócus 2. Tair ID 3. Seq. de ácido 4. Seq. de Poli- 5. Suposta função bioquími 6. Domínio conservado nucleicoGI# peptídeo GI# ca/nome da proteína da proteína IPR001965 similar a dedo de Zn, dedo de PHD H102044A At1g07200 gi|30680018 gi|22329388 Relacionada à proteína CIpB Clp IPR001270 Chaperonina dpA/B protease dependente de ATP HI02062 B At3g21530 Gl:42565085 gi|42565086 proteína da família de endonuclea- IPR005135 Endonuclease/ exonu- se/exonuclease/fosfatase clease/fosfatase IPR004808 Exodeoxirribonuclease Ill xth IPR000097 AP endonuclease, fa¬ mília 1 HI02070 B At1g03230 gi |42561644 gi| 18379072 suposta glicoproteína dérmica ex- tracelular/suposta EDGP HI02079 B At1g71420 gi| 18409850 gi|15217470 proteína contendo repetição de IPR002885 Repetição de pentatri¬ pentatricopeptídeo (PPR) copeptídeo H102084A At3g12020 gi|22331005 gi|22331006 relacionada à proteína motora qui- IPR001752 Quinesina, região mo¬ nesina tora HI02091 B At1g09850 gi |30681401 gi|18391078 cisteína protease, similar à papaína IPR000169 Peptidase, sítio ativo (XBCP3) da cisteína peptidase eucariótica TABELA 2 - continuação 1. Lócus 2. Tair ID 3. Seq. de ácido 4. Seq. de Poli- 5. Suposta função bioquími 6. Domínio conservado nucleicoGI# peptídeo GI# ca/nome da proteína da proteína IPR000668 Peptidase C1A, papaí- na IPR000118 Granulina HI02093 A At5g61370 gi|30697519 gi| 15240232 proteína contendo repetição de IPR002885 Repetição de pentatri¬ pentatricopeptídeo (PPR) copeptídeo HI02093C At5g61390 gi|42568688 gi|42568689 proteína da família de exonuclease IPR006055 Exonuclease IPR006054 DNA polimerase III, subunidade épsilon H102094 C At3g13224 Gl:30682549 Gl:30682550 Proteína contendo o motivo de re¬ IPR000504 Região RNP-1 de liga¬ conhecimento de RNA (RRM) ção ao RNA (motivo de reconheci¬ mento de RNA) IPR009909 Nmi/IFP 35 IPR002343 Antígeno de encefalo- mielite paraneoplásica HI02094 C At3g13224 GI.30682552 Gl .30682553 Proteína contendo o motivo de re¬ IPR000504 Região RNP-1 de liga¬ conhecimento de RNA (RRM) ção ao RNA (motivo de reconheci¬ mento de RNA) TABELA 2 - continuação 1. Lócus 2. Tair ID 3. Seq. de ácido 4. Seq. de Poli- 5. Suposta função bioquími 6. Domínio conservado nucleicoGI# peptídeo GI# ca/nome da proteína da proteína IPR009909 Nmi/IFP 35 IPR002343 Antígeno de encefalo- mielite paraneoplásica HI02094 D At3g13227 Gl:30682556 gi|22331053 relacionada à proteína rica em se- rina HI02011 B At4g 10540 gi|18413350 gi|18413351 proteína da família subtilase IPR010259 Inibidor de proteinase 19, pró-peptídeo de subtilisina IPR003137 Associado à protease PA IPR000209 Peptidase S8 e S53, subtilisina, kexina, sedolisina HI02104 B At4g33900 gi|18418316 gi|18418317 proteína da família F-box contendo IPR006652 Repetição kelch repetições kelch IPR011498 Kelch IPR001810 F-box similar à ciclina TABELA 3 1. Lócus 2. Tair ID 3. Seq. de ácido 4. Seq. de Poli- 5. Ortólogos Ácido Polipeptídeo Espécie nucleico GI# GI# HI02022A At1g21160 gi|42562216 gi|15218159 gi|42563274 gi|42563275 Arabidopsis thaliana gi|30699194 gi|30699195 Arabidopsis thaliana gi|23452070 gi|23452071 Pisum sativum H102024A At5g43820 gi| 18422375 gi| 15239991 gi|30685153 gi| 15242190 Arabidopsis thaliana gi|50918926 gi|50918927 Oryza sativa (grupo do cultivar japonica) gi|34896697 gi|34896698 Oryza sativa (grupo do cultivar japonica) HI02029A At4g21880 gi|30685605 gi|30685606 gi|30679876 gi|30679877 Arabidopsis thaliana gi|50905060 gi|50905061 Oryza sativa (grupo do cultivar japonica) gi|18415436 gi| 15235288 Arabidopsis thaliana HI02036A At1g35610 gi| 18399770 gi|15219660 gi| 18400150 gi|15231357 Arabidopsis thaliana gi|42572370 gi|42572371 Arabidopsis thaliana gi| 18399212 gi| 15229741 Arabidopsis thaliana TABELA 3 - continuação 1. Lócus 2. Tair ID 3. Seq. de ácido 4. Seq. de Poli- 5. Ortólogos Ácido Polipeptideo Espécie nucleico GI# GI# 102044 A At1g07200 gi|30680018 gi|22329388 gi|30680018 gi|22329388 Arabidopsis thaliana gi|42569462 gi|18402202 Arabidopsis thaliana gi|42568597 gi| 15242850 Arabidopsis thaliana H102062 B At3g21530 Gl:42565085 gi|42565086 gi|42570014 gi|18407510 Arabidopsis thaliana gi|34898867 gi|34898868 Oryza sativa (grupo do cultivar japonica) gi|21229478 gi|21231641 Xanthomonas campestrís pv. campestris cepa ATCC 33913 HI02070 B At1g03230 gi|42561644 gi| 18379072 gi|30678499 gi| 15218740 Arabidopsis thaliana gi|285740 gi|285741 Daucus carota gi|32482805 gi|32482806 Solanum tuberosum HI02079 B At1g71420 gi| 18409850 gi|15217470 gi|18416131 gi| 15242550 Arabidopsis thaliana gi|30693149 gi|30693150 Arabidopsis thaliana gi]50899005 gi|50899006 Oryza sativa (grupo do cultivar japonica) TABELA 3 - continuação 1. Lócus 2. Tair ID 3. Seq. de ácido 4. Seq. de Poli- 5. Ortólogos Ácido Polipeptídeo Espécie nucleico GI# GI# H102084A At3g12020 gi|22331005 gi|22331006 gi|22326628 gi|22326629 Arabidopsis thaliana gi|30687505 gi|30687506 Arabidopsis thaliana gi|50924423 gi|50924424 Oryza sativa (grupo do cultivar japonica) HI02091 B At1 g09850 gi|30681401 gi|18391078 gi|50932272 gi|50932273 Oryza sativa (grupo do cultivar japonica) gi|30694200 gi| 18422289 Arabidopsis thaliana gi|30141018 gi|30141019 Helianthus annuus HI02093 A At5g61370 gi|30697519 gi| 15240232 gi|37534457 gi|37534458 Oryza sativa (grupo do cultivar japonica) gi|30697448 gi| 15239488 Arabidopsis thaliana gi|30693231 gi| 15229604 Arabidopsis thaliana HI02093 C At5g61390 gi|42568688 gi|42568689 gi|42567730 gi| 15240840 Arabidopsis thaliana gi|22330631 gi| 15221225 Arabidopsis thaliana gi|37534221 gi|37534222 Oryza sativa (grupo do cultivar japonica) TABELA 3 - continuação 1. Lócus 2. Tair ID 3. Seq. de ácido 4. Seq. de Poli- 5. Ortólogos Ácido Polipeptídeo Espécie nucleico GI# GI# HI02094 C At3g13224 Gl: 30682549 Gl:30682550 gi|30682552 gi|30682553 Arabidopsis thaliana gi|50944098 gi|50944099 Oryza sativa (grupo do cultivar japonica) gi |50947154 gi|50947155 Oryza sativa (grupo do cultivar japonica) Gl:51964985 Gl:51964986 Oryza sativa (grupo do cultivar japonica) HI02094 C At3g 13224 Gl:30682552 Gl:30682553 gi|30682549 gi|30682550 Arabidopsis thaliana gi|50944098 gi|50944099 Oryza sativa (grupo do cultivar japonica) gi|50947154 gi|50947155 Oryza sativa (grupo do cultivar japonica) Gl:51964985 Gl:51964986 Oryza sativa (grupo do cultivar japonica) H102094 D At3g13227 Gl:30682556 gi|22331053 Gl:4105789 Gl:4105790 Petunia x híbrida TABELA 3 - continuação 1. Lócus 2. Tair ID 3. Seq. de ácido 4. Seq. de Poli- 5. Ortólogos Ácido Polipeptídeo Espécie nucleico GI# GI# Gl:50905728 Gl:50905729 Oryza sativa (grupo do cultivar japonica) Gl:30697586 GI: 15220581 Arabidopsis thaliana HI02011 B At4g 10540 gi| 18413350 gi|18413351 gi|30681486 gi| 18413353 Arabidopsis thaliana gi| 18413344 gi|18413345 Arabidopsis thaliana gi|30692780 gi| 18398655 Arabidopsis thaliana HI02104 B At4g33900 gi|18418316 gi|18418317 GI: 18416176 gi| 15236530 Arabidopsis thaliana GI: 18418391 gi| 15235260 Arabidopsis thaliana GI: 18407622 gi|15229754 Arabidopsis thaliana EXEMPLO 2

Análise da Seqüência de HIO de Arabidopsis

As análises de seqüência foram realizadas com BLAST (Altschul e outros, 1990, J. Mol. Biol. 215:403-410), PFAM (Bateman e outros, 1999, 5 Nucleic Aeids Res. 27:260-262), INTERPRO (Mulder e outros 2003 Nucleie Aeids Res. 31, 315-318), PSORT (Nakai K e Horton P, 1999, Trends Bio- ehem. Sei. 24:34-6) e/ou CLUSTAL (Thompson JD e outros, 1994, Nueleie Aeids Res. 22:4673-4680).

EXEMPLO 3 Experimentos de Resumo

Para testar se a superexpressão dos genes nas Tabelas 1 e 2 alteram o fenótipo de composição das sementes, o conteúdo de proteínas, de proteínas que podem ser digeridas, de óleos e de fibras nas sementes das plantas transgênicas que expressam estes genes foi comparado com o 15 conteúdo de proteínas, de proteínas que podem ser digeridas, de óleos e de fibras nas sementes das plantas de controle não transgênicas. Para fazer isso, os genes foram clonados nos vetores de transformação de plantas a- trás do promotor de CsVMV constitutivo forte e do promotor PRU específico de semente. Estes constructos foram transformados em plantas de Arabi- 20 dopsis utilizando o método de imersão floral. O vetor de transformação de plantas contém um gene, que fornece resistência a um composto tóxico e serve como um marcador que pode ser selecionado. A semente das plantas transformadas foram plantadas em meio com ágar contando o composto tóxico. Após 7 dias, as plantas transgênicas foram identificadas como plan- 25 tas verdes saudáveis e foram transplantadas para o solo. As plantas de con- trole não transgênicas foram germinadas em meio com ágar, permitidas que crescessem durante 7 dias e então transplantadas para o solo. As mudas transgênicas e as plantas de controle não transgênicas foram transplantadas em vasos de 5,08 cm (duas polegadas) que foram colocados em posições 30 aleatórias em uma bandeja de 25,4 cm (10 polegadas) por 50,8 cm (20 pole- gadas). As plantas foram crescidas até a maturidade, permitidas que sofres- sem autofertilização e produzissem semente. A semente foi colhida de cada planta e seu conteúdo de óleos foi estimado através de Near Infrared (NIR) Spectroscopy utilizando métodos descritos anteriormente. O efeito de cada construção sobre a composição da semente foi verificado em pelo menos dois experimentos.

5 A Tabela 4 lista os constructos testados por causarem um au-

mento significativo no conteúdo de óleos, proteínas, proteínas que podem ser digeridas ou um decréscimo significativo no conteúdo de fibras foi identi- ficado através do teste de Análise de Variância em duas vias (ANOVA) em um valor de p <0,05. Estes constructos estão listados na Tabela 4. Os valo- 10 res de p de ANOVA para Proteína, Óleo, Proteína Que Pode Ser Digerida e Fibra estão listados nas colunas 4-7, respectivamente. Aqueles com valor de p significativo estão listados em negrito. Os valores médios para Proteína, Óleo, Proteína Que Pode Ser Digerida e Fibra estão listados nas colunas 8- 11, respectivamente e foram calculados através da média dos valores mé- 15 dios determinados para as plantas transgênicas em cada experimento. TABELA 4 ANOVA Média 1. Pseudônimo 2. Tair 3.Construção 4. Proteína 5. Óleo 6. Proteína 7. Fibra 8. Proteína 9. Óleo 10. Proteína 11. Fibra que pode que pode ser digerida ser digerida HI02011 B At4g10540 CsVMV:: At4g10540 0,498 0,736 0,854 0,789 98,5% 100,7% 100,2% 100,3% HI02011 B At4g 10540 Pru ::At4g 10540 0,680 0,107 0,004 0,002 99,4% 103,3% 102,9% 95,9% HI02022A At1g21160 CsVMV:: At1 g21160 0,245 0,689 0,084 0,067 103,5% 98,2% 99,6% 100,7% HI02022A At1g21160 Pru::At1g21160 0,538 0,119 0,034 0,003 101,5% 102,3% 102,9% 96,0% H102024A At5g43820 CsVMV: :At5g43820 0,582 0,131 0,005 0,047 99,3% 102,6% 102,4% 96,9% HI02024A At5g43820 Pru::At5g43820 0,074 0,864 0,033 0,039 103,5% 99,8% 102,0% 97,3% HI02029A At4g21880 CsVMV: :At4g21880 0,119 0,159 0,002 0,372 101,4% 98,3% 102,1% 99,2% HI02029A At4g21880 Pru::At4g21880 0,533 0,054 <,0001 <,0001 101,1% 102,8% 104,2% 94,5% HI02036A At1g35610 CsVMV: :At1g35610 0,040 0,001 0,314 0,005 97,0% 106,5% 100,9% 96,3% H102036 A At1g35610 Pru::At1g35610 0,776 0,780 0,008 0,025 100,6% 100,6% 103,0% 97,2% H102044A At1g07200 CsVMV: :At1g07200 0,815 0,336 0,037 0,069 100,3% 101,8% 101,7% 97,7% HI02044A At1g07200 Pru::At1g07200 0,134 0,202 0,000 0,001 102,0% 102,3% 103,3% 95,7% H102062 B At3g21530 CsVMV: :At3g21530 0,709 0,423 0,256 0,145 99,5% 100,7% 100,7% 99,1% HI02062 B At3g21530 Pru::At3g21530 0,316 0,024 0,756 0,160 98,3% 102,8% 99,8% 98,8% HI02070 B At1g03230 CsVMV:: At1g03230 0,966 0,618 0,258 0,044 100,1% 101,1% 101,0% 98,1% HI02070 B At1g03230 Pru::At1g03230 0,995 0,019 0,018 0,003 100,1% 102,8% 102,3% 96,8% TABELA 4 - continuação ANOVA Média 1. Pseudônimo 2. Tair 3.Construção 4. Proteína 5. Óleo 6. Proteína 7. Fibra 8. Proteína 9. Óleo 10. Proteína 11. Fibra que pode que pode ser digerida ser digerida H102079B At1g71420 CsVMV::At1g71420 0,297 0,033 0,083 0,058 99,0% 102,7% 101,2% 98,0% HI02079 B At1g71420 Pru::At1g71420 0,114 0,810 0,008 0,002 102,6% 99,8% 102,3% 97,1% HI02084A At3g12020 CsVMV:: At3g 12020 0,076 0,728 0,063 0,200 102,4% 99,5% 101,6% 98,3% HI02084A At3g12020 Pru ::At3g 12020 0,487 0,019 0,022 0,001 98,6% 103,7% 102,0% 96,1% HI02091 B At1g09850 CsVMV:: At1 g09850 0,041 0,065 0,760 0,830 97,2% 102,8% 99,8% 100,4% HI02091 B At1g09850 Pru::At1g09850 0,354 0,170 0,475 0,748 101,9% 98,4% 101,1% 100,2% HI02093A At5g61370 CsVMV: :At5g61370 0,337 0,098 0,224 0,074 98,8% 102,4% 101,0% 97,9% HI02093A At5g61370 Pru ::At5g61370 0,535 0,139 <,0001 <,0001 100,8% 101,9% 103,4% 94,0% HI02093C At5g61390 CsVMV: :At5g61390 0,058 0,065 0,064 0,051 97,1% 103,0% 101,1% 98,1% HI02093C At5g61390 Pru::At5g61390 0,949 0,068 0,005 0,000 100,1% 101,9% 102,7% 95,6% HI02094C At3g 13224 CsVMV: :At3g 13224 0,710 0,065 0,186 0,070 99,5% 101,7% 101,2% 98,2% HI02094 C At3g13224 Pru::At3g 13224 0,034 0,173 0,025 0,125 104,5% 98,4% 102,6% 98,0% HI02094 D At3g13227 CsVMV: :At3g 13227 0,096 0,030 0,153 0,042 97,3% 104,5% 101,2% 97,2% HI02094 D At3g13227 Pru ::At3g 13227 0,042 0,004 0,430 <0001 97,9% 97,8% 101,3% 105,0% HI02104 B At4g33900 CsVMV: :At4g33900 0,846 0,722 0,374 0,064 100,0% 99,6% 99,5% 102,5% HI02104 B At4g33900 Pru::At4g33900 0,152 0,015 0,048 0,002 98,3% 103,5% 101,7% 95,6% LISTAGEM DE SEQÜÊNCIAS <110> Agrinomics LLC Davi es, John p.

Ng, Hein Tsoeng

<120> PRODUÇÃO DE PLANTAS COM CONTEÚDO ALTERADO DE ÓLEOS, PROTEÍNAS OU FIBRAS

<130> 6616-72632-27 <150> 60/870,345 <151> 2006-12-15 <160> 34 <170> Patentin version 3. 3 <210> 1 <211> 3603 <212> DNA <21B> Arabidops is thaliana <400> 1 ctcaaatata tctctgcaac gaaaagaaat cacctgctta ctcttctcct gaaagacctg 60 atcttctccg gtgaattgtt ttttgttccg tcaatcttcc gagtttgttt ttgcctaata 120 tgaagttaaa cccattacag aaaaaggcta tattcatatt tgatttctat caatggatcc 180 gaggaattcg agtgcgtggg gtgggggtga tggtctcccc cttatctcat ccatgggagg 240 tgttgaatca aagaatagat gctgtgtgac tgacgacgat ggctctattg gtacgaagct 300 atgtgagaaa cctaaagctg aggagattga tttttctgct cggaaaaaga agttgaaatc 360 gaagaaaggc gggtctgtta gctttgctct tctcgatgtt gaagatgaca aggaggaagc 420 agaggatgga gacgacaaaa atccttctat taggagtgat gaggtggttg gagaaacttc 480 aatgagtaag aaaaagaaga aggataagag tggcaagcat ggggtatgtg aagaagatga 540 tgatgcggac aagattcttg ctcaacatgg gataacaact actgtttcaa cagggcctga 600 agcggagata gctctagctc aacctgagca agttgcatct gcagatgggg ctgttgacaa 660 ggacggagaa gaaaagactg ttgagtcagc tacagcgaag aaaaagaaaa agaagaagga 720 caaggacaag aaagcaagtg cttctttagc tatttcttct gtggaggcta aggaggatag 780 acaagggaag aaagatgtaa agattaaagt agcggaaaag aaagttccta aacatgttcg 840 agagaagcaa gagactcttg cgcggtggaa agaagctgaa gatgggaaga agaaggaaga 900 agaagagaga ttgaggaaag aggaagagga gcgccgtata gaggaagagc gagaaaggga 960 agctgaagag attaggcaga agagaaagat gattctaaca gcaaagcaaa agcgtgatgc gttgactgat gctggaagtc ttcttgttgc catatatggc aataaaaaca aattagcttg 5 ggctaaaggt gatggggaaa ccaaggaaaa tgacttggtt tcagttgaag atagaagggt gacacatgaa tctgttgatg tatcacaaga aaaaactaat tttaccatca agggtgattc gttcaagaaa ggtttaaaag acactgcatc 10 gaagcctgga ggttctggca agccaaaaac tgatactacc cggccgaaag atacttctaa tgctaaagaa gtagaagaaa atcttcgctc ttctggtaaa acaaagctgt tggattgcat tggaggtatt actcaacaga ttggtgcaac 15 gaccaaagag ttacaagcta atgctaaact acctggacac gagtcattca caaatctgcg aattctagtg gttgatataa tgcgaggtct tttgagaaga aggaatgtaa agttcattat gtgggaaaaa agcaagaatg ctcctataag 20 ggttaaggaa tttaaaatga ggctaaaccg caacagtatg ctttattaca agaacagaga tagcgctatt agtggggaag ggattccaga gaaaacgatg gtggagaaac ttacatatgt caaagttatt gaaggccatg gtattacagt 25 tgaaggtgat caaattgttg tttgtgggtc attgttgact ccttatccta tgaacgagat agaagtaaag gctgcgcagg gtatcaaaat tggtactgcc ttgcatgtga ttggacctaa catggaagat attgagtcag ttatgaaccg 30 acaagcatct acattagggt ccttggaagc aaaaatacct gtcagtggta ttggcatagg cggggtaatg ctagagaaga aaaaagagtt

caggaaaatg gagaagaagc aagaaggcct 1020 tgctaagaat gaggctttca gaaaaagggt 1080 agataaaaac ggtgattcct caaaacgtcc 1140 caaaaaagca aacgatcctg cttctgtcca 1200 tcatgcagca gatgaaccat gtactttacc 1260 tggtattatc gaatcagtag acacagaaga 1320 gaatggtgat gaggaagatg tgtgggatgc 1380 tgatgatgag gaggaaaaac ctcagcctgt 1440 aaaggcacat gattcagata gaccaacagt 1500 agctgccaaa aaagctatgc ctaaggtgga 1560 aaaggatgaa ggcttagtac tgaatgaact 1620 tccaatttgc tgcatcatgg gtcatgttga 1680 cagaggaaca aatgttcagg aaggtgaagc 1740 CtttttCCCt gcagaaaaca tccgtgagag 1800 caaggtgcca ggtatattgg ttatcgatac 1860 gtcaaggggt tcaaatttgt gtgaccttgc 1920 agagccacaa accatagaat ctcttaatct 1980 tgccttgaat aaggtggata ggctatatgg 2040 gaagacaatg atgcaacaaa cgggagatgt 2100 agttcaaaac cagttccaag aacaaggact 2160 aatgggagaa actatcagta tcctacctgc 2220 tcttttactg ttcttggttc aatgggctca 2280 tgacaaagtg cagtgtaccg tccttgaggt 2340 tgatgttgtt ttggtcaacg gtgtactccg 2400 acagggacca attgtaacaa ctattagatc 2460 gcgggtgacg ggtacctata tgcctcacag 2520 tgctgcacag ggccttgaac acgccattgc 2580 tgaggacatg gaagaagcca agaaaaatgc 2640 cattgacaaa agtggtgaag gcgtttatgt 2700 attgctcgag ttcttgaagt cctcagatgt 2760 acctgtgcat aagaaggata tcatgaaggc 2820 tgcaacgatt ttggcctttg atgtgaaaat 2880 aagtgcagaa gctcgtgaac ttgcagacaa aatgggagta aaaatcttct gcgatgatac 2940 catctattgt ctgttcgata agtttaagag ttacatagag ggtatcaaag aggagaaaaa 3000 gaaagaaaca gcttgtgaag cagttttccc atgtatcctt cagattttac caaaccatat 3060 ctacaatcag agggacccaa ttatccttgg agttaaagtc aatgatggaa tactaaaggt 3120 5 tggaactccc atttgcattg ttaaaaggat tgagaatgta agagtgttta tggacattgg 3180 gcgcgtctca tcaattaaga ataacaacaa catgccagtt gattatgcaa ggaaaggaca 3240 ggaggtggct attaagatca ttgcttctaa cccagaagaa cagaaaatgt ttgggaggca 3300 ctttggtgta gacgacaggc ttatcagtca catttctagt cgatccgtgg acgtaatcag 3360 aactaattac tggaatgagt tatctaacga cgagaaggat cttgttttga gacttaaaag 3420 10 gatattcaag atacaatgaa gatttttgag atttgagagt gagggactta aacttatgta 3480 ttttttttct ttttttgaag tgctgatttt tttatttttt tttcgttttt aataatatag 3540 acaaacaact cctttaatgc ccctaaatac tttatggaag caattgtctt ttgtttttgg 3600 cta 3603

<210> 2 <211> 1088 <212> PRT

<213> Arabidopsis thaliana <400> 2

Met Asp Pro Arg Asn Ser Ser Ala Trp Gly Gly Gly Asp Gly Leu Pro 1 5 10 15

Leu Ile Ser Ser Met Gly Gly Val Glu Ser Lys Asn Arg Cys Cys Val 20 25 30

Thr Asp Asp Asp Gly Ser Ile Gly Thr Lys Leu Cys Glu Lys Pro Lys 35 40 45

Ala Glu Glu Ile Asp Phe Ser Ala Arg Lys Lys Lys Leu Lys Ser Lys 50 55 60

Lys Gly Gly Ser Val Ser Phe Ala Leu Leu Asp Val Glu Asp Asp Lys 65 70 75 80

Glu Glu Ala Glu Asp Gly Asp Asp Lys Asn Pro Ser Ile Arg Ser Asp 85 90 95

Glu Val Val Gly Glu Thr Ser Met Ser Lys Lys Lys Lys Lys Asp Lys 100 105 110 Ser Gly Lys His Gly Val Cys Glu Glu Asp Asp Asp Ala Asp Lys Ile 115 120 125

Leu Ala Gln His Gly Ile Thr Thr Thr Val Ser Thr Gly Pro Glu Ala 130 135 140

Glu Ile Ala Leu Ala Gln Pro Glu Gln vai Ala ser Ala Asp Gly Ala 145 150 155 160

val Asp Lys Asp Gly Glu Glu Lys Thr vai Glu ser Ala Thr Ala Lys 165 170 175

Lys Lys Lys Lys Lys Lys Asp Lys Asp Lys Lys Ala Ser Ala Ser Leu 180 185 190

Ala Ile ser ser val Glu Ala Lys Glu Asp Arg Gln Gly Lys Lys Asp 195 200 205

val Lys Ile Lys val Ala Glu Lys Lys val Pro Lys His val Arg Glu 210 215 220

Lys Gln Glu Thr Leu Ala Arg Trp Lys Glu Ala Glu Asp Gly Lys Lys 225 230 235 240

Lys Glu Glu Glu Glu Arg Leu Arg Lys Glu Glu Glu Glu Arg Arg Ile 245 250 255

Glu Glu Glu Arg Glu Arg Glu Ala Glu Glu Ile Arg Gln Lys Arg Lys 260 265 270

Ile Arg Lys Met Glu Lys Lys Gln Glu Gly Leu Ile Leu Thr Ala Lys 275 280 285

Gln Lys Arg Asp Ala Ala Lys Asn Glu Ala Phe Arg Lys Arg val Leu 290 295 300

Thr Asp Ala Gly Ser Leu Leu val Ala Asp Lys Asn Gly Asp Ser ser 305 310 315 320

Lys Arg Pro Ile Tyr Gly Asn Lys Asn Lys Leu Ala Cys Lys Lys Ala 325 330 335

Asn Asp Pro Ala Ser val Gln Ala Lys Gly Asp Gly Glu Thr Lys Glu 340 345 350

Asn His Ala Ala Asp Glu Pro Cys Thr Leu Pro Asp Leu val Ser val 355 360 365 Glu Asp Arg Arg Val Gly Ile Ile Glu Ser Val Asp Thr Glu Glu Thr 370 375 380

His Glu Ser Val Asp val Ser Gln Glu Asn Gly Asp Glu Glu Asp Val 385 390 395 400

Trp Asp Ala Lys Thr Asn Phe Thr Ile Lys Gly Asp Ser Asp Asp Glu

405 410 415

Glu Glu Lys Pro Gln Pro val Phe Lys Lys Gly Leu Lys Asp Thr Ala 420 425 430

Ser Lys Ala His Asp ser Asp Arg Pro Thr val Lys Pro Gly Gly ser 435 440 445

Gly Lys Pro Lys Thr Ala Ala Lys Lys Ala Met Pro Lys Val Asp Asp 450 455 460

Thr Thr Arg pro Lys Asp Thr ser Lys Lys Asp Glu Gly Leu Val Leu 465 470 475 480

Asn Glu Leu Ala Lys Glu Val Glu Glu Asn Leu Arg Ser Pro Ile Cys

485 490 495

Cys Ile Met Gly His val Asp Ser Gly Lys Thr Lys Leu Leu Asp Cys 500 505 510

Ile Arg Gly Thr Asn val Gln Glu Gly Glu Ala Gly Gly Ile Thr Gln 515 520 525

Gln ile Gly Ala Thr Phe Phe Pro Ala Glu Asn Ile Arg Glu Arg Thr 530 535 540

Lys Glu Leu Gln Ala Asn Ala Lys Leu Lys val Pro Gly Ile Leu val 545 550 555 560

Ile Asp Thr Pro Gly His Glu Ser Phe Thr Asn Leu Arg Ser Arg Gly

565 570 575

Ser Asn Leu Cys Asp Leu Ala Ile Leu val val Asp Ile Met Arg Gly 580 585 590

Leu Glu Pro Gln Thr Ile Glu Ser Leu Asn Leu Leu Arg Arg Arg Asn 595 600 605

val Lys Phe Ile Ile Ala Leu Asn Lys val Asp Arg Leu Tyr Gly Trp 610 615 620 Glu Lys Ser Lys Asn Ala Pro Ile Arg Lys Thr Met Met Gln Gln Thr 625 630 635 640

Gly Asp Val Val Lys Glu Phe Lys Met Arg Leu Asn Arg Val Gln Asn 645 650 655

Gln Phe Gln Glu Gln Gly Leu Asn Ser Met Leu Tyr Tyr Lys Asn Arg 660 665 670

Glu Met Gly Glu Thr Ile Ser Ile Leu Pro Ala Ser Ala Ile Ser Gly 675 680 685

Glu Gly Ile Pro Asp Leu Leu Leu Phe Leu Val Gln Trp Ala Gln Lys 690 695 700

Thr Met val Glu Lys Leu Thr Tyr Val Asp Lys Val Gln Cys Thr val 705 710 715 720

Leu Glu Val Lys val Ile Glu Gly His Gly Ile Thr Val Asp val Val 725 730 735

Leu val Asn Gly val Leu Arg Glu Gly Asp Gln Ile val val Cys Gly

740 745 750

Ser Gln Gly Pro Ile Val Thr Thr Ile Arg Ser Leu Leu Thr Pro Tyr 755 760 765

Pro Met Asn Glu Met Arg val Thr Gly Thr Tyr Met Pro His Arg Glu 770 775 780

Val Lys Ala Ala Gln Gly Il e Lys Ile Ala Ala Gln Gly Leu Glu His 785 790 795 800

Ala Ile Ala Gly Thr Ala Leu His Val Ile Gly Pro Asn Glu Asp Met 805 810 815

Glu Glu Ala Lys Lys Asn Ala Met Glu Asp Ile Glu Ser val Met Asn

820 825 830

Arg Ile Asp Lys Ser Gly Glu Gly val Tyr val Gln Ala Ser Thr Leu 835 840 845

Gly Ser Leu Glu Ala Leu Leu Glu Phe Leu Lys Ser ser Asp val Lys 850 855 860

Ile Pro val Ser Gly Ile Gly Ile Gly Pro val His Lys Lys Asp Ile 865 870 875 880 Met Lys Ala Gly val Met Leu Glu Lys Lys Lys Glu Phe Ala Thr Ile 885 890 895

Leu Ala Phe Asp val Lys Ile Ser Ala Glu Ala Arg Glu Leu Ala Asp 900 905 910

Lys Met Gly val Lys Ile Phe Cys Asp Asp Thr Ile Tyr Cys Leu Phe 915 920 925

Asp Lys Phe Lys Ser Tyr Ile Glu Gly Ile Lys Glu Glu Lys Lys Lys 930 935 940

Glu Thr Ala Cys Glu Ala Val Phe Pro Cys Ile Leu Gln Ile Leu Pro 945 950 955 960

Asn His Ile Tyr Asn Gln Arg Asp Pro Ile Ile Leu Gly Val Lys val 965 970 975

Asn Asp Gly Ile Leu Lys val Gly Thr Pro Ile Cys Ile val Lys Arg 980 985 990

Ile Glu Asn val Arg val Phe Met Asp Ile Gly Arg val Ser Ser Ile 995

Lys Asn Asn Asn Asn Met 1010

Glu val Ala Ile Lys Ile 1025

Met Phe Gly Arg His Phe 1040

Ile Ser Ser Arg Ser Val 1055

Glu Leu ser Asn Asp Glu 1070

Ile Phe Lys Ile Gln 1085 <210> 3 <211> 2043 <212> DNA

<213> Arabidopsis thaliana

1000 1005

Pro val Asp Tyr Ala Arg Lys Gly Gln 1015 1020

Ile Ala Ser Asn Pro Glu Glu Gln Lys 1030 1035

Gly val Asp Asp Arg Leu Ile ser His 1045 1050

Asp Val Ile Arg Thr Asn Tyr Trp Asn 1060 1065

Lys Asp Leu val Leu Arg Leu Lys Arg 1075 1080 <400> 3

atgcttagga gatggaacat agttattgaa tcgctacgtc gcgttcatag cagtgattta 60 gaaaacctaa tttcggcttc cctatacaat cgaacacttt gcacagcctc agaatcattg 120 aatcatggtg ttgttgatga gagttatgtt ctagctgaat tatcttcatt gcttccaatt 180 tcatctaata aaacctcagt gtcaaaggaa gacagtagct caaagaatca agtagctatt 240 gattcgtttt tgtcagcaga ggacaaactt agaggtgtgt ttcttcagaa attgaaaggc 300 aagtctgcta ttcagaagag tttgagtagt cttggtattg gtttgagtat tgacattgtt 360 gccgatgtat tgaatcgagg gaatttaagc ggcgaagcga tggtaacgtt ctttgattgg 420 gcggttcgtg agcctggtgt gactaaagat gttggtagct acagtgtgat tttaagagcg 480 ttaggaagga gaaagctttt ctcttttatg atggatgttc taaagggaat ggtatgtgaa 540 ggtgttaatc ctgatctgga gtgtttaact attgctatgg atagctttgt tagggttcat 600 tatgtgcgta gagcgataga gttgtttgag gaaagtgaaa gttttggggt gaaatgtagt 660 actgagtctt tcaatgcatt gttacggtgt ctatgtgagc gttcacatgt gagtgctgca 720 aagtcagtat ttaatgctaa gaaaggtaat ataccttttg atagttgtag ttataacatt 780 atgattagtg ggtggtcaaa gctcggtgag gttgaagaga tggaaaaggt tttgaaggag 840 atggtggaga gtggatttgg tcctgactgt ttgtcttata gccatcttat tgaagggttg 900 ggaagaactg gtcgtatcaa tgattctgtt gagatctttg ataatataaa acacaagggt 960 aatgttcctg atgcaaatgt ttacaatgct atgatctgta atttcatatc tgctcgagat 1020 tttgatgagt ctatgaggta ctaccgaagg atgctggatg aggaatgtga acctaacttg 1080 gaaacctatt ccaagcttgt ttctgggctc attaaaggcc gtaaggtttc tgatgcgctt 1140 gagatattcg aagagatgtt atcaagaggg gttcttccca ccacagggct tgttacctct 1200 ttcctcaagc ctctttgcag ctatggtcca ccacacgctg caatggttat ctatcagaaa 1260 tcaagaaaag ccgggtgtag gatatcagaa agcgcatata agctgttgct taagcggcta 1320 tcaagatttg gaaaatgcgg gatgctgttg aacgtatggg atgaaatgca agagtctgga 1380 tatccttctg acgtggaagt ctacgagtat attgtggatg ggctctgtat cattgggcat 1440 ctagagaatg ctgtgcttgt gatggaagaa gctatgcgta aagggttttg cccaaaccgc 1500 tttgtttata gtaggcttag cataattagg aaatggcagc agaagttcag aaaagggaag 1560 gaggagatgg aaaagtggga ggcacttcaa gttcgatggg tgtccctctt caggaacgct 1620 tcttctatca tccagagatt acaggaaatg caaaatcatg ggagctatgg agctttgaga 1680 tgcctgaaag ggattgaaga cgcagttgtg cagcaacaga tgggtcaact ggagtctcta 1740 ttgcgttcca tgaaaaacgt tatggaggaa ttctggggct gtgttttgac atttgagaag 1800 ctacatcggg acggtttaca gttacgtgaa attgaatcaa gcaagaggcg agtagaggaa 1860 cgaattggag taaaaccgtg cattactgat tgcttggagg atgcatcaat cagatcctgg tgatctaaac gcgctacaat aatatcccga aagatgaagt acaacacatt ttcgatgtca tga

<210> 4 <211> 680 <212> PRT

<213> Arabidopsis thaliana <400> 4

Met Leu Arg Arg Trp Asn Ile Val 1 5

Ser Ser Asp Leu Glu Asn Leu Ile 20

Leu Cys Thr Ala Ser Glu Ser Leu 35 40

Tyr Val Leu Ala Glu Leu Ser Ser 50 55

Thr Ser Val Ser Lys Glu Asp Ser 65 70

Asp Ser Phe Leu Ser Ala Glu Asp

85

Lys Leu Lys Gly Lys Ser Ala Ile 100

Ile Gly Leu Ser Ile Asp Ile Val 115 120

Leu Ser Gly Glu Ala Met Val Thr 130 135

Pro Gly Val Thr Lys Asp Val Gly 145 150

Leu Gly Arg Arg Lys Leu Phe Ser

165

Met Val Cys Glu Gly Val Asn Pro

gactttctat tctttatgac 1920 acctcgtggt tgatcagccg 1980 tattcgcgga agagatcaaa 2040

2043

Ile Glu Ser Leu Arg Arg Val His 10 15

Ser Ala Ser Leu Tyr Asn Arg Thr 30

Asn His Gly Val Val Asp Glu Ser 45

Leu Leu Pro Ile Ser Ser Asn Lys 60

Ser Ser Lys Asn Gln Val Ala Ile 75 80

Lys Leu Arg Gly Val Phe Leu Gln 90 95

Gln Lys Ser Leu Ser Ser Leu Gly 105 110

Ala Asp Val Leu Asn Arg Gly Asn 125

Phe Phe Asp Trp Ala Val Arg Glu 140

Ser Tyr Ser Val Ile Leu Arg Ala 155 160

Phe Met Met Asp Val Leu Lys Gly 170 175

Asp Leu Glu Cys Leu Thr Ile Ala 180 185 190

Met Asp Ser Phe Val Arg val His Tyr val Arg Arg Ala Ile Glu Leu 195 200 205

Phe Glu Glu Ser Glu Ser Phe Gly Val Lys Cys Ser Thr Glu Ser Phe 210 215 220

Asn Ala Leu Leu Arg Cys Leu Cys Glu Arg Ser His val Ser Ala Ala 225 230 235 240

Lys ser val Phe Asn Ala Lys Lys Gly Asn Ile Pro Phe Asp Ser Cys 245 250 255

Ser Tyr Asn Ile Met Ile ser Gly Trp Ser Lys Leu Gly Glu Val Glu

260 265 270

Glu Met Glu Lys Val Leu Lys Glu Met Val Glu Ser Gly Phe Gly Pro 275 280 285

Asp Cys Leu Ser Tyr Ser His Leu Ile Glu Gly Leu Gly Arg Thr Gly 290 295 300

Arg Ile Asn Asp Ser Val Glu Ile Phe Asp Asn Ile Lys His Lys Gly 305 310 315 320

Asn val Pro Asp Ala Asn val Tyr Asn Ala Met Ile Cys Asn Phe Ile 325 330 335

Ser Ala Arg Asp Phe Asp Glu Ser Met Arg Tyr Tyr Arg Arg Met Leu

340 345 350

Asp Glu Glu Cys Glu Pro Asn Leu Glu Thr Tyr Ser Lys Leu Val Ser 355 360 365

Gly Leu Ile Lys Gly Arg Lys val ser Asp Ala Leu Glu Ile Phe Glu 370 375 380

Glu Met Leu Ser Arg Gly Val Leu Pro Thr Thr Gly Leu val Thr Ser 385 390 395 400

Phe Leu Lys Pro Leu Cys Ser Tyr Gly Pro Pro His Ala Ala Met val 405 410 415

Ile Tyr Gln Lys Ser Arg Lys Ala Gly Cys Arg Ile Ser Glu Ser Ala

420 425 430

Tyr Lys Leu Leu Leu Lys Arg Leu Ser Arg Phe Gly Lys Cys Gly Met 435 440 445

Leu Leu Asn val Trp Asp Glu Met Gln Glu Ser Gly Tyr Pro Ser Asp 450 455 460

val Glu val Tyr Glu Tyr Ile Val Asp Gly Leu Cys Ile Ile Gly His 465 470 475 480

Leu Glu Asn Ala val Leu val Met Glu Glu Ala Met Arg Lys Gly Phe 485 490 495

Cys Pro Asn Arg Phe Val Tyr Ser Arg Leu Ser Ile Ile Arg Lys Trp 500 505 510

Gln Gln Lys Phe Arg Lys Gly Lys Glu Glu Met Glu Lys Trp Glu Ala 515 520 525

Leu Gln val Arg Trp Val Ser Leu Phe Arg Asn Ala Ser Ser Ile Ile 530 535 540

Gln Arg Leu Gln Glu Met Gln Asn His Gly Ser Tyr Gly Ala Leu Arg 545 550 555 560

Cys Leu Lys Gly Ile Glu Asp Ala val val Gln Gln Gln Met Gly Gln 565 570 575

Leu Glu Ser Leu Leu Arg Ser Met Lys Asn Val Met Glu Glu Phe Trp 580 585 590

Gly Cys Val Leu Thr Phe Glu Lys Leu His Arg Asp Gly Leu Gln Leu 595 600 605

Arg Glu Ile Glu Ser Ser Lys Arg Arg Val Glu Glu Arg Ile Gly Val 610 615 620

Lys Pro Cys Ile Thr Asp Cys Leu Glu Gly Leu Ser Ile Leu Tyr Asp 625 630 635 640

Met His Gln Ser Asp Pro Gly Asp Leu Asn Ala Leu Gln Tyr Leu Val 645 650 655

Val Asp Gln Pro Asn Ile Pro Lys Asp Glu Val Gln His Ile Phe Asp 660 665 670

val Ile Phe Ala Glu Glu Ile Lys 675 680

<210> 5 <211> 2589

<212> DNA

<213> Arabidopsis thaliana

<400> 5

ο cgttctaggc cttgattcga ttttgttaac aaggcgaaga aaagcttaag cgcgatattt gccgaagttg aagccaaagc cgtagccgga tcaatgtctt taataccgga ttttctctca attggtcaag attttggtga accggcactt 10 aaatctattg gatataatct tcttcgagaa gtattggaaa ccttagattt actgtctagg gcttcacgtg gtaggatgct gacagaaaat aagcttgcca agggatgtgt tcggaagttg aaaatgggga aagaagcggg tgagaaagaa 15 cgtgcgagga gaagcaatga tgcagaatat catctcaaag aaatgagaca gcttggattc tttaagtact tagttgatat ggaaatggta aaggaggcat gtcctgagtc ttgtgggaga caagtcaacg acgaagagaa gatccacaaa 20 agtttatcaa tcctacaaga tggagtggag acctgcatcc caaattcaac ggtagaggat gaactagata tcgtgccttc atctacatct tcaaatgagg tggtcactgc tcttgatata atatcagcaa acatcctgca ctcattgtta 25 ttggtgcaaa gaatctattc aataatgagc ttcaggaaat ctataaattt gtgcataaga tatgctgttt ctcacagaac tttttgttat ggttccgtgc agtttgaagg tgcatataac gcaccgaact ctagcatgta caattctata 30 aacagtgcct taaaggtcct caaggaaatg acttttagct atctaataaa ctattgtggc gagatgaagc aagcaggagt tgaagttaat

tgttgtaaat gtgaaaaaac aatggcttta 60 cgctttgcga tgagaaacgc tgccaaaact 120 gattctctga tttcagacac tggaccagtg 180 tcgcttaagt ctccggaaga ttcttccaac 240 gcgggtcagg tctcgtctgc gttagatgtt 300 agaaatggcg agaaagtttt tccgaagaac 360 aaaggttgtt cgtcgcaaaa gccaaagcag 420 taccagaaca aacagtctga gattatggag 480 ggaactgaga ctatgtttga ggtgttgact 540 tacaatgcaa tgactaaact ttgcatacaa 600 gctcttgatc aaattgggaa ggctattgaa 660 tctattggag aaggagctta tggccctttt 720 gcggagttcc aaattctcaa ggattttatt 780 cttgtctact atgaaatgct tctttggatc 840 ctttgcaata aagttgatga tagtgggcta 900 acagtttcaa atctcatatt cagctatgca 960 gccattttca agtttaacaa gttgcatgaa 1020 tatgagaatc ttgtcagtta tctttgtggc 1080 gttgaaaata tgtgtgaagc aggtctggta 1140 caggccattg agcagattct tgagtttaat 1200 aacaagagtg tgaagccaaa tagtgagact 1260 atcaaagata ctctagcaat gaagtatgaa 1320 ccaaccataa caatttgcta tcaacctatt 1380 atgcttggta atttaaagaa tttcaatttg 1440 atggcaggat atttccggga gaaaaaagtg 1500 aaagaagctg atgttaaacc tgattcggtg 1560 gaggaggcga ctattgcgaa gtattataag 1620 aagcacgttt acatgtccct tgttaaagca 1680 tatgcatcat gcggacagtt tgaaaaggca aaacaggtgc tcatggacct ggaagttccg 1740

gctaaggatc acaatgagct gaaaagtgta cttatatctg ctctggcatc aaatggaaat 1800 ataacagagg ctttaagtat ttatgaagaa atgaagaaac tccgctgccc cgtagagcca 1860

aaagctatct tatctcttat agagaactct gattcaaacg cagagctggg aacgttggtt 1920

gaactcactc atgagctgcg tgattctaaa ttttggatag atggtttctt caaaattatc 1980 gtgtttgctg ttcgcaacaa tagatcaagc tctattctgg atttgttaga gcagaccaaa 2040

aaccacttgt ccaaggatga cgtcggtgtg gaatattggt ttgaagaggt gtttaagtca 2100

atagcggaaa cagagtctag tgatgtgaag gtagggctgg acttggtgag ttttatgaaa 2160

gaagagcttg agttatgtcc ttcaagaaaa tgtctggatt ttcttctaca tgcttgtgtc 2220

aatgccaaag ataagcagag cgctctactg gtatgggaag agtaccaatg tgcagaactt 2280

ccttacaatg tcatcaacta tttaaggcaa gagctctttt atctcctaca tttaaaaggg 2340

atgcccgtat tgttcaccgc ctcaaccgct cctgcccagc ttgagtaccc atccaggtca 2400

cagttcaagg ctacaatgat atccggtgaa gtcaggtatg ttacctcgtc ttggtgcaaa 2460

ccttacacaa agctcacctt aactctactg tttgttgttg aggtggttgc tattgtacca 2520

gataagtcag atggaacttc aggtccgatc attatgatct gcacggttcc taaaccatta 2580

agcaagtga 2589 <210> 6 <211> 845 <212> PRT 20 <213> Arabidopsis thaliana <400> 6

Met Ala Leu Lys Ala Lys Lys Ser Leu Ser Ala Ile Phe Arg Phe Ala 15 10 15

Met Arg Asn Ala Ala Lys Thr Ala Glu Val Glu Ala Lys Ala Val Ala 20 25 30

Gly Asp ser Leu Ile Ser Asp Thr Gly Pro Val Ser Met Ser Leu Ile 35 40 45

Pro Asp Phe Leu Ser Ser Leu Lys Ser Pro Glu Asp Ser Ser Asn Ile 50 55 60 Gly Gln Asp Phe Gly Glu Pro Ala Leu Ala Gly Gln Val Ser Ser Ala

65 70 75 80

Leu Asp Val Lys Ser Ile Gly Tyr Asn Leu Leu Arg Glu Arg Asn Gly 85 90 95

Glu Lys Val Phe Pro Lys Asn val Leu Glu Thr Leu Asp Leu Leu Ser 100 105 110

Arg Lys Gly Cys Ser ser Gln Lys Pro Lys Gln Ala Ser Arg Gly Arg 115 120 125

Met Leu Thr Glu Asn Tyr Gln Asn Lys Gln Ser Glu Ile Met Glu Lys 130 135 140

Leu Ala Lys Gly Cys Val Arg Lys Leu Gly Thr Glu Thr Met Phe Glu 145 150 155 160

Val Leu Thr Lys Met Gly Lys Glu Ala Gly Glu Lys Glu Tyr Asn Ala

165 170 175

Met Thr Lys Leu Cys Ile Gln Arg Ala Arg Arg Ser Asn Asp Ala Glu 180 185 190

Tyr Ala Leu Asp Gln Ile Gly Lys Ala Ile Glu His Leu Lys Glu Met 195 200 205

Arg Gln Leu Gly Phe Ser Ile Gly Glu Gly Ala Tyr Gly Pro Phe Phe 210 215 220

Lys Tyr Leu Val Asp Met Glu Met Val Ala Glu Phe Gln Ile Leu Lys 225 230 235 240

Asp Phe Ile Lys Glu Ala Cys Pro Glu Ser Cys Gly Arg Leu Val Tyr

245 250 255

Tyr Glu Met Leu Leu Trp Ile Gln Val Asn Asp Glu Glu Lys Ile His 260 265 270

Lys Leu Cys Asn Lys Val Asp Asp Ser Gly Leu Ser Leu Ser Ile Leu 275 280 285

Gln Asp Gly Val Glu Thr val Ser Asn Leu Ile Phe Ser Tyr Ala Thr 290 295 300

Cys Ile Pro Asn Ser Thr Val Glu Asp Ala Ile Phe Lys Phe Asn Lys 305 310 315 320

Leu His Glu Glu Leu Asp Ile Val Pro ser Ser Thr Ser Tyr Glu Asn

325 330 335

Leu Val ser Tyr Leu Cys Gly Ser Asn Glu Val val Thr Ala Leu Asp 340 345 350

Ile Val Glu Asn Met Cys Glu Ala Gly Leu Val Ile Ser Ala Asn Ile 355 360 365

Leu His Ser Leu Leu Gln Ala Ile Glu Gln Ile Leu Glu Phe Asn Leu 370 375 380

Val Gln Arg Ile Tyr Ser Ile Met Ser Asn Lys Ser Val Lys Pro Asn 385 390 395 400

Ser Glu Thr Phe Arg Lys Ser Ile Asn Leu Cys Ile Arg Ile Lys Asp 405 410 415

Thr Leu Ala Met Lys Tyr Glu Tyr Ala Val Ser His Arg Thr Phe Cys

420 425 430

Tyr Pro Thr Ile Thr Ile Cys Tyr Gln Pro Ile Gly Ser val Gln Phe 435 440 445

Glu Gly Ala Tyr Asn Met Leu Gly Asn Leu Lys Asn Phe Asn Leu Ala 450 455 460

Pro Asn Ser Ser Met Tyr Asn ser Ile Met Ala Gly Tyr Phe Arg Glu 465 470 475 480

Lys Lys Val Asn Ser Ala Leu Lys Val Leu Lys Glu Met Lys Glu Ala 485 490 495

Asp val Lys Pro Asp Ser Val Thr Phe Ser Tyr Leu Ile Asn Tyr Cys

500 505 510

Gly Glu Glu Ala Thr Ile Ala Lys Tyr Tyr Lys Glu Met Lys Gln Ala 515 520 525

Gly Val Glu Val Asn Lys His val Tyr Met Ser Leu Val Lys Ala Tyr 530 535 540

Ala Ser Cys Gly Gln Phe Glu Lys Ala Lys Gln Val Leu Met Asp Leu 545 550 555 560

Glu Val Pro Ala Lys Asp His Asn Glu Leu Lys Ser val Leu Ile Ser 565 570 575

Ala Leu Ala Ser Asn Gly Asn Ile Thr Glu Ala Leu Ser Ile Tyr Glu

580 585 590

Glu Met Lys Lys Leu Arg Cys Pro Val Glu Pro Lys Ala Ile Leu Ser 595 600 605

Leu Ile Glu Asn Ser Asp Ser Asn Ala Glu Leu Gly Thr Leu val Glu 610 615 620

Leu Thr His Glu Leu Arg Asp Ser Lys Phe Trp Ile Asp Gly Phe Phe 625 630 635 640

Lys Ile Ile Val Phe Ala Val Arg Asn Asn Arg Ser Ser Ser Ile Leu 645 650 655

Asp Leu Leu Glu Gln Thr Lys Asn His Leu Ser Lys Asp Asp Val Gly 660 665 670

val Glu Tyr Trp Phe Glu Glu val Phe Lys Ser Ile Ala Glu Thr Glu 675 680 685

Ser Ser Asp Val Lys Val Gly Leu Asp Leu Val Ser Phe Met Lys Glu 690 695 700

Glu Leu Glu Leu Cys Pro Ser Arg Lys Cys Leu Asp Phe Leu Leu His 705 710 715 720

Ala Cys val Asn Ala Lys Asp Lys Gln Ser Ala Leu Leu Val Trp Glu 725 730 735

Glu Tyr Gln Cys Ala Glu Leu Pro Tyr Asn Val Ile Asn Tyr Leu Arg 740 745 750

Gln Glu Leu Phe Tyr Leu Leu His Leu Lys Gly Met Pro Val Leu Phe 755 760 765

Thr Ala Ser Thr Ala Pro Ala Gln Leu Glu Tyr Pro Ser Arg ser Gln 770 775 780

Phe Lys Ala Thr Met Ile Ser Gly Glu Val Arg Tyr Val Thr Ser Ser 785 790 795 800

Trp Cys Lys Pro Tyr Thr Lys Leu Thr Leu Thr Leu Leu Phe val Val 805 810 815

Glu Val val Ala Ile val Pro Asp Lys Ser Asp Gly Thr Ser Gly Pro 820 825 830

Ile Ile Met Ile Cys Thr val Pro Lys Pro Leu Ser Lys 835 840 845

<210> 7 <211> 1839

<212> DNA

<213> Arabidopsis thaliana

<400> 7

5 atgggttttg aagatggacc aagatgtctt ttgtccgttc gatacagatt caactttcgt gctgctacga cgccggattg tctctactac aatggttgcc atcaacgtcc aagaaggata actctcttct atcgaaaccc cgaaaccaga 10 cctggtaaaa ttgaggatac atcaggtcca tataagtctg atatcatatt caacaaatgc tggttttatc gttgtttgat ctgtagtttt ccacttctta ctattacaaa cccgaaaagc ccattattag ttccatgtga tgcttgtggg 15 tgtttccaat gtaattacat ggttcatcag atcacgcgtc acccgcaccg gctctctcat tgccaaatct gctataaaga ggttgatatc gattgttttt atgtagtcca ttctaaatgt gaactcgagt gggaaatcga gtctgatgaa 20 ggtgatggtt tcataaagca tttttgtcac ggtgctcgag acacagaaaa gcaatgtcga ttttaccatt gcaagaaatg caattactct aaactggatc atgcattgca caatcacact tgttgttcag cttgttcccg agaatccact 25 tgccaagatt ttgttctaga tgttcgatgc agtcacgaac atcccatttt tatctccaca aaagtttgca agaaaagatg tttgggggct atgtgttact catgtgctat cattccagat ctcacccttt cttgtgggga aagcgcggat 30 caattggatc caaaagaatg gttctacaca cattgcatat ttggatcttc tgtctttatg ggaaaggtgc aagtttttcg aaacaatagt

atgtctcatc cagctcaccc ttctcataac 60 atcggttgct ttacatgtgg cgggaaagca 120 tactgcacca cctgcgaggt gacgttccac 180 acacatcctt atcacctcca acatcctctt 240 gttatatcca acatcatccc tgatgcttgt 300 gagaagtatg aattcgtgga tatcgtcccg 360 acttggtgtg caaaagattt caaaggtgat 420 tgcttggatc tctcttgtgc ggcaactctt 480 catcaccact ctctcgtctt cttaccccgg 540 ttggttgacg ggttggaacc aagttatgct 600 aattgcatag acttaccccg agtcataaaa 660 actccttatt gttcatcttt gacttcgtca 720 aagtatgggc aatattcttg ccatctccaa 780 gcaacacatg aaaatgtttg ggatgggaag 840 actgaagata tttcaccttt taggaaccta 900 aaacaccgtt tgaagctcaa gaatcatgat 960 gcgtgcatat atccaattgt ttctcaccaa 1020 ctccacgagg tatgtgctgg cctttctcga 1080 cttatcctat ctccatctcc cggaaagttt 1140 ggtttcagtt acatatgctc taataaaggt 1200 atctcagtgc tagagtattt catccataga 1260 tcctacaaca gtaaagacga gatcctctgc 1320 catctacagt gtacgttatg cgagtttact 1380 gaaatacact acaaatttga caagcatcct 1440 aacacgtatt ggtgcgaggt gtgtgaaaaa 1500 tgtaacaaat gttgcatcac catccacctt 1560 aaacctggtt ccatatttcg tgattattat 1620 aacactcgac aactctgtta tatgtgtcac 1680 I

Pro Ser His Asn Leu Ser Val Arg 20

Cys Phe Thr Cys Gly Gly Lys Ala 35 40

Tyr Tyr Tyr Cys Thr Thr Cys Glu 50 55

Gln Arg Pro Arg Arg Ile Thr His 65 70

Thr Leu Phe Tyr Arg Asn Pro Glu 85

Pro Asp Ala Cys Pro Gly Lys Ile 100

Tyr Glu Phe Val Asp Ile val Pro 115 120

Lys Cys Thr Trp Cys Ala Lys Asp 130 135

Cys Leu Ile Cys Ser Phe Cys Leu 145 150

Pro Leu Leu Thr Ile Thr Asn Pro 165

Phe Leu Pro Arg Pro Leu Leu val 180

ggaatgctac atattactac 1740 ctttggaatg tgagatatta 1800

1839

Cys Leu Met Ser His Pro Ala His 15

Tyr Arg Phe Asn Phe Arg Ile Gly 30

Ala Ala Thr Thr Pro Asp Cys Leu 45

val Thr Phe His Asn Gly Cys His 60

Pro Tyr His Leu Gln His Pro Leu 75 80

Thr Arg val Ile ser Asn Ile Ile 90 95

Glu Asp Thr Ser Gly Pro Glu Lys 105 110

Tyr Lys Ser Asp Ile Ile Phe Asn 125

Phe Lys Gly Asp Trp Phe Tyr Arg 140

Asp Leu Ser Cys Ala Ala Thr Leu 155 160

Lys Ser His His His Ser Leu val 170 175

Pro Cys Asp Ala Cys Gly Leu val 185 190

aaccgttgta ccggtttgat cttctacgaa ggctacagaa aatcatagca atcgatcaac tcatagaatg attttttgct gggatgagaa aacgtcgtct catccgtctt ccgaggtaa <210> 8 <211> 612 <212> PRT

<213> Arabidopsis thaliana <400> 8

Met Gly Phe Glu Asp Gly Pro Arg 5 Asp Gly Leu Glu Pro Ser Tyr Ala Cys Phe Gln Cys Asn Tyr Met Val 195 200 205

His Gln Asn Cys Ile Asp Leu Pro Arg Val Ile Lys Ile Thr Arg His 210 215 220

Pro His Arg Leu Ser His Thr Pro Tyr Cys Ser Ser Leu Thr Ser Ser 225 230 235 240

Cys Gln Ile Cys Tyr Lys Glu Val Asp Ile Lys Tyr Gly Gln Tyr Ser 245 250 255

Cys His Leu Gln Asp Cys Phe Tyr Val Val His Ser Lys Cys Ala Thr 260 265 270

His Glu Asn Val Trp Asp Gly Lys Glu Leu Glu Trp Glu Ile Glu Ser 275 280 285

Asp Glu Thr Glu Asp Ile Ser Pro Phe Arg Asn Leu Gly Asp Gly Phe 290 295 300

Ile Lys His Phe Cys His Lys His Arg Leu Lys Leu Lys Asn His Asp 305 310 315 320

Gly Ala Arg Asp Thr Glu Lys Gln Cys Arg Ala Cys Ile Tyr Pro Ile 325 330 335

val Ser His Gln Phe Tyr His Cys Lys Lys Cys Asn Tyr ser Leu His 340 345 350

Glu Val Cys Ala Gly Leu Ser Arg Lys Leu Asp His Ala Leu His Asn 355 360 365

His Thr Leu Ile Leu Ser Pro Ser Pro Gly Lys Phe Cys Cys Ser Ala 370 375 380

Cys Ser Arg Glu Ser Thr Gly Phe Ser Tyr Ile Cys Ser Asn Lys Gly 385 390 395 400

Cys Gln Asp Phe Val Leu Asp Val Arg Cys Ile Ser val Leu Glu Tyr 405 410 415

Phe Ile His Arg Ser His Glu His Pro Ile Phe Ile Ser Thr Ser Tyr 420 425 430

Asn ser Lys Asp Glu Ile Leu Cys Lys Val Cys Lys Lys Arg Cys Leu 435 440 445 Gly Ala His Leu Gln Cys Thr Leu Cys Glu Phe Thr Met Cys Tyr ser 450 455 460

Cys Ala Ile Ile Pro Asp Glu Ile His Tyr Lys Phe Asp Lys His Pro 465 470 475 480

Leu Thr Leu Ser Cys Gly Glu Ser Ala Asp Asn Thr Tyr Trp Cys Glu

485 490 495

val Cys Glu Lys Gln Leu Asp Pro Lys Glu Trp Phe Tyr Thr Cys Asn 500 505 510

Lys Cys Cys Ile Thr Ile His Leu His Cys Ile Phe Gly Ser Ser Val 515 520 525

Phe Met Lys Pro Gly Ser Ile Phe Arg Asp Tyr Tyr Gly Lys Val Gln 530 535 540

Val Phe Arg Asn Asn Ser Asn Thr Arg Gln Leu Cys Tyr Met Cys His 545 550 555 560

Asn Arg Cys Thr Gly Leu Ile Phe Tyr Glu Gly Tyr Arg Arg Asn Ala

565 570 575

Thr Tyr Tyr Tyr Asn His Ser Asn Arg Ser Thr His Arg Met Ile Phe 580 585 590

Cys Ser Leu Glu Cys Glu Ile Leu Gly Met Arg Lys Arg Arg Leu Ile 595 600 605

Arg Leu Pro Arg 610 <210> 9 <211> 2037 <212> DNA

<213> Arabidopsis thaliana <400> 9

tgttcccttt ggagggttct tctcatcaac atcaaatttc agagttccat tgagtagcac 60 agtgaatcag acgctctcta gatgccacct ctgcaacgag aagtatttgc aagaagtagc 120 cgctgttctc aaggccggtt cgagtctttc tctggctgac aaatgttccg agaagttagc 180 cccatggcta cgggctattg agaccaaaga agacaaggga ataacaggca gcagtaagtg 240 caggctttag atgacgctaa tacatcagcc tcgcaaaccg ctgctctaca gaagaaatgg 300 10

15

20

25

30

gacaacatat gccaaagtat ccatcacact ccggcgtttc ctaaacttgg ttttcagtcg 360 gtgagtccgc agttcccagt tcagactgag aagagtgtga gaactcctac aagctatttg 420 gagacgccta aactgctgaa tccgccaatc tcaaagccaa aacctatgga ggatcttacg 480 gcatcggtga ctaaccgcac agtgagtttg cctttgagct gtgttactac agattttggg 540 ttgggagtaa tctatgcatc caaaaaccag gaatcaaaaa caacgaggga gaaaccgatg 600 ctggtgactc taaactcttc tttagaacat acatatcaga aagatttcaa gtctctcaga 660 gaaatactct ctcgtaaagt tgcctggcag accgaagctg taaatgccat aagccaaatt 720 atctgcggat gcaaaaccga ctccacgcga agaaaccaag caagcggaat ttggctggct 780 cttcttggac ccgataaagt ggggaagaag aaagtggcga tgactctttc tgaagtcttc 840 tttggtggta aagtcaatta catatgtgta gattttgggg cagagcattg ttcccttgat 900 gacaaattca gaggcaaaac agtggtggat tacgtaaccg gtgagttatc taggaaacca 960 cactctgttg ttttactcga aaacgtggaa aaagctgagt tcccggatca gatgagattg 1020 tctgaagctg tgagtacggg gaaaatccgt gatttgcatg gaagagtgat tagtatgaaa 1080 aatgtgattg ttgttgtgac gtctgggatt gccaaggata atgccactga ccatgttatt 1140 aaacctgtga agtttcctga ggagcaagtt ctcagcgcga gaagctggaa actgcagata 1200 aagctaggag atgctactaa atttggggta aataagagaa aatatgagct agaaacagcg 1260 caacgtgcag tgaaggtgca acgttcatat ctggatctga atcttccagt gaatgaaaca 1320 gaatttagcc ctgatcatga ggcagaggac agggacgctt ggttcgatga attcattgaa 1380 aaagtagatg gaaaagtgac gttcaaaccg gttgatttcg atgagttagc caagaacatt 1440 caagagaaga ttggttcaca ttttgagcgg tgctttggat ccgaaacaca tctagaactt 1500 gataaagaag tgatccttca gattctggcg gcttcatggt catcattatc atcgggcgaa 1560 gaagaaggga gaacaatagt tgatcagtgg atgcaaacag ttcttgctcg aagctttgct 1620 gaagcaaaac agaagtacgg ttcgaatccc atgttgggcg tgaagctggt tgcttcttct 1680 agcggcttag cttccggagt agaattgccg gcgaaggtgg atgtgatatg gtgacatgca 1740 tatatataaa tgaggtaata ataaagagtt ataatcctca gattgttttt ctcatggaaa 1800 gttttttgct tgtgtaaatt acaatgtaaa atggctaagc tatcacttgg tagataggtt 1860 tgtttaggag taccaatttg ccacatcttt tttggcattt tgagttttag gtatttctcc 1920 taaaattttc cccaacttcc aaatttagat gaattaaacc atcttctctg taaccgagtt 1980 tgttgtatat tatgttacgt ttgtcgaaat atagaaacga tgctttccac gccgatc 2037 <210> 10 <211> 422 <212> PRT <213> Arabidopsis thaliana <400> 10

Met Glu Asp Leu Thr Ala Ser Val Thr Asn Arg Thr Val Ser Leu Pro 15 10 15

Leu Ser Cys Val Thr Thr Asp Phe Gly Leu Gly Val Ile Tyr Ala Ser 20 25 30

Lys Asn Gln Glu Ser Lys Thr Thr Arg Glu Lys Pro Met Leu Val Thr 35 40 45

Leu Asn Ser Ser Leu Glu His Thr Tyr Gln Lys Asp Phe Lys Ser Leu 50 55 60

Arg Glu Ile Leu Ser Arg Lys Val Ala Trp Gln Thr Glu Ala Val Asn 65 70 75 80

Ala Ile Ser Gln Ile Ile Cys Gly Cys Lys Thr Asp Ser Thr Arg Arg 85 90 95

Asn Gln Ala Ser Gly Ile Trp Leu Ala Leu Leu Gly Pro Asp Lys val

100 105 HO

Gly Lys Lys Lys Val Ala Met Thr Leu Ser Glu val Phe Phe Gly Gly 115 120 125

Lys Val Asn Tyr Ile Cys Val Asp Phe Gly Ala Glu His Cys Ser Leu 130 135 140

Asp Asp Lys Phe Arg Gly Lys Thr Val Val Asp Tyr Val Thr Gly Glu 145 150 155 160

Leu Ser Arg Lys Pro His Ser val val Leu Leu Glu Asn val Glu Lys 165 170 175

Ala Glu Phe Pro Asp Gln Met Arg Leu Ser Glu Ala Val Ser Thr Gly

180 185 190

Lys Ile Arg Asp Leu His Gly Arg Val Ile Ser Met Lys Asn Val Ile 195 200 205

val Val val Thr Ser Gly Ile Ala Lys Asp Asn Ala Thr Asp His val 210 215 220

Ile Lys Pro Val Lys Phe Pro Glu Glu Gln Val Leu Ser Ala Arg Ser 225 230 235 240 Trp Lys Leu Gln Ile Lys Leu Gly Asp Ala Thr Lys Phe Gly Val Asn 245 250 255

Lys Arg Lys Tyr Glu Leu Glu Thr Ala Gln Arg Ala Val Lys Val Gln 260 265 270

5 Arg Ser Tyr Leu Asp Leu Asn Leu Pro Val Asn Glu Thr Glu Phe Ser 275 280 285

Pro Asp His Glu Ala Glu Asp Arg Asp Ala Trp Phe Asp Glu Phe Ile 290 295 300

Glu Lys Val Asp Gly Lys Val Thr Phe Lys Pro Val Asp Phe Asp Glu 10 305 310 315 320

Leu Ala Lys Asn Ile Gln Glu Lys Ile Gly Ser His Phe Glu Arg Cys 325 330 335

Phe Gly Ser Glu Thr His Leu Glu Leu Asp Lys Glu Val Ile Leu Gln 340 345 350

Ό5 Ile Leu Ala Ala Ser Trp ser Ser Leu Ser Ser Gly Glu Glu Glu Gly 355 360 365

Arg Thr Ile Val Asp Gln Trp Met Gln Thr Val Leu Ala Arg Ser Phe 370 375 380

Ala Glu Ala Lys Gln Lys Tyr Gly Ser Asn Pro Met Leu Gly Val Lys

385 390 395 400

Leu Val Ala Ser Ser ser Gly Leu Ala Ser Gly val Glu Leu Pro Ala 405 410 415

Lys Val Asp val Ile Trp 420

25 <210> 11 <211> 1496 <212> DNA

<213> Arabidopsis thaliana <400> 11

30 tgaaaagttc aaatctttgt tttgaaaact ctcaaagtgt taatcttttg tagctgtttc 60 cattttttga agcagaataa cagagagatt acatgttgtg tgtgtttaga aggaagcttg 120 gttgcctttt ttcaagactt agatgggtta tcaagaaacg ggtgagggct agagttatag 180 tcaggaggtt caggaaagca aggtggagag ctcgaagaaa agagagtccg gaatctgaag 240

tttcttctat ccatctgagc tcaaactctg gaagacatat tcgggttgca acgtttaacg 300

tggctatgtt ctcacttgcg cctgttgtgc aaaccatgga ggaaacagct tttcttggtc 360

atctagatag cagcaacatc acatgccctt ctccaaaagg gattctgaag cagtctccat 420

tacattcttc tgcagtcagg aaaccaaagg tttgcattaa tctcccagac aatgagattt 480

ccttagcaca gagctacagc tttctgagta tggtagagaa tgataacgac gggaaggaaa 540

acagaggaag tctctcgatg agatctcccg tgtgtcttcc ctcttgttgg tgggaccaag 600

aaagctttaa cggatacagc agcagaagaa gcatagctga attgttaaga gagttggatg 660

cagacatctt ggctttacaa gacgtgaaag cagaggaaga gacacttatg aaaccattat 720

cagatttggc ttccgcctta ggtatgaaat acgtgtttgc agagagctgg gcgcctgagt 780

atggaaacgc catactatca aaatggccca taaagaagtg gagagttcag agaattgctg 840

atgtagatga ttttaggaat gtgttgaagg tgactgtaga gatcccatgg gctggagatg 900

taaatgtgta ttgtactcaa cttgaccatc tagatgagaa ctggcgtatg aagcagatcg 960

atgcaattac tcgaggagac gaatctcccc acatcctcct tggaggcttg aattctcttg 1020

atggctctga ttattccata gcaagatgga accacatcgt aaagtattac gaggattctg 1080

gaaagccgac gcctagagtt gaagtgatga ggtttctcaa gggaaaagga tacttggatt 1140

caaaagaatt tgcaggagaa tgtgagcctg tagtcattat tgccaaagga caaaatgtac 1200

aaggaacatg caagtacggg acacgggtcg attacattct ggcatctcca gagtcacctt 1260

acgaatttgt tcctggctcg tactcagttg tttcttccaa aggtacttct gatcatcata 1320

tagtcaaagt cgatttagtt ataaccaaag agcgatctcg aggtaacttc aaacattcac 1380

gcaagaaagc aaagcagaag atctttcaga taaaagctaa tttgatgtcg aaagatacat 1440

ggaaactagg aaatctgatg tcttcataaa gtttggacac tgattaagaa acaaca 1496 <210> 12 <211> 458 <212> PRT

<213> Arabidopsis thaliana <400> 12

Met Leu Cys Val Phe Arg Arg Lys Leu Gly Cys Leu Phe Ser Arg Leu 15 10 15

Arg Trp Val Ile Lys Lys Arg Val Arg Ala Arg Val Ile Val Arg Arg

20 25 30

Phe Arg Lys Ala Arg Trp Arg Ala Arg Arg Lys Glu Ser Pro Glu Ser 40 45

Glu Val Ser Ser Ile His Leu Ser Ser Asn Ser Gly Arg His Ile Arg 50 55 60

val Ala Thr Phe Asn Val Ala Met Phe ser Leu Ala Pro val val Gln 65 70 75 80

Thr Met Glu Glu Thr Ala Phe Leu Gly His Leu Asp Ser ser Asn Ile 85 90 95

Thr Cys Pro Ser Pro Lys Gly Ile Leu Lys Gln Ser Pro Leu His Ser 100 105 110

Ser Ala Val Arg Lys Pro Lys Val Cys Ile Asn Leu Pro Asp Asn Glu 115 120 125

Ile Ser Leu Ala Gln Ser Tyr ser Phe Leu Ser Met Val Glu Asn Asp 130 135 140

Asn Asp Gly Lys Glu Asn Arg Gly Ser Leu Ser Met Arg Ser Pro val 145 150 155 160

Cys Leu Pro Ser Cys Trp Trp Asp Gln Glu Ser Phe Asn Gly Tyr Ser 165 170 175

Ser Arg Arg Ser Ile Ala Glu Leu Leu Arg Glu Leu Asp Ala Asp Ile 180 185 190

Leu Ala Leu Gln Asp Val Lys Ala Glu Glu Glu Thr Leu Met Lys Pro 195 200 205

Leu Ser Asp Leu Ala Ser Ala Leu Gly Met Lys Tyr Val Phe Ala Glu 210 215 220

Ser Trp Ala Pro Glu Tyr Gly Asn Ala Ile Leu Ser Lys Trp Pro Ile 225 230 235 240

Lys Lys Trp Arg Val Gln Arg Ile Ala Asp Val Asp Asp Phe Arg Asn 245 250 255

val Leu Lys Val Thr Val Glu Ile Pro Trp Ala Gly Asp val Asn val 260 265 270

Tyr Cys Thr Gln Leu Asp His Leu Asp Glu Asn Trp Arg Met Lys Gln 275 280 285

Ile Asp Ala Ile Thr Arg Gly Asp Glu Ser Pro His Ile Leu Leu Gly 290 295 300

Gly Leu Asn Ser Leu Asp Gly Ser Asp Tyr Ser Ile Ala Arg Trp Asn 305 ΒΙΟ 315 320

His Ile Val Lys Tyr Tyr Glu Asp Ser Gly Lys Pro Thr Pro Arg val 325 330 335

Glu Val Met Arg Phe Leu Lys Gly Lys Gly Tyr Leu Asp Ser Lys Glu 340 345 350

Phe Ala Gly Glu Cys Glu Pro Val Val Ile Ile Ala Lys Gly Gln Asn 355 360 365

val Gln Gly Thr Cys Lys Tyr Gly Thr Arg val Asp Tyr Ile Leu Ala 370 375 380

Ser Pro Glu Ser Pro Tyr Glu Phe val Pro Gly Ser Tyr Ser val val 385 390 395 400

Ser Ser Lys Gly Thr Ser Asp His His Ile val Lys val Asp Leu val 405 410 415

Ile Thr Lys Glu Arg Ser Arg Gly Asn Phe Lys His Ser Arg Lys Lys 420 425 430

Ala Lys Gln Lys Ile Phe Gln Ile Lys Ala Asn Leu Met Ser Lys Asp 435 440 445

Thr Trp Lys Leu Gly Asn Leu Met Ser Ser 450 455

<210> 13 <211> 1502 <212> DNA <213> Arabidopsis thaliana <400> 13

tcctcattca tctctaacaa tggcgtcttc tcgaatcatc atcttctccg ttcttcttct 60 ctccatcttc tcactctcat catctgccca accatctttc cgccccaaag ctctccttct 120 cccagtaaca aaagacccat ctaccctcca gtacacaacc gtcatcaacc aacgcacacc 180 30 tctcgtcccc gcttccgtcg tattcgacct cggtggtcga gaattctggg tcgactgtga 240 ccaaggctac gtctccacca cttaccgctc tcctcgctgc aactccgctg tctgctcacg 300 cgccggctcc atcgcctgcg gcacatgctt ctctcctccg agacctggct gtagtaacaa 360 cacttgcggc gcttttccag ataactccat caccggatgg gcaacctcgg gcgaatttgc 420 tttagacgtt gtgtctatcc agtccactaa cggatccaat ccgggtcggt tcgttaaaat 480 ccccaatcta atattcagtt gcggatcaac gtctcttctt aaaggactcg ctaaaggagc 540 cgttggtatg gctggaatgg gacgtcacaa catcggctta ccgttgcagt tcgccgccgc 600 gtttagcttc aaccgcaaat tcgccgtgtg tcttacttcc ggtagaggcg tcgccttctt 660 cggcaacgga ccttacgttt tcctccccgg gatccagatc tcaaggcttc aaaagacacc 720 gcttctcatc aatccaggga ccactgtttt tgagttttca aaaggcgaga agtcgccgga 780 gtattttatc ggcgtgacgg cgattaagat cgtcgagaaa acacttccaa tcgatccaac 840 gcttttgaag ataaacgcaa gtactggaat aggaggaacc aaaatcagct ccgtcaatcc 900 ttacacggtg ttggagtcat cgatctacaa agcttttacg tcggagttta ttagacaagc 960 agcggcgagg agcatcaaga gagtagcgtc ggtgaaaccg ttcggcgcgt gtttcagcac 1020 gaagaacgtt ggcgtcacgc gcctaggata cgccgtaccg gagattcagc tcgtgcttca 1080 tagcaaagac gtcgtttgga gaatctttgg agctaactcg atggtgagtg tcagtgatga 1140 cgtcatctgt ttgggtttcg ttgacggagg agtcaaccca ggagcctctg tggtgatcgg 1200 agggttccag ttggaggata atttgatcga atttgatttg gcgagtaaca aatttgggtt 1260 tagttccacg ttattgggcc gtcaaactaa ctgcgccaac tttaatttca cttccactgc 1320 ttgattaaat ttagttgatg cactttctcc aaaataaatg tgtttcagta acactaaata 1380 aatgtattgt attatgttta atttgatcag gagccaatgg aatcatttct aagcattttt 1440 atcacttgat ctgaataatt atgtaatgag tgagtatttg attttaaaaa tttaaattta 1500 gc 1502

<210> 14 <211> 434 <212> PRT

<213> Arabidopsis thaliana <400> 14

Met Ala Ser Ser Arg Ile Ile Ile Phe Ser Val Leu Leu Leu Ser Ile 15 10 15

Phe Ser Leu Ser Ser Ser Ala Gln Pro Ser Phe Arg Pro Lys Ala Leu 20 25 30

Leu Leu Pro Val Thr Lys Asp Pro Ser Thr Leu Gln Tyr Thr Thr Val 35 40 45

Ile Asn Gln Arg Thr Pro Leu Val Pro Ala Ser Val Val Phe Asp Leu 50 55 60

Gly Gly Arg Glu Phe Trp val Asp Cys Asp Gln Gly Tyr val Ser Thr 65 70 75 80

Thr Tyr Arg Ser Pro Arg Cys Asn Ser Ala val Cys Ser Arg Ala Gly 85 90 95

Ser Ile Ala Cys Gly Thr Cys Phe Ser Pro Pro Arg Pro Gly Cys Ser 100 105 110

Asn Asn Thr Cys Gly Ala Phe Pro Asp Asn Ser Ile Thr Gly Trp Ala 115 120 125

Thr Ser Gly Glu Phe Ala Leu Asp Val Val Ser Ile Gln Ser Thr Asn 130 135 140

Gly Ser Asn Pro Gly Arg Phe val Lys Ile Pro Asn Leu Ile Phe Ser 145 150 155 160

Cys Gly Ser Thr Ser Leu Leu Lys Gly Leu Ala Lys Gly Ala Val Gly 165 170 175

Met Ala Gly Met Gly Arg His Asn Ile Gly Leu Pro Leu Gln Phe Ala 180 185 190

Ala Ala Phe Ser Phe Asn Arg Lys Phe Ala Val Cys Leu Thr Ser Gly 195 200 205

Arg Gly val Ala Phe Phe Gly Asn Gly Pro Tyr val Phe Leu Pro Gly 210 215 220

Ile Gln Ile Ser Arg Leu Gln Lys Thr Pro Leu Leu Ile Asn Pro Gly 225 230 235 240

Thr Thr Val Phe Glu Phe Ser Lys Gly Glu Lys Ser Pro Glu Tyr Phe 245 250 255

Ile Gly Val Thr Ala Ile Lys Ile val Glu Lys Thr Leu Pro Ile Asp 260 265 270

Pro Thr Leu Leu Lys Ile Asn Ala ser Thr Gly Ile Gly Gly Thr Lys 275 280 285

Ile Ser Ser Val Asn Pro Tyr Thr val Leu Glu Ser Ser Ile Tyr Lys 290 295 300

Ala Phe Thr Ser Glu Phe Ile Arg Gln Ala Ala Ala Arg Ser Ile Lys 305 310 315 320

Arg val Ala Ser val Lys Pro Phe Gly Ala Cys Phe Ser Thr Lys Asn 325 330 335

Val Gly val Thr Arg Leu Gly Tyr Ala val Pro Glu Ile Gln Leu Val 340 345 350

Leu His Ser Lys Asp val Val Trp Arg Ile Phe Gly Ala Asn Ser Met 355 360 365

Val Ser val Ser Asp Asp Val Ile Cys Leu Gly Phe Val Asp Gly Gly 370 375 380

val Asn Pro Gly Ala Ser val val Ile Gly Gly Phe Gln Leu Glu Asp 385 390 395 400

Asn Leu Ile Glu Phe Asp Leu Ala Ser Asn Lys Phe Gly Phe Ser Ser 405 410 415

Thr Leu Leu Gly Arg Gln Thr Asn Cys Ala Asn Phe Asn Phe Thr Ser

15

20

25

30

420 425 430 Thr Ala <210> 15 <211> 2238 <212> DNA <213> Arabidopsis thaliana <400> 15 atgattacaa gcttatctca aatctctttt gggacattga ggcgctttgg ctcttctgtt 60 ttaccttctg cactgaaacg cgaatttgtt gaaggattgc gtacgttagt aaggtctggt 120 gatatccgtc gagctgtttc cttattctat tctgcgccgg tcgagcttca gtctcaacag 180 gcttacgcag ctctgttcca agcatgtgca gagcaacgca atctcctcga tggaatcaac 240 ttgcaccacc acatgctctc acatccctat tgttattcac agaacgttat acttgctaat 300 ttcctcatta atatgtatgc caaatgtggg aatatcttat acgcacgaca ggtgtttgat 360 acaatgcctg agaggaatgt tgtttcatgg actgcattga tcacaggcta tgtacaggct 420 gggaatgagc aagagggatt ctgtcttttc tcgtctatgt tatcccattg tttccctaac 480 gagtttacgc tgtcaagcgt gttaacttca tgtcgatatg agcctggaaa gcaggtacat 540 ggacttgctc tgaaacttgg tttacattgt tcgatctatg tggcgaatgc agttatctct 600 atgtacggta ggtgtcatga tggtgccgca gcatatgaag cttggactgt gtttgaagcc 660 ataaagttta agaatt tggt tacttggaac tcaatgattg ctgcttttca gtgctgcaat 720 cttgggaaaa aggccattgg cgtttttatg cggatgcata gtgatggagt gggatttgat 780 cgtgccacgt tgcttaatat atgttcttcc ttgtacaaaa gctctgactt agttcctaat 840 gaggtttcaa agtgttgtct tcaactgcat tctctgactg taaaatccgg gttggtgact 900 cagactgaag tggctactgc attgattaaa gtttattcag aaatgttaga agactatact 960 gactgctaca agctttttat ggaaatgagt cactgcaggg acattgttgc ttggaatggg 1020 attataacag cgtttgcagt gtatgatccg gagagagcta ttcatctctt tggtcagtta 1080 cgtcaggaga agctaagccc tgactggtat actttctcaa gtgtactaaa agcttgtgca 1140 ggacttgtca ctgctcgcca tgctttgtct atacacgctc aagtgatcaa gggtggtttt 1200 ttggctgaca cggtgctgaa caactcatta atccatgcgt atgccaagtg tggctctctt 1260 gacttgtgta tgcgtgtatt tgacgatatg gattcgcggg atgttgtttc ctggaactca 1320 atgctcaagg cttactcatt acatggccaa gtagactcaa ttctaccagt ctttcagaaa 1380 atggacatca accccgattc agcgactttc atagcccttc tctcggcttg cagccacgca 1440 ggacgagtag aagaaggatt gagaatattc agatccatgt ttgagaaacc tgaaactctt 1500 cctcagctaa atcactacgc ttgtgtgatc gatatgctaa gccgagctga gcgttttgct 1560 gaggcagaag aggttatcaa gcagatgcca atggacccag atgctgtagt ttggattgca 1620 ttattgggat catgtagaaa gcacggtaac acccggttgg gtaagttagc ggcagataaa 1680 cttaaagagc tagtcgaacc cacaaactca atgagttaca tccagatgtc aaacatatac 1740 aacgcagaag gtagctttaa cgaagccaat cttagcataa aggagatgga aacatggaga 1800 gtacggaaag aaccagactt aagctggaca gagataggaa acaaggttca cgaattcgca 1860 tcgggaggaa gacaccgtcc ggacaaggaa gccgtataca gagaattgaa gagactgatt 1920 agttggttaa aggagatggg ttacgttcca gaaatgaggt cagcttcaca agatatagaa 1980 gacgaagaac aggaggaaga taatttatta catcacagcg agaaacttgc gttagcgttt 2040 gcggttatgg agggaagaaa atcgagtgat tgtggtgtga atttgataca gattatgaag 2100 aacacaagga tctgtattga ttgccataac ttcatgaaat tagcttctaa gcttttggga 2160 aaagagattc ttatgagaga ctcgaatcgg tttcaccatt tcaaagattc ttcttgctcc 2220 tgtaatgact actggtaa 2238 <210> 16 <211> 745

<212> PRT

<213> Arabidopsis thaliana

<400> 16 Met Ile Thr Ser Leu Ser Gln Ile Ser Phe Gly Thr Leu Arg Arg Phe 15 10 15

Gly Ser Ser Val Leu Pro Ser Ala Leu Lys Arg Glu Phe Val Glu Gly 20 25 BO

Leu Arg Thr Leu Val Arg Ser Gly Asp Ile Arg Arg Ala Val Ser Leu 35 40 45

Phe Tyr Ser Ala Pro Val Glu Leu Gln Ser Gln Gln Ala Tyr Ala Ala 50 55 60

Leu Phe Gln Ala Cys Ala Glu Gln Arg Asn Leu Leu Asp Gly Ile Asn 65 70 75 80

Leu His His His Met Leu Ser His Pro Tyr Cys Tyr Ser Gln Asn val 85 90 95

Ile Leu Ala Asn Phe Leu Ile Asn Met Tyr Ala Lys Cys Gly Asn Ile 100 105 110

Leu Tyr Ala Arg Gln Val Phe Asp Thr Met Pro Glu Arg Asn Val Val 115 120 125

Ser Trp Thr Ala Leu Ile Thr Gly Tyr val Gln Ala Gly Asn Glu Gln 130 135 140

Glu Gly Phe Cys Leu Phe Ser Ser Met Leu Ser His Cys Phe Pro Asn 145 150 155 160

Glu Phe Thr Leu Ser ser val Leu Thr Ser Cys Arg Tyr Glu Pro Gly 165 170 175

Lys Gln Val His Gly Leu Ala Leu Lys Leu Gly Leu His Cys Ser Ile 180 185 190

Tyr Val Ala Asn Ala Val Ile Ser Met Tyr Gly Arg Cys His Asp Gly 195 200 205

Ala Ala Ala Tyr Glu Ala Trp Thr Val Phe Glu Ala Ile Lys Phe Lys 210 215 220

Asn Leu val Thr Trp Asn Ser Met Ile Ala Ala Phe Gln Cys Cys Asn 225 230 235 240

Leu Gly Lys Lys Ala Ile Gly val Phe Met Arg Met His Ser Asp Gly 245 250 255 Val Gly Phe Asp Arg Ala Thr Leu Leu Asn Ile Cys Ser ser Leu Tyr 260 265 270 Lys ser Ser Asp Leu Val Pro Asn Glu Val Ser Lys Cys Cys Leu Gln

275 280 285

Leu His Ser Leu Thr Val Lys Ser Gly Leu Val Thr Gln Thr Glu Val

290 295 300

Ala Thr Ala Leu Ile Lys vai Tyr Ser Glu Met Leu Glu Asp Tyr Thr 305 310 315 320

Asp Cys Tyr Lys Leu Phe Met Glu Met Ser His Cys Arg Asp Ile Val

325 330 335

Ala Trp Asn Gly Ile Ile Thr Ala Phe Ala Val Tyr Asp Pro Glu Arg

340 345 350

Ala Ile His Leu Phe Gly Gln Leu Arg Gln Glu Lys Leu ser Pro Asp

355 360 365

Trp Tyr Thr Phe Ser Ser Val Leu Lys Ala Cys Ala Gly Leu Val Thr

370 375 380

Ala Arg His Ala Leu Ser Ile His Ala Gln Val Ile Lys Gly Gly Phe 385 390 395 400

Leu Ala Asp Thr Val Leu Asn Asn Ser Leu Ile His Ala Tyr Ala Lys

405 410 415

Cys Gly Ser Leu Asp Leu Cys Met Arg vai Phe Asp Asp Met Asp Ser

420 425 430

Arg Asp Val vai Ser Trp Asn Ser Met Leu Lys Ala Tyr Ser Leu His

435 440 445

Gly Gln Val Asp Ser Ile Leu Pro Val Phe Gln Lys Met Asp Ile Asn

450 455 460

Pro Asp Ser Ala Thr Phe Ile Ala Leu Leu Ser Ala Cys Ser His Ala 465 470 475 480

Gly Arg Val Glu Glu Gly Leu Arg Ile Phe Arg Ser Met Phe Glu Lys

485 490 495

Pro Glu Thr Leu Pro Gln Leu Asn His Tyr Ala Cys Val Ile Asp Met 500 505 510 Leu ser Arg Ala Glu Arg Phe Ala Glu Ala Glu Glu Val Ile Lys Gln

515 520 525

Met Pro Met Asp Pro Asp Ala Val Val Trp Ile Ala Leu Leu Gly Ser

530 535 540

Cys Arg Lys His Gly Asn Thr Arg Leu Gly Lys Leu Ala Ala Asp Lys 545 550 555 560

Leu Lys Glu Leu Val Glu Pro Thr Asn Ser Met Ser Tyr Ile Gln Met

565 570 575

Ser Asn Ile Tyr Asn Ala Glu Gly Ser Phe Asn Glu Ala Asn Leu Ser

580 585 590

Ile Lys Glu Met Glu Thr Trp Arg Val Arg Lys Glu Pro Asp Leu Ser

595 600 605

Trp Thr Glu Ile Gly Asn Lys Val His Glu Phe Ala Ser Gly Gly Arg

610 615 620

His Arg Pro Asp Lys Glu Ala Val Tyr Arg Glu Leu Lys Arg Leu Ile 625 630 635 640

Ser Trp Leu Lys Glu Met Gly Tyr vai Pro Glu Met Arg Ser Ala ser

645 650 655

Gln Asp Ile Glu Asp Glu Glu Gln Glu Glu Asp Asn Leu Leu His His

660 665 670

Ser Glu Lys Leu Ala Leu Ala Phe Ala Val Met Glu Gly Arg Lys Ser

675 680 685

Ser Asp Cys Gly vai Asn Leu Ile Gln Ile Met Lys Asn Thr Arg Ile

690 695 700

Cys Ile Asp Cys His Asn Phe Met Lys Leu Ala Ser Lys Leu Leu Gly 705 710 715 720

Lys Glu Ile Leu Met Arg Asp Ser Asn Arg Phe His His Phe Lys Asp

725 7B0 735

Ser Ser Cys Ser Cys Asn Asp Tyr Trp 740 745

<210> 17 <211> 3093 <212> DNA

<213> Arabidopsis thaliana <400> 17

atggcatcta gacaaggatc aaaatcgaga aaagcagggt taaagggtgc tgattctact 60 gcatcttcga caacctcgtc ttcgaagctt tatcaagaga cttctataga tggccatagc 120 tcccctgctt cttcatctgc tcaaagcaag cagcagttct tctcaccaga tcccttacca 180 caaactgctc agcggtctaa agaaaacgtc acagtgacag ttcgctttcg cccactcagt 240 ccaagggaaa ttcgccaagg ggaggaggtt gcatggtatg cagatgggga aactatcgtg 300 cgaaatgagc ataatccgac aatagcttat gcctatgacc gtgtctttgg acctacaacc 360 acaacacgca atgtctatga tattgctgca caccatgttg ttaatggggc tatggagggg 420 ataaatggga ccattttcgc atatggagtg acaagcagtg gaaagacaca cacaatgcat 480 ggtgaccaga gatctcctgg tattataccg ttagcagtga aagatgcttt cagcatcatc 540 caagagactc ctaatcgaga atttcttctg cgtatttcct acatggaaat atataatgag 600 gttgtcaatg atttgttgaa tccagcagga cacaatttga ggatcagaga agacaagcag 660 ggaacctttg tcgaagggat taaagaagaa gttgttttat cccctgctca tgcgctttct 720 cttattgcag ctggagaaga gcaacgacat gttggatcca caaattttaa tttgctcagc 780 agccggagcc atacaatatt tacgttgacg atagaaagta gtcccttagg tgacaagagt 840 aaaggtgaag ctgtacacct ctcacaactg aacctcgttg atctggcagg ttccgagagt 900 tcaaaggttg aaaccagtgg tgtaagacgc aaagaaggat catatataaa taaaagtttg 960 ctgacgttag ggactgtgat atcaaagctt acggatgtga gggcttcaca tgtaccatac 1020 agagactcta agttaaccag gatccttcag tcctcattga gtggtcatga ccgagtatct 1080 ctcatttgta ccgtcactcc tgcatcaagc agttcggaag aaacacacaa tacactgaaa 1140 tttgctcatc gtgcaaagca tattgagatt caagctgaac aaaacaagat aattgatgag 1200 aaatcattaa tcaagaagta ccaacgcgag attcgtcaac tgaaggaaga gttggaacag 1260 cttaaacagg aaattgtacc agttcctcag ctgaaggata ttggtgcaga tgatattgtt 1320 cttctgaagc agaagctaga agatggtcaa gtcaagctgc aatctagact cgaagaagag 1380 gaagaagcta aagcagctct cctgagtcga atccaaagat tgacgaaatt aattttggtg 1440 tcgactaaaa atccacaagc atctcgatta cctcatcgtt ttaatccgcg gaggagacat 1500 tcatttgggg aagaagagct tgcttaccta ccatacaaga ggcgggacat gatggacgat 1560 gagcaacttg acctgtatgt ttctgtggag ggaaatcatg agattagaga taatgcgtat 1620 agagaagaaa aaaagacccg caagcacgga ttgttaaatt ggttaaagcc taagaaaaga 1680 gatcacagtt caagtgccag cgaccagtca agtgtggtca aatctaacag cacaccatca 1740 actcctcaag ggggaggcag tcatctgcac acagaatcaa gactttcaga aggctcgcct 1800 ttgatggaac aactctcaga gcctagggaa gacagagaag ctttagaaga cagttcccat 1860 gaaatggaga ttccggagac tagcaataaa atgagcgatg agttggatct tttgagggaa 1920 cagaaaaaga tattatctga agaggcggca ctgcaattaa gttctttaaa acggatgtca 1980 gatgaagctg caaagtcccc tcaaaatgag gagattaatg aggaaattaa agtactcaat 2040 gacgacatca aagcaaagaa tgaccagatt gctacgttgg agagacagat aatggatttt 2100 gttatgacat ctcatgaggc attggataaa tctgatatca tgcaggcagt tgctgagctg 2160 agggatcaac ttaatgagaa atcttttgaa ctcgaggtga tcgaattgtt tctgtttatg 2220 caatttttct tcatctatgc agaagttaga gatggttttg ctattgcctg gataagatta 2280 ttcattttag ctcaatatta tctctcctca tacctgaata aagtttcttc tgtgtatatt 2340 ataaaatacc agtattcaaa acgccagact atattaacaa tgaagctaat ggttaaagct 2400 gcagataatc gcatcattca gcaaacactc aatgaaaaga catgtgaatg tgaagtgttg 2460 caagaagaag ttgcaaatct aaagcagcag ctctctgagg ccctggaact agcacaggga 2520 actaagatta aagagctgaa acaagacgcc aaggaactaa gtgaatcaaa ggagcagtta 2580 gaactcagaa acaggaaact tgcagaagag agttcatatg caaaaggtct tgcatcagca 2640 gctgcagttg agctcaaggc attatccgaa gaagttgcaa agcttatgaa tcagaacgag 2700 agactagcag ctgagctggc aacacagaag agcccaatcg cacaacgaaa taagacagga 2760 acaacaacaa atgtaaggaa caatggaaga agagagagtc ttgcaaagag gcaagaacat 2820 gacagcccat caatggagct gaagagagaa ctgaggatga gtaaggaacg tgagctatcg 2880 tatgaagctg cacttggtga aaaagaacaa agagaagctg agcttgaaag gatattagaa 2940 gaaacaaaac agagagaagc atatctggag aatgagcttg ctaatatgtg ggttcttgtt 3000 tctaagctga gaagatctca aggagcagat tcagaaatct ctgattctat atcagagacg 3060 cgacaaacgg aacaaacgga aggttcattt tga 3093

<210> 18 <211> 1030 <212> PRT

<213> Arabidopsis thaliana <400> 18

Met Ala Ser Arg Gln Gly Ser Lys Ser Arg Lys Ala Gly Leu Lys Gly 10 15

Ala Asp Ser Thr Ala Ser Ser Thr Thr Ser Ser Ser Lys Leu Tyr Gln 25 30 Glu Thr ser lie Asp Gly His Ser ser Pro Ala ser Ser Ser Ala Gln

40 45

Ser Lys Gln Gln Phe Phe Ser Pro Asp Pro Leu Pro Gln Thr Ala Gln

50 55 60

Arg Ser Lys Glu Asn Val Thr Val Thr Val Arg Phe Arg Pro Leu Ser 65 70 75 80

Pro Arg Glu Ile Arg Gln Gly Glu Glu Val Ala Trp Tyr Ala Asp Gly

85 90 95

Glu Thr Ile vai Arg Asn Glu His Asn Pro Thr Ile Ala Tyr Ala Tyr

100 105 110

Asp Arg vai Phe Gly Pro Thr Thr Thr Thr Arg Asn Val Tyr Asp Ile

115 120 125

Ala Ala His His Val Val Asn Gly Ala Met Glu Gly Ile Asn Gly Thr

130 135 140

Ile Phe Ala Tyr Gly Val Thr Ser Ser Gly Lys Thr His Thr Met His 145 150 155 160

Gly Asp Gln Arg ser Pro Gly Ile Ile Pro Leu Ala vai Lys Asp Ala

165 170 175

Phe ser Ile Ile Gln Glu Thr Pro Asn Arg Glu Phe Leu Leu Arg Ile

180 185 190

Ser Tyr Met Glu Ile Tyr Asn Glu Val Val Asn Asp Leu Leu Asn Pro

195 200 205

Ala Gly His Asn Leu Arg Ile Arg Glu Asp Lys Gln Gly Thr Phe Val

210 215 220

Glu Gly lie Lys Glu Glu vai Val Leu Ser Pro Ala His Ala Leu Ser 225 230 235 240

Leu Ile Ala Ala Gly Glu Glu Gln Arg His Val Gly Ser Thr Asn Phe

245 250 255

Asn Leu Leu Ser Ser Arg ser His Thr Ile Phe Thr Leu Thr Ile Glu

260 265 270

Ser ser Pro Leu Gly Asp Lys Ser Lys Gly Glu Ala vai His Leu Ser 275 280 285 Gln Leu Asn Leu Val Asp Leu Ala Gly Ser Glu Ser Ser Lys Val Glu

290 295 300

Thr Ser Gly Val Arg Arg Lys Glu Gly Ser Tyr Ile Asn Lys Ser Leu 305 310 315 320

Leu Thr Leu Gly Thr Val Ile Ser Lys Leu Thr Asp Val Arg Ala Ser

325 330 335

His Val Pro Tyr Arg Asp Ser Lys Leu Thr Arg Ile Leu Gln ser ser

340 345 350

Leu Ser Gly His Asp Arg vai Ser Leu Ile Cys Thr Val Thr Pro Ala

355 360 365

Ser Ser Ser Ser Glu Glu Thr His Asn Thr Leu Lys Phe Ala His Arg

370 375 380

Ala Lys His Ile Glu Ile Gln Ala Glu Gln Asn Lys Ile Ile Asp Glu 385 390 395 400

Lys Ser Leu Ile Lys Lys Tyr Gln Arg Glu Ile Arg Gln Leu Lys Glu

405 410 415

Glu Leu Glu Gln Leu Lys Gln Glu Ile Val Pro Val Pro Gln Leu Lys

420 425 430

Asp Ile Gly Ala Asp Asp Ile Val Leu Leu Lys Gln Lys Leu Glu Asp

435 440 445

Gly Gln Val Lys Leu Gln ser Arg Leu Glu Glu Glu Glu Glu Ala Lys

450 455 460

Ala Ala Leu Leu ser Arg Ile Gln Arg Leu Thr Lys Leu Ile Leu vai 465 470 475 480

Ser Thr Lys Asn Pro Gln Ala Ser Arg Leu Pro His Arg Phe Asn Pro

485 490 495

Arg Arg Arg His Ser Phe Gly Glu Glu Glu Leu Ala Tyr Leu Pro Tyr

500 505 510

Lys Arg Arg Asp Met Met Asp Asp Glu Gln Leu Asp Leu Tyr vai Ser

515 520 525

Val Glu Gly Asn His Glu Ile Arg Asp Asn Ala Tyr Arg Glu Glu Lys 530 535 540 Lys Thr Arg Lys His Gly Leu Leu Asn Trp Leu Lys Pro Lys Lys Arg 545 550 555 560

Asp His Ser ser ser Ala ser Asp Gln ser ser vai vai Lys ser Asn

565 570 575

Ser Thr Pro Ser Thr Pro Gln Gly Gly Gly Ser His Leu His Thr Glu

580 585 590

Ser Arg Leu Ser Glu Gly ser Pro Leu Met Glu Gln Leu Ser Glu Pro

595 600 605

Arg Glu Asp Arg Glu Ala Leu Glu Asp Ser Ser His Glu Met Glu Ile

610 615 620

Pro Glu Thr Ser Asn Lys Met Ser Asp Glu Leu Asp Leu Leu Arg Glu 625 630 635 640

Gln Lys Lys Ile Leu Ser Glu Glu Ala Ala Leu Gln Leu Ser Ser Leu

645 650 655

Lys Arg Met Ser Asp Glu Ala Ala Lys Ser Pro Gln Asn Glu Glu Ile

660 665 670

Asn Glu Glu lie Lys Val Leu Asn Asp Asp Ile Lys Ala Lys Asn Asp

675 680 685

Gln Ile Ala Thr Leu Glu Arg Gln Ile Met Asp Phe Val Met Thr Ser

690 695 700

His Glu Ala Leu Asp Lys Ser Asp Ile Met Gln Ala Val Ala Glu Leu 705 710 715 720

Arg Asp Gln Leu Asn Glu Lys Ser Phe Glu Leu Glu Val Ile Glu Leu

725 730 735

Phe Leu Phe Met Gln Phe Phe Phe Ile Tyr Ala Glu Val Arg Asp Gly

740 745 750

Phe Ala lie Ala Trp Ile Arg Leu Phe Ile Leu Ala Gln Tyr Tyr Leu

755 760 765

Ser Ser Tyr Leu Asn Lys Val Ser Ser Val Tyr Ile Ile Lys Tyr Gln

770 775 780

Tyr Ser Lys Arg Gln Thr Ile Leu Thr Met Lys Leu Met Val Lys Ala 785 790 795 800 Ala Asp Asn Arg Ile Ile Gln Gln Thr Leu Asn Glu Lys Thr Cys Glu

805 810 815

Cys Glu Val Leu Gln Glu Glu Val Ala Asn Leu Lys Gln Gln Leu Ser 820 825 830

Glu Ala Leu Glu Leu Ala Gln Gly Thr Lys Ile Lys Glu Leu Lys Gln 835 840 845

Asp Ala Lys Glu Leu Ser Glu Ser Lys Glu Gln Leu Glu Leu Arg Asn

850 855 860

Arg Lys Leu Ala Glu Glu Ser ser Tyr Ala Lys Gly Leu Ala Ser Ala 865 870 875 880

Ala Ala Val Glu Leu Lys Ala Leu Ser Glu Glu vai Ala Lys Leu Met

885 890 895

Asn Gln Asn Glu Arg Leu Ala Ala Glu Leu Ala Thr Gln Lys Ser Pro 900 905 910

Ile Ala Gln Arg Asn Lys Thr Gly Thr Thr Thr Asn Val Arg Asn Asn 915 920 925

Gly Arg Arg Glu Ser Leu Ala Lys Arg Gln Glu His Asp Ser Pro Ser

930 935 940

Met Glu Leu Lys Arg Glu Leu Arg Met Ser Lys Glu Arg Glu Leu Ser 945 950 955 960

Tyr Glu Ala Ala Leu Gly Glu Lys Glu Gln Arg Glu Ala Glu Leu Glu

965 970 975

Arg lie Leu Glu Glu Thr Lys Gln Arg Glu Ala Tyr Leu Glu Asn Glu

980 985 990

Leu Ala Asn Met Trp Val Leu vai ser Lys Leu Arg Arg ser Gln Gly

995 1000 1005

Ala Asp ser Glu Ile Ser Asp ser Ile Ser Glu Thr Arg Gln Thr

1010 1015 1020

Glu Gln Thr Glu Gly Ser Phe 1025 1030

<210> 19 <211> 1638 <212> DNA

<213> Arabidopsis thaliana <400> 19

ttctaggcca aaactatctc cacgattcta acaaacaaaa attacagaaa tgtcaatgtc 60 atcgtcctcc tttatctctc tcactttctt cttccttctt ctcgtttctt catcgtcatc 120 ttccgatgac atctctgagc tattcgacga ctggtgccag aaacatggca aaacgtacgg 180 ttcagaagaa gagaggcaac agaggattca aatctttaaa gataatcacg acttcgttac 240 gcaacacaat ctcatcacta acgctactta ctctctctct ctcaatgctt tcgcggatct 300 gactcaccac gagttcaagg cttctcgtct tggtctctct gtttccgctc cgtcggtgat 360 aatggctagt aagggacaga gtctcggtgg tagcgtaaag gttccagatt ctgttgattg 420 gagaaagaag ggagctgtta ctaatgtcaa agatcaagga agctgcgggg catgttggtc 480 gttctcggcg actggagcta tggagggaat taaccagata gtaacaggag atctcatcag 540 cctctctgag caggaactga ttgattgtga caagtcctac aatgctggct gtaatggtgg 600 tctcatggac tatgcttttg aatttgtcat taaaaaccat ggaatagaca cagagaaaga 660 ctatccttat caagaacgtg atggcacctg taagaaggat aagttgaaac aaaaggttgt 720 gacaattgat agctatgctg gtgtaaaatc aaatgatgag aaagcgttaa tggaggctgt 780 agcggctcag ccagttagtg ttggcatctg tggaagcgag agagcgtttc agctatattc 840 tagtggaata ttctctggcc cgtgttcgac atcattggat catgctgtgc tcatagtagg 900 atatggttca cagaatggtg ttgattattg gattgtgaaa aactcatggg gaaaaagttg 960 gggaatggat gggtttatgc acatgcagcg taacactgaa aattcagacg gcgtttgcgg 1020 aatcaacatg cttgcttcat atcccatcaa gacacatcca aacccgcctc caccgtcccc 1080 tcctggccct acaaaatgca accttttcac gtattgttca tctggagaga cttgttgctg 1140 tgcaagagaa ttgtttggtt tatgcttctc atggaaatgc tgcgagatag aatccgctgt 1200 gtgttgcaag gatggtcgtc attgttgtcc acatgattac cctgtttgtg atacaaccag 1260 aagtctctgc cttaagaaaa ctggtaattt cactgcgatc aagcccttct ggaagaagaa 1320 ttcttcaaaa caacttggcc gatttgagga atgggttatg tgagagaagt tttacgcaca 1380 tgttacagaa aattcaaact catccataca aaaacctcgt agattcgatt atctgcgagg 1440 ggattatttg tagctgttat tgagatagat atatacgata tcatcacgga tgtattttta 1500 gtctctcatt tggatgtata caacttctga gtcaataaag gacacttgca ggacaagcac 1560 agtatttgta tctgcaagac acataaagta ataagagtat catctatgta tattatagag 1620 agactaagct tcactgtt 1638 <210> 20

<211> 437

<212> PRT

<213> Arabidopsis thaliana

<400> 20

Met Ser Met Ser Ser Ser Ser Phe Ile Ser Leu Thr Phe Phe Phe Leu

10 15

Leu Leu vai Ser Ser Ser Ser Ser Ser Asp Asp He Ser Glu Leu Phe

25 30

Asp Asp Trp cys Gln Lys His Gly Lys Thr Tyr Gly Ser Glu Glu Glu 40 45

Arg Gln Gln Arg Ile Gln Ile Phe Lys Asp Asn His Asp Phe Val Thr

50 55 60

Gln His Asn Leu Ile Thr Asn Ala Thr Tyr Ser Leu Ser Leu Asn Ala 65 70 75 80

Phe Ala Asp Leu Thr His His Glu Phe Lys Ala Ser Arg Leu Gly Leu

85 90 95

Ser Val Ser Ala Pro Ser Val Ile Met Ala Ser Lys Gly Gln Ser Leu 100 105 110

Gly Gly Ser Val Lys Val Pro Asp Ser Val Asp Trp Arg Lys Lys Gly 115 120 125

Ala Val Thr Asn Val Lys Asp Gln Gly Ser Cys Gly Ala Cys Trp Ser

I30 135 140

Phe Ser Ala Thr Gly Ala Met Glu Gly He Asn Gln Ile Val Thr Gly 145 150 155 160

Asp Leu Ile Ser Leu Ser Glu Gln Glu Leu Ile Asp Cys Asp Lys Ser

165 170 175

Tyr Asn Ala Gly Cys Asn Gly Gly Leu Met Asp Tyr Ala Phe Glu Phe 180 185 190

Val He Lys Asn His Gly Ile Asp Thr Glu Lys Asp Tyr Pro Tyr Gln 195 200 205

Glu Arg Asp Gly Thr Cys Lys Lys Asp Lys Leu Lys Gln Lys Val Val 210 215 220

Thr Ile Asp ser Tyr Ala Gly Val Lys Ser Asn Asp Glu Lys Ala Leu 225 230 235 240

Met Glu Ala Val Ala Ala Gln Pro vai Ser Val Gly Ile Cys Gly Ser 245 250 255

Glu Arg Ala Phe Gln Leu Tyr Ser ser Gly Ile Phe Ser Gly Pro Cys

260 265 270

Ser Thr Ser Leu Asp His Ala Val Leu Ile Val Gly Tyr Gly ser Gln 275 280 285

Asn Gly Val Asp Tyr Trp Ile Val Lys Asn Ser Trp Gly Lys Ser Trp 290 295 300

Gly Met Asp Gly Phe Met His Met Gln Arg Asn Thr Glu Asn Ser Asp 305 310 315 320

Gly vai Cys Gly Ile Asn Met Leu Ala Ser Tyr Pro Ile Lys Thr His 325 330 335

Pro Asn Pro Pro Pro Pro Ser Pro Pro Gly Pro Thr Lys Cys Asn Leu

340 345 350

Phe Thr Tyr Cys Ser Ser Gly Glu Thr Cys Cys Cys Ala Arg Glu Leu 355 360 365

Phe Gly Leu Cys Phe Ser Trp Lys Cys Cys Glu Ile Glu Ser Ala vai 370 375 380

Cys Cys Lys Asp Gly Arg His Cys Cys Pro His Asp Tyr Pro Val Cys 385 390 395 400

Asp Thr Thr Arg ser Leu Cys Leu Lys Lys Thr Gly Asn Phe Thr Ala 405 410 415

lie Lys Pro Phe Trp Lys Lys Asn Ser Ser Lys Gln Leu Gly Arg Phe

420 425 430

Glu Glu Trp vai Met 435

<210> 21 <211> 1862 <212> DNA <213> Arabidopsis thaliana <400> 21

atgaaatctg caaatttagg tcttttaata gaaatctgaa tttcatgttg ctgaaagaat 60 ttacaacgaa gttgtaaata ctctgagaaa catgtaagtc aggagagagt cccttctatg 120 gtttatattt ggcggctttt aagaagcata cgcatatcaa gtgtttgatg aaattcctca 180 gagaagatga tgtccaccac agtcagatta aacaggttta cgtatctaac gagtactgca 240 aaactgacac gttacttttg ctctcaccat ttagttgacc gatcggaaac ggcgttgcat 300 gaagttattc ggatagtttc ttctccagtt ggtggtctag atgaccttga agaaaacttg 360 aaccaggttt ctgtttctcc atcatcaaac cttgttaccc aagtgattga gtcttgcaag 420 aacgagactt caccgagaag gctgttgagg tttttctcct ggtcgtgtaa aagcttggga 480 tctagtttac acgacaagga attcaactat gtcctaagag ttttggctga gaagaaggat 540 cacacagcta tgcagatact cttatcagat ctcaggaagg agaatcgggc gatggacaag 600 caaacgttta gcattgtcgc tgaaactctg gttaaggttg gtaaggaaga agatgcaata 660 ggtatcttca agatcttgga caaattttct tgcccacaag atggtttcac tgtgacggct 720 attataagcg ctctttgttc cagaggacat gtgaagagag cattgggagt tatgcatcat 780 cacaaggatg taatatccgg gaatgaattg tctgtgtata gaagtctttt attcgggtgg 840 tcggtacaaa gaaacgtgaa ggaagcaaga agagttatac aagatatgaa atcagcaggg 900 attacaccgg atttgttctg tttcaactcg ttgctgacct gcctttgcga aagaaacgtg 960 aatcgaaacc cgtctgggct tgttcctgaa gctttgaata ttatgttgga gatgaggtct 1020 tacaaaatcc aacctacgtc tatgagttac aacattttgc tctcttgttt gggaaggact 1080 aggagggtga gagagtcctg ccagatttta gaacagatga aaagatcggg atgtgatccg 1140 gatacaggga gctattactt cgttgtgagg gtcctgtatt tgacaggaag gtttggtaaa 1200 ggcaaccaaa ttgtggatga gatgatcgag agaggattta gacccgaacg caaattctat 1260 tatgatctga tcggggttct ttgtggggtc gagcgggtta actttgctct tcaattgttt 1320 gagaagatga agagaagctc agtgggtggt tatggtcagg tttatgatct gctcatacca 1380 aaactatgta aaggaggaaa ctttgagaaa ggaagagagc tttgggaaga ggcattgtca 1440 attgatgtta cacttagttg ctccattagt ttgcttgatc catctgtcac agaggttttc 1500 aaacctatga agatgaaaga agaagctgca atggtggatc gtcgtgctct taacttgaag 1560 attcacgcta gaatgaacaa aacaaagcca aaactgaaac taaaaccgaa acgcaggagc 1620 aagacaaaga agaagaatct gcaacattga ttgatttctt ctacccattg ttaagaacat 1680 ctgatatagc aggcaatgta tcacaagaaa ctcaagtaag atgttctgct ttttatgtat 1740 tagtagtaat gcagaagcaa aggacatgag attcttttgt tgttctcttt gtcccattga 1800 ttcttattac gaaaaatatg ggttctgaag aatacaaaac aagagacaag aatattgtga 1860

tc 1862 <210> 22

<211> 487

<212> prt

<213> Arabidopsis thaliana

<400> 22

Met Met Ser Thr Thr Val Arg Leu Asn Arg Phe Thr Tyr Leu Thr Ser 1 5 10 15

Thr Ala Lys Leu Thr Arg Tyr Phe Cys Ser His His Leu vai Asp Arg

25 30

Ser Glu Thr Ala Leu His Glu vai Ile Arg He Val Ser Ser Pro Val

40 45

Gly Gly Leu Asp Asp Leu Glu Glu Asn Leu Asn Gln Val Ser Val Ser 50 55 60

Pro Ser ser Asn Leu Val Thr Gln vai Ile Glu Ser Cys Lys Asn Glu 65 70 75 80

Thr Ser Pro Arg Arg Leu Leu Arg Phe Phe Ser Trp Ser Cys Lys Ser 85 90 95

Leu Gly ser ser Leu His Asp Lys Glu Phe Asn Tyr vai Leu Arg vai

100 105 110

Leu Ala Glu Lys Lys Asp His Thr Ala Met Gln Ile Leu Leu ser Asp

115 120 125

Leu Arg Lys Glu Asn Arg Ala Met Asp Lys Gln Thr Phe ser Ile Val 130 135 140

Ala Glu Thr Leu Val Lys Val Gly Lys Glu Glu Asp Ala Ile Gly Ile 145 150 155 160

Phe Lys Ile Leu Asp Lys Phe Ser Cys Pro Gln Asp Gly Phe Thr Val 165 170 175

Thr Ala Ile Ile Ser Ala Leu Cys Ser Arg Gly His Val Lys Arg Ala

180 185 190

Leu Gly Val Met His His His Lys Asp Val Ile Ser Gly Asn Glu Leu 195 200 205

Ser vai Tyr Arg Ser Leu Leu Phe Gly Trp ser vai Gln Arg Asn Val

210 215 220

Lys Glu Ala Arg Arg vai Ile Gln Asp Met Lys Ser Ala Gly Ile Thr 225 230 235 240

Pro Asp Leu Phe Cys Phe Asn ser Leu Leu Thr Cys Leu Cys Glu Arg

245 250 255

Asn Val Asn Arg Asn Pro Ser Gly Leu Val Pro Glu Ala Leu Asn Ile 260 265 270

Met Leu Glu Met Arg ser Tyr Lys Ile Gln Pro Thr Ser Met ser Tyr 275 280 285

Asn He Leu Leu Ser Cys Leu Gly Arg Thr Arg Arg vai Arg Glu Ser

2^O 295 300

Cys Gln Ile Leu Glu Gln Met Lys Arg ser Gly Cys Asp Pro Asp Thr 305 310 315 320

Gly ser Tyr Tyr Phe Val Val Arg Val Leu Tyr Leu Thr Gly Arg Phe

325 330 335

Gly Lys Gly Asn Gln Ile Val Asp Glu Met Ile Glu Arg Gly Phe Arg

340 345 350

Pro Glu Arg Lys Phe Tyr Tyr Asp Leu Ile Gly vai Leu Cys Gly vai

355 360 365

Glu Arg vai Asn Phe Ala Leu Gln Leu Phe Glu Lys Met Lys Arg Ser

370 375 380

Ser Val Gly Gly Tyr Gly Gln Val Tyr Asp Leu Leu Ile Pro Lys Leu 385 390 395 400

Cys Lys Gly Gly Asn Phe Glu Lys Gly Arg Glu Leu Trp Glu Glu Ala

405 410 415

Leu Ser Ile Asp vai Thr Leu ser Cys Ser Ile ser Leu Leu Asp Pro

420 425 430

Ser Val Thr Glu Val Phe Lys Pro Met Lys Met Lys Glu Glu Ala Ala

435 440 445

Met Val Asp Arg Arg Ala Leu Asn Leu Lys Ile His Ala Arg Met Asn 15

450 455 460

Lys Thr Lys Pro Lys Leu Lys Leu Lys Pro Lys Arg Arg ser Lys Thr

465 470 475 480

Lys Lys Lys Asn Leu Gln His

485

<210> 23

<211> 1691

<212> DNA

<213> Arabidopsis thaliana

<400> 23

agttatcttc atacttcata taaatctctg ctcattttcg ataaaaagtt gaatcctttt 60 cacattttcc gctcaattcg atcttacatg ttaacaatgg ttggtctaac tccagctgag 120 gatcgttcag agattgcctt tttcgacgtc gagacgacaa ttccgttccg agttggtcag 180 gggtacgcga ttctggagtt tggatcgatt ctggtttgcc ccaagaagct tgtggagctg 240 aaaaactact ctgttctggt tcgtcctgct aatctcaacc tcatcacgcc tcggtccgtg 300 aagtgcaacg gcatcaaacg cgaagacgtc gaatcagctc ttacctttgc agatatcgcc 360 gacaccgtct acgatattct ccatggaagg atatgggcag gtcataacat attgaagttc 420 gattgtccaa ggataagaga agcatttgct gagattggac gagatccacc agagccaaag 480 ggcaccattg actccttggc tttgcttact caaaggtttg ggagaagagc tggtgatatg 540 aagatggcga ctttggctac atactttgga cttggaaacc agacgcatag gagtctggac 600 gatgtaagga tgaacttcga ggttctcaag tattgtgcca ctgttttgtt cttggagtca 660 agtcttccag atgaacttat agagaactcg gttactacta ctactcctga aactagttca 720 agaaggcgta ggactataaa aaaatctcct ctgcaatctc ccactgatca gcagacagga 780 gagaacatga caactatacc tattttatca tttgtttcat ccgcagaagc tcaaacggat 840 ccatttgata tgagcacttt gaggaacgaa atagcccctg aagttcttca atcagatgtt 900 cccatggaag aagaacaaaa tcagcagtct gagactgttg cctctgaagg taccggtgac 960 caggaaggat tcatggagct agataaaata tctgtttcaa gtatcagagc aactcatgtc 1020 ccgctatatg acgggagcca aacaatgaag ctgcaactct tccttgggga cagacccctt 1080 cagctccatt gtcctcgtct gaaagtacgg tttggaatca atgggaaatt tatggataaa 1140 gctggaagac ggaggttgaa ctttgtaatt gatctgtatc caagtctctg caacgtactt 1200 caagaatgcg acagtgctgc acagacaata tctgttgatt caggcagtgg ttctgactgg 1260 aaccctctag tcattccaat gaaaggattt ctgaactgtc ccactgcaag gatacatata 1320

20

30 cccacagagt taaatggaga tatagatcgg tacgcagctg agatacacca gaaagagttc 1380 tctggagcta ctgctactca gaaactcatt tctagcaacc ccaaggctga agagattgag 1440 tctttgttga atccgagaac tgttcttgac gctttcttgt ctctggagcc atatgattat 1500 cagcagagag ccggaatccg tctagttgct agaaagcttg ttatacatta gtggacctta 1560 ctcaatagca ccacagagaa ttaaagaaat cagagtttag tggactgtag agatttattt 1620 atgtagtcat gaaagaaaca cagaactgtt gttcctgaca gtagatatac agctgattat 1680 gttcttagtt t 1691

<210> 24 <211> 487 <212> PRT

<213> Arabidopsis thaliana <400> 24

Met Leu Thr Met Val Gly Leu Thr Pro Ala Glu Asp Arg Ser Glu Ile 1 5 10 15

Ala Phe Phe Asp Val Glu Thr Thr Ile Pro Phe Arg Val Gly Gln Gly

25 30

Tyr Ala Ile Leu Glu Phe Gly Ser Ile Leu Val Cys Pro Lys Lys Leu

40 45

Val Glu Leu Lys Asn Tyr Ser Val Leu Val Arg Pro Ala Asn Leu Asn

50 55 60

Leu Ile Thr Pro Arg Ser Val Lys Cys Asn Gly Ile Lys Arg Glu Asp 65 70 75 80

Val Glu Ser Ala Leu Thr Phe Ala Asp Ile Ala Asp Thr Val Tyr Asp

85 90 95

Ile Leu His Gly Arg Ile Trp Ala Gly His Asn Ile Leu Lys Phe Asp

100 105 110

Cys Pro Arg Ile Arg Glu Ala Phe Ala Glu Ile Gly Arg Asp Pro Pro

115 120 125

Glu Pro Lys Gly Thr Ile Asp Ser Leu Ala Leu Leu Thr Gln Arg Phe

130 135 140

Gly Arg Arg Ala Gly Asp Met Lys Met Ala Thr Leu Ala Thr Tyr Phe 145 150 155 160 Gly Leu Gly Asn Gln Thr His Arg ser Leu Asp Asp vai Arg Met Asn

165 170 175

Phe Glu Val Leu Lys Tyr Cys Ala Thr vai Leu Phe Leu Glu Ser Ser

180 185 190

Leu Pro Asp Glu Leu Ile Glu Asn ser Val Thr Thr Thr Thr Pro Glu

195 200 205

Thr ser Ser Arg Arg Arg Arg Thr Ile Lys Lys Ser Pro Leu Gln Ser

210 215 220

Pro Thr Asp Gln Gln Thr Gly Glu Asn Met Thr Thr Ile Pro Ile Leu 225 230 235 240

Ser Phe Val Ser ser Ala Glu Ala Gln Thr Asp Pro Phe Asp Met Ser

245 250 255

Thr Leu Arg Asn Glu Ile Ala Pro Glu Val Leu Gln Ser Asp Val Pro

260 265 270

Met Glu Glu Glu Gln Asn Gln Gln Ser Glu Thr vai Ala Ser Glu Gly

275 280 285

Thr Gly Asp Gln Glu Gly Phe Met Glu Leu Asp Lys Ile ser vai Ser

290 295 300

Ser lie Arg Ala Thr His Val Pro Leu Tyr Asp Gly Ser Gln Thr Met 305 310 315 320

Lys Leu Gln Leu Phe Leu Gly Asp Arg Pro Leu Gln Leu His Cys Pro

325 330 335

Arg Leu Lys Val Arg Phe Gly Ile Asn Gly Lys Phe Met Asp Lys Ala

340 345 350

Gly Arg Arg Arg Leu Asn Phe vai Ile Asp Leu Tyr Pro Ser Leu Cys

355 360 365

Asn Val Leu Gln Glu Cys Asp Ser Ala Ala Gln Thr Ile Ser Val Asp

370 375 380

Ser Gly Ser Gly Ser Asp Trp Asn Pro Leu Val Ile Pro Met Lys Gly 385 390 395 400

Phe Leu Asn Cys Pro Thr Ala Arg Ile His Ile Pro Thr Glu Leu Asn 405 410 415 Gly Asp Ile Asp Arg Tyr Ala Ala Glu Ile His

420 425

Gly Ala Thr Ala Thr Gln Lys Leu Ile Ser Ser 435 440

Glu lie Glu Ser Leu Leu Asn Pro Arg Thr vai 450 455

Ser Leu Glu Pro Tyr Asp Tyr Gln Gln Arg Ala 465 470 475

Ala Arg Lys Leu vai Ile His 485

<210> 25 <211> 2179 <212> DNA

<213> Arabidopsis thaliana <400> 25

gaagagacat cagatcttat caaaacccta gctttcggtg tctctctcga tcctttagct 60

caatcgaaaa ctgaatttag gagctgcgat gggttccaga tctcgtaatg ataatttcca 120

gtccggcgat ggcgctagtc ctgggaaaat attcattgga ggattgcaca aagacacgac 180

taatactgtg ttcaataagc actttggcaa gtacggggag attacagatt ctgtcattat 240

gcgagatcga catactggac aacctagggg tttcggtttc atcaccttcg ctgacccttc 300

tgttgttgac aaagttatcg aagatactca tgtcatcaat ggcaaacagg ttgagatcaa 360

aaggactatt ccgaaaggtg ctggtggcaa tcagtcaaag gacatcaaaa caaagaagat 420

tttcgttggt ggtataccct caacggttac agaagatgaa cttaaggact tctttgccaa 480

gtatgggaac gtggtggagc accaggttat tcgagaccat gaaacaaaca ggtccagagg 540

ttttggtttt gtaatttttg atagcgaaga agtcgtagat gaattattgt ccaaaggaaa 600

catgatcgat atggcagaca ctcaggtaag cttgtacaaa tggggattag aattttggtt 660

catgatgaca tatttatctt ggtttcaatt tgatattttc tccttgttcc tttcattata 720

cacgtttaac ttagttagaa ttctacccac tagcttacca aatgtaagga gcttgtcaca 780

gtaagatagg aaatccctgc tatagtttgg gtccttagca tagctaggtt aattaagttg 840

ctttgttgta ggtggagatc aagaaagctg aaccaaagaa atctctaaac cgttcacctc 900

cttcttacgg tagtcaccct agaggtcgtt cttctaacga tagttatgca agttatggtg 960 gaccttacgg aggttttgat ggagggtatg gtcatcctcc aggtcccatt aggtcacatg 1020

Gln Lys Glu Phe ser 430

Asn Pro Lys Ala Glu 445

Leu Asp Ala Phe Leu 460

Gly lie Arg Leu Val 480 gaggtcctgc tagtagatat gctgggggat atgggtatgg tcgtggcagt gtaggccctg 1080 aatttggagg aggttataat aattatgggg gtggtagttt aggaggttac cggaatgaac 1140 caccccttgg ctattctagt cgttttggac cctatgggag tgggtttggt ggtgagggat 1200 atggccgtgg aggagaagga gcctatttgg gatatcctcg tggaggaggg gaaggctatg 1260 ggggatatgg tgggcctggt tacggcggtg catatgaatc tggtggccca ggtggcagtt 1320 atgaaggagc aggtggtcca tatgggaggg gttatagtag cagtagtcga taccatccgt 1380 atgcaaggta gggtcgaggt aatagcaatc agttggagct atagaagctt ctctcacagg 1440 ttcctctaga ttgttccaat tgctctaggt gcattctaga gttatcatgt agcgccaaca 1500 tcaggaaggg ttgctaagga caggaagagc atcaaaaagc ttttattagt catcttttag 1560 ttgtgtgttt acctaattta agtgttgtct tatctctata acttagattg tgttatgtag 1620 actttagcat atttgggctt ggagtttgtt tctcactggc acaagaatga tttatcattt 1680 ggtagtcttg ttagatgatc aattactcgc ttagcttagt tttcacaatc atacgaatta 1740 gcttaagaag ctctgcaaaa tgtgcactca tctattcttt agagctcaag ttgaatgctt 1800 tatgtggtct cttgtatctc tgtacatttt gttgtgctga acaaaggttt gacggcagtt 1860 agtgcatgtg taagtaggca tatttttgtc agctgcatac gtaggttcta gctacaaatt 1920 ggaattgtat gtgtttgaaa acgtaaaatc aattataaat gtttttgaaa atcatctata 1980 caagcatggt tatttggttc ttgtttcctt attttttcgg gtaagggcca cggataattg 2040 gttagacatt ggttctaata atgtgggttt tgttatctgt aatttctcgt caaaatgatg 2100 tactgtatca ttaaatgaat atcacttatt gtacatgctt ttataagtta attgaaatcc 2160 aaactctttt acgttttaa <210> 26 <211> 231 <212> PRT

<213> Arabidopsis thaliana <400> 26

Met Gly Ser Arg Ser Arg Asn Asp Asn Phe Gln Ser 1 5 10

Ser Pro Gly Lys Ile Phe Ile Gly Gly Leu His Lys

25

Thr Val Phe Asn Lys His Phe Gly Lys Tyr Gly Glu

40

Val Ile Met Arg Asp Arg His Thr Gly Gln Pro Arg

Gly Asp Gly Ala 15

Asp Thr Thr Asn 30

Ile Thr Asp Ser 45

Gly Phe Gly Phe 50 55 60

Ile Thr Phe Ala Asp Pro ser Val vai Asp Lys Val Ile Glu Asp Thr 65 70 75 80

His Val Ile Asn Gly Lys Gln vai Glu Ile Lys Arg Thr Ile Pro Lys

85 90 95

Gly Ala Gly Gly Asn Gln Ser Lys Asp Ile Lys Thr Lys Lys Ile Phe

100 105 110

Val Gly Gly Ile Pro Ser Thr vai Thr Glu Asp Glu Leu Lys Asp Phe

115 120 125

Phe Ala Lys Tyr Gly Asn Val Val Glu His Gln vai Ile Arg Asp His

130 135 140

Glu Thr Asn Arg ser Arg Gly Phe Gly Phe Val Ile Phe Asp Ser Glu 145 150 155 160

Glu vai Val Asp Glu Leu Leu Ser Lys Gly Asn Met Ile Asp Met Ala

165 170 175

Asp Thr Gln vai ser Leu Tyr Lys Trp Gly Leu Glu Phe Trp Phe Met

180 185 190

Met Thr Tyr Leu Ser Trp Phe Gln Phe Asp Ile Phe ser Leu Phe Leu

195 200 205

Ser Leu Tyr Thr Phe Asn Leu Val Arg Ile Leu Pro Thr ser Leu Pro

210 215 220

Asn vai Arg ser Leu Ser Gln 225 230

<210> 27 <211> 1959 <212> DNA

<213> Arabidopsis thaliana <400> 27

aattagatga agagacatca gatcttatca aaaccctagc tttcggtgtc tctctcgatc 60 ctttagctca atcgaaaact gaatttagga gctgcgatgg gttccagatc tcgtaatgat 120 aatttccagt ccggcgatgg cgctagtcct gggaaaatat tcattggagg attgcacaaa 180 gacacgacta atactgtgtt caataagcac tttggcaagt acggggagat tacagattct 240 gtcattatgc gagatcgaca tactggacaa gacccttctg ttgttgacaa agttatcgaa gagatcaaaa ggactattcc gaaaggtgct aagaagattt tcgttggtgg tataccctca tttgccaagt atgggaacgt ggtggagcac tccagaggtt ttggttttgt aatttttgat aaaggaaaca tgatcgatat ggcagacact aaatctctaa accgttcacc tccttcttac gatagttatg caagttatgg tggaccttac ccaggtccca ttaggtcaca tggaggtcct ggtcgtggca gtgtaggccc tgaatttgga ttaggaggtt accggaatga accacccctt agtgggtttg gtggtgaggg atatggccgt cgtggaggag gggaaggcta tgggggatat tctggtggcc caggtggcag ttatgaagga agcagtagtc gataccatcc gtatgcaagg ctatagaagc ttctctcaca ggttcctcta gagttatcat gtagcgccaa catcaggaag gcttttatta gtcatctttt agttgtgtgt taacttagat tgtgttatgt agactttagc gcacaagaat gatttatcat ttggtagtct gttttcacaa tcatacgaat tagcttaaga ttagagctca agttgaatgc tttatgtggt gaacaaaggt ttgacggcag ttagtgcatg acgtaggttc tagctacaaa ttggaattgt atgtttttga aaatcatcta tacaagcatg gggtaagggc cacggataat tggttagaca gtaatttctc gtcaaaatga tgtactgtat ttttataagt taattgaaat ccaaactctt <210> 28 <211> 358 <212> PRT

cctaggggtt tcggtttcat caccttcgct 300 gatactcatg tcatcaatgg caaacaggtt 360 ggtggcaatc agtcaaagga catcaaaaca 420 acggttacag aagatgaact taaggacttc 480 caggttattc gagaccatga aacaaacagg 540 agcgaagaag tcgtagatga attattgtcc 600 caggtggaga tcaagaaagc tgaaccaaag 660 ggtagtcacc ctagaggtcg ttcttctaac 720 ggaggttttg atggagggta tggtcatcct 780 gctagtagat atgctggggg atatgggtat 840 ggaggttata ataattatgg gggtggtagt 900 ggctattcta gtcgttttgg accctatggg 960 ggaggagaag gagcctattt gggatatcct 1020 ggtgggcctg gttacggcgg tgcatatgaa 1080 gcaggtggtc catatgggag gggttatagt 1140 tagggtcgag gtaatagcaa tcagttggag 1200 gattgttcca attgctctag gtgcattcta 1260 ggttgctaag gacaggaaga gcatcaaaaa 1320 ttacctaatt taagtgttgt cttatctcta 1380 atatttgggc ttggagtttg tttctcactg 1440 tgttagatga tcaattactc gcttagctta 1500 agctctgcaa aatgtgcact catctattct 1560 ctcttgtatc tctgtacatt ttgttgtgct 1620 tgtaagtagg catatttttg tcagctgcat 1680 atgtgtttga aaacgtaaaa tcaattataa 1740 gttatttggt tcttgtttcc ttattttttc 1800 ttggttctaa taatgtgggt tttgttatct 1860 cattaaatga atatcactta ttgtacatgc 1920 ttacgtttt 1959 <213> Arabidopsis thaliana <400> 28

Met Gly Ser Arg Ser Arg Asn Asp Asn Phe Gln Ser Gly Asp Gly Ala 10 15

ser Pro Gly Lys Ile Phe Ile Gly Gly Leu His Lys Asp Thr Thr Asn 25 30

Thr vai Phe Asn Lys His Phe Gly Lys Tyr Gly Glu Ile Thr Asp Ser

40 45

Val Ile Met Arg Asp Arg His Thr Gly Gln Pro Arg Gly Phe Gly Phe 1O 50 55 60

Ile Thr Phe Ala Asp Pro ser vai Val Asp Lys Val Ile Glu Asp Thr 65 70 75 80

His vai lie Asn Gly Lys Gln Val Glu Ile Lys Arg Thr Ile Pro Lys 85 90 95

Gly Ala Gly Gly Asn Gln ser Lys Asp Ile Lys Thr Lys Lys Ile Phe

100 105 110

Val Gly Gly Ile Pro Ser Thr Val Thr Glu Asp Glu Leu Lys Asp Phe

115 120 125

Phe Ala Lys Tyr Gly Asn Val Val Glu His Gln vai He Arg Asp His

130 135 140

Glu Thr Asn Arg ser Arg Gly Phe Gly Phe Val Ile Phe Asp ser Glu 145 150 155 160

Glu Val Val Asp Glu Leu Leu Ser Lys Gly Asn Met Ile Asp Met Ala

165 170 175

Asp Thr Gln Val Glu Ile Lys Lys Ala Glu Pro Lys Lys Ser Leu Asn

180 185 190

Arg ser Pro Pro Ser Tyr Gly Ser His Pro Arg Gly Arg Ser Ser Asn

195 200 205

Asp Ser Tyr Ala Ser Tyr Gly Gly Pro Tyr Gly Gly Phe Asp Gly Gly

210 215 220

Tyr Gly His Pro Pro Gly Pro Ile Arg ser His Gly Gly Pro Ala Ser 225 230 235 240 Arg Tyr Ala Gly Gly Tyr Gly Tyr Gly Arg Gly Ser Val

245 250

Phe Gly Gly Gly Tyr Asn Asn Tyr Gly Gly Gly Ser Leu 260 265 Arg Asn Glu Pro Pro Leu Gly Tyr Ser ser Arg Phe Gly 275 280 285

Ser Gly Phe Gly Gly Glu Gly Tyr Gly Arg Gly Gly Glu

290 295 300

Leu Gly Tyr Pro Arg Gly Gly Gly Glu Gly Tyr Gly Gly 305 310 315

Pro Gly Tyr Gly Gly Ala Tyr Glu Ser Gly Gly Pro Gly

325 330

Glu Gly Ala Gly Gly Pro Tyr Gly Arg Gly Tyr Ser Ser 340 345

Tyr His Pro Tyr Ala Arg 355

<210> 29 <211> 500 <212> DNA

<213> Arabidopsis thaliana <400> 29

gaaggaaaaa gaaaaaacac aaatggaagg gaaagaggaa gaagcaaaga ggaggatgat 60 gatgaagatc aaacttaagg agacagaagc agacgtaagc caagacgaca ttaaaagaca 120 agaagcttac aacatgtctc cacgcgtacg tcgtggtggt ggtggtggcg gtggctcggt 180 aggtatgagc aagtcatcga gcgtgaggca aaactgttta tgcgcaccaa ctacacaccc 240 tggctccttc aggtgccgtt accaccgtcg taacgctgga ctcgggatgt ctcgtggcac 300 atccgttccc tctaaccttt ccatgttggc tggtggagac tctaattctc ccaagtgatg 360 attaatatat attatgtgtt tcttctcatc aatttaaaat tctcgtatgt gtctgtgtat 420 atacaaaaat gcataagtcg agaaatctct ggatattcac tttgctgttt gcacaaatga 480 aataaattca aatgatcgtg 500

<210> 30 <211> 111

Gly Pro Glu

255 Gly Gly Tyr 270

Pro Tyr Gly

Gly Ala Tyr

Tyr Gly Gly 320

Gly Ser Tyr 335

Ser Ser Arg 350 <212> PRT

<213> Arabidopsis thaliana <400> 30

Met Glu Gly Lys Glu Glu Glu Ala Lys Arg Arg Met Met Met Lys Ile 51 5 10 I5

Lys Leu Lys Glu Thr Glu Ala Asp Val Ser Gln Asp Asp Ile Lys Arg

25 30

Gln Glu Ala Tyr Asn Met Ser Pro Arg Val Arg Arg Gly Gly Gly Gly 40 45

Gly Gly Gly Ser Val Gly Met Ser Lys Ser Ser Ser Val Arg Gln Asn 50 55 60

Cys Leu Cys Ala Pro Thr Thr His Pro Gly Ser Phe Arg Cys Arg Tyr 65 70 75 80

His Arg Arg Asn Ala Gly Leu Gly Met Ser Arg Gly Thr Ser Val Pro 85 90 95

Ser Asn Leu Ser Met Leu Ala Gly Gly Asp Ser Asn Ser Pro Lys 100 105 110

<210> 31 <211> 2328 <212> DNA

<213> Arabidopsis thaliana <400> 31

atgaagagtt gcagaacctt aatttttgtg gcaataattc tcaacgggct gagtactttc 60 gttgcacatg ccggtgctga gagcaaggtt cacatagttt atttgggtga gaagcagcac 120 gatgatcccg agtttgtcac ggaatctcat catcggatgt tgtggtcact tcttggaagt 180 aaagaggatg cccatagttc aatggtccat agttaccgac atggcttctc gggttttgca 240 gccaagctta ccaagtccca agccaagaag cttgcagatt tacctgaagt tgttcacgtc 300 acgccggata gcttctacca actagataca actcggactt gggactactt aggcctttcc 360 gtcgccaatc ctaaaaatct tctaaatgac actaatatgg gtgaagaagt tatcattggc 420 attgtagact caggagtttg gccagaatct gaagtcttta atgacaatgg gattggacca 480 gtgccaagcc actggaaagg aggctgtgta tcaggagaga atttcacttc ctctcagtgc 540 aacaaaaagc ttataggagc caaatacttc atcaatgggt ttcttgcgac gcacgaaagc 600 ttcaactcca cagaatcact tgactttatt tcccctagag accgtagcgg acatggcacg 660 catgtagcca ccatagcggg tggttcctac gtgcctagca taagctacaa ggggttagct 720 ggagggactg tgagaggtgg ggcaccacgt gctcgtatag cgatgtacaa agcttgttgg 780 tatctagatc gttttgacat aaatacatgt tcatctgctg atatcttgaa agctatggat 840 gaagctatgc atgatggtgt tgatgttttg tccttgtcta tcggctatcg ttttccttac 900 ttcccagaaa ctgatgttcg cgccgtgata gccacgggag cattccatgc tgttttaaag 960 ggtatcacag ttgtttgttc gggaggtaac tctggtcctg cggctcagac tgtgggaaac 1020 acggctccat ggattttgac agtggctgca actactttag accgatcttt tcccacacct 1080 atcacacttg ggaacaataa actgatattg ggtcaagcaa tgtacaccgg tccagaactt 1140 ggcttcacta gcttggttta cccagagaat ccagggaaca gcaacgagag tttttctggt 1200 gactgtgagc ttctattttt caactccaat catacaatgg cggggaaagt cgtgttatgc 1260 ttcacaacat caacacgtta catcactgta tcaagtgctg tgtcttatgt gaaggaagct 1320 ggtggtcttg gcgtaattgt agcaagaaac cccggcgaca atctttcacc atgtgaagat 1380 gattttcctt gtgttgctgt tgactacgag cttgggacag atatactttt atacatacgt 1440 tccacaggat tacctgttgt gaagatacaa ccttctaaaa cacttgttgg acaaccagtg 1500 ggcacaaagg ttgcagattt ctcatcaaga ggacctaatt caattgagcc tgccatcctc 1560 aaaccggata tagcagcacc aggagtgagc atattagcgg ctacaactac caataaaact 1620 ttcaacgacc gaggattcat tttcttgtca gggacatcaa tggcagctcc taccatttca 1680 ggagttgttg ctcttctcaa agctctgcac cgtgattggt ctcctgctgc cattagatca 1740 gccattgtca ccacagcttg gagaacagat ccatttggag agcagatatt tgcagaaggg 1800 tcacctcgga agctagctga tccgtttgac tatggtggag gccttgtgaa tccagagaaa 1860 gctgcaaaac ctggtcttgt atatgacttg ggacttgaag actatgttct ctacatgtgc 1920 tctgttggtt acaacgagac atcaatctct caacttgtcg gaaaaggaac agtttgttcg 1980 aatcccaaac catctgttct tgattttaac ttgccttcca tcacaatccc aaacctcaaa 2040 gatgaagtca ctctcaccag aaccctcact aacgttggac aacttgagtc ggtctataaa 2100 gttgtgatcg agccaccgat aggcattcaa gtgactgtga caccagagac gcttctgttt 2160 aactctacaa ccaaaagggt ctcttttaaa gtcaaagttt cgaccacaca caaaatcaac 2220 acaggttact tctttggaag cttgacttgg agtgactctc tacataatgt gaccattcct 2280 ctctctgtga gaactcaaat tttgcagaac tactacgatg aaaactga 2328

<210> 32 <211> 775 <212> PRT <213> Arabidopsis thaliana <400> 32

Met Lys ser Cys Arg Thr Leu Ile Phe Val Ala Ile Ile Leu Asn Gly 10 15

Leu ser Thr Phe Val Ala His Ala Gly Ala Glu Ser Lys vai His Ile

25 30

vai Tyr Leu Gly Glu Lys Gln His Asp Asp Pro Glu Phe Val Thr Glu

40 45

Ser His His Arg Met Leu Trp Ser Leu Leu Gly Ser Lys Glu Asp Ala

50 55 60

His Ser ser Met Val His Ser Tyr Arg His Gly Phe Ser Gly Phe Ala 65 70 75 80

Ala Lys Leu Thr Lys Ser Gln Ala Lys Lys Leu Ala Asp Leu Pro Glu

85 90 95

Val vai His Val Thr Pro Asp Ser Phe Tyr Gln Leu Asp Thr Thr Arg

100 105 110

Thr Trp Asp Tyr Leu Gly Leu Ser vai Ala Asn Pro Lys Asn Leu Leu

115 120 125

Asn Asp Thr Asn Met Gly Glu Glu vai Ile Ile Gly Ile Val Asp Ser

130 135 140

Gly Val Trp Pro Glu Ser Glu Val Phe Asn Asp Asn Gly Ile Gly Pro 145 150 155 160

Val Pro ser His Trp Lys Gly Gly Cys Val ser Gly Glu Asn Phe Thr

165 170 175

Ser ser Gln Cys Asn Lys Lys Leu Ile Gly Ala Lys Tyr Phe Ile Asn

180 185 190

Gly Phe Leu Ala Thr His Glu Ser Phe Asn ser Thr Glu Ser Leu Asp

195 200 205

Phe Ile Ser Pro Arg Asp Arg Ser Gly His Gly Thr His Val Ala Thr

210 215 220

Ile Ala Gly Gly ser Tyr vai Pro Ser Ile Ser Tyr Lys Gly Leu Ala 225 230 235 240 Gly Gly Thr Val Arg Gly Gly Ala Pro Arg Ala Arg Ile Ala Met Tyr

245 250 255

Lys Ala Cys Trp Tyr Leu Asp Arg Phe Asp Ile Asn Thr Cys Ser ser 260 265 270

Ala Asp Ile Leu Lys Ala Met Asp Glu Ala Met His Asp Gly vai Asp 275 280 285

Val Leu Ser Leu Ser Ile Gly Tyr Arg Phe Pro Tyr Phe Pro Glu Thr

290 295 300

Asp vai Arg Ala vai Ile Ala Thr Gly Ala Phe His Ala Val Leu Lys 305 310 315 320

Gly Ile Thr Val Val Cys Ser Gly Gly Asn ser Gly Pro Ala Ala Gln

325 330 335

Thr vai Gly Asn Thr Ala Pro Trp Ile Leu Thr vai Ala Ala Thr Thr 340 345 350

Leu Asp Arg ser Phe Pro Thr Pro Ile Thr Leu Gly Asn Asn Lys Leu 355 360 365

Ile Leu Gly Gln Ala Met Tyr Thr Gly Pro Glu Leu Gly Phe Thr ser

370 375 380

Leu vai Tyr Pro Glu Asn Pro Gly Asn Ser Asn Glu Ser Phe Ser Gly 385 390 395 400

Asp Cys Glu Leu Leu Phe Phe Asn Ser Asn His Thr Met Ala Gly Lys

405 410 415

Val vai Leu Cys Phe Thr Thr Ser Thr Arg Tyr Ile Thr vai Ser Ser

420 425 430

Ala Val Ser Tyr vai Lys Glu Ala Gly Gly Leu Gly vai Ile vai Ala

435 440 445

Arg Asn Pro Gly Asp Asn Leu Ser Pro Cys Glu Asp Asp Phe Pro Cys

450 455 460

Val Ala Val Asp Tyr Glu Leu Gly Thr Asp Ile Leu Leu Tyr Ile Arg 465 470 475 480

Ser Thr Gly Leu Pro Val Val Lys Ile Gln Pro Ser Lys Thr Leu Val 485 490 495 Gly Gln Pro Val Gly Thr Lys Val Ala Asp Phe ser Ser Arg Gly Pro

500 505 510

Asn ser Ile Glu Pro Ala Ile Leu Lys Pro Asp Ile Ala Ala Pro Gly

515 520 525

Val ser Ile Leu Ala Ala Thr Thr Thr Asn Lys Thr Phe Asn Asp Arg

530 535 540

Gly Phe Ile Phe Leu Ser Gly Thr Ser Met Ala Ala Pro Thr Ile Ser 545 550 555 560

Gly vai vai Ala Leu Leu Lys Ala Leu His Arg Asp Trp Ser Pro Ala

565 570 575

Ala Ile Arg ser Ala Ile Val Thr Thr Ala Trp Arg Thr Asp Pro Phe

580 585 590

Gly Glu Gln Ile Phe Ala Glu Gly Ser Pro Arg Lys Leu Ala Asp Pro

595 600 605

Phe Asp Tyr Gly Gly Gly Leu Val Asn Pro Glu Lys Ala Ala Lys Pro

610 615 620

Gly Leu Val Tyr Asp Leu Gly Leu Glu Asp Tyr Val Leu Tyr Met Cys 625 630 635 640

Ser vai Gly Tyr Asn Glu Thr Ser Ile Ser Gln Leu Val Gly Lys Gly

645 650 655

Thr vai Cys Ser Asn Pro Lys Pro Ser vai Leu Asp Phe Asn Leu Pro

660 665 670

Ser lie Thr Ile Pro Asn Leu Lys Asp Glu Val Thr Leu Thr Arg Thr

675 680 685

Leu Thr Asn Val Gly Gln Leu Glu Ser vai Tyr Lys Val vai Ile Glu

690 695 700

Pro Pro Ile Gly Ile Gln Val Thr Val Thr Pro Glu Thr Leu Leu Phe 705 710 715 720

Asn Ser Thr Thr Lys Arg vai Ser Phe Lys Val Lys Val ser Thr Thr

725 730 735

His Lys Ile Asn Thr Gly Tyr Phe Phe Gly Ser Leu Thr Trp Ser Asp 740 745 750 10

ser Leu His Asn vai Thr Ile Pro Leu ser vai Arg Thr Gln Ile Leu

755 760 765

Gln Asn Tyr Tyr Asp Glu Asn 770 775

<210> 33 <211> 1140 <212> DNA

<213> Arabidopsis thaliana <400> 33

atggaatatg gagaagaacc ctcgattaaa agatttctaa tgcttcctga tgatttggta 60 tttaactgct tagctcgcgt ctcaagatta cattatccaa ctctctcatt agtctccaaa 120 aaatttcgct ttcttcttgc ttcaaaggag ctttaccaaa cccgaatcct cttaggcgga 180 acggagagtt gtctttacgt gtgcgtacga ctccataccg attctgaaca actacattgg 240 ttcattatct accagggacc aaatagctcc aaaaaagttt tggtcccgat ttcatctccc 300 aattttactt ccgcagccct gccgggtttt gtagtggtcg gtcatgagat atatgccatt 360 ggcggtggat cagagaataa aaacgcttcg ataaatgcaa ctggatcaaa gacttataac 420 gctttgtcta gcgttatggt tatggactct cgttctcaca catggcgtga agctccaagc 480 atgcgggtgg cccgtgtgtt tccatctgct tgtaccctcg atgggagaat atatgttacg 540 ggaggctgcg aaaatctcaa ttcaatgaat tggatggaga tttttgatac gaagactcaa 600 acttgggagt ttttacagat ccctagcgag gaggtatgca aaggctctga gtacttaagc 660 ataagttatc aaagaaccgt ctatgtaggg tctagggaaa aagatgtcac ttacaagatg 720 cataaaggta aatggagagg ggcagacata tgcctgaatc atggatggag tctggatcca 780 tcatcttgtt gtgtgataga gaacgtgttc taccgttgca gtcttgggga tgtacgttgg 840 tatgacctca agaaaagaga atgggcagct ttgaagggtt tggaaggact gcctactttt 900 actaattatt atagaaattt taaatcggcg gatcattgtg gaaaattggc gatttcttgg 960 gaggagtatg tgttagttga tgacgaaaca aagatttggt gtgcggaaat tgcgattcaa 1020 aaacgccaaa atggagaaat ttggggaacg cttgagtggt ttgacaatgt gtttatatcc 1080 agtggaccaa accgtcatgt ggatttatta gtgaatgctc ttactgcaac agtttggtga 1140 <210> 34 <211> 379 <212> PRT

<213> Arabidopsis thaliana <400> 34

Met Glu Tyr Gly Glu Glu Pro Ser Ile Lys Arg Phe Leu Met Leu Pro 1 5 10 15

Asp Asp Leu vai Phe Asn Cys Leu Ala Arg vai ser Arg Leu His Tyr

25 30

Pro Thr Leu ser Leu Val Ser Lys Lys Phe Arg Phe Leu Leu Ala Ser

40 45

Lys Glu Leu Tyr Gln Thr Arg Ile Leu Leu Gly Gly Thr Glu Ser Cys

50 55 60

Leu Tyr Val Cys Val Arg Leu His Thr Asp Ser Glu Gln Leu His Trp 65 70 75 80

Phe Ile Ile Tyr Gln Gly Pro Asn ser ser Lys Lys Val Leu Val Pro

85 90 95

Ile ser Ser Pro Asn Phe Thr Ser Ala Ala Leu Pro Gly Phe Val Val

100 105 110

vai Gly His Glu Ile Tyr Ala Ile Gly Gly Gly Ser Glu Asn Lys Asn

115 120 125

Ala ser Ile Asn Ala Thr Gly ser Lys Thr Tyr Asn Ala Leu Ser Ser

130 135 140

Val Met vai Met Asp ser Arg ser His Thr Trp Arg Glu Ala Pro Ser 145 150 155 160

Met Arg Val Ala Arg Val Phe Pro Ser Ala Cys Thr Leu Asp Gly Arg

165 170 175

Ile Tyr vai Thr Gly Gly Cys Glu Asn Leu Asn Ser Met Asn Trp Met

180 185 190

Glu Ile Phe Asp Thr Lys Thr Gln Thr Trp Glu Phe Leu Gln Ile Pro

195 200 205

ser Glu Glu vai Cys Lys Gly ser Glu Tyr Leu Ser Ile ser Tyr Gln

210 215 220

Arg Thr vai Tyr Val Gly Ser Arg Glu Lys Asp Val Thr Tyr Lys Met 225 230 235 240

His Lys Gly Lys Trp Arg Gly Ala Asp Ile Cys Leu Asn His Gly Trp 245 250 255

Ser Leu Asp Pro ser Ser Cys Cys vai Ile Glu Asn Val Phe Tyr Arg

260 265 270

Cys Ser Leu Gly Asp vai Arg Trp Tyr Asp Leu Lys Lys Arg Glu Trp

275 280 285

Ala Ala Leu Lys Gly Leu Glu Gly Leu Pro Thr Phe Thr Asn Tyr Tyr

290 295 300

Arg Asn Phe Lys Ser Ala Asp His Cys Gly Lys Leu Ala Ile Ser Trp 305 BlO 315 320

Glu Glu Tyr Val Leu Val Asp Asp Glu Thr Lys Ile Trp Cys Ala Glu

325 330 335

Ile Ala Ile Gln Lys Arg Gln Asn Gly Glu He Trp Gly Thr Leu Glu

340 345 350

Trp Phe Asp Asn vai Phe Ile Ser ser Gly Pro Asn Arg His Val Asp

355 360 365

Leu Leu vai Asn Ala Leu Thr Ala Thr vai Trp 370 375

Claims

1. Planta transgênica, que compreende um vetor de transforma- ção de plantas que compreende uma seqüência de nucleotídeos que codifi- ca ou é complementar a uma seqüência que codifica um polipeptídeo HIO que compreende a seqüência de aminoácidos que é apresentada na SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32 ou SEQ ID NO: 34 ou um ortólogo ou um parálo- go da mesma, através do que a planta transgênica possui um fenótipo de maior conteúdo de óleo ou um fenótipo de maior qualidade de farinha, em relação às plantas de controle.

2. Planta transgênica de acordo com a reivindicação 1, que é selecionada do grupo que consiste em plantas de espécies de Brassica, in- cluindo canola e semente de colza, soja, milho, girassol, algodão, cacau, açafroa, dendezeiro, coqueiro, linho, mamona, amendoim, trigo, aveia e ar- roz.

3. Parte da planta obtida da planta como definida na reivindica- ção 1.

4. Parte da planta de acordo com a reivindicação 3, que é uma semente.

5. Farinha, produto alimentício ou alimento produzido partindo da semente como definida na reivindicação 4.

6. Processo de produção de óleo que compreende o cultivo da planta transgênica como definida na reivindicação 1, e a recuperação do ó- Ieo da dita planta.

7. Processo de acordo com a reivindicação 6, em que o óleo é recuperado de uma semente da planta.

8. Processo de produção de maior conteúdo de óleo em uma planta, o dito processo compreendendo: a) a introdução nas células progenitoras da planta de um vetor de trans- formação de plantas que compreende uma seqüência de nucleotídeos b) que codifica ou é complementar a uma seqüência que codifica um poli- peptídeo HIO que compreende a seqüência de aminoácidos que é a- presentada na SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO:16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32 ou SEQ ID NO: 34 ou um ortólogo ou um parálogo da mesma e c) o cultivo das células progenitoras transformadas para produzir uma planta transgênica, em que a dita seqüência de polinucleotídeo é ex- pressa e a dita planta transgênica exibe um fenótipo de maior conteúdo de óleo em relação às plantas de controle.

9. Planta obtida através de um processo como definido na rei- vindicação 8.

10. Planta de acordo com a reivindicação 9, que é selecionada do grupo que consiste em plantas das espécies de Brassica, incluindo cano- Ia e semente de colza, soja, milho, girassol, algodão, cacau, açafroa, dende- zeiro, coqueiro, linho, mamona, amendoim, trigo, aveia e arroz.

11. Planta de acordo com a reivindicação 9, em que a planta é selecionada do grupo que consiste em uma planta crescida partindo das di- tas células progenitoras, uma planta que é a progênie direta de uma planta crescida partindo das ditas células progenitoras e uma planta que é a progê- nie indireta de uma planta crescida partindo das ditas células progenitoras.

12. Processo de produção de uma planta que possui um maior conteúdo de óleo, que compreende a identificação de uma planta que possui um alelo em seu gene HIO que resulta no maior conteúdo de óleo compara- da a plantas que não possuem o alelo e a produção de progênie da dita planta identificada, em que a progênie gerada herda o alelo e possui o fenó- tipo de alto conteúdo de óleo.

13. Processo de acordo com a reivindicação 12 que emprega metodologia de gene/QTL candidato.

14. Processo de acordo com a reivindicação 12 que emprega a metodologia de TILLING.

15. Produto alimentício, farinha, grão, alimento ou semente que compreende um polipeptídeo codificado pela seqüência de ácido nucleico que é apresentada na SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31 ou SEQ ID NO: 33.

16. Produto alimentício, farinha, grão, alimento ou semente que compreende um polipeptídeo que compreende uma seqüência de aminoáci- dos que é apresentada na SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32 ou SEQ ID NO: 34 ou um ortólogo ou um parálogo da mesma.

17. Planta transgênica de acordo com a reivindicação 1, em que um fenótipo de maior qualidade de farinha compreende um aumento na e- nergia que pode ser metabolizada disponível na farinha produzida partindo das sementes da planta transgênica, em relação às plantas de controle.

18. Planta transgênica de acordo com a reivindicação 17, em que um aumento na energia que pode ser metabolizada disponível compre- ende um conteúdo alterado de proteínas e/ou de fibras nas sementes da planta transgênica.

19. Planta transgênica de acordo com a reivindicação 18, em que o conteúdo de proteínas é aumentado e/ou o conteúdo de fibras é dimi- nuído.

20. Planta transgênica de acordo com a reivindicação 17, em que um aumento na energia que pode ser metabolizada disponível compre- ende um menor conteúdo de fibras nas sementes da planta transgênica.

21. Processo de produção de farinha, que compreende o cultivo da planta transgênica como definida na reivindicação 1, e a recuperação da farinha da planta, produzindo assim a farinha.

22. Processo de acordo com a reivindicação 21, em que a fari- nha é produzida partindo de sementes da planta.

23. Processo de produção de um fenótipo de maior qualidade de farinha em uma planta, o dito processo compreendendo: a) a introdução nas células progenitoras da planta de um vetor de transformação de plantas que compreende uma seqüência de nucleotí- deos que codifica ou é complementar a uma seqüência que codifica um poli- peptídeo HIO que compreende a seqüência de aminoácidos apresentada na SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO:28, SEQ ID NO: 30, SEQ ID NO: 32 ou SEQ ID NO: 34 ou um ortólogo ou um parálogo da mesma e b) o cultivo das células progenitoras transformadas para produzir uma planta transgênica, em que a seqüência de nucleotídeos é expressa e a planta transgênica exibe um fenótipo de maior qualidade de farinha em rela- ção às plantas de controle, produzindo assim o fenótipo de maior qualidade de farinha na planta.

24. Planta obtida através de um processo como definido na rei- vindicação 23.

25. Planta de acordo com a reivindicação 24, que é selecionada do grupo que consiste em plantas das espécies de Brassica, incluindo cano- Ia e semente de colza, soja, milho, girassol, algodão, cacau, açafroa, dende- zeiro, coqueiro, linho, mamona, amendoim, trigo, aveia e arroz.

26. Planta de acordo com a reivindicação 24, em que a planta é selecionada do grupo que consiste em uma planta crescida partindo das di- tas células progenitoras, uma planta que é a progênie direta de uma planta crescida partindo das ditas células progenitoras e uma planta que é a progê- nie indireta de uma planta crescida partindo das ditas células progenitoras.

27. Processo de produção de uma planta que possui um fenótipo de maior qualidade de farinha que compreende a identificação de uma plan- ta que possui um alelo em seu gene HIO que resulta na melhor qualidade de farinha, comparada a plantas que não possuem o alelo e a produção da pro- gênie da dita planta identificada, em que a progênie gerada herda o alelo e possui a qualidade de farinha melhorada, gerando assim uma planta que possui um fenótipo de maior qua- Iidade de farinha.

28. Processo de acordo com a reivindicação 27 que emprega a metodologia de gene/QTL candidato.

29. Processo de acordo com a reivindicação 27 que emprega a metodologia de TILLING.