BRPI0612710A2 - método para aumentar o rendimento de plantas com relação às plantas de controle, e para produzir uma planta transgênica tendo rendimento aumentado, planta, construção, partes coletáveis de uma planta, produtos, e, uso de um ácido nucleico / gene de tipo ste20 ou variante do mesmo, ou uso de um polipeptìdeo de tipo ste20 ou seu homólogo - Google Patents

método para aumentar o rendimento de plantas com relação às plantas de controle, e para produzir uma planta transgênica tendo rendimento aumentado, planta, construção, partes coletáveis de uma planta, produtos, e, uso de um ácido nucleico / gene de tipo ste20 ou variante do mesmo, ou uso de um polipeptìdeo de tipo ste20 ou seu homólogo Download PDF

Info

Publication number
BRPI0612710A2
BRPI0612710A2 BRPI0612710-0A BRPI0612710A BRPI0612710A2 BR PI0612710 A2 BRPI0612710 A2 BR PI0612710A2 BR PI0612710 A BRPI0612710 A BR PI0612710A BR PI0612710 A2 BRPI0612710 A2 BR PI0612710A2
Authority
BR
Brazil
Prior art keywords
leu
lys
glu
wing
plant
Prior art date
Application number
BRPI0612710-0A
Other languages
English (en)
Inventor
Christophe Reuzeau
Ana Isabel Sanz Molinero
Original Assignee
Cropdesign Nv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cropdesign Nv filed Critical Cropdesign Nv
Publication of BRPI0612710A2 publication Critical patent/BRPI0612710A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1205Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)

Abstract

MéTODOS PARA AUMENTAR O RENDIMENTO DE PLANTAS COM RELAçãO àS PLANTAS DE CONTROLE, E PARA PRODUZIR UMA PLANTA TRANSGêNICA TENDO RENDIMENTO AUMENTADO, PLANTA, CONSTRUçãO, PARTES COLETáVEIS DE UMA PLANTA, PRODUTOS, E, USO DE UM áCIDO NUCLEICO/GENE DE TIPO STE20 OU VARIANTE DO MESMO, OU USO DE UM POLIPEPTìDEO DE TIPO STE20 OU SE HOMóLOGO. A presente invenção refere-se a um método para aumentar o rendimento de plantas por modulação da expressão em uma planta de um ácido nucleico codificando um polipeptídeo de tipo Ste20 ou seu homólogo. Tal método compreende introduzir em uma planta um ácido nucleico de tipo Ste20 ou variante do mesmo. A invenção refere-se também às plantas transgênicas tendo introduzindo nas mesmas um ácido nucleico de tipo Ste20 ou variante do mesmo, cuja plantas têm um rendimento aumentado com relação às plantas de controle. A presente invenção refere-se também a construções utilizáveis nos métodos da invenção.

Description

"MÉTODOS PARA AUMENTAR O RENDIMENTO DE PLANTAS COM RELAÇÃO AS PLANTAS DE CONTROLE, E PARA PRODUZIR UMA PLANTA TRANSGÊNICA TENDO RENDIMENTO AUMENTADO, PLANTA, CONSTRUÇÃO, PARTES COLETÁVEIS DE UMA PLANTA, PRODUTOS, Es USO DE UM ÁCIDO NUCLEICO /GENE DE TIPO STE20 OU VARIANTE DO MESMO, OU USO DE UM POLIPEPTÍDEO DE TIPO STE20 OU SEU HOMÓLOGO"
A presente invenção refere-se geralmente ao campo de biologia molecular e refere-se a um método para aumentar o rendimento de plantas com relação às plantas de controle. Mais especificamente, a presente invenção refere-se a um método para aumentar o rendimento de plantas compreendendo modular a expressão em uma planta de um ácido nucleico codificando um polipeptídeo de tipo Ste20 ou seu homólogo. A presente invenção refere-se também a plantas tendo expressão modulada de um ácido nucleico codificando um polipeptídeo de tipo Ste20 ou seu homólogo, cujas plantas tem rendimento aumentado com relação a plantas de controle. A invenção também refere-se a construções utilizáveis nos método da invenção.
A população mundial em crescimento constante e o suprimento diminuído de terras aráveis disponíveis para agricultura impulsionam as pesquisas para melhorar a eficiência da agricultura. Os meios convencionais para melhorar a horticultura e as culturas utilizam técnicas de criação seletivas para identificar plantas tendo características desejáveis. No entanto, estas técnicas de criação seletivas tem vários inconvenientes, ou seja, que estas técnicas são tipicamente de largo emprego de mão de obra e resultam em plantas que com freqüência contém componentes genéticos heterogêneos que podem nem sempre resultar no traço desejável ser passado adiante das plantas parentais. Os avanços em biologia molecular tem permitido à humanidade modificar o germplasma de animais e plantas. A engenharia genética de plantas acarreta o isolamento e manipulação de material genetico (tipicamente na forma de DNA ou RNA) e a introdução subseqüente deste material genético em uma planta. Esta tecnologia tem a capacidade de distribuir culturas ou plantas tendo melhorados traços econômicos, agronômicos ou de horticultura. Um traço de particular interesse econômico é o rendimento, necessariamente relacionado com uma cultura específica, área e/ou período de tempo. O rendimento é normalmente definido como a produtividade mensurável de valor econômico de uma cultura. Isto pode ser definido em termos de quantidade e/ou qualidade. O rendimento é diretamente dependente de vários fatores, por exemplo, o número e tamanho dos órgãos, arquitetura das plantas, (por exemplo o número de galhos), a produção de sementes e mais. O desenvolvimento de raízes, absorção de nutrientes e tolerância ao estresse podem ser também fatores importantes na determinação do rendimento. A otimização de um dos fatores acima mencionados pode assim contribuir para o aumento do rendimento da cultura.
A biomassa de plantas é o rendimento para culturas de forragem como alfafa, milho para silagem e feno. Muitas proxias para o rendimento tem sido usadas em culturas de grãos. A principal entre estas são as estimativas do tamanho das plantas. O tamanho das plantas pode ser medido em muitos modos dependendo da espécie e estágio de desenvolvimento, mas incluem peso seco de planta total, peso seco acima da terra, peso fresco acima da terra, área de folhas, volume do talo, altura da planta, diâmetro da roseta, comprimento da folha, comprimento da raiz, massa da raiz, número de rebentos, e número de folhas. Muitas espécies mantém uma relação conservativa entre o tamanho de partes diferentes da planta em um dado estágio de desenvolvimento. Estas relações alométricas são usadas para extrapolar de uma destas medidas de tamanho para outra (por exemplo Tittonell et al 2005 Agric Ecosys & Environ 105: 213). O tamanho da planta em um estágio de desenvolvimento iniciai irá tipicamente correlacionar com o tamanho da planta depois no desenvolvimento. Uma planta maior com uma area de folha maior pode tipicamente absorver mais luz e dióxido de carbono do que uma planta menor e, assim, irá provavelmente ganhar um maior peso durante o mesmo período (Fasoula & Tollenaar 2005 Maydica 50:39). Isto está em adição à continuação potencial da vantagem genética ou micro- ambiental que a planta precisa alcançar o tamanho maior inicialmente. Existe um componente genético forte para a taxa de crescimento e tamanho da planta (por exemplo ter Steege et al 2005 Plant Physiology 139:1078) e assim para uma faixa de diversos genótipos, tamanho de planta sob uma condição ambiental irá provavelmente estar correlacionado com o tamanho sob outra (Hittalmani et al 2003 Theoretical Applied Genetics 107:679). Deste modo, um meio padrão é usado como uma proxia para os meios diversos e dinâmicos encontrados em diferentes locais e tempos de culturas no campo.
O índice de colheita, a relação de rendimento de semente para peso seco acima da terra, é relativamente estável sob muitas condições ambientais e assim uma correlação robusta entre o tamanho de planta e o rendimento do grão pode ser obtido com freqüência (por exemplo Rebetzke et al 2002 Crop Science 42:739). Estes processos são intrinsecamente ligados porque a maior parte da biomassa de grãos é dependente de produtividade fotossintética corrente ou armazenada pelas folhas e caule da planta. (Gardener et al 1985 Physiology of Crop Plants. Iowa State University Press, pp68-73) Assim, a seleção para tamanho da planta, mesmo em estágios iniciais de desenvolvimento, tem sido usada como um indicador para o rendimento potencial futuro (por exemplo Tittonell et al 2005 Agric Ecosys & Environ 105: 213). Quando testando o impacto de diferenças genéticas em tolerância ao estresse, a capacidade de padronizar as propriedades do solo, temperatura, e disponibilidade de água e nutrientes e intensidade da luz é uma vantagem intrínseca de estufa ou meios de câmara de crescimento de plantas comparado com o campo. No entanto, as limitações artificiais no rendimento devido a uma fraca polinização devido à ausência de vento ou insetos, ou espaço insuficiente para crescimento de canopia ou raiz madura, podem limitar o uso destes meios controlados para testar as diferenças de rendimento. Assim, medidas de tamanho de plantas em desenvolvimento inicial, sob condições padronizadas em uma câmara de crescimento ou estufa, são práticas padrões para prover indicação de vantagens de rendimento genético potencial.
O rendimento da semente é um traço particularmente importante porque as sementes de muitas plantas são importantes para nutrição humana e animal. As culturas, como milho, arroz, trigo, canola e soja perfazem uma metade da ingestão calórica humana total, seja através do consumo direto das próprias sementes ou através do consumo de produtos de carne criados em sementes processadas. Elas são também uma fonte de açúcares, óleos e muitos tipos de metabólitos usados em processos industriais.
As sementes contém um embrião (a fonte de novos brotos e raízes) e um endosperma (a fonte de nutrientes para crescimento do embrião durante a germinação e durante o crescimento inicial das mudinhas). O desenvolvimento de uma semente envolve muitos genes e requer a transferência de metabólitos de raízes, folhas, e caules na semente em crescimento. O endosperma, particularmente, assimila os precursores metabólicos de carboidratos, óleos e proteínas e sintetiza os mesmos em macromoléculas de armazenamento para encher o grão. A capacidade de aumentar o rendimento das sementes de plantas, seja através do número de sementes, biomassa de sementes, desenvolvimento das sementes, enchimento das sementes, ou qualquer outro traço relacionado com a semente pode ter muitas aplicações em agricultura, e mesmo muitos usos não agrícolas, como na produção biotecnológica de substâncias como fármacos, anticorpos ou vacinas.
Ste20 é uma Ser/Thr quinase pertencendo ao grupo de MAP4 quinases (MAP4Ks, MAP quinase quinase quinase quinases, ou MAP3K quinases), e foi pela primeira vez isolada de trigo. MAP4Ks são quinases que ativam cascatas de MAP quinase por fosforilação direta de MAP3Ks. Um recente estudo filogenético discriminou 6 grupos principais de MAP4Ks, dentre os quais o grupo STE20/PAK de MAP4Ks (Champion et al, Trends Plant Sci. 9, 123-129, 2004). A maior parte das MAP4Ks tem um domínio catalítico N-terminal, apesar de proteínas de plantas homólogas a Ste20 poderem ter uma organização diferente. Os membros do grupo Ste20 de quinases atuam, como se acredita, como reguladores de cascatas de MAP quinase (Dan et al., Trends Cell Biol. 11, 220-230, 2001), e atuam, com se p acredita, em particular sobre MAP3 quinases dos tipos MEKK e Raf, a jusante das proteínas G (Champion et al., 2004). Ste20 de levedura desempenha um papel em várias vias de sinalização, por exemplo, Cândida Ste20 foi mostrado como estando evolvida em sinalização de fernomônios, crescimento invasivo, resposta a estresse hipertônico, integridade da parede celular e na ligação de CDC42, requerido para morfogênese polarizada (Calcagno et al., Yeast 21, 557-568, 2004). Em Drosophilav o homólogo de Ste20 Hippo é relatado como estando envolvido na progressão do ciclo celular (Udan et al., Nat. Cell Biol. 5, 853-855, 2003). Em geral, os efeitos de sinalização dirigida a STE20/PAK parecerem ser eventos nucleares que influenciam expressão de genes por um lado, e os eventos citoesqueletais que impactam a dinâmica celular (Bagrodia e Cerione, Trends Cell Biol. 9, 350- 355, 1999). Apesar de Ste20 e proteínas relacionadas serem relativamente bem estudados em leveduras, Drosophila e em mamíferos, pouco ou nada é conhecido sobre os homólogos de plantas de levedura Ste20. Leprince et al. (Biochim. Biophys. Acta 1444, 1-13, 1999) caracterizaram um MAP4K de Brassica napus. Sua expressão pareceu regulada pelo ciclo celular e transcritos foram relatados como sendo mais abundantes em raízes, sílicas e brotos de flores. No entanto, não foram descritos mutantes ou plantas transgênicas. De modo surpreendente, foi verificado que a modulação da expressão em uma planta de um ácido nucleico codificando um polipeptídeo de tipo Ste20 ou seu homólogo fornece plantas tendo rendimento aumentado com relação às plantas de controle. Preferivelmente, o polipeptídeo de tipo Ste20 ou seu homólogo é de origem em planta.
Assim, a invenção provê um método para aumentar o rendimento das plantas, compreendendo modular a expressão em uma planta de um ácido nucleico codificando um polipeptídeo de tipo Ste20 ou seu homólogo.
Com vantagem, o desempenho dos métodos de acordo com a presente invenção resulta em plantas tendo aumentado rendimento, particularmente rendimento de sementes, com relação às plantas de controle.
A escolha de plantas de controle é uma parte de rotina da configuração experimental e pode incluir plantas de tipo selvagem correspondentes ou plantas correspondentes sem o gene de interesse. A planta de controle é tipicamente da mesma espécie de planta ou mesmo da mesma variedade que a planta a ser comparada. A planta de controle pode ser também um multizigoto da planta a ser comparada. Os nulizigotos são indivíduos faltando o transgene por segregação. Uma "planta de controle" como usado aqui refere-se não somente às plantas completas, mas também a partes de plantas, incluindo sementes e partes de sementes.
Uma "referência", "planta de referência", "planta de controle", tipo selvagem", ou "planta de tipo selvagem" é particularmente uma célula, um tecido, um órgão, uma planta, ou uma parte da mesma, que não foi produzida de acordo com o método da invenção. Assim, os termos "tipo selvagem", "controle" ou "referência" são interpermutáveis e podem ser uma célula ou uma parte da planta como um organelo ou tecido, ou uma planta, que não foi modificada ou tratada de acordo com o método aqui descrito de acordo com a invenção. Assim, a célula ou parte da planta como um organelo ou uma planta usada como tipo selvagem, controle ou referência corresponde à célula, planta ou parte da mesma como possível ou está em qualquer outra propriedade mas no resultado do processo da invenção como idêntica ao assunto da invenção na medida do possível. Assim, o tipo selvagem, controle ou referência é tratado de modo idêntico ou tão idêntico como possível, isto é que somente condições ou propriedades podem ser diferentes que não influenciam a qualidade da propriedade testada. Isto significa, em outras palavras, que tipo selvagem denota (1) uma planta, que transporta a forma não alterada ou não modulada de um gene ou alelo ou (2) o material de partida /planta da qual as plantas produzidas pelo processo ou método da invenção são derivadas.
Preferivelmente, qualquer comparação entre plantas de tipo selvagem e plantas produzida pelo método da invenção é realizada sob condições análogas. O termo "condições análogas" significa que todas as condições como, por exemplo, condições de cultura ou crescimento, condições de teste (como composição de tampão, temperatura, substratos, cepa de patógeno, concentrações e outros) são mantidas idênticas entre as experiências a serem comparadas.
A "referência", "controle" ou "tipo selvagem" é preferivelmente um indivíduo, por exemplo, um organelo, uma célula, um tecido, uma planta que não foi modulada, modificada ou tratada de acordo com o processo aqui descrito da invenção e é em qualquer outra propriedade tão similar ao assunto da invenção como possível. A referência, controle ou tipo selvagem está em seu genoma,
transcriptoma, proteoma ou metaboloma tão similar como possível ao assunto da presente invenção. Preferivelmente, os termos organelo, célula, tecido ou planta de "referência", "controle" ou "tipo selvagem" referem-se a um organelo, célula, tecido ou planta que são quase geneticamente idênticos ao organelo, célula, tecido ou planta da presente invenção ou uma parte dos mesmos, preferivelmente 95%, mais preferido são 98%, ainda mais preferido são 99,00%, em particular 99,10%, 99,30%, 99,50%, 99,70%, 99,90%, 99,99%, 99, 999% ou mais. Mais preferível, "referência", "controle" ou "tipo selvagem" é preferivelmente um indivíduo, por exemplo, um organelo, uma célula, um tecido, uma planta que é geneticamente idêntico à planta, organelo de célula usado de acordo com o método da invenção exceto que as moléculas de ácido nucleico do produto de gene codificado pelos mesmos são mudadas, moduladas ou modificadas de acordo com o método da invenção.
Em caso, um controle, referência ou tipo selvagem diferindo do indivíduo da presente invenção somente por não ser submetido ao método da invenção não pode ser provido, um controle, referência ou tipo selvagem pode ser uma planta em que a causa para a modulação da atividade conferindo o aumento dos metabólitos, como descrito nos exemplos.
O termo "rendimento", em geral, significa uma produção mensurável de valor econômico, necessariamente relacionada com uma cultura especificada, a uma área e a um período de tempo. AS partes de plantas individuais diretamente contribuem para o rendimento com base em seu número, tamanho e/ou peso. Apesar do rendimento real ser o rendimento por acre para uma cultura e ano, que é determinado por divisão da produção total (inclui tanto a produção coletada como a estimada) por acres plantados.
Os termos "aumentar", "melhorando" ou "melhorar" são interpermutáveis e devem significar no sentido da aplicação de pelo menos a 5%, 6%, 7%, 8%, 9% ou 10%, preferivelmente pelo menos 15% ou 20%, mais preferivelmente 25%, 30%, 35% ou 40% mais produção e/ou crescimento em comparação com a planta de tipo selvagem como aqui definido.
O aumento referido à atividade das quantidades de polipeptídeo em uma célula, tecido, organelo, órgão ou organismo ou uma parte dos mesmos e preferivelmente a pelo menos 5%, preferivelmente a pelo menos 10% ou a pelo menos 15%, especialmente preferivelmente a pelo menos 20%, 25%, 30% ou mais, muito especialmente preferivelmente são a pelo menos 40%, 50% ou 60%, o mais preferivelmente são a pelo menos 70%) ou mais em comparação com o controle, referência ou tipo selvagem.
O termo "rendimento aumentado" como definido aqui é tomado para significar um aumento na biomassa (peso) de uma ou mais partes de uma planta, que pode incluir as partes acima da terra (coletável) e/ou partes abaixo da terra (coletáveis).
Particularmente, estas partes coletáveis são sementes e biomassa de folhas, o desempenho dos métodos da invenção resulta em plantas tendo aumentada biomassa das folhas e aumentada produção de sementes com relação ao rendimento de sementes de plantas de controle.
O rendimento aumentado de sementes pode se manifestar como um ou mais dos seguintes: a) um aumento na biomassa da semente (peso de semente total) que pode ser em uma base de semente individual e/ou por planta e/ou por hectare ou acre; b) aumentado número de flores por planta; c) aumentado número de sementes (cheias); d) aumentada taxa de enchimento de sementes (que é expressado como a relação entre o número de sementes cheias dividido pelo número total de sementes; e) aumentado índice de colheita, que é expressado como uma relação do rendimento de partes coletáveis, como sementes, dividido pela biomassa total; e f) peso de mil grãos aumentado (TKW), o que é extrapolado do número de sementes cheias contadas e seu peso total. Um TKW aumentado pode resultar de um tamanho de semente aumentado e/ou peso de semente, e também pode resultar de um aumento no tamanho do embrião e/ou endosperma.
O termo "expressão" ou "expressão de genes" significa o aparecimento de um traço fenotípico como uma conseqüência da transcrição de um gene específico ou genes específicos. O termo "expressão" ou "expressão de genes" particularmente significa a transcrição de um gene ou genes em RNA estrutural (rRNA, tRNA) ou mRNA com subseqüente tradução do último em uma proteína. O processo inclui a transcrição de DNA5 processamento do produto de mRNA resultante e sua tradução em uma proteína ativa.
O termo "modulação" significa em relação à expressão ou expressão de genes, um processo em que o nível de expressão é mudado pela referida expressão de genes em comparação com a planta de controle, preferivelmente o nível de expressão é aumentado. A expressão original, não modulada, pode ser de qualquer tipo de expressão de um RNA estrutural (rRNA, tRNA) ou mRNA com subseqüente tradução. O termo "modulação da atividade" deve significar qualquer mudança da expressão das seqüências de ácido nucleico da invenção ou proteínas codificadas, que leva a um rendimento aumentado e/ou crescimento aumentado das plantas.
Um aumento na produção de sementes pode ser também manifestado como um aumento no tamanho de sementes e/ou volume de sementes que pode também influenciar a composição de sementes (incluindo teor total e composição de óleo, proteína e carboidratos). Além disso, um aumento no rendimento de sementes também pode se manifestar como um aumento na área de sementes e/ou comprimento das sementes e/ou largura das sementes e/ou perímetro das sementes. O rendimento aumentado pode também resultar em arquitetura modificada, ou pode ocorrer devido a uma arquitetura modificada.
Tomando-se milho como exemplo, um aumento no rendimento pode ser manifestado como um ou mais dos seguintes: aumento no número de plantas por hectare ou acre, aumento no número de espigas por planta, aumento no número de fileiras, número de grãos por fileira, peso do grão, peso de mil grãos, comprimento/ diâmetro da espiga, aumento na taxa de enchimento da semente (que é o número de sementes cheias dividido pelo número total de sementes e multiplicado por 100), entre outros. Tomando arroz como um exemplo, um aumento no rendimento pode se manifestar como um aumento em um ou mais dos seguintes: número de plantas por hectare ou acre, número de panículas por planta, número de espiguetas por panícula, número de flores (floretes) por panícula, (que é expressado como uma relação do número de sementes cheias sobre o número de panículas primárias), aumento na taxa de enchimento das sementes (que é o número de sementes cheias dividido pelo número total de sementes e multiplicado por 100), aumento no peso de mil grãos, dentre outros. Um aumento no rendimento também pode resultar em arquitetura modificada, ou pode ocorrer como um resultado da arquitetura modificada.
De acordo com um aspecto preferido, o desempenho dos método da invenção resulta em plantas tendo produção aumentada, particularmente rendimento das sementes. Assim, de acordo com a presente invenção, provê-se um método para aumentar o rendimento de plantas, cujo método compreende modular a expressão em uma planta de um ácido nucleico codificando um polipeptídeo de tipo Ste20 ou seu homólogo.
Porque as plantas transgênicas de acordo com a presente invenção tem rendimento aumentado, é provável que estas plantas demonstram uma taxa de crescimento aumentado (durante pelo menos parte de seu ciclo de vida), com relação à taxa de crescimento de plantas de tipo selvagem correspondentes, em estágio correspondente em seu ciclo de vida. A taxa de crescimento aumentado pode ser específica para uma ou mais partes de uma planta (incluindo sementes) ou pode ser completamente substancialmente a planta completa. As plantas tendo uma taxa de crescimento aumentado pode ter um ciclo de vida mais curto. O ciclo de vida de uma planta pode significar o tempo necessário para crescer de uma semente madura seca até o estágio onde a planta produziu sementes maduras secas, similar ao material de partida. Este ciclo de vida pode ser influenciado por fatores como vigor inicial, taxa de crescimento, tempo de florescência e velocidade de maturação da semente. Um aumento na taxa de crescimento pode ocorrer em um ou mais estágios no ciclo de vida de uma planta ou durante substancialmente o ciclo de vida da planta completo. A taxa de crescimento aumentado durante os estágios iniciais no ciclo de vida de uma planta pode refletir vigor melhorado. O aumento na taxa de crescimento pode alterar o ciclo de colheita de uma planta deixando as plantar ser semeadas depois e/ou colhidas antes do que seria de outra forma possível (um efeito similar pode ser obtida com um tempo de florescência anterior). Se a taxa de crescimento for aumentada de modo suficiente, pode permitir a outra semeadora de sementes da mesma espécie de planta (por exemplo semeando e colhendo plantas de arroz seguido por semeadura e colheita de outras plantas de arroz todas dentro de um período de crescimento convencional). Similarmente, se a taxa de crescimento for suficientemente aumentada, ela pode permitir outra semeadura das sementes de diferentes espécies de plantas (por exemplo a semeadura e colheita de plantas de arroz seguida, por exemplo, por semeadura e colheita opcional de feijão de soja, batata ou qualquer outra planta). Os tempos adicionais de colheita do mesmo material de raiz no caso de algumas plantas de cultura também pode ser possível. A alteração do ciclo de colheita de uma planta pode levar a um aumento na produção de biomassa anual por acre (devido a um aumento no número de vezes (digamos em um ano) que qualquer planta particular pode ter crescido e ser colhida). Um aumento na taxa de crescimento também pode permitir o cultivo de plantas transgênicas em uma área geográfica mais ampla do que suas contra-partes de tipo selvagem, porque as limitações territoriais para o cultivo de uma cultura são com freqüência determinadas por condições ambientais adversas no momento do planta (estação prematura) ou no momento da colheita (estação tardia). Estas condições adversas podem ser evitadas se o ciclo de colheita for encurtado. A taxa de crescimento pode ser determinada por derivação de vários parâmetros das curvas de crescimento, como estes parâmetros podem ser: T-Mid (o tempo que leva para as plantas alcançarem 50% de seu tamanho máximo) e T-90 (tempo que leva para as plantas alcançarem 90% de seu tamanho máximo), dentre outros.
De acordo com um aspecto preferido da presente invenção, o desempenho dos métodos da invenção dá plantas tendo uma taxa de crescimento aumentada ou rendimento aumentado em comparação com plantas de controle. Assim, de acordo com a presente invenção provê-se um método para aumentar o rendimento e/ou a taxa de crescimento de plantas, cujo método compreende modular, preferivelmente aumentar a expressão em uma planta de um ácido nucleico codificando uma proteína de tipo Ste20.
Um aumento no rendimento e/ou taxa de crescimento ocorre se a planta estiver sob condições de não estresse ou se a planta for exposta aos vários estresses comparada com as plantas de controle. As plantas tipicamente respondem a exposição a estresses por crescimento mais lento. Em condições de estresse severo, a planta pode mesmo parar de crescer no todo. Um estresse brando, por outro lado, é definido aqui como sendo qualquer estresse ao qual a planta é exposta e que não resulta na planta cessar de crescer no todo sem a capacidade de iniciar o crescimento. O estresse brando no sentido da invenção leva a uma redução no crescimento da plantas estressadas de menos do que 40%, 35% ou 30%, preferivelmente menos do que 25%, 20% ou 15%, mais preferivelmente menos do que 14%, 13%», 12%», 11% ou 10% ou menos em comparação com a planta de controle sob condições de não estresse. Devido a avanços nas práticas agrícolas (irrigação, fertilização, tratamentos com pesticidas), severos estresses não são com freqüência encontrados em plantas de cultura cultivadas. Como uma conseqüência, o crescimento comprometido induzido por estresse brando é com freqüência um aspecto indesejável para a agricultura. Os estresses brandos são os estresses típicos aos quais uma planta pode ser exposta. Estes estresses podem ser os estresses bióticos e/ou abióticos (ambientais) aos quais uma planta é exposta. Os estresses abióticos ou ambientais incluem estresses de temperatura causados por temperaturas quentes ou frias/congelantes atípicas; estresses de sal; estresses de água (seca ou água em excesso). Os produtos químicos também causam estresses abióticos. Os estresses bióticos são tipicamente os estresses causados por patógenos, como bactérias, vírus, fungos e insetos. Em outra forma de realização preferida da invenção, um aumento no rendimento e/ou taxa de crescimento ocorre de acordo com o método da invenção sob condições de não estresse ou estresse brando abiótico ou biótico, preferivelmente em condições de não estresse ou estresse abiótico brando.
As características de crescimento acima mencionadas podem ser modificadas com vantagem em qualquer planta.
O termo "planta" como usado aqui engloba plantas completas, ancestrais e progênie das plantas, células de plantas, e partes de plantas, incluindo sementes, brotos, caules, folhas, raízes (incluindo tubérculos) flores, e tecidos e órgãos, em que cada um acima mencionado compreende o gene / ácido nucleico de interesse. O termo "planta" também inclui culturas em suspensão, tecido de calo, embriões, regiões meristemáticas, gametófitos, esporófitos, pólen e microesporos, novamente em que cada um dos acima mencionados compreende o gene/ ácido nucleico de interesse.
As plantas que são particularmente utilizáveis nos métodos da invenção incluem todas as plantas que pertencem à superfamília Viridiplantae, em particular plantas monocotiledôneas e dicotiledôneas incluindo alimentos vegetais ou forragem para animais, plantas ornamentais, culturas de alimentos, árvores, arbustos selecionados dentre a lista compreendendo Acer spp., Actinidia spp., Abelmoschus spp., Agropyron spp., Allium spp., Amaranthus spp., Ananas eomosus, Annona spp., Apium graveolens, Arabidopsis thaliana, Araehis spp, Artocarpus spp., Asparagus offieinalis, Avena sativa, Averrhoa earambola, Benineasa hispida, Bertholletia excelsea, Beta vulgaris, Brassica spp., Cadaba farinosa, Camellia sinensis, Canna indica, Capsicum spp., Carex elato, Caricapapaya, Carissa maeroearpa, Carya spp., Carthamus tinetorius, Castanea spp., Cichorium endivia, Cinnamomum spp., Citrullus lanatus, Citrus spp., Cocas spp., Coffea spp., Coloeasia eseulenta, Cola spp., Coriandrum sativum, Corylus spp., Crataegus spp., Crocus sativus, Cueurbita spp., Cueumis spp., Cynara spp., Daueus earota, Desmodium spp., Dimoearpus longany Dioscorea spp., Diospyros spp., Echinoehloa spp., Eleusine eoraeana, Eriobotrya japoniea, Eugenia uniflora, Fagopyrum spp., Fagus spp., Ficus eariea, Fortunella spp., Fragaria spp., Ginkgo biloba, Glycine spp., Gossypium Hrsutum, Helianthus spp., Hemerocallis fulva, Hibiseus spp., Hordeum spp., Ipomoea batatas, Juglans spp., Lactuca sativa, Lathyrus spp., Lens Culinaris, Linum usitatissimum, Litehi chinensis, Loto spp., acutangula, Lupinus spp., Luzula Sylvatica, Macrotyloma spp., Malus spp., Malpighia emarginata, Mammea americana, Mangifera indica, Manihot spp., Manilkara Zapota, Medieago Sativa, Melilotus spp., Mentha spp., Momordica spp., Morus nigra, Musa spp., Nicotiana spp., Olea spp., Opuntia spp., Ornithopus spp., Oryza spp., Panicum miliaeeum, Passiflora edulis, Pastinaca sativa, Persea spp., Petroselinum Crispum, Phaseolus spp., Phoenix spp., Physalis spp., Pzwms spp., Pistacia vera, Pisum spp., Poa spp., Populus spp., Prosopis spp., Prunus spp., Psidium spp., Punica granatum, Pyrws Communis, Quercus spp., Raphanus sativus, Rheum rhabarbarum, Ribes spp., Rubus spp., Saecharum spp., Sambucus spp., Seeale cereale, Sesamum spp., Sinapis sp., Solanum spp., Sorghum bicolor, Spinacia spp., Syzygium spp., Tamarindus indica, Theobroma caeao, Trifolium spp., Triticosecale Hmpaui, Triticum spp., Tropaeolum minus, Tropaeolum majus, Vaccinium spp., Vicia spp., Vigna spp., Viola odorata, Vitis spp., Zea mays, Zizania palustris, Ziziphus spp., dentre outros. De acordo com a forma de realização preferida da presente invenção, a planta é uma planta de cultura como soja, girassol, canola, alfafa, semente de colza, algodão, tomate, batata ou tabaco. Mais preferivelmente, a planta é uma planta monocotiledônea, como cana de açúcar. Mais preferivelmente, a planta é um cereal como arroz, milho, cevada, milheto, centeio, sorgo ou aveia.
Outras plantas vantajosas são selecionadas dentre o grupo consistindo de
Asteraceae como os gêneros Helianthus, Tagetes por exemplo a espécie Helianthus annus [girassol], Tagetes lúcida, Tagetes erecta ou Tagetes tenuifolia [tagetes], Brassicaceae como os gêneros Brassica, Arabadopsis por exemplo a espécie Brassica napus, Brassica rapa ssp. [canola, colza de semente oleígena, nabo silvestre] ou Arabidopsis thaliana. Fabaceae como os gêneros Glycine por exemplo a espécie Glycine max, Soja hispida ou Soja max [soja]. Linaceae como os gêneros Linum por exemplo a espécie Linum usitatissimum, [linho, linhaça]; Poaceae como os gêneros Hordeum, Secale, Avena, Sorghum, Oryza, Zea, Triticum por exemplo a espécie Hordeum vulgare [cevada]; Secale cereale [centeio], Avena sativa, Avena fatua, Avena byzantina, Avena fatua var. sativa, Avena hybrida [aveia], Sorghum bicolor [Sorgo, milheto], Oryza sativa, Oryza latifolia [arroz], Zea mays [milho, milho maize] Triticum aestivum, Triticum ]durum, Triticum turgidum, Triticum hybernum, Triticum macha, Triticum sativum ou Triticum vulgare [trigo, tribo de pão, trigo comum]; Solanaceae como os gêneros Solanum, Lycopersicon por exemplo a espécie Solanum tuberosum [batata], Lycopersicon esculentum, Lycopersicon lycopersicum., Lycopersicon pyriforme, Solanum integrifolium ou Solanum lycopersicum [tomate].
O termo "polipeptídeo de tipo Ste20 ou seu homólogo", como definido aqui, refere-se a um polipeptídeo MAP4K, preferivelmente de origem de plantas, compreendendo um domínio N-terminal Ser/Thr quinase (equipado com a base de dados SMART entrada SM00220, InterPro acesso IPR002290). O domínio
quinase em SEQ ID NO: 2 começa em Yl5 e termina em F293, e compreende o ProSite Ser/Thr protein quinase, padrão PS00108:
[LI VMF YC]-x- [HY] -x-D- [LIVMF Y]-K-x(2)-N- [LIVMFYCT](3), em que o primeiro χ está faltando. Preferivelmentej o polipeptídeo de tipo Ste20 ou seu homólogo compreende a seqüência de assinatura Ste20:
G(T/N)P(Y/C/R)(W/R)MAPE(V/K) (SEQ ID NO: 6; Dan et al., 2001),
mais preferivelmente, ele compreende o motivo de seqüência:
(S/H/N)(I/L)(V/I/L/M)(S/K)(S/H/T/ A/I/V)(S/G/V / A) (F/Y)(P/Q)(S/N/D/E)G (SEQ ID NO:7),
mais preferivelmente o polipeptídeo de tipo Ste20 ou seu homólogo compreende pelo menos um dos seguintes motivos de seqüência:
SEQ ID NO: 8, (V/I)HSH(T/N/V)GY(G/S)(F/I)
SEQ ID NO: 9, RPPLSHLPP(L/S)KS
SEQ ID NO: 10, RRISGWNF
Na extremidade C-terminal da proteína, um motivo de espiral espiralada pode estar presente (K450 a T477 em SEQ ID NO: 2).
O termo "domínio" refere-se a um conjunto de aminoácidos conservados em posições específicas ao longo de um alinhamento de seqüências de proteínas relacionadas de modo evolucionário. Apesar de aminoácidos em outras posições poderem variar entre homólogos, os aminoácidos que são altamente conservados em posições específicas indicam aminoácidos que são essenciais na estrutura, a estabilidade, ou a atividade de uma proteína. Identificados por seu grau elevado e conservação em seqüências alinhadas de uma família de homólogos de proteína, eles podem ser usados como identificadores para determinar se qualquer polipeptídeo em questão pertence a uma família de polipeptídeos previamente identificados (neste caso, a família de proteínas de tipo Ste20). O temo "motivo" refere-se a uma região conservada curta em uma seqüência de proteína. Os motivos são com freqüência partes altamente conservadas de domínios, mas também podem incluir somente parte do domínio, ou estarem localizados fora do domínio conservado (se todos os aminoácidos do motivo estiverem fora de um domínio definido).
As bases de dados especialistas existem para a identificação de domínios. O domínio quinase em uma proteína de tipo Ste20 pode ser identificado usando por exemplo SMART (Schultz et al. (1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244), InterPro (Mulder et al, (2003) Nucl. Acids. Res. 31, 315-318), Prosite (Bucher e Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its funetion in automatic sequence interpretation. (em) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137, (2004)) ou Pfam (Bateman et al, Nucleic Acids Research 30(1): 276-280 (2002)). Um conjunto de ferramentas para a análise in silico de seqüências de proteína é disponível no servidor ExPASY proteomies (hospedado pelo Swiss Institute of Bioinformatics (Gasteiger et al., ExPASy: the proteomies server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31:3784-3788(2003)).
Por alinhamento de outras seqüências de proteína com SEQ ID NO: 2, a seqüência de assinatura Ste20 correspondente, o domínio quinase e outros motivos de seqüência detalhados acima pode ser facilmente identificado. Deste modo, os polipeptídeos de tipo Ste20 ou homólogos do mesmo, (englobando ortólogos e parálogos) podem prontamente ser identificados, usando técnicas de rotina bem conhecidas na arte como alinhamento de seqüência. Os métodos para o alinhamento de seqüências para comparação são bem conhecidos na arte, estes métodos incluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o algoritmo de Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar o alinhamento de duas seqüências completas que maximizam o número de correspondências e minimiza o número de espaços. O algoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-10) calcula a identidade de seqüência percentual e realiza uma análise estatística da similaridade entre as duas seqüências. O software para realizar a análise BLAST é disponível ao público através do National Centre for Biotechnology Information. Os homólogos podem ser prontamente identificados usando, por exemplo, o algoritmo de alinhamento de seqüência múltipla ClustalW (versão 1.83), com os parâmetros de alinhamento aos pares de default e um método de classificação em porcentagem. As porcentagens globais de similaridade e identidade também podem ser determinadas usando um dos métodos disponível no pacote de software MatGAT (Campaneila et al, BMC Bioinformatics. 2003 Jul 10;4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences.). A edição manual menor pode ser realizada para otimizar o alinhamento entre os motivos conservados, como seria evidente para o versado. Além disso, em vez de usar seqüências de comprimento completo para a identificação de homólogos, domínios específicos (como o domínio quinase) podem ser também usados. Os valores de identidade de seqüência, que são indicados acima como a porcentagem foram determinados sobre o domínio conservado completo ou ácido nucleico ou seqüência de aminoácido usando os programas mencionados acima usando os parâmetros de default.
Os exemplos de polipeptídeos de tipo Ste20 ou seus homólogos incluem as seqüências de Arabidopsis SEQ ID NO: 12 (correspondendo a At5gl4720, codificado por GenBank número de acesso AAL38867), SEQ ID NO: 14 (Atlg70430, GenBank NP_177200), SEQ ID NO: 16 (Atlg23700, GenBank NP_173782), SEQ ID NO: 18 (Atlg79640, GenBank ΝΡ_178082), SEQ ID NO: 20 (At4gl0730, GenBank NP_192811), SEQ ID NO: 22 (At4g24100, GenBank NP_194141); as seqüências de arroz SEQ ID NO: 24 (GenBank XP_469286, o ortólogo de arroz de SEQ ID NO: 2), SEQ ID NO: 26 (GenBank BAD37346), SEQ ID NO: 28 (GenBank XP_468215), SEQ ID NO: 30 (GenBank AAL54869), SEQ ID NO: 32 (GenBank NP_912431) e as seqüências de Medicago SEQ ID NO: 34 (ortólogo de SEQ ID NO: 2).
Será entendido que as seqüências caindo sob a definição de "polipeptídeo de tipo Ste20 ou seu homólogo" não são limitadas às seqüências representadas por SEQ ID NO: 2, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32 ou SEQ ID NO: 34, mas que qualquer polipeptídeo compreendendo um domínio N-terminal quinase, como definido acima, a seqüência de assinatura Ste20 e preferivelmente também um ou mais dos motivos de seqüência detalhados em SEQ ID NO: 7, 8, 9 e 10, pode ser apropriado para uso nos métodos da invenção. Em uma forma de realização preferida, o homólogo usado nos método da presente invenção é um ortólogo de SEQ ID NO: 2.
Um teste pode ser realizado para determinar a atividade de tipo Ste20. Por exemplo, para determinar a atividade de quinase, várias testes são disponíveis e bem conhecidos na arte (por exemplo Current Protocols in Molecular Biology, Volumes 1 e 2, Ausubel et al. (1994), Current Protocols). A proteína de tipo Ste20 é uma MAP4K quinase envolvida em transdução de sinal. Para vários organismos, o substrato de Ste20 foi identificado como Stellp (Drogen et al, Current Biology 10, 630-639, 2000). Além da fosforilação in vitro da proteína Stel lp, Ste20 foi também mostrado como fosforilando histona H2B (Ahn et al, Cell 120, 25-36, 2005). A composição de tratamento, potência iônica, e pH podem ser otimizados partindo de uma mistura de teste de quinase. Um tampão padrão 5x quinase geralmente contém 5 mg/ml BSA (Albumina de soro bovino evitando a adsorção da quinase ao tubo de teste), 150 mM Tris-Cl (pH 7,5), 100 raM MgCl2. Cátions divalentes são requeridos para a maior parte das tirosina quinases, apesar de algumas tirosina quinases (por exemplo, receptores de insulina, IGF-1-, e PDGF quinases) requerem MnCl2 em vez de MgCl2 (ou em adição a MgCl2). As concentrações ótimas de cátions divalentes devem ser determinadas empiricamente para cada proteína quinase. Um doador comumente usado para o grupo fosforila é [gama-32P]ATP radio-rotulado( normalmente a 0,2 mM de concentração final). A quantidade de 32P incorporado nos peptídeos pode ser determinada por medida da atividade sobre os chumaços secos de nitrocelulose em um contador de cintilação.
Além disso, a expressão da proteína de tipo Ste20 ou de um seu homólogo em plantas e particularmente em arroz, tem o efeito de aumentar o rendimento de planta transgênica quando comparada com as plantas de controle, em que o rendimento aumentado compreende pelo menos um dentre: peso total de sementes, número de sementes cheias e índice de colheita.
"Homólogos" de uma proteína engloba peptídeos, oligopeptídeos, polipeptídeo s, proteínas e enzimas tendo substituições, deleções e/ou inserções de aminoácido com relação à proteína não modificada em questão e tendo uma atividade funcional e biológica similar como a proteína não modificada da qual eles são derivados.
Estão englobados pelo termo "homólogos" as seqüências ortólogas e as seqüências parálogas, duas formas especiais de homologia que englobam conceitos evolucionários usados para descrever relações de ancestrais de genes. Os parálogos são genes dentro da mesma espécie que se originaram através de duplicação de um gene ancestral e ortólogos são genes de organismos diferentes que se originaram através de especialização.
Os ortólogos e parálogos podem ser facilmente encontrados por realização de uma assim chamada busca Blast recíproca. Isto pode ser feito por um primeiro BLAST envolvendo realizar a busca BLAST em uma seqüência de busca (por exemplo SEQ ID NO: 1 ou SEQ ID NO: 2) contra qualquer base de dados de seqüência, como a base publicamente disponível NCBL BLASTN ou TBLASTX (usando valores de default padrões) podem ser usados partindo de uma seqüência de nucleotídeos e BLASTP ou TBLASTN (usando valores de default padrões) podem ser usados quando partindo de uma seqüência de proteína. Os resultados de BLAST podem ser opcionalmente filtrados. As seqüências de comprimento completo de ou os resultados filtrados ou resultados não filtrados são então buscadas em BLAST de novo (segundo BLAST) contra as seqüências do organismo do qual a seqüência de busca é derivada (onde a seqüência de busca SEQ ID NO: 1 ou SEQ ID NO: 2, a segunda BLAST deve ser assim contra as seqüências de Arabidopsis). Os resultados da primeira e segunda Blasts são então comparados. Um parálogo é identificado se uma dica de alta ordem da segunda BLAST é da mesma espécie como a da qual a seqüência de busca é derivada; um ortólogo é identificado se uma dica de alta ordem não é da mesma espécie como a da qual a seqüência de busca é derivada. Os ortólogos preferidos são ortólogos de SEQ ID NO: 1 ou SEQ ID NO: 2. As dicas de alta ordem são as tendo um valor E baixo. Quanto menor o valor E, mais significante o escore (ou em outras palavras quanto menor a possibilidade de que a dica é encontrada por acaso). A computação do valor E é bem conhecida na arte. Além dos valores E, as comparações são também classificadas por identidade percentual. A identidade percentual refere-se ao número de nucleotídeos idênticos (ou aminoácidos) entre as duas seqüências de ácido nucleico comparadas (ou polipeptídeos) em um comprimento particular. Preferivelmente, o escore é maior do que 50, mais preferivelmente maior do que 100; e preferivelmente o valor E é menor que e-5, mais preferivelmente menor que e-6. No caso de grandes famílias, ClustalW pode ser usado, seguido pela geração de árvore de união vizinha, para ajudar a visualizar o agrupamento de genes relacionados e para identificar ortólogos e parálogos. Os exemplos de ortólogos de seqüências para SEQ ID NO: 2 incluem SEQ ID NO: 24 e SEQ ID NO: 34. Exemplos de parálogos de SEQ ID NO: 2 incluem SEQ ID NO: 12 (At5gl4720) e SEQ ID NO: 20 (At4gl0730).
Preferivelmente, os domínios de quinase de proteínas de tipo Ste20 utilizáveis nos métodos da presente invenção tem, em ordem crescente de preferência, pelo menos 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de seqüência para o domínio de quinase da proteína de tipo Ste20 de SEQ ID NO: 2. Um exemplo detalhando a identificação de homólogos é dado no exemplo 1. A matriz mostrada no exemplo 1 (tabela 4) mostra similaridades e identidades (em negrito) sobre o comprimento completo da proteína. No caso em que somente domínios específicos são comparados, a identidade e similaridade podem ser maior dentre as proteínas diferentes (tabela 5: comparação dos domínios quinase apenas).
Um polipeptídeo de tipo Ste20 ou seu homólogo é codificado por um ácido nucleico / gene de tipo Ste20. Assim, o termo "ácido nucleico / gene de tipo Ste20" como definido aqui é qualquer ácido nucleico / gene codificando um polipeptídeo de tipo Ste20 ou um seu homólogo como definido acima.
Os exemplos de ácidos nucleicos de tipo Ste20 incluem mas não são limitados aos representados por qualquer uma dentre SEQ ID NO: 3, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31 ou SEQ ID NO: 33.
Os ácidos nucleicos/ genes de tipo StelO e suas variantes podem ser apropriados na prática dos métodos da invenção. Os ácidos nucleicos/ genes de tipo Ste20 variantes incluem porções de um ácido nucleico / gene de tipo Ste20, variantes de emenda, variantes alélicas e/ou ácidos nucleicos capazes de hibridizar com um ácido nucleico /gene de tipo Ste20.
O termo porção, como definido aqui, refere-se a um pedaço de DNA codificando um polipeptídeo compreendendo a seqüência de assinatura de Ste20 G(T/N)P(Y/C/R)(W/R)MAPE(V/K) (SEQ ID NO: 6) e um domínio de quinase N-terminal Ser/Thr como definido acima. Uma porção pode ser preparada, por exemplo, fazendo uma ou mais deleções para um ácido nucleico de tipo Ste20. As porções podem ser usadas em forma isolada ou podem ser fundidas para outras seqüências de codificação (ou não codificação) a fim de, por exemplo, produzir uma proteína que combina várias atividades. Quando fundido a outras seqüências de codificação, o polipeptídeo resultante produzido quando da tradução pode ser maior do que o previsto para o fragmento de tipo Ste20. A porção é tipicamente pelo menos 300, 400, 500, 600 ou 700 nucleotídeos em comprimento, preferivelmente pelo menos 750, 900, 850, 900 ou 950 nucleotídeos em comprimento, mais preferivelmente pelo menos 1000, 1100, 1200 ou 1300 nucleotídeos em comprimento e o mais preferivelmente pelo menos 1350, 1400 ou 1450 nucleotídeos em comprimento. Preferivelmente, a porção é uma porção de um an como representado por uma ou mais dentre SEQ ID NO: 1, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31 ou SEQ ID NO: 33. O mais preferivelmente a porção de um ácido nucleico é como representada por SEQ ID NO: 1.
Os termos "fragmento", "fragmento de uma seqüência" ou "parte de uma seqüência", "porção" ou "sua porção" significam uma seqüência truncada da seqüência original aqui referida. A seqüência truncada (seqüência de ácido nucleico ou proteína) pode variar amplamente em comprimento; o tamanho mínimo sendo uma seqüência de tamanho suficiente para prover uma seqüência com pelo menos uma função comparável e/ou atividade da seqüência original referida a ou hibridizando com a molécula de ácido nucleico da invenção ou usada no processo da invenção sob condições estringentes, enquanto o tamanho máximo não é crítico. Em algumas aplicações, o tamanho máximo geralmente não é substancialmente maior do que o requerido para prover a atividade e/ou função (ões) desejada(s) da seqüência original. Uma função original significa pelo menos 40%, 45% ou 50%, preferivelmente pelo menos 60%, 70%, 80% ou 90% ou mais da seqüência original.
Outra variante de ácido nucleico / gene de tipo Ste20 é um ácido nucleico capaz de hibridizar sob condições estringentes reduzidas, preferivelmente sob condições estringentes com um ácido nucleico / gene de tipo StelO como acima definido ou com uma porção como acima definido.
As seqüências de hibridização utilizáveis nos métodos da presente invenção codificam um polimerização tendo uma seqüência de assinatura de Ste20 G(T/N)P(Y/C/R)(W/R)MAPE(V/K) (SEQ ID NO: 6) and um domínio quinase N-terminal Ser/Thr como definido acima e tendo substancialmente a mesma atividade biológica como a proteína de tipo Ste20 representada por SEQ ID NO: 2 ou seus homólogos. A seqüência de hibridização tem tipicamente pelo menos 800 nucleotídeos em comprimento, preferivelmente pelo menos 1000 nucleotídeos em comprimento, mais preferivelmente pelo menos 1200 nucleotídeos em comprimento e o mais preferivelmente pelo menos 1400 nucleotídeos em comprimento.
Preferivelmente, a seqüência de hibridização é uma que é capaz de hibridizar em um ácido nucleico como representado por (ou as sondas dai derivadas) SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31 ou SEQ ID NO: 33, ou a uma porção de qualquer uma das seqüências acima mencionadas, uma porção sendo como acima definida. Mais preferivelmente, a seqüência de hibridização é capaz de hibridizar a SEQ ID NO: 1, ou a suas porções (ou sondas). Os métodos para projetar sondas são bem conhecidos na arte. As sondas são geralmente menores do que 1000 bp, 900 bp, 800 bp, 700 bp, 600 bp em comprimento, preferivelmente menos do que 500 bp, 400 bp, 300 bp 200 bp ou 100 bp em comprimento. Comumente, os comprimentos de sonda para hibridizações de DNA-DNA como Southern blotting, variam entre 100 e 500 bp, enquanto a região de hibridização em sondas para a hibridização de DNA-DNA como em amplificação PCR geralmente são mais curtas do que 50 mas mais longas do que 10 nucleotídeos, preferivelmente tem 15, 20, 25, 30, 35, 40, 45 ou 50 bp em comprimento.
O termo "hibridização" como definido aqui é um processo em que seqüências de nucleotídeos complementares substancialmente homólogas anelam umas nas outras. O processo de hibridização pode ocorrer completamente em solução, isto é, ambos os ácidos nucleicos complementares estão em solução. O processo de hibridização também pode ocorrer com um ou mais ácidos nucleicos complementares imobilizados em uma matriz como contas magnéticas, contas Sepharose, ou qualquer outra resina. O processo de hibridização pode ainda ocorrer4 com um dos ácidos nucleicos complementares imobilizados em um suporte sólido como nitro- celulose ou membrana de náilon ou imobilizado por, por exemplo, fotolitografia para, por exemplo, um suporte de vidro silicioso (o último conhecido como arranjos de ácido nucleico ou micro-arranjos ou como pastilhas de ácido nucléico). A fim de permitir a ocorrência da hibridização, as moléculas de ácido nucleico são geralmente desnaturadas de modo térmico ou químico para fundir um filamento duplo em dois filamentos únicos e/ou para remover "grampos de cabelo" ou outras estruturas secundárias de ácidos nucleicos de filamento único.
O termo "estringência" refere-se às condições sob as quais a hibridização ocorre. A estringência de hibridização é influenciada por condições como temperatura, concentração de sal, resistência iônica e composição de tampão de hibridização. Geralmente, as condições de baixa estringência são selecionadas a cerca de 30°C menores do que o ponto de fusão térmico (Tm) para a seqüência específica em uma resistência iônica e pH definidos. As condições de estringência média são quando a temperatura está 20°C abaixo de Tm, e condições de alta estringência são quando a temperatura é 10°C abaixo de Tm. As condições de hibridização de alta estringência são tipicamente usadas para isolar as seqüências de hibridização que tem uma similaridade de seqüência elevada para a seqüência de ácido nucleico de marcação. No entanto, os ácidos nucleicos podem se desviar em seqüência e ainda codificar um polipeptídeo substancialmente idêntico, devido à degenerescência do código genético. Assim, as condições de hibridização de estringência média podem às vezes ser necessárias para identificar estas moléculas de ácido nucleico.
O Tm é a temperatura sob resistência iônica e pH definidos, em que 50% da seqüência de marcação hibridiza para uma sonda perfeitamente correspondida. O Tm é dependente das condições de solução e a composição de base e o comprimento da sonda. Por exemplo, seqüências mais longas hibridizam especificamente em maiores temperaturas. A taxa máxima de hibridização é obtida de cerca de 16°C até 32°C abaixo do Tm. A presença de cátions monovalentes na solução de hibridização reduz a repulsa eletrostática entre os dois filamentos de ácido nucleico assim promovendo a formação do híbrido; este efeito é visível para concentrações de sódio de até 0,4 M (para concentrações maiores, este efeito pode ser ignorado). A formamida reduz a temperatura de fusão de duplexes DNA-DNA e DNA-RNA com 0,6 a 0,7°C para cada porcentagem de formamida, e adição de 50% de formamida permite que a hibridização seja realizada a 30 a 45°C, apesar da taxa de hibridização poder ser abaixada. Os desalinhamentos dos pares de base reduzem a taxa de hibridização e a estabilidade térmica dos duplexes. Em sondas médias e para as grandes, o Tm diminui cerca de 1°C por % de desalinhamento de base. O Tm pode ser calculado usando as seguintes equações, dependendo dos tipos de híbridos:
1)-híbridos de DNA-DNA (Meinkoth e Wahl, Anal Biochem., 138:267-284, 1984):
Tm= 81,5°C + 16,6xlogio[Na+]a + 0,41x%[G/Cb] - 500xtLc]-1 - 0,61x% formamida
2) híbridos de DNA-RNA ou RNA-RNA:
Tm= 79,8 + 18,5 (log]0[Na+]a) + 0,58 (%G/Cb) + 11,8 (%G/Cb)2 - 820/Lc
3) híbridos oligo-DNA ou oligo-RNAd:
Para <20 nucleotídeos: Tm= 2 (In)
Para 20-35 nucleotídeos: Tm= 22 + 1,46 (In)
a ou para outro cátion monovalente, mas somente preciso na faixa de 0,01-0,4 M.
b somente preciso para %GC na faixa de 30% a 75%.
c L = comprimento do duplex em pares de base.
d Oligo, oligonucleotídeo; ln, comprimento efetivo do iniciador = 2x(no. de G/C)+(no. de A/T).
A ligação não específica pode ser controlada usando qualquer uma de várias técnicas conhecidas como por exemplo bloqueio da membrana com soluções contendo proteína, adições de RNA heterólogo, DNA e SDS ao tampão de hibridização, e tratamento com Rnase. Para sondas não homólogas, uma série de hibridizações pode ser realizada por variação de (i) progressivamente abaixando a temperatura de andamento (por exemplo de 68 a 42°C) ou (ii) progressivamente abaixando a concentração de formamida (por exemplo de 50% a 0%). O versado é capaz de conhecer vários parâmetros que podem ser alterados durante a hibridização e manter ou mudar as condições de estringência.
Além das condições de hibridização, a especificidade de hibridização tipicamente também depende da função das lavagens de pós- hibridização. Para remover o fundo resultante de hibridização não específica, amostras são lavadas com soluções de sal diluído. Os fatores críticos destas lavagens incluem a resistência iônica e temperatura da solução de lavagem final: quanto menor a concentração de sal e maior a temperatura de lavagem, maior a estringência da lavagem. As condições de lavagem são tipicamente realizadas em ou abaixo da estringência de hibridização. Uma hibridização positiva dá um sinal de que é pelo menos duas vezes a do fundo. Geralmente, condições de estringência apropriadas para testes de hibridização de ácido nucleico ou procedimentos de detecção de amplificação de genes são especificados acima. As condições mais ou menos estringentes podem ser também selecionadas. O versado na arte conhece os vários parâmetros que podem ser alterados durante a lavagem e que ou mantém ou mudança as condições de estringência.
Por exemplo, condições de estringência elevadas típicas para híbridos de DNA mais longos do que 50 nucleotídeo englobam hibridização a 65°C em 1x SSC ou a em 42°C em 1x SSC e 50% formamida, seguido por lavagem a 65°C em 0,3x SSC. Exemplos de condições de hibridização de estringência média para os híbridos de DNA com mais do que 50 nucleotídeos englobam hibridização a 50°C em 4x SSC ou a 40°C em 6x SSC e 50% formamida, seguido por lavagem a 50°C em 2x SSC. O comprimento do híbrido é o comprimento antecipado para a hibridização do ácido nucleico. Quando os ácidos nucleicos de seqüência conhecida são hibridizados, o comprimento do híbrido pode ser determinado por alinhamento das seqüências e identificação das regiões conservadas descritas aqui. 1xSSC é 0,15Μ NaCl e 15mM citrato de sódio, as hibridizações e lavagem podem adicionalmente incluir 5 x reagente de Denhardt, 0,5-1,0% SDS, 100 μg/ml DNA de esperma de salmão fragmentado, desnaturado, 0,5% pirofosfato de sódio.
Para os fins de definir o nível de estringência, a referência pode ser feita de modo conveniente a Sambrook et al. (2001) Molecular Cloning: a laboratory manual, 3a. ed. Cold Spring Harbor Laboratory Press, CSH, New York, ou a Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989 e atualizações anuais).
Também são utilizáveis nos métodos da invenção os ácidos nucleicos codificando homólogos da seqüência de aminoácido representada por SEQ ID NO: 2.
Um homólogo pode estar na forma de uma "variante substancional" de uma proteína, isto é, onde pelo menos um resíduo em uma seqüência de aminoácido foi removida e um resíduo diferente inserido em seu lugar. As substituições de aminoácidos são tipicamente de resíduos únicos, mas podem ser agrupadas dependendo das limitações funcionais colocadas no polipeptídeo; as inserções serão geralmente da ordem de cerca de 1 a 10 resíduos de aminoácidos. Preferivelmente, as substituições de aminoácidos compreendem substituições de aminoácidos conservativas. Para produzir estes homólogos, aminoácidos da proteína podem ser substituídos por outros aminoácidos tendo propriedades similares (como hidrofobicidade, hidrofilicidade, antigenicidade, propensão para formar ou romper estruturas α-helical, ou estruturas de β-folha similares). As tabelas de substituição conservativa são bem conhecidas na arte (ver, por exemplo, Creighton (1984) Proteins. W.H. Freeman and Company e tabela 1 abaixo). Tabela 1: Exemplos de substituições de aminoácidos conservadas
<table>table see original document page 32</column></row><table>
Um homólogo também pode estar na forma de um "variante insercional" de uma proteína, isto é onde um ou mais resíduos de aminoácidos são introduzidos em um sítio pré-determinado de uma proteína. As inserções podem compreender fusões N-terminal e/ou C-terminal assim como inserções intra-seqüências de aminoácidos únicos ou múltiplos. Geralmente, as inserções dentro da seqüência de aminoácido serão menores do que as fusões N- ou C-terminais, da ordem de cerca de 1 a 10 resíduos. Exemplos de proteínas de fusão N- ou C-terminal ou peptídeos incluem o domínio de ligação ou domínio de ativação de um ativador transcripcional, como usado no sistema de dois híbridos de levedura, proteínas de capa de fagos, (histidina)-ó-etiqueta, glutatationa S-transferase-etiqueta, proteína A, proteína de ligação a maltose, dihidrofolato redutase, epítopo Tag-100, epítopo c-myc, epítopo FLAGCE)-, lacZ, CMP (peptídeo de ligação a calmodulina), epítopo EA, epítopo proteína C e epítopo VSV.
Os homólogos na forma de "variantes de deleção" de uma proteína são caracterizados pela remoção de um ou mais aminoácidos de uma proteína.
As variantes de aminoácidos de uma proteína (variantes de substituição, deleção e/ou inserção) podem ser feitas prontamente usando técnicas sintéticas de peptídeos bem conhecidas na arte, como síntese de peptídeo de fase sólida, e outras, ou por manipulação de DNA recombinante. Os métodos para a manipulação de seqüências de DNA para produzir variantes de substituição, inserção ou deleção de uma proteína são bem conhecidas na arte. Por exemplo, as técnicas para fazer mutações de substituição em sítios pré-determinados em DNA são bem conhecidas dos versados η a arte e incluem mutagênese M13, mutagênese T7-Gen in vitro (USB, Cleveland, OH), mutagênese de tipo QuickChange Site Directed (Stratagene, San Diego, CA), mutagênese dirigida ao sítio mediada por PCR ou outros protocolos de mutagênese dirigidos ao sítio.
O polipeptídeo de tipo Ste20 ou seus homólogos também podem ser derivados. "Derivados" incluem peptídeo, oligopeptídeos, polipeptídeos, proteínas e enzimas que podem compreender substituições, deleções ou adições de resíduos de aminoácido de ocorrência natural ou não natural comparados com a seqüência de aminoácidos de uma forma de ocorrência natural da proteína, por exemplo, como apresentado em SEQ ID NO: 2. "Derivados" incluem peptídeos oligopeptídeo, polipeptídeos que podem, comparado com a seqüência de aminoácido da forma de ocorrência natural da proteína, como a apresentada em SEQ ID NO: 2, compreendem substituições de aminoácidos com resíduos de aminoácido de ocorrência não natural, ou adições de resíduos de aminoácido de ocorrência não natural. "Derivados" de uma proteína também englobam peptídeos, oligopeptídeos, polipeptídeos que podem compreender resíduos de aminoácidos de ocorrência natural alterados (glicosilados, adiados, ubiquinados, prenilados, fosforilados, miristoilados, sulfatados, etc) ou alterados não naturalmente comparados com a seqüência de aminoácido de forma de ocorrência natural do polipeptídeo. Um derivado também pode compreender um ou mais substituintes não aminoácido ou adições comparadas com a seqüência de aminoácido da qual ele é derivado, por exemplo, uma molécula repórter ou outro ligando, ligado covalentemente ou não covalentemente à seqüência de aminoácido, como uma molécula repórter que é ligada para facilitar sua detecção, e resíduos de aminoácidos não de ocorrência natural com relação à seqüência de aminoácido de uma proteína de ocorrência natural. Os derivados de ortólogos ou parálogos de SEQ ID NO: 2 são ainda exemplos que podem ser apropriados para uso nos métodos da invenção.
O polipeptídeo de tipo Ste20 ou seu homólogo pode ser codificado por uma variante de emenda de um ácido nucleico /gene de tipo Ste20. O termo "variante de emenda" como usado aqui engloba variantes de uma seqüência de ácido nucleico em que íntrons e/ou exons selecionados foram excisados, substituídos, deslocados ou adicionados, ou em que íntrons foram encurtados ou alongados. Estas variantes serão as em que a atividade biológica da proteína é substancialmente retida, isto pode ser obtido por seletivamente retendo os segmentos funcionais da proteína. Estas variantes de emenda podem ser encontradas na natureza ou podem ser feitas pelo homem. Os métodos para fazer estas variantes de emenda são bem conhecidos na arte. As variantes de emenda preferidas são variantes de emenda do ácido nucleico codificando um polipeptídeo compreendendo a seqüência de assinatura Ste20 (SEQ ID NO: 6) e um domínio N-terminal Ser/Thr quinase como definido acima. Preferivelmente, o polipeptídeo de tipo Ste20 ou um seu homólogo adicionalmente compreende SEQ ID NO: 7, mais preferivelmente o polipeptídeo de tipo Ste20 ou seu homólogos compreende uma ou mais das seguintes: SEQ ID NO: 8, SEQ ID NO: 9 e SEQ ID NO: 10. As variantes de emenda preferidas de ácidos nucleicos representadas por SEQ ID NO: 1, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31 e SEQ ID NO: 33. Mais preferida é uma variante de emenda dos ácidos nucleicos representada por SEQ ID NO: 1.
Outra variante de ácido nucleico utilizável nos métodos da invenção é uma variante alélica de um ácido nucleico codificando um polipeptídeo de tipo Ste20 ou um seu homólogo, como definidos acima, preferivelmente uma variante alélica de um ácido nucleico codificando um polipeptídeo de tipo Ste20 compreendendo a seqüência de assinatura Ste20 (SEQ ID NO: 6) e um domínio N-terminal Ser/Thr quinase. Preferivelmente o polipeptídeo de tipo Ste20 ou seu homólogo adicionalmente compreende SEQ ID NO: 7, mais preferivelmente o polipeptídeo de tipo Ste20 ou um seu homólogo compreende uma ou mais dos seguintes: SEQ ID NO: 8, SEQ ID NO: 9 e SEQ ID NO: 10. Ainda preferidas são as variantes alélicas de ácidos nucleicos representadas por SEQ ID NO: 1, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31 e SEQ ID NO: 33. Mais preferida é uma variante alélica de um ácido nucleico como representada por SEQ ID NO: 1. As variantes alélicas existem na natureza, e englobado dentro dos métodos da presente invenção o uso destes alelos natura8is. As variantes alélicas englobam polimorfismos de nucleotídeo único (SNPs), assim como polimorfismos de inserção/ deleção pequenos (INDELs). O tamanho dos INDELs é geralmente menor do que 100 bp. SNPs e INDELs formam o maior conjunto de variantes de seqüência em cepas polimórficas de ocorrência natural da maior parte dos organismos.
Uma outra variante de ácido nucleico utilizável nos métodos da invenção é uma variante de ácido nucleico obtida por embaralhamento de genes. O embaralhamento de genes ou evolução dirigida também pode ser usado para gerar variantes de ácidos nucleicos de tipo Ste20. Isto consiste de interações de embaralhamento de DNA seguido por triagem e/ou seleção apropriadas para gerar variantes de ácidos nucleicos de tipo Ste20, ou suas porções tendo uma atividade biológica modificada. (Castle et al., (2004) Science 304(5674): 1151-4; patentes US 5.811.238 e 6.395.547).
Além disso, a mutagênese dirigida ao sítio pode ser usada para gerar variantes de ácidos nucleicos de tipo Ste20. Vários métodos são disponíveis para obter a mutagênese sítio-dirigida; os mais comuns sendo os métodos com base em PCR (Current Protocols in Molecular Biology. Wiley Eds.).
O ácido nucleico de tipo Ste20 ou variante do mesmo pode ser derivado de qualquer fonte natural ou artificial. O ácido nucleico /gene ou sua variante pode ser isolado de uma fonte microbiana, como levedura ou fungos, ou de uma fonte de plantas, algas ou animais (incluindo humanos). Este ácido nucleico pode ser modificado de sua forma nativa em composição e/ou meio genômico através de manipulação humana deliberada. O ácido nucleico é preferivelmente de origem de plantas, ou na forma da mesma espécie de planta (por exemplo de uma em que ele deve ser introduzido) ou de uma espécie de planta diferente. O ácido nucleico pode ser isolado de espécies dicotiledônea s, preferivelmente da família Brassicaceae, mais preferivelmente de Arabidopsis thaliana. Mais preferivelmente, o ácido nucleico de tipo StelQ é isolado de Arabidopsis thaliana e é representado por SEQ ID NO: 1, e as seqüências de aminoácido de tipo Ste20 são como representadas por SEQ ID NO: 2.
De acordo com um aspecto preferido da presente invenção, a expressão modulada, preferivelmente aumentada, o ácido nucleico de tipo Ste20 ou sua variante, é visada. Os métodos para aumentar a expressão de genes ou produtos de genes são bem documentados na arte e incluem, por exemplo, a super-expressão dirigida por promotores apropriados, o uso de melhoradores de transcrição, ou melhoradores de tradução. Os ácidos nucleicos isolados que serem como elementos de promotor ou melhorador podem ser introduzidos em uma posição apropriada (tipicamente a montante) de uma forma não heteróloga de um polinucleotídeo de modo a regular de modo positivo a expressão de um ácido nucleico de tipo Ste20 ou sua variante. Por exemplo, os promotores endógenos podem ser alterados in vivo por mutação, deleção e/ou substituído (ver, Kmiec, Pat. U.S. No. 5,565,350; Zarling et ai, PCT/US93/03868), ou promotores isolados podem ser introduzidos em uma célula de planta na orientação apropriada e distância de um gene da presente invenção de modo a controlar a expressão do gene. Os métodos para reduzir a expressão de genes ou produtos de genes são bem documentados na arte.
A expressão de um ácido nucleico codificando um polipeptídeo de tipo Ste20 ou seu homólogo pode ser modulada por introdução de uma modificação genética (preferivelmente no locus de um gene de tipo Ste20. O locus de um gene como aqui definido é tomado para significar uma região genômica, que inclui o gene de interesse e 10 kb a montante ou a jusante da região de codificação.
A modificação genética pode ser introduzida por, por exemplo, ativação de T-DNA, TILLING, ou recombinação homóloga. Após introdução da modificação genética, segue-se uma etapa de seleção de expressão modificada de um ácido nucleico codificando um polipeptídeo de tipo Ste20 ou seu homólogo, cuja modificação em expressão dá plantas tendo rendimento aumentado.
A etiqueta de ativação de T-DNA (Hayashi et ai. Science (1992) 1350-1353) envolve a inserção de T-DNA, geralmente contendo um promotor (também pode ser um melhorador de tradução ou um íntron), na região genômica do gene de interesse ou 10 kb a montante ou a jusante da região de codificação de um gene em uma configuração como que o promotor dirige expressão do gene marcado. Tipicamente, a regulação de expressão do gene marcado por seu promotor natural é rompida e o gene cai sob o controle do promotor recentemente introduzido. O promotor é tipicamente envolvido em um T-DNA. Este T-DNA é aleatoriamente inserido no genoma da planta, por exemplo, através de infecção por Agrobacterium e leva à super-expressão de genes próximos do T_DNA inserido. As plantas transgênicas resultantes mostram fenótipos dominantes devido à super-expressão de genes próximo do promotor introduzido. O promotor a ser introduzido pode ser qualquer promotor capaz de dirigir a expressão de um gene no organismo desejado, neste caso uma planta. Por exemplo, promotores constitutivos, preferidos para tecidos, preferidos para tipo de células e indutíveis são todos apropriados para uso em ativação de T-DNA.
Uma modificação genética também pode ser introduzida no locus de um gene de tipo Ste20 usando a técnica de TILLING (Targeted Induced Local Lesions In Genomes - lesões locais induzidas marcadas em genomas). Esta é uma tecnologia de mutagênese utilizável para gerar e/ou identificar (e eventualmente isolar) variantes mutageneizadas de um ácido nucleico de tipo StelO com expressão modulada e/ou atividade. TILLING também permite a seleção de plantas transportando estas variantes mutantes. Estas variantes mutantes podem demonstrar expressão modificada, ou em resistência ou em local ou no tempo (se as mutações afetarem o promotor por exemplo). Estas variantes mutantes podem mesmo demonstrar uma maior atividade de tipo Ste20 do que a mostrada pelo gene em sua forma natural. TILLING combina mutagênese de alta densidade com métodos de triagem de elevada produção. As etapas tipicamente seguidas em TILLING são: (a) mutagênese EMS (Redei GP e Koncz C (1992) em Methods in Arabidopsis Research, Koncz C, Chua NH, Schell J, eds. Singapore, World Scientific Publishing Co, pp. 16-82; Feldmann et al., (1994) em Meyerowitz EM, Somerville CR, eds, Arabidopsis. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY9 pp 137-172; Lightner J e Caspar T (1998), em J Martinez-Zapater, J Salinas, eds, Methods on Molecular Biology, VoL 82. Humana Press, Totowa, NJ, pp 91-104); (b) preparação de DNA e reunião dos indivíduos; (c) amplificação de PCR de uma região de interesse (d) desnaturação e anelamento para permitir a formação de heteroduplexes; (e) DHPLC, onde a presença de um heteroduplex em uma poça é detectada como um pico extra no cromatograma; (f) identificação do indivíduo mutante; e (g) seqüenciamento do produto PCR mutante. Métodos para TILLING são bem conhecidos na arte (McCallum et ai, (2000) Nat Biotechnol 18: 455-457; revisto por Stemple (2004) Nat Rev Genet 5(2): 145-50).
A ativação de T-DNA e TILLING são exemplos de tecnologias que permitem a geração de novos alelos e variantes de tipo Ste20.
Os efeitos da invenção podem ser também reproduzidos usando recombinação homóloga, que permite a introdução em um genoma de um ácido nucleico selecionado em uma posição selecionada definida. A recombinação homóloga é uma tecnologia padrão usada como rotina em ciências biológicas para organismos inferiores como levedura e o musgo Physcomitrella. Os métodos para realizar a recombinação homóloga em plantas foram descritos não somente para plantas modelos (Offringa et ai. (1990) EMBO J 9(10): 3077-84) mas também para plantas de cultura, por exemplo, arroz (Terada et ai (2002) Nat Biotech 20(10): 1030-4; Iida e Terada (2004) Curr Opin Biotech 15(2):132-8). O ácido nucleico a ser marcado (que pode ser um ácido nucleico de tipo Ste20 ou variante do mesmo, como acima definido) não precisa ser marcado no locus de um gene de tipo Ste20, mas pode ser introduzido por exemplo em regiões de expressão elevada. O ácido nucleico a ser marcado pode ser um alelo melhorado usado para substituir o gene endógeno ou pode ser introduzido além do gene endógeno.
Um método preferido para a introdução de uma modificação genética (que neste caso não precisa estar no locus de um gene de tipo Ste20) consiste em introduzir e expressar em uma planta um ácido nucleico codificando uma polipeptídeo de tipo Ste20 ou seu homólogo, como definido acima. O ácido nucleico a ser introduzido em uma planta pode ser um ácido nucleico de comprimento completo ou pode ser uma porção ou uma seqüência de hibridização como acima definido.
A invenção também provê construções genéticas e vetores para facilitar a introdução e/ou expressão das seqüências de nucleotídeos utilizáveis nos métodos de acordo com a invenção.
Assim, provê-se uma construção de genes compreendendo:
i) um ácido nucleico de tipo Ste20 ou variante do mesmo, como definido acima,
(ii) uma ou mais seqüências de controle capazes de dirigir a expressão da seqüência de ácido nucleico de (i); e opcionalmente
(iii) uma seqüência de terminação de transcrição.
As construções utilizáveis nos métodos de acordo com a intermediário podem ser construídas usando tecnologia de DNA recombinante bem conhecidas dos versados. As construções de genes podem ser inseridas nos vetores, que podem ser comercialmente disponíveis, apropriados para transformar em plantas e apropriados para expressão do gene de interesse nas células transformadas.
As plantas são transformadas com um vetor compreendendo a seqüência de interesse (isto é, um ácido nucleico codificando um polipeptídeo de tipo Ste20 ou seu homólogo). O versado conhecem bem os elementos genéticos que devem estar presentes no vetor a fim de transformar, selecionar e propagar com sucesso as células hospedeiras contendo a seqüência de interesse. A seqüência de interesse é ligada operativamente a uma ou mais seqüências de controle (pelo menos a um promotor). Os termos "elemento regulador", "seqüência de controle" e "promotor" são todos usados e modo interpermutável aqui e devem ser tomados em um contexto amplos para fazer referência a seqüências de ácido nucleico regulatórias capazes de efetuar a expressão das seqüências a quais elas são ligadas. O termo " promotor" tipicamente se refere a uma seqüência de controle de ácido nucleico localizada a montante do início de transcrição de um gene e que está envolvida no reconhecimento e ligação de RNA poiimerase e outras proteínas, assim dirigindo a transcrição de um ácido nucleico ligado operativamente. Estão englobadas pelos termos acima mencionados as seqüências regulatórias de transcrição derivadas de um gene genômico eucariótico clássico (incluindo a caixa TATA que é requerida para a iniciação da transcrição precisa, com ou sem uma seqüência de caixa CCAAT) e elementos regulatórios adicionais (isto é, seqüências de ativação a montante, melhoradores e silenciadores), que alteram a expressão dos genes em resposta aos estímulos de desenvolvimento e/ou externos, ou em um modo específico de tecido. Também está incluída no termo uma seqüência regulatória de transcrição de um gene procariótico clássico, neste caso, ele pode incluir uma seqüência de caixa -35 e/ou seqüências regulatórias de transcrição caixa -10. O termo "elemento regulatório" também engloba uma molécula de fusão sintética ou derivado que confere, ativa ou melhora a expressão de uma molécula de ácido nucleico, em uma célula, tecido ou órgão. O termo "ligado operativamente" como usado aqui refere-se a uma ligação funcional entre a seqüência do promotor e o gene de interesse, de modo que a seqüência de promotor é capaz de iniciar a transcrição do gene de interesse.
Os promotores apropriados, que são funcionais em plantas, são geralmente conhecidos. Eles podem tomar a forma de promotores constitutivos ou indutíveis. Os promotores apropriados podem permitir a expressão específica de desenvolvimento e/ou tecido em eucarióticos múltiplos; assim promotores específicos de folhas, raízes, flores, sementes, estomatas, tubérculos, ou frutas podem ser usados com vantagem nas plantas.
Os promotores de plantas diferentes utilizáveis em plantas são promotores como, por exemplo, os promotores USP, LeB4-, DC3 ou o promotor de ubiquitina de salsa.
Um promotor de "planta" compreende elementos regulatórios, que mediam a expressão de um segmento de seqüência de codificação em células de plantas. Conseqüentemente, um promotor de plantas não precisa ser de origem de plantas, mas pode ser originar de vírus ou microorganismos, particularmente por exemplo de vírus que atacam as células de plantas.
O promotor de "planta" também pode se originar de uma célula de plantas, por exemplo, da planta, que é transformada com a seqüência de ácido nucleico a ser expressada no processo da invenção e aqui descrita. Isto também se aplica a outros sinais regulatórios de plantas, por exemplo, em terminadores de "plantas".
Para expressão em plantas, a molécula de ácido nucleico deve, como descrito acima, ser ligada operativamente a ou compreender um promotor apropriado que expressa o gene no ponto correto em tempo e em modo específico de células ou tecido. Os promotores utilizáveis são promotores constitutivos (Benfey et al., EMBO J. 8 (1989) 2195-2202), como os que se originam de vírus de plantas, como 35S CAMV (Franck et al, Cell 21 (1980) 285-294), 19S CaMV (ver também.US 5352605 e WO 84/02913), 34S FMV (Sanger et al, Plant. Mol. Biol., 14, 1990: 433-443), o promotor de ubiquitina de salsa, ou promotores de plantas, como o promotor de subunidade pequena Rubisco descrito em US 4,962,028 ou os promotores de plantas PRPl [Ward et al., Plant. Mol. Biol. 22 (1993)], SSU5 PGEL1, OCS [Leisner (1988) Proc Natl Acad Sci USA 85(5): 2553-2557], lib4, usp, mas [Cornai (1990) Plant Mol Biol 15 (3):373-381], STLS1, ScBV (Schenk (1999) Plant Mol Biol 39(6): 1221-1230), B33, SADl ou SAD2 (promotores de linho, Jain et al, Crop Science, 39 (6), 1999: 1696-1701) ou nos [Shaw et al. (1984) Nucleic Acids Res. 12(20):7831-7846]. Outros exemplos de promotores de plantas constitutivos são os promotores de beterraba de açúcar V-ATPase (WO 01/14572). Exemplos de promotores constitutivos sintético são o promotor Super (WO 95/14098) e promotores derivados de caixas G (WO 94/12015). Se apropriado, promotores indutíveis químicos também podem ser além disso usados, comparar EP-A 388186, EP-A 335528, WO 97/06268. A expressão constitutiva estável das proteínas de acordo com a invenção em uma planta pode ser vantajosa. No entanto, a expressão indutível do polipeptídeo da invenção é vantajosa, se uma expressão tardia antes da colheita for de vantagem, como manipulação metabólica pode levar a retardo no crescimento de plantas.
A expressão de genes de plantas pode ser facilitada também via um promotor indutível químico (para um estudo, ver Gatz 1997, Annu. Rev. Plant PhysioL Plant MoL Biol., 48:89-108). Os promotores quimicamente indutíveis são particularmente apropriados quando se deseja expressar o gene em um modo específico no tempo. Os exemplos destes promotores são promotor indutível de ácido salicílico (WO 95/19443), e promotor indutível de ácido abscíssico (EP 335 528), um promotor indutível de tetraciclina (Gatz et ai. (1992) Plant J. 2, 397-404), um promotor indutível de um ciclohexanol ou etanol (WO 93/21334) ou outros como descrito aqui.
Outros promotores apropriados são os que reagem às condições de estresse biótico ou abiótico, por exemplo, o promotor de gene PRPl induzido por patógeno (Ward et al., Plant. MoL BioL 22 (1993) 361- 366), o promotor hsp80 indutível por calor de tomate (US 5,187,267), o promotor alfa-amilase indutível por frio da batata (WO 96/12814) ou o promotor pinll indutível por ferida (EP-A-0 375 091) ou outros como descrito aqui.
Os promotores preferidos são particularmente os que ocasionam a expressão de genes tem tecidos e órgãos, em células de sementes, como células de endosperma e células do embrião em desenvolvimento. Os promotores apropriados são o promotor do gene napina de colza de semente oleígena (US 5,608,152), o promotor USP de Vicia faba (Baeumlein et al., Mol Gen Genet, 1991, 225 (3): 459-67), o promotor oleosina de Arabidopsis (WO 98/45461), o promotor faseolina de Phaseolus vulgaris (US 5,504,200), o promotor Bce4 de Brassica (WO 91/13980), o promotor arc5 de feijão, o promotor DcG3 de cenoura, ou o promotor B4 de Legumina (LeB4; Baeumlein et al., 1992, Plant Journal, 2 (2): 233-9), e promotores que ocasionam a expressão específica em semente em plantas monocotiledôneas como milho, cevada, trigo, centeio, arroz e outras. Os promotores específicos de sementes vantajosos são o e promotor de proteína de ligação de sacarose (WO/26388), o promotor faseolina e o promotor napins. Os promotores apropriados que devem ser considerados são o promotor de gene lpt2 ou Iptl de cevada (WO 95/15389 and WO 95/23230), e os promotores descritos em WO 99/16890 (promotores de gene hordeina de cevada, o gene glutelina de arroz, o orizina de arroz, o gene prolamina de arroz, o gene gliadina de trigo, o gene glutelina de tribo, o gene zeína de milho, o gene glutelina de aveia, o gene kasirina de sorgo, e o gene secalina de centeio). Outros promotores apropriados são Amy32b, Amy 6-6 e Aleurain [US 5,677,474], Bce4 (colza de semente oleígena) [US 5,530,149], glicinina (soja) [EP 571 741], fosfoenolpiruvato carboxilase (soja) [JP 06/62870], ADRl2-2 (soja) [WO 98/08962], isocitrato liase (colza de semente oleígena) [US 5,689,040] ou α-amilase (cevada) [EP 781 849]. Outros promotores que são disponíveis para a expressão dos genes em plantas são promotores específicos de folhas, com os descritos em DE-A 19644478 ou promotores regulados pela luz, como por exemplo, o promotor petE de ervilha.
Outros promotores de plantas apropriados são o promotor FBPase citosólico ou o promotor ST-LSI de batata (Stockhaus et ai, EMBO J. 8, 1989, 2445), o promotor fosforibosilpirofosfato amidotransferase de Glycine max (GenBank Acesso No. U87999) ou promotor específico de nódulo descrito em EP-A-O 249 676.
Com vantagem, qualquer tipo de promotor pode ser usado para dirigir a expressão da seqüência de ácido nucleico. O promotor pode ser um promotor indutível, isto é, tendo uma iniciação de transcrição induzida ou aumentada em resposta a um produto químico estímulo físico ou ambiental. Um exemplo de um promotor indutível é um promotor indutível por estresse, isto é, um promotor ativado quando uma planta é exposta a várias condições de estresse, ou um promotor induzido por patógeno. Adicionalmente ou alternativamente, o promotor pode ser um promotor preferido de tecido, isto é, um que é capaz de preferivelmente iniciar a transcrição em alguns tecidos, como as folhas, raízes, tecido de sementes, etc, ou pode ser um promotor ubíquo, que é ativo em substancialmente todos os tecidos ou células de um organismo, ou o promotor pode ser regulado no desenvolvimento, assim sendo ativo durante alguns estágios de desenvolvimento ou em partes da planta que sofrem mudanças no desenvolvimento. Os promotores capazes de iniciar a transcrição em alguns tecidos somente são referidos aqui como "específico para tecido", similarmente, os promotores capazes de iniciar a transcrição em algumas células somente são referidos aqui como "específicos de células".
Preferivelmente, o ácido nucleico de tipo StelO ou variante do mesmo é ligado operativamente a um promotor constitutivo. Um promotor constitutivo é transcripcionalmente ativo durante a maior parte, mas não necessariamente, todas as fases de seu crescimento ou desenvolvimento e sob a maior parte das condições ambientais em pelo menos uma célula, tecido ou órgão. Um promotor constitutivo preferido é um promotor constitutivo que é também substancialmente expressado de modo ubíquo. Ainda preferivelmente o promotor é derivado de uma planta, mais preferivelmente uma planta monocotiledônea. Mais preferido é o uso de um promotor G0S2 (de arroz) como usado no cassete de expressão de SEQ ID NO: 5). Deve ser evidente que a aplicabilidade da presente invenção não é limitada ao ácido nucleico de tipo StelO representado por SEQ ID NO: 1, nem é a aplicabilidade da invenção limitada à expressão de um ácido nucleico codificando uma proteína de tipo Ste20 quando dirigida por um promotor G0S2. Os exemplos de outros promotores constitutivos que podem ser também usados para dirigir a expressão de um ácido nucleico codificando uma proteína de tipo Ste20 são mostrados na tabela 2 abaixo. Tabela 2: Exemplos de promotores constitutivos
<table>table see original document page 46</column></row><table>
Opcionalmente, uma ou mais seqüências de terminador (também uma seqüência de controle) pode ser usada na construção introduzida em uma planta. O termo "terminador" engloba uma seqüência de controle que é uma seqüência de DNA no final da unidade de transcrição que assinala processamento 3' e poliadenilação de um transcrito primário e terminação de transcrição. O terminador pode ser derivado do gene natural, de uma variedade de outros genes de plantas, ou de T-DNA. O terminador a ser adicionado pode ser derivado de, por exemplo, os genes nopalina sintase ou octopina sintase, ou alternativamente de outro gene de planta, mesmo preferivelmente de qualquer outro gene eucariótico. Os elementos regulatórios adicionais podem incluir melhoradores de transcrição assim como de tradução. Os versados conhecem as seqüências de terminador e melhorador que podem ser apropriadas para uso na realização da invenção. Estas seqüências devem ser conhecidas ou podem ser prontamente obtidas por um versado.
Uma seqüência de íntron pode ser também adicionada para a região 5' não traduzida ou a seqüência de codificação da seqüência de codificação parcial para aumentar a quantidade de mensagem madura que acumula no citosol. A inclusão de um íntron emendável na unidade de transcrição nas construção de expressão tanto de plantas como de animais foi mostrada como aumentando a expressão dos genes em níveis de mRNA e de proteína em até 1000 vezes; Buchman e Berg, MoL Cell biol. 8:4395-4405 (1988); Callis et ai, Genes Dev. 1:1183-1200 (1987). Esta melhora de introns de expressão de genes é tipicamente maior quando colocada próximo da extremidade 5' da unidade de transcrição. Os usos de introns de milho Adhl-S íntron 1, 2, e 6, o íntron Bronze-I são bem conhecidos na arte. Ver geralmente The Maize Handbook, Cap. 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).
Outras seqüências de controle (além de promotor, melhorador, silenciador, seqüências de introns, regiões 3' UTR e/ou 5' UTR) podem ser elementos de estabilização de proteína e/ou RNA. Estas seqüências devem ser conhecidas ou podem ser prontamente obtidas por um versado na arte.
As construções genéticas da invenção podem ainda incluir uma seqüência de origem de replicação que é requerida para a manutenção e/ou replicação em um tipo de células específico. Um exemplo é quando uma construção genética é requerida para ser mantida em uma célula bacteriana como um elemento genético epissomal (por exemplo molécula de plasmídeo ou cosmídeo). As origens preferidas de replicação incluem, mas não são limitadas a fl-ori e colEl.
Para a detecção e/ou seleção da transferência com sucesso de seqüências de ácido nucleico como mostrado no protocolo de seqüência e usado no processo da invenção, é vantajoso usar genes marcadores (= genes repórter). Estes genes marcadores permitem a identificação de uma transferência com sucesso das moléculas de ácido nucleico via uma série de diferentes princípios, por exemplo, via identificação visual com a ajuda de fluorescência, luminescência ou na faixa de comprimento de onda de luz que é discernível para o olho humano, por uma resistência a herbicidas, ou antibióticos, via os que são conhecidos como marcadores nutritivos (marcadores de auxotrofismo) ou marcadores anti-nutritivos, vias testes de enzimas ou via fitohormônios. Os exemplos destes marcadores que podem ser mencionados são GFP (= proteína fluorescente verde), o sistema luciferina/ luciferase, β-galactosidase com seus substratos coloridos, por exemplo, X- Gal, a resistência aos herbicidas, por exemplo, imidazolinona, glifosato, fosfmotricina ou sulfonil uréia, resistência aos antibióticos por exemplo, bleomicina, higromicina, estreptomicina, canamicina, tetraciclina, cloramphenicol, ampicilina, gentamicina, geneticina (G418), espectinomicina ou blasticidina, para mencionar apenas alguns, marcadores nutritivos, como a utilização de manose ou xilose, ou marcadores anti-nutritivos, como resistência a 2-deoxiglucose. Esta lista é um número pequeno de marcadores possíveis. O versado é muito familiarizado com estes marcadores. Os marcadores diferentes são preferidos, dependendo do organismo e o método de seleção.
Assim, a construção genética pode opcionalmente compreender um gene marcador selecionável. Como usado aqui, o termo "marcador selecionável" ou " gene de marcador selecionável" inclui qualquer gene que confere um fenótipo em uma célula em que ele é expressado para facilitar a identificação e/ou seleção de células que são transfectadas ou transformadas com uma construção de ácido nucleico da invenção. Os marcadores apropriados podem ser selecionados de marcadores que conferem resistência a antibiótico ou herbicida, que introduzem um novo traço metabólico ou que permitem uma seleção visual. Os exemplos de genes marcadores selecionáveis incluem genes conferindo resistência a antibióticos (como nptll, que fosforila neomicina e canamicina, ou hpt, fosforilando higromicina), a herbicidas (por exemplo bar que provê resistência a Basta, aroA ou gox provendo resistência contra glifosato) ou genes que provêem um traço metabólico (como manA que permite às plantas usar manose como a única fonte de carbono). Os genes marcadores visuais resultam na formação de cor (por exemplo β- glucuronidase, GUS), luminescência (como luciferase), ou fluorescência (proteína fluorescente verde, GFP5 e seus derivados).
Conhece-se que a integração estável ou transiente de ácidos nucleicos em células de plantas em que somente uma minoria das células absorve o DNA estranho e, se desejado, integra o mesmo em seu genoma, dependendo do vetor de expressão usado e a técnica de transfecção usada. Para identificar e selecionar estes integrantes, um gene codificando para um marcador selecionável (como descrito acima, por exemplo, resistência a antibióticos) é geralmente introduzido nas células hospedeiras junto com o gene de interesse. Os marcadores selecionáveis preferidos em plantas compreendem os que conferem resistência a um herbicida como glifosato ou glufosinato. Outros marcadores apropriados são, por exemplo, marcadores que codificam genes envolvidos em vias biossintéticas de, por exemplo, açúcares ou aminoácidos, como β-galactosidase, ura3 ou ilv2. Os marcadores que codificam genes como luciferase, gfp, ou outros genes fluorescentes, são do mesmo modo apropriados. Estes marcadores e os marcadores acima mencionados podem ser usados em mutantes dos quais estes genes não são funcionais porque, por exemplo, eles foram deletados por métodos convencionais. Além disso, as moléculas de ácido nucleico que codificam um marcador selecionável, podem ser introduzidas em uma célula hospedeira no mesmo vetor como estes, que codificam os polipeptídeos da invenção ou usados no processo ou também em um vetor separado. As células que foram transfectadas estavelmente com o ácido nucleico introduzido podem ser identificadas por exemplo por seleção (por exemplo células que foram integradas no marcador selecionável sobrevivem, enquanto as outras células morrem).
Porque os genes marcadores, como uma regra especificamente o gene para resistência a antibiótico e herbicidas, não são mais requeridos ou não são desejados na célula hospedeira transgênica uma vez que os ácidos nucleicos foram introduzidos com sucesso, o processo de acordo com a invenção para a introdução de ácidos nucleicos com vantagem emprega técnicas que permitem a remoção, ou excisão, destes genes marcadores. Um tal método é o conhecido como co-transformação. O método de co- transformação emprega dois vetores simultaneamente para a transformação, um vetor contendo o ácido nucleico de acordo com a invenção e um segundo contendo o(s) gene(s) marcador(es). Uma grande proporção de transformantes recebe, ou no caso de plantas, compreende (até 40% dos transformantes e acima), ambos os vetores. No caso de transformação com Agrobacteria5 os transformantes geralmente recebem somente uma parte do vetor, a seqüência flanqueada por T-DNA, que geralmente representa o cassete de expressão. Os genes marcadores podem subseqüentemente ser removidos da planta transformada por realização de cruzamentos. Em outro método, os genes marcadores integrados no transposon são usados para a transformação junto com o ácido nucleico desejado (conhecida com a tecnologia Ac/Ds). Os transformantes podem ser cruzados com um recurso de transposase ou os transformantes são transformados com uma construção de ácido nucleico conferindo expressão de uma transposase, transientemente ou estável. Em alguns casos (aproximadamente 10%), o transposon pula fora do genoma da célula hospedeira uma vez que a transformação ocorreu com sucesso e é perdido. Em um outro número de casos, o transposon pula para um local diferente. Nestes casos, o gene marcador deve ser eliminado por realização de cruzamentos. Em microbiologia, as técnicas foram desenvolvidas que tornam possível, ou facilitam, a detecção destes eventos. Um outro método vantajoso se baseia no que é conhecido como sistemas de recombinação; cuja vantagem é que a eliminação por cruzamento pode ser dispensada. O melhor sistema conhecido deste tipo é o conhecido como o sistema Cre/lox. Crel é uma recombinase, que remove as seqüências localizadas entre as seqüências IoxP. Se o gene marcador for integrado entre as seqüências IoxP, ele é removido, uma vez que a transformação ocorreu com sucesso, por expressão da recombinase. Outros sistemas de recombinação são os sistemas HIN/HIX, FLP/FRT e REP/STB (Tribble et al., J. BioL Chem., 275, 2000: 22255-22267; Velmurugan et al, J. Cell Biol., 149, 2000: 553-566). Uma integração sítio- específica no genoma da planta das seqüências de ácido nucleico de acordo com a invenção é possível. Naturalmente, estes métodos também podem ser aplicados a microorganismos como leveduras, fungos ou bactérias.
A presente invenção também engloba plantas obteníveis pelos métodos de acordo com a presente invenção. A presente invenção assim prove plantas obteníveis pelo método de acordo com a presente invenção, cujas plantas têm introduzidas nas mesmas um ácido nucleico de tipo Ste20 ou variante do mesmo.
A invenção também provê um método para a produção de plantas transgênicas tendo aumentado rendimento, compreendendo a introdução e expressão em uma planta de um ácido nucleico de tipo Ste20 ou uma variante do mesmo, como definido acima.
Para os fins da invenção, "transgênico", "transgene", ou "recombinante" significa com relação a, por exemplo, uma seqüência de ácido nucléico, um cassete de expressão (= construção de gene) ou um vetor compreendendo a seqüência de ácido nucleico ou um organismo transformado com as seqüências de ácido nucléico, cassetes de expressão ou vetores de acordo com a invenção, todas as construções ocasionadas por métodos recombinantes em que ou
a) as seqüências de ácido nucleico de acordo com a invenção,
ou
b) seqüências de controle genético que é ligada operativamente com a seqüência de ácido nucleico de acordo com a invenção, por exemplo, um promotor, ou
c) a) e b) não estão localizadas em seu meio genético natural ou foram modificadas por métodos recombinantes, sendo possível para a modificação tomar a forma de, por exemplo, uma substituição, adição, deleção, inversão ou inserção de um ou mais resíduos de nucleotídeos. O meio genético natural é entendido como significando o locus genômico ou cromossômico na planta original ou a presença em uma biblioteca genômica. No caso de uma biblioteca genômica, o meio genético natural da seqüência de ácido nucleico é preferivelmente retido, pelo menos em parte. O meio flanqueia a seqüência de ácido nucleico pelo menos em um lado e tem um comprimento de seqüência de pelo menos 50 bp, preferivelmente pelo menos 500 bp, especialmente preferivelmente pelo menos 1000 bp, o mais preferivelmente pelo menos 5000 bp. Um cassete de expressão de ocorrência natural - por exemplo a combinação de ocorrência natural do promotor natural das seqüências de ácido nucleico com a seqüência de ácido nucleico correspondente codificando um polipeptídeo tendo domínios quinase ou um homólogo de tal polipeptídeo - se torna um cassete de expressão transgênico quando este cassete de expressão é modificado por métodos não naturais, sintéticos ("artificiais") como, por exemplo, tratamento mutagênico. Os métodos apropriados são descritos, por exemplo, em US 5,565,350 ou WO 00/15815.
Uma planta transgênica para os fins da invenção é assim entendida como significando, como acima, que os ácidos nucleicos usados no método da invenção são estão em seus locus naturais no genoma da referida planta, sendo possível para os ácidos nucleicos serem expressados de modo homólogo ou heterólogo. No entanto, como mencionado, transgênico também significa que, enquanto os ácidos nucleicos de acordo com a invenção ou usados no método da invenção estão em sua posição natural no genoma de uma planta, a seqüência foi modificada com relação à seqüência natural, e/ou que as seqüências regulatórias das seqüências naturais foram modificadas. Transgênico é preferivelmente entendido como significando a expressão dos ácidos nucleicos de acordo com a invenção em um locus não natural no genoma, isto é, expressão homóloga ou, preferivelmente, heteróloga dos ácidos nucleicos ocorre. As plantas transgênicas preferidas são aqui mencionadas.
As plantas hospedeiras para os ácidos nucleicos ou o vetor usado no método de acordo com a invenção, o cassete de expressão ou construção ou vetor são, em princípio, com vantagem todas as plantas, que são capazes de sintetizar os polipeptídeos usados no método da invenção.
Mais especificamente, a presente invenção provê um método para a produção de plantas transgênicas tendo rendimento aumentado, cujo método compreende:
(i) introduzir e expressar em uma célula de plantas um ácido nucleico de tipo Ste20 ou variante do mesmo; e
(ii) cultivar a célula de planta sob condições promovendo o crescimento e desenvolvimento da planta.
O ácido nucleico pode ser introduzido diretamente em uma célula de planta ou na própria planta (incluindo introdução em um tecido, órgão, ou qualquer outra parte de uma planta). De acordo com um aspecto preferido da presente invenção, o ácido nucleico é preferivelmente introduzido em uma planta por transformação.
O termo "introdução" ou "transformação" como referidos aqui engloba a transferência de um polinucleotídeo exógeno em uma célula hospedeira, sem levar em conta o método usado para a transferência. Tecido de planta capaz de propagação clonal subseqüente, seja por organogenese ou embriogenese, pode ser transformado com uma construção genética da presente invenção e uma planta completa regenerada da mesma. O tecido particular selecionado irá variar dependendo dos sistemas de propagação clonais disponíveis ou, e melhor apropriados para, a espécie particular sendo transformada. As marcações de tecido exemplares incluem discos de folha, pólen, embriões, cotilédones, hipocótiles, megagametófitos, tecido de calo, tecido meristemático existente, (por exemplo meristema apical, brotos axilares, e meristemas de raiz) e tecido de meristema induzido (por exemplo meristema de cotilédone e meristema de hipocótilo). O polinucleotídeo pode ser introduzido de modo transiente ou estável em uma célula hospedeira e pode ser mantido não integrado, por exemplo, como um plasmídeo. Alternativamente, ele pode ser integrado no genoma do hospedeiro. A célula de planta transformada resultante pode ser então usada para regenerar uma planta transformada em um modo bem conhecido dos versados na arte.
A transferência de genes estranhos no genoma de uma planta é chamada transformação. Ao fazer isto, os métodos descritos para a transformação e regeneração de plantas a partir de tecidos de plantas ou células de plantas são usados para transformação estável ou transiente. Um método de transformação vantajoso é a transformação in planta. Para isto, é possível, por exemplo, deixar as agrobactérias atuarem sobre as sementes de plantas ou inocular o meristema da planta com agrobactérias. Foi provado ser particularmente expediente de acordo com a invenção permitir uma suspensão de agrobactérias transformadas atuarem sobre a planta intacta ou pelo menos os primórdios da flor. A planta é subseqüentemente cultivada até as sementes da planta tratada serem obtidas (Clough e Bents Plant J. (1998) 16, 735-743). Para selecionar as plantas transformadas, o material de planta obtido na transformação é como uma regra, submetido a condições seletivas de modo que as plantas transformadas podem ser distintas de plantas não transformadas. Por exemplo, as sementes obtidas no modo acima descrito podem ser plantadas e, após um período de crescimento inicial, submetidas a uma seleção apropriada por pulverização. Uma outra possibilidade consiste em crescimento de sementes, se apropriado, após esterilização, em placas de agar usando um agente de seleção apropriado de modo que somente as sementes transformadas podem crescer em plantas. Outros métodos de transformação vantajosos, particularmente para plantas, são bem conhecidos dos versados e descritos abaixo.
A transformação de espécies de plantas é agora uma técnica de rotina conveniente. Com vantagem, qualquer um dos vários métodos de transformação pode ser usado para introduzir o gene de interesse em uma célula ancestral apropriada. Os métodos de transformação incluem o uso de lipossomas, eletroporação, produtos químicos que aumentam a absorção de DNA livre, injeção de DNA diretamente na planta, bombardeio de pistola de partículas, transformação usando vírus ou pólen e microprojeção. Os métodos podem ser selecionados dentre o método de cálcio/ polietileno glicol para protoplastos (Krens, F.A. et ai, (1982) Nature 296, 72-74; Negrutiu I et al. (1987) Plant Mol Biol 8: 363-373); electroporação de protoplastos (Shillito R.D. et al. (1985) Bio/Technol 3, 1099-1102); microinjeção no material de plantas (Crossway A et al., (1986) Mol. Gen Genet 202: 179-185); bombardeio de partículas revestidas com DNA ou RNA (Klein TM et al., (1987) Nature 327: 70) infecção com vírus (não-integrativos) e semelhantes. As plantas de arroz transgênicas expressando um ácido nucleico de tipo Ste20 / gene são preferivelmente produzidas via transformação mediada por Agrobacterium usando qualquer um dos métodos bem conhecidos para a transformação de arroz, como descrito em qualquer um dos seguintes: pedido de patente européia publicado EP 1198985 Al, Aldemita e Hodges (Planta 199: 612-617, 1996); Chan et al. (Plant Mol Biol 22 (3): 491-506, 1993), Hiei et al. (Plant J 6 (2): 271-282, 1994), cujas descrições são incorporadas por referência aqui como completamente especificadas. No caso de transformação de milho, o método preferido é como descrito em ou Ishida et al. (Nat. Biotechnol 14(6): 745-50, 1996) ou Frame et al. (Plant Physiol 129(1): 13-22, 2002), cujas descrições são incorporadas por referência aqui como completamente especificadas. Os referidos métodos são ainda descritos por meio de exemplo em B. Jenes et al., Techniques for Gene Transfer, em: Transgenic Plantsi Vol. 1, Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press (1993) 128-143 e em Potrykus Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 (1991) 205-225). Os ácidos nucleicos ou a construção a ser expressada são preferivelmente clonados em um vetor, que é apropriado para a transformação de Agrobacterium tumefaciens, por exemplo, pBinl9 (Bevan et ai, NueL Aeids Res. 12 (1984) 8711). Agrobactérias transformadas por este vetor podem ser então usadas em modo conhecido para a transformação de plantas, particularmente plantas de cultura como a título de exemplo plantas de tabaco, por exemplo, por banho das folhas machucadas ou folhas cortadas em uma solução agrobacteriana e então cultivando as mesmas em meio apropriado. A transformação de plantas por meio de Agrobacterium tumefaciens é descrita, por exemplo, por Hõfgen e Willmitzer in Nucl. Acid Res. (1988) 16, 9877 ou é conhecida inter alia de F.F. White5 Vectors for Gene Transfer in Higher Plants; em Transgenic Plants, VoL 1, Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press, 1993, pp. 15-38.
Geralmente, após transformação, as células de plantas ou grupamentos de células são selecionados pela presença de um ou mais marcadores que são codificados pelos genes expressáveis em plantas co- transferidos com o gene de interesse, após o que o material transformado é regenerado em uma planta completa.
Como mencionado, agrobactérias transformadas com um vetor de expressão de acordo com a invenção também podem ser usadas no modo conhecido por si para a transformação de plantas como plantas experimentais como Arabidopsis ou plantas de cultura, como por exemplo, cereais, milho, aveia, centeio, cevada, trigo, soja, arroz, algodão, beterraba de açúcar, canola, girassol, linho, cânhamo, batata, tabaco, tomate, cenoura, pimentão, colza de semente oleígena, tapioca, cassava, araruta, tagetes, alfafa, alface e as várias espécies de árvores, nozes, e vinhedos, particularmente planta de cultura contendo óleo, como soja, amendoim, planta de óleo de rícino, girassol, milho, algodão, Iinho5 colza de semente oleígena, coco, palma de óleo, cártamo (Carthamus tinctorius) ou bagos de cacau, por exemplo, por banho das folhas escarificadas ou segmentos de folhas em uma solução agrobacteriana e subseqüentemente cultivando as mesmas em meios apropriados.
Além da transformação de células somáticas, que então precisam ser regeneradas em plantas intactas, é também possível transformar as células de meristemas de plantas e em particular as células que se desenvolvem em gametas. Neste caso, os gametas transformados seguem o desenvolvimento das plantas natural, dando lugar a plantas transgênicas. Assim, por exemplo, sementes de Arabidopsis são tratadas com agrobactérias e sementes são obtidas das plantas em desenvolvimento das quais uma certa proporção é transformada e assim transgênica [Feldman, KA e Marks MD (1987). Mol Gen Genet 208:274-289; Feldmann K (1992). In: C Koncz, N-H Chua e J Shell, eds, Methods in Arabidopsis Research. Word Scientific5 Singapore, pp. 274-289]. Os métodos alternativos são baseados na remoção repetida das influorescências e incubação do sítio de excisão no centro da roseta com agrobactérias transformadas, assim as sementes transformadas podem do mesmo modo ser obtidas em um ponto posterior em tempo (Chang (1994). Plant J. 5: 551-558; Katavic (1994). Mol Gen Genet, 245: 363-370). No entanto, um método especialmente efetivo é o método de infiltração a vácuo com suas modificações como o método de "imersão floral". No caso de infiltração a vácuo de Arabidopsis, as plantas intactas sob pressão reduzida são tratadas com uma suspensão agrobacteriana [Bechthold, N (1993). C R Acad Sci Paris Life Sei, 316: 1194-1199], enquanto no caso do método de "imersão floral" o tecido floral em desenvolvimento é incubado brevemente com uma suspensão agrobacteriana tratada com tensoativo [Clough, SJ e Bent5 AF (1998). The Plant J. 16, 735-743]. Uma certa proporção de sementes transgênicas são coletadas em ambos os casos, e estas sementes podem ser distintas de sementes não transgênicas por cultivo sob as condições seletivas acima mencionadas. Além disso, a transformação estável de plastídeos é de vantagem porque os plastídeos são herdados maternalmente na maior parte das culturas, reduzindo ou eliminando o risco de fluxo de transgenes através do pólen. A transformação do genoma do cloroplasto é geralmente obtida por um processo, que foi esquematicamente mostrado em Klaus et aL, 2004 [Nature Biotechnology 22 (2), 225-229]. Brevemente, as seqüências a serem transformadas são clonadas juntas com um gene marcador selecionável entre as seqüências de flanco homólogas ao genoma do cloroplasto. Estas seqüências de flanco homólogas dirigem a integração específica de sítio no plastoma. A transformação plastidial foi descrita para muitas espécies de plantas diferentes e um estudo pode ser obtido de
Bock (2001) Transgenic plastids in basic research and plant biotechnology. J Mol Biol. 2001 Sep 21; 312 (3):425-38 ou Maliga, P (2003) Progress towards commercialization of plastid transformation technology. Trends BiotechnoL 21, 20-28. Outro progresso biotecnológico foi recentemente relatado na forma de transformantes de plastídeos isentos de marcador, que podem ser produzidos por gene marcador co-integrado transiente (Klaus et aL, 2004, Nature Biotechnology 22(2), 225-229).
As células de plantas geneticamente modificadas podem ser regeneradas via todos os métodos com os quais o versado está familiarizado. Os métodos apropriados podem ser encontrados nas publicações acima mencionadas por S.D. Kung e R. Wu, Potrykus ou Hõfgen e Willmitzer.
Após a transformação e regeneração do DNA, as plantas putativamente transformadas podem ser avaliadas, por exemplo, usando análise Southern, pela presença do gene de interesse, número de cópias e/ou organização genômica. Alternativamente ou adicionalmente, os níveis de expressão do DNA recentemente introduzido podem ser monitorados usando análise Northern e/ou Western, ou PCR quantitativo, todas as técnicas sendo bem conhecidas dos versados na arte.
As plantas transformadas geradas podem ser propagadas por vários meios, como por propagação clonal ou técnica de criação clássicas. Por exemplo, uma planta transformada de primeira geração (ou TI) pode ser auto- cruzada e os transformantes de segunda geração homozigóticos (ou T2) selecionados, e as plantas T2 podem ser então ainda propagadas através de técnicas de criação clássicas.
Os organismos transformados gerados podem tomar várias formas. Por exemplo, eles podem ser quimeras de células transformadas e células não transformadas; transformantes clonais (por exemplo todas as células transformadas para conter o cassete de expressão); enxertos de tecidos transformados ou não transformados (por exemplo em plantas, um material de raiz transformado enxertado em um rebento não transformado).
A presente invenção claramente se estende a qualquer célula de planta ou planta produzida por qualquer um dos métodos aqui descritos, e a todas as partes de plantas e propágulos das mesmas. A presente invenção se estende ainda para englobar a progênie de uma célula, tecido, órgão ou planta completa transformada ou transfectada primaria que foi produzida por qualquer um dos métodos acima mencionados, a única exigência sendo que a progênie demonstre as mesmas característica(s) genotípicas e/ou fenotípicas como as produzidas pelo parental nos métodos de acordo com a invenção. A invenção também inclui as células hospedeiras contendo um ácido nucleico de tipo Ste20 isolado ou variante do mesmo. As células hospedeiras preferidas de acordo com a invenção são células de plantas. A invenção também se estende a partes coletáveis de uma planta como, mas não limitadas a sementes, folhas, frutos, flores, caules, rizomas, tubérculos e bulbos. A invenção além disso refere-se a produtos diretamente derivados de uma parte coletável de uma tal planta, como pelotas ou pós secos, óleo, gordura, e ácidos graxos, amido ou proteínas.
A presente invenção também engloba o uso de ácidos nucleicos de tipo Ste20 ou variantes dos mesmos e uso de polipeptídeos de tipo Ste20 ou seus homólogos.
Um tal uso refere-se à melhora das características de crescimento de plantas, particularmente para melhorar o rendimento, especialmente o rendimento de sementes. O rendimento de sementes pode incluir um ou mais dos seguintes: peso total aumentado de sementes, número aumentado de sementes cheias e índice de colheita aumentado.
Os ácidos nucleicos de tipo Ste20 ou variantes os mesmos, ou polipeptídeos de tipo Ste20 ou seus homólogos podem encontrar uso na criação de programas em que um marcador de DNA é identificado que pode ser geneticamente ligado a um gene de tipo Ste20 ou variante do mesmo. Os ácidos nucleicos de tipo Ste20 / genes ou suas variantes, ou polipeptídeos de tipo Ste20 ou seus homólogos podem ser usados para definir um marcador molecular. Este marcador de DNA ou proteína pode ser então usado em programas de criação para selecionar plantas tendo rendimento aumentado. O gene de tipo Ste20 ou variante do mesmo pode, por exemplo, ser um ácido nucleico como representado por qualquer um dentre SEQ ID NO: 1, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31 e SEQ ID NO: 33.
As variantes alélicas de um ácido nucleico de tipo Ste20 i gene também encontram uso em programas de criação auxiliada por marcador. Estes programas de criação às vezes requerem a introdução de uma variação alélica por tratamento mutagênico das plantas, usando por exemplo mutagênese EMS; alternativamente, o programa pode partir com uma coleção de variantes alélicas de assim chamada origem "natural" causada não intencionalmente. A identificação de variantes alélicas então ocorre, por exemplo, por PCR. Isto é seguido por uma etapa para seleção de variantes alélicas superiores da seqüência em questão e que dão um rendimento aumentado. A seleção é tipicamente realizada por monitoração do desempenho de crescimento de plantas contendo variantes alélicas diferentes da seqüência em questão, por exemplo, variantes alélicas diferentes de qualquer um dentre SEQ ID NO: 1, SEQ ID NO: 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31 e SEQ ID NO: 33. O desempenho de crescimento pode ser monitorado em uma estufa ou no campo. Outras etapas opcionais incluem o cruzamento de plantas, em que a variante alélica superior foi identificada, com outra planta. Isto pode ser usado, por exemplo, para fazer uma combinação de aspectos fenotípicos interessantes.
Um ácido nucleico de tipo Ste20 ou variante do mesmo também pode ser usado como sondas para geneticamente e fisicamente mapear os genes que são uma parte de, e como marcadores de traços ligados a estes genes. Esta informação pode ser utilizável em criação de plantas a fim de desenvolver linhagens com fenótipos desejados. Este uso de ácidos nucleicos de tipo StelO ou variantes dos mesmos requer somente uma seqüência de ácido nucleico de pelo menos 15 nucleotídeo de comprimento. Os ácidos nucleicos de tipo Ste20 ou variantes dos mesmos podem ser usados como marcadores de polimorfismo de comprimento de fragmento de restrição (RFLP). Southern blots (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de DNA genômico de plantas digerido por restrição pode ser sondado com os ácidos nucleicos de tipo Ste20 ou variantes dos mesmos. Os padrões de banda resultantes podem ser então submetidos a análises genéticas usando programas de computador como MapMaker (Lander et al. (1987) Genomics 1: 174-181) a fim de construir um mapa genético. Além disso, os ácidos nucleicos podem ser usados para sondar Southern blots contendo DNAs genômicos tratados com endonuclease de restrição de um conjunto de indivíduos representando parentais e progênies de um cruzamento genético definido. A segregação dos polimorfismos de DNA é notada e usada para calcular a posição do ácido nucleico de tipo Ste20 ou variante do mesmo no mapa genética previamente obtido usando esta população (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).
A produção e uso de sondas derivadas de genes de plantas para uso em mapeamento genético são descritos em Bernatzky e Tanksley (1986) Plant MoL Biol. Repórter 4: 37-41. Numerosas publicações descrevem o mapeamento genético de clones de cDNA específicos usando a metodologia dada acima ou suas variações. Por exemplo, as populações de inter- cruzamento F2, populações de retro-cruzamento, populações casadas aleatoriamente, linhagens isogênicas próximas, e outros conjuntos de indivíduos podem ser usados para o mapeamento. Estas metodologias são bem conhecidas dos versados.
As sondas de ácido nucleico também podem ser usadas para mapeamento físico (isto é, colocação de seqüências em mapas físicos, ver Hoheisel et ai. In: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346, e suas referências citadas ).
Em outra forma de realização, as sondas de ácido nucleico podem ser usadas em mapeamento com hibridização in situ de fluorescência direta (FISH)
(Trask (1991) Trends Genet. 7:149-154). Apesar de métodos correntes de mapeamento FISH favorecerem o uso de clones grandes (vários kb a várias centenas de kb; ver Laan et al. (1995) Genome Res. 5:13-20), melhoras na sensibilidade podem permitir um desempenho de mapeamento de FISH usando sondas mais curtas.
Vários métodos com base em amplificação de ácido nucleico para mapeamento genético e físico podem ser realizados usando os ácidos nucleicos. Os exemplos incluem amplifícação específica de alelo (Kazazian (1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentos amplificados por PCR (CAPS; Sheffield et ai. (1993) Genomics 16:325-332), ligação específica para alelo (Landegren et ai. (1988) Science 241:1077- 1080), reações de extensão de nucleotídeos (Sokolov (1990) Nucleic Acid Res. 18:3671), mapeamento de híbridos com radiação Walter et al. (1997) Nat. Genet. 7:22-28) e "Happy Mapping" (Dear and Cook (1989) Nucleic Acid Res. 17:6795-6807). Para estes métodos, a seqüência de um ácido nucleico é usada para projetar e produzir pares de iniciadores para uso na reação de amplifícação ou em reações de extensão de iniciador. O projeto destes iniciadores é bem conhecido dos versados na arte. Em métodos empregando mapeamento genética com base em PCR, pode ser necessário identificar diferenças de seqüência de DNA entre os parentais do cruzamento do mapeamento na região correspondendo à presente seqüência de ácido nucléico. Isto, no entanto, não é geralmente necessário para métodos de mapeamento.
Os métodos de acordo com a presente invenção resultam em plantas tendo rendimento aumentado, como descrito acima. Estas características de crescimento vantajosas também podem ser combinadas com outros traços economicamente vantajosos, como outros traços de melhora do rendimento, tolerância a vários estresses, traços modificando vários aspectos arquitetônicos e/ou aspectos bioquímicos e/ou fisiológicos.
DESCRIÇÃO DAS FIGURAS
A presente invenção será agora descrita com referência ás seguintes figuras em que:
A figura 1 mostra a estrutura de domínio típica de polipeptídeos de tipo Ste20. A extremidade N-terminal da proteína compreende um domínio Ser/Thr quinase. O domínio o mais C-terminal (em cinza claro) tem uma estrutura de espiral espiralada, que é geral mas nem sempre está presente.
A figura 2 mostra um vetor binário p070, para expressão em Oryza sativa de uma seqüência de codificação de tipo Ste20 de Arabidopsis thaliana sob o controle de um promotor GOS2 (referência interna PROO129).
A figura 3 detalha exemplos de seqüências utilizáveis para realização dos método de acordo com a presente invenção.
Exemplos
A presente invenção será agora descrita com referência aos seguintes exemplos, que são a título de ilustração apenas. Salvo indicado em contrário, técnicas de DNA recombinantes são realizadas de acordo com os protocolos padrões descritos em (Sambrook (2001) Molecular Cloning: a laboratory manual, 3a. ed. Cold Spring Harbor Laboratory Press, CSH, New York) ou em Volumes 1 e 2 def Ausubel et al. (1994), Current Protocols in Molecular Biology, Current Protocols. Materiais padrões e métodos para trabalho molecular com plantas são descritos em Plant Molecular Biology Labfax (1993) por R.D.D. Croy, publicado por BIOS Scientific Publications Ltd (UK) e Blackwell Scientific Publications (UK).
Exemplo 1: identificação de homólogos de proteína de tipo Ste20 de SEQID NO: 2 e determinação de sua similaridade/identidade
As seqüências (cDNA de comprimento completo, ESTs ou genômico) relacionadas com a seqüência de ácido nucleico usada nos métodos da presente invenção foram identificadas dentre as mantidas na base de dados Entrez Nucleotides no National Center for Biotechnology Information usando ferramentas de busca de seqüências de base de dados, como Basic Local Alignment Tool (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215:403-410; e Altschul et al. (1997) Nucleic Acids Res. 25:3389- 3402). Este programa é tipicamente usado para encontrar regiões de similaridade local entre seqüências por comparação das seqüências de ácido nucleico ou polipeptídeo com bases de dados de seqüência e por cálculo da significância estatística de correspondências. O polipeptídeo codificado pelo ácido nucleico da presente invenção foi usado com o algoritmo TBLASTN, com configurações de default e o filtro para ignorar seqüências de baixa complexidade foi fixado. A saída da análise foi vista por comparação à feição de pares, e classificada de acordo com o escore de probabilidade (valor E), onde o escore reflete a probabilidade de que um alinhamento particular ocorre por acaso (quanto menor o valor E, mais significante a dica). Além dos valores Es comparações também foram classificadas por identidade percentual. A identidade percentual refere-se ao número de nucleotídeos idênticos (ou aminoácidos) entre duas seqüências de ácido nucleico (ou polipeptídeo) comparadas sobre um comprimento particular. Em alguns casos, os parâmetros de default podem ser ajustados para modificar a estringência da busca.
As seqüências de arroz e seqüências EST de várias espécies de plantas também podem ser obtidas de outras bases de dados, como KOME (Knowledge-based Oryza Molecular biological Encyclopedia; Kikuchi et al., Science 301, 376-379, 2003), Sputnik (Rudd, S., Nucleic Acids Res., 33: D622 - D627, 2005) ou a base de dados de ortólogos de genes eucarióticos (EGO, hospedado pelo Institute for Genomic Research). Estas bases de dados podem ser pesquisadas com a ferramenta BLAST. SEQ ID NO: 11 a SEQ ID NO: 34 são seqüências de ácido nucleico e proteína de homólogos de SEQ ID NO: 2 e foram obtidas das bases de dados acima mencionadas usando a SEQ ID NO: 2 com a seqüência de consulta.
As porcentagens de similaridade e identidade entre as seqüências de comprimento completo e as seqüências de domínios quinase de proteínas de tipo Ste20 foram determinadas usando software MatGAT (Matrix Global Alignment Tool) (BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein ou DNA sequences. Campanella JJ, Bitincka L, Smalley J; software hospedado por Ledion Bitincka). 0 software MatGAT gera matrizes de similaridade /identidade para seqüências de DNA ou proteína sem precisar de um pré- alinhamento dos dados. O programa realiza uma série de alinhamento à feição dos pares usando o algoritmo de alinhamento global de Myers e Miller (com uma penalidade de abertura de espaço de 22, e uma penalidade de extensão de espaço de 1), calcula a similaridade e a identidade usando por exemplo Blosum 62 (para polipeptídeos) e então coloca os resultados em uma matriz de distância. A similaridade de seqüência é mostrada na metade de fundo da linha divisória e identidade de seqüência é mostrada na metade de topo da linha divisória diagonal. A seqüência de SEQ ID NO: 2 é indicada como o número 1 na matriz.
Os domínios de quinase das proteínas de tipo Ste-20 foram delineados usando a ferramenta SMART e as seqüências obtidas são relacionadas na tabela 3.
Tabela 3: Relação dos domínios quinase nas várias SEQ ID Nos:
<table>table see original document page 66</column></row><table> <table>table see original document page 67</column></row><table>
Resultados da análise MATGAT são mostrados na tabela 4 para as seqüências de comprimento completo e na tabela 5 para os domínios quinase do polipeptídeos de tipo Ste20. A identidade percentual é dada acima da diagonal (em negrito) e a similaridade percentual é dada abaixo da diagonal (fonte normal). A identidade percentual entre os domínios quinase de parálogos e ortólogos de tipo Ste20 de SEQ ID NO: 2 está na faixa entre 44% (para SEQ ID NO: 28) e 71% (para SEQ ID NO: 34). Tabela 4
<table>table see original document page 68</column></row><table>
Tabela 5
<table>table see original document page 68</column></row><table> Exemplo 2: Clonagem de genes de tipo Ste20
O gene de tipo StelO de Arabidopsis thaliana foi amplificado por PCR usando como gabarito uma biblioteca de cDNA de mudas de Arabidopsis thaliana (Invitrogen, Paisley, UK). Após a transcrição reversa de RNA extraído de mudas, os cDNAs foram clonados em pCMV Sport 6.0. Um tamanho de inserto médio do banco foi de 1,5 kb e o número original de clones foi da ordem de 1,59 χ 107 cfu. O título original foi determinado para ser de 9,6 χ 105 cfu/ml após a primeira amplificação de 6 χ 1011 cfu/ml. Após a extração de plasmídeos,
200 ng de gabarito foram usados em uma mistura 50 μΐ PCR.
Os iniciadores
prm03186 (SEQ ID NO: 3; sentido, códon de partida em negrito, sítio AttB 1 em itálico: 5' - ggggacaagtttgtacaaaaaagcaggcttcacaatggctcggã&cââgctc 3') e prm03187 (SEQ ID NO: 4; reverso, complementar, sítio AttB2 em itálico: 5' ggggaccactttgtacaagaaagctgggtaitagttaacccLa&&csLCtitcttSL 3'), que incluem os sítios AttB para recombinação Gateway, foram usados para a amplificação PCR. PCR foi realizado usando Hifi Taq DNA polimerase em condições padrões. Um fragmento de PCR de 1532 bp (incluindo sítios attB) foi amplificado e purificado também usando métodos padrões. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada durante o que o fragmento de PCR recombina in vivo com o plasmídeo pDONR201 para produzir, de acordo com a terminologia Gateway, um "clone de entrada", p068. Plasmídeo pDONR201 foi adquirido de Invitrogen, como parte da tecnologia Gateway®.
Exemplo 3: Construção de vetor
O clone de entrada p068 foi subseqüentemente usado em uma reação LR com p00640, um vetor de destinação usado para transformação de Oryza sativa. Este vetor contém, como elementos funcionais, dentro das bordas do T-DNA: um marcador selecionável para planta, cassete de expressão de marcador triável, e um cassete Gateway destinado para recombinação LR in vivo com a seqüência de interesse já clonada no clone de entrada. Um promotor GOS2 de arroz (nucleotídeos 1 a 2193 de SEQ ID NO: 5) para a expressão constitutiva (PR00129) estava localizado a montante deste cassete Gateway.
Após a etapa de recombinação LR, o vetor de expressão resultante,
p070 para o tipo Ste20 (Figura 2) foi transformada em cepa de Agrobacterium LBA4044 e subseqüentemente em plantas de Oryza sativa. As plantas de arroz transformadas foram deixadas crescer e foram então examinadas para os parâmetros descritos no Exemplo 4.
Exemplo 4: Avaliação e resultados de tipo Ste20 sob o controle do promotor GOS2 de arroz
Aproximadamente 15 a 20 transformantes independentes TO de arroz foram gerados. Os transformantes primários foram transferidos de uma câmara de cultura de tecido para uma estufa para crescer e coletar a semente TI. Cinco eventos, dos quais a progênie de TI, segregou 3:1 para a presença/ ausência do transgene, foram retidos. Para cada um destes eventos, aproximadamente 10 mudas Tl contendo o transgene (hetero- e homo- zigotos) e aproximadamente 10 mudas Tl faltando o transgene (nulizigotos) foram selecionadas por monitoração da expressão do marcador visual. As plantas Tl selecionadas foram transferidas para a estufa. Cada planta recebeu um único rótulo de código de barras para ligar de modo não ambíguo os dados de fenotipagem para a planta correspondente. As plantas Tl selecionadas foram cultivadas em solo em vasos de 10 cm de diâmetro sob as seguintes configurações ambientais: fotoperíodo= 11,5 h, intensidade da luz do dia = 30,000 lux ou mais, temperatura do dia= 28°C, temperatura da noite= 22°C, umidade relativa = 60-70%. As plantas transgênicas e os nulizigotos correspondentes foram cultivados lado a lado em posições aleatórias. Do estágio de semeadura até o estágio de maturidade, as plantas foram passadas várias vezes através de uma cabine de formação de imagem digital. Em cada ponto de tempo, imagens digitais (2048x1536 pixels, 16 milhões de cores) foram tomadas de cada planta de pelo menos 6 ângulos diferentes.
As panículas primárias maduras foram coletadas, ensacadas, rotuladas com código de barras e então secadas durante três dais no forno a 37°C. As panículas foram então debulhadas e todas as sementes coletadas. As cascas debulhadas cheias foram separadas das vazias usando um dispositivo de sopro de ar. Após separação, ambos os lotes de sementes foram então contados usando uma máquina de contagem comercialmente disponível. Os debulhados vazios foram descartados. Os debulhados cheios foram pesados em uma balança analítica e a área de seção transversal da sementes foi medida usando imagem digital. Este procedimento resultou no conjunto dos seguintes parâmetros relacionados com as sementes:
O número de sementes cheias foi determinado por contagem dos número de debulhados cheios que permaneceram após a etapa de separação. O rendimento de sementes total foi medido por peso de todos os debulhados cheios coletados de uma planta. O número de semente total por planta foi medido por contagem do número de debulhados coletados de uma planta. O peso de mil grãos (TKW), é extrapolado do número de sementes cheias contadas e seu peso total. O índice de colheita é definido com a relação entre o peso de semente total e a área acima da tem (mm), multiplicado por um fator 106. Estes parâmetros foram derivados em um modo automatizado das imagens digitais usando software de análise de imagem e foram analisados estatisticamente. Os parâmetros de sementes individuais (incluindo largura, comprimento, área peso) foram medidos usando um dispositivo feito sob encomenda consistindo de dois componentes principais, um dispositivo de pesagem e de formação de imagem, acoplado a um software para análise da imagem.
Um ANOVA de dois fatores (análises de variância) corrigidos para o projeto não equilibrado foi usado como modelo estatístico para a avaliação global de características fenotípicas de plantas. Um teste F foi realizado em todos os parâmetros medidos de todas as plantas de todos os eventos transformados com este gene. O teste F foi realizado para verificar um efeito do gene sobre todos os eventos de transformação e para verificar um efeito global do gene, também chamado aqui "efeito de gene". Se o valor de teste F mostra que os dados são significantes, então é concluído que se tem um efeito de "gene" significando que não apenas a presença ou a posição do gene está causando o efeito. O limiar para a significância para um efeito de gene global verdadeiro é fixado a 5% de nível de probabilidade para o teste F.
Para verificar um efeito dos genes dentro de um evento, isto é, para um efeito específico de linha, um teste t foi realizado dentro de cada evento usando conjuntos de dados das plantas transgênicas e as plantas nulas correspondentes. "Plantas nulas" ou "segregantes nulos" ou "nulizigotos" são as plantas tratadas do mesmo modo que a planta transgênica, mas das quais o transgene foi segregado. As plantas nulas também podem ser descritas como as plantas transformadas negativas homozigóticas. O limiar para a significância para o teste t é fixado a 10% de nível de probabilidade. Os resultados para alguns eventos podem estar acima ou abaixo deste limiar. Isto é baseado na hipótese de que um gene pode somente ter um efeito em algumas posições no genoma, e que a ocorrência deste efeito dependente de posição não é incomum. Este tipo de efeito de gene é também chamado aqui de um "efeito de linha do gene". 0 valor ρ é obtido por comparação do valor t para a distribuição t ou alternativamente, por comparação do valor F para a distribuição F. O valor ρ então dá a probabilidade de que a hipótese de nulo (isto é, que não se tem efeito do transgene) está correto.
Os dados obtidos para Ste20 na primeira experiência foram confirmados em uma segunda experiência com plantas T2. Quatro linhas que tinham o padrão de expressão correto foram selecionadas para outra análise. As bateladas de sementes das plantas positivas (ambos hetero- e homozigotos) em TI, foram tríadas por monitoração da expressão do marcador. Para cada evento selecionado, as bateladas de sementes heterozigóticas foram então retidas para avaliação de T2. Dentro de cada batelada de semente, um número igual de plantas positivas e negativas foram cultivadas na estufa para avaliação.
Um número total de 120 plantas transformadas Ste 20 foram avaliadas na geração de T2, isto é, 30 plantas por evento das quais 15 positivas para o transgene e 15 negativas.
Porque as duas experiências com eventos de sobreposição tinham sido realizadas, uma análise combinada foi realizada. Isto é utilizável para verificar a consistência dos efeitos sobre as duas experiências, e se este for o caso, para acumular evidências de ambas as experiências a fim de aumentar a confiança na conclusão. O método usado foi uma abordagem de modelo misto que leva em conta a estrutura de múltiplos níveis dos dados (isto é, experiência - evento - segregantes). Os valores P são obtidos por comparação do teste de relação de probabilidade para as distribuições de chi quadrado.
Exemplo 5: Avaliação dos transformantes de Ste20: medida dos parâmetros relacionados com o rendimento
Quando da análise das sementes como descrito acima, os inventores verificaram que as plantas transformadas com a construção de gene Ste20 tinham um maior rendimento de semente, expressado como o número de sementes cheias, peso total de sementes e índice de colheita, comparado com as plantas faltando o transgene SteIO.
Os resultados obtidos para plantas na geração Tl são resumidos na tabela 6: Tabela 6:
<table>table see original document page 74</column></row><table>
Estes resultados positivos foram novamente obtidos na geração T2. Na tabela 7, os dados mostram que a % global aumenta para o número de sementes cheias, peso total de sementes e índice de colheita, calculados a partir dos dados das linhagens individuais da geração T2, e os valores ρ respectivos. Estes dados de T2 foram re-avaliados em uma análise combinada com os resultados para a geração Tl, e os valores ρ obtidos mostram que os efeitos observados foram altamente significantes.
Tabela 7:
<table>table see original document page 74</column></row><table> LISTAGEM DE SEQÜÊNCIA
<110> CropDesign N.V.
<120> Plantas tendo rendimento aumentado e um método para fabricar as mesmas <130> PF57841 <150> <151> EP 05106135.6 2005-07-06 <150> <151> US 60/697.38 2005-07-08 <160> 34 <170> PatentIn versão 1.3 <210> <211> <212> <213> 1 1554 DNA Arabidopsis thaliana <400> 1
cataacaatt caataagcaa gagtgtactc atcttctttc tatttatggc tcggaacaag 60 ctcgagttcc ctcttgatgc tgaagcctac gagatcatct gcaagatagg cgttggtgtt 120 agtgcttcgg tctacaaggc catatgcatt ccgatgaact caatggtagt tgctatcaaa 180 gccatcgatc ttgatcagtc gcgggctgac tttgacagtc ttcgccgtga aaccaagacg 240 atgtctctgc tttctcatcc gaatattctc aatgcttatt gttcattcac cgttgatcga 300 tgtctctggg tggttatgcc attcatgtct tgtggctctc ttcattcgat cgtctcttcg 360 tcttttccaa gtgggttacc agaaaactgc atttccgtct tcctcaagga aactctgaat 420 gcaatctcgt atcttcacga tcagggtcat ttgcaccgtg acatcaaggc aggtaacatt 480 ctggtagatt ctgatggatc cgtgaagctc gctgatttcg gagtatctgc atccatctat 540 gaacccgtga catcttcctc tggaacaaca tcttcttctt taaggttaac tgatatagcg 600 ggaacaccgt attggatggc tccggaagtg gttcattccc acacagggta tggtttcaaa 660 gcagacattt ggtctttcgg gataacagcg ttggagttag cacatggaag acctccgtta 720 tctcacttac cgccgttgaa gagtctgctc atgaagatca ccaaaaggtt tcatttttct 780 gattacgaga tcaatacgag cggaagcagc aaaaagggta acaagaagtt ctcaaaagct 840 tttagagaaa tggttggttt gtgtctagag caagatccta ctaaaagacc atcggcagag 900 aagttgttga agcatcctt t tttcaagaac tgtaaaggac tcgactttgt ggtcaagaac 960 gtgttgcata gcttgtcaaa cgcagagcag atgtttatgg agagtcagat tttgatcaag 1020 agtgttggag atgatgatga agaagaagaa gaagaagacg aagagatagt gaagaataga 1080 agaatcagtg ggtggaattt ccgtgaagac gatctccaac ttagtccagt gttcccagct 1140 actgaatcag actcttctga gtccagtcca cgtgaagaag atcaatcaaa agacaaaaag 1200
gaagacgata acgtcacaat aacggggtat gaactcggtt taggtttgtc gaacgaggaa 1260
gctaagaacc aagaaggtga ggttgttggg tttgataaag atttggtgtt agagaaactg 1320
aaagtgttga agaaaagttt agagcatcaa agagcaagag tgtcgattat aatcgaagca 1380
ttgagtgggg acaaggaaga gaagagcaga gaagaagagc ttctagagat ggtggagaag 1440
ttaaagattg aattggaaac tgagaagcta aagaccttgc gtgctgataa agatagtgtt 1500
ttgggttaac tattctaaac ttgttaatat tttttttcta tatgctaaaa ttat 1554
<210> 2 <211> 487 <212> PRT
<213> Arabidopsis thaliana <400> 2
Met Ala Arg Asn Lys Leu Glu Phe Pro Leu Asp Ala Glu Ala Tyr Glu
1 5 10 15
Ile Ile Cys Lys Ile Gly Val Gly Val Ser Ala Ser Val Tyr Lys Ala
20 25 30
Ile Cys Ile Pro Met Asn Ser Met Val Val Ala Ile Lys Ala Ile Asp
35 40 45
Leu Asp Gln Ser Arg Ala Asp Phe Asp Ser Leu Arg Arg Glu Thr Lys
50 55 60
Thr Met Ser Leu Leu Ser His Pro Asn Ile Leu Asn Ala Tyr Cys Ser
65 70 75 80
Phe Thr Val Asp Arg Cys Leu Trp Val Val Met Pro Phe Met Ser Cys 85 90 95
Gly Ser Leu His Ser Ile Val Ser Ser Ser Phe Pro Ser Gly Leu Pro 100 105 HO
Glu Asn Cys Ile Ser Val Phe Leu Lys Glu Thr Leu Asn Ala Ile Ser 115 120 125
Tyr Leu His Asp Gln Gly His Leu His Arg Asp Ile Lys Ala Gly Asn
130 135 140
Ile Leu Val Asp Ser Asp Gly Ser Val Lys Leu Ala Asp Phe Gly Val 145 150 155 160
Ser Ala Ser Ile Tyr Glu Pro Val Thr Ser Ser Ser Gly Thr Thr Ser 165 170 175
Ser Ser Leu Arg Leu Thr Asp Ile Ala Gly Thr Pro Tyr Trp Met Ala 180 185 190
Pro Glu Val Val His Ser His Thr Gly Tyr Gly Phe Lys Ala Asp Ile 195 200 205
Trp Ser Phe Gly Ile Thr Ala Leu Glu Leu Ala His Gly Arg Pro Pro 210 215 220
Leu Ser His Leu Pro Pro Leu Lys Ser Leu Leu Met Lys Ile Thr Lys 225 230 235 240
Arg Phe His Phe Ser Asp Tyr Glu Ile Asn Thr Ser Gly Ser Ser Lys 245 250 255
Lys Gly Asn Lys Lys Phe Ser Lys Ala Phe Arg Glu Met Val Gly Leu 260 265 270
Cys Leu Glu Gln Asp Pro Thr Lys Arg Pro Ser Ala Glu Lys Leu Lei 275 280 285
Lys His Pro Phe Phe Lys Asn Cys Lys Gly Leu Asp Phe Val Val Lys 290 295 300
Asn Val Leu His Ser Leu Ser Asn Ala Glu Gln Met Phe Met Glu Ser 305 310 315 320
Gln Ile Leu Ile Lys Ser Val Gly Asp Asp Asp Glu Glu Glu Glu Glu 325 330 335
Glu Asp Glu Glu Ile Val Lys Asn Arg Arg Ile Ser Gly Trp Asn Phe 340 345 350
Arg Glu Asp Asp Leu Gln Leu Ser Pro Val Phe Pro Ala Thr Glu Ser 355 360 365
Aso Ser Ser Glu Ser Ser Pro Arg Glu Glu Asp Gln Ser Lys Asp Lys 370 375 380
Lys Glu Asp Asp Asn Val Thr Ile Thr Gly Tyr Glu Leu Gly Leu Gly 385 390 395 400
Leu Ser Asn Glu Glu Ala Lys Asn Gln Glu Gly Glu Val Val Gly Phe 405 410 415 Asp Lys Asp Leu Val Leu Glu Lys Leu Lys Val Leu Lys Lys Ser Leu 420 425 430
Glu His Gln Arg Ala Arg Val Ser Ile Ile Ile Glu Ala Leu Ser Gly 435 440 445
Asp Lys Glu Glu Lys Ser Arg Glu Glu Glu Leu Leu Glu Met Val Glu 450 455 460
Lys Leu Lys Ile Glu Leu Glu Thr Glu Lys Leu Lys Thr Leu Arg Ala 465 470 475 480
Asp Lys Asp Ser Val Leu Gly 485
<210> 3
<211> 52
<212> DNA
<213> Seqüência artificial
<220>
<223> iniciador: prm0318 6
<400> 3
ggggacaagt ttgtacaaaa aagcaggctt cacaatggct cggaacaagc tc 52
<210> 4
<211> 56
<212> DNA
<213> Seqüência artificial
<220>
<223> iniciador: prm03187
<400> 4
ggggaccact ttgtacaaga aagctgggta atagttaacc caaaacacta tcttta
56
<210> 5 <211> 3710 <212> DNA
<213> Seqüência artificial
<220>
<223> cassete de expressão
<400> 5
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120 catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata
180 240 300 aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360 atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420 ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480 ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540 gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600 tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660 tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720 aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780 aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840 acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900 tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960 aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020 ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080 cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140 cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200 tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260 gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320 ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380 gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440 aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500 ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560 atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620 acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680 cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740 ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800 gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860 tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920 attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980 tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040 cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100 agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160 tggtgtagct tgccactttc accagcaaag ttcatttaaa tcaactaggg atatcacaag 2220 tttgtacaaa aaagcaggct tcacaatggc tcggaacaag ctcgagttcc ctcttgatgc 2280 tgaagcctac gagatcatct gcaagatagg cgttggtgtt agtgcttcgg tctacaaggc 2340 catatgcatt ccgatgaact caatggtagt tgctatcaaa gccatcgatc ttgatcagtc 2400 gcgggctgac tttgacagtc ttcgccgtga aaccaagacg atgtctctgc tttctcatcc 2460 gaatattctc aatgcttatt gttcattcac cgttgatcga tgtctctggg tggttatgcc 2520 attcatgtct tgtggctctc ttcattcgat cgtctcttcg tcttttccaa gtgggttacc 2580 agaaaactgc atttccgtct tcctcaagga aactctgaat gcaatctcgt atcttcacga 2640 tcagggtcat ttgcaccgtg acatcaaggc aggtaacatt ctggtagatt ctgatggatc 2700 cgtgaagctc gctgatttcg gagtatctgc atccatctat gaacccgtga catcttcctc 2760 tggaacaaca tcttcttctt taaggttaac tgatatagcg ggaacaccgt attggatggc 2820 tccggaagtg gttcattccc acacagggta tggtttcaaa gcagacattt ggtctttcgg 2880 gataacagcg ttggagttag cacatggaag acctccgtta tctcacttac cgccgttgaa 2940 gagtctgctc atgaagatca ccaaaaggtt tcatttttct gattacgaga tcaatacgag 3000 cggaagcagc aaaaagggta acaagaagtt ctcaaaagct tttagagaaa tggttggttt 3060 gtgtctagag caagatccta ctaaaagacc atcggcagag aagttgttga agcatccttt 3120 tttcaagaac tgtaaaggac tcgactttgt ggtcaagaac gtgttgcata gcttgtcaaa 3180 cgcagagcag atgtttatgg agagtcagat tttgatcaag agtgttggag atgatgatga 3240 agaagaagaa gaagaagacg aagagatagt gaagaataga agaatcagtg ggtggaattt 3300 ccgtgaagac gatctccaac ttagtccagt gttcccagct actgaatcag actcttctga 3360 gtccagtcca cgtgaagaag atcaatcaaa agacaaaaag gaagacgata acgtcacaat 3420 aacggggtat gaactcggtt taggtttgtc gaacgaggaa gctaagaacc aagaaggtga 3480 ggttgttggg tttgataaag atttggtgtt agagaaactg aaagtgttga agaaaagttt 3540 agagcatcaa agagcaagag tgtcgattat aatcgaagca ttgagtgggg acaaggaaga 3600 gaagagcaga gaagaagagc ttctagagat ggtggagaag ttaaagattg aattggaaac 3660 tgagaagcta aagaccttgc gtgctgataa agatagtgtt ttgggttaac 3710
<210> 6
<211> 10
<212> PRT
<213> Seqüência artificial
<220>
<223> seqüência de assinatura ste20
<220>
<221> MISC ASPECTO <222> (2)..(2)
<223> Xaa pode ser Thr ou Asn
<220>
<221> MISC_ASPECTO
<222> (4)..(4)
<223> Xaa pode ser Tyr, Cys ou Arg
<220>
<221> MISC_ASPECTO
<222> (5). . (5)
<223> Xaa pode ser Trp ou Arg
<220>
<221> MISC_ASPECTO
<222> (10)..(10)
<223> Xaa pode ser Val ou Lys
<400> 6
Gly Xaa Pro Xaa Xaa 1 5
Met Ala Pro Glu Xaa 10
<210> 7
<211> 10
<212> PRT
<213> Seqüência artificial
<220>
<223> seqüência de consenso
<220>
<221> MISC_ASPECTO
<222> (1) . . (1)
<223> Xaa pode ser Ser, His ou Asn
<220>
<221> MISC_ASPECTO
<222> (2)..(2)
<223> Xaa pode ser Ile ou LEu
<220>
<221> MISC_ASPECTO
<222> (3) . . (3)
<223> Xaa pode ser Vai, lie, Leu ou Met
<220>
<221> MISC_ASPECTO
<222> (4) . . (4)
<223> Xaa pode ser Ser ou Lys
<220>
<221> MISC_ASPECTO
<222> (5)..(5)
<223> Xaa pode ser Ser, His, Thr, Ala, Ile ou Val
<220>
<221> MISC_ASPECTO
<222> (6) . . (6)
<223> Xaa pode ser Ser, Gly, Val ou Ala <220>
<221> MISC_ASPECTO
<222> (7) .. (7)
<223> Xaa pode ser Phe ou Tyr
<220>
<221> MISC__ASPECTO
<222> (8) .. (8)
<223> Xaa pode ser Pro ou Gln
<220>
<221> MI SC__AS PECTO
<222> (9)..(9)
<223> Xaa pode ser Ser, Asn, Asp ou Glu
<400> 7
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gly 1 5 10
<210> 8
<211> 9
<212> PRT
<213> Seqüência artificial
<220>
<223> seqüência de consenso
<220>
<221> MISC_ASPECTO
<222> (1) .. (1)
<223> Xaa pode ser Val ou Ile
<220>
<221> MISC_ASPECTO
<222> (5)..(5)
<223> Xaa pode ser Thr, Asn ou Val
<220>
<221> MISC_ASPECTO
<222> (8) .. (8)
<223> Xaa pode ser Gly ou Ser
<220>
<221> MISC_ASPECTO
<222> (9)..(9)
<223> Xaa pode ser Phe ou Ile
<4 00> 8
Xaa His Ser His Xaa Gly Tyr Xaa Xaa
1 5
<210> 9
<211> 12
<212> PRT
<213> Seqüência artificial
<220>
<223> seqüência de consenso <220>
<221> MISC_ASPECTO
<222> (10) .. (10)
<223> Xaa pode ser Leu ou Ser
<400> 9
Arg Pro Pro Leu Ser His Leu Pro Pro Xaa Lys Ser 1 5 10
<210> 10
<211> 8
<212> PRT
<213> Seqüência artificial
<220>
<223> seqüência de consenso
<400> 10
Arg Arg Ile Ser Gly Trp Asn Phe 1 5
<210> 11
<211> 2772
<212> DNA
<213> Arabidopsis thaliana
<400> 11
cagacgacag aaaagctaac cacaagagga ggagagaaac tcgataacaa acaagagaaa 60 gagaaagcga gattctaaaa tctaatctcg tgcttccaat tcaaataatt ttgtctcctt 120 agcggatcga tcgtagatta taaagctccg ccgtcgcctc cgccgcaatc gacggcggtg 180 tctacgtcgc tttcgtttcg tgcgtaacag gaggagcagc agcaaaataa gtcagcttaa 240 gtaacgccgt ctttgatttg acttgagata agtattttgg tgatatggca ttgatgatgt 300 ttccgcattt gctcgacgtt gacgaaaagt aaaatgctgg cgaattggaa gaaaccacat 360 acagattgat gctctcttca gtcgacctct tttgtaaatt tgttgaaact tacggggtcg 420 aaggtgtgta gcatatatgc tataagaaga ttataaagta aaaattatgg aatcgggttc 480 agagaaaaag ttccctctca atgcaaaaga ctacaagtta tatgaagaaa ttggagatgg 540 tgtcagtgcg actgtgcata gagctttgtg tataccgctt aatgtggtag ttgctatcaa 600 ggttcttgat ctggaaaagt gcaacaacga tctggatggg atccggagag aggtgcaaac 660 aatgagtctg atcaaccatc caaatgtgtt gcaagctcat tgctcattta ccaccggaca 720 ccagctttgg gttgtgatgc cttacatggc tggaggatct tgtctccata taattaagtc 780 ttcctatcca gatggatttg aggaacctgt tatcgctact ttacttcgtg agactctgaa 840 agctcttgta tatcttcatg ctcatgggca tatccacagg gatgtgaagg ctggaaacat 900
77 tttattggat tccaatggtg ccgttaagtt agcagacttt ggagtatcag cttgcatgtt 960 tgatacggga gatagacaac gttccagaaa tacatttgtt gggactccat gctggatggc 1020 tcctgaagtc atgcagcaac tacatggata tgatttcaaa gcagatgtat ggtcatttgg 1080 aataacagca cttgaattgg cacatggtca tgccccattt tccaaatatc cgccaatgaa 1140 ggttttgctg atgaccttac aaaatgcacc tcctggactt gactacgaga gagacaaaag 1200 attctcgaaa gccttcaagg aaatggtggg tacatgcctg gtgaaggacc caaagaagcg 1260 tccaacttca gaaaagcttt tgaaacaccc tttcttcaaa catgcacgtc cagctgatta 1320 cctggttaaa acaattctaa atggtcttcc tccattaggt gatcgctata gacaaataaa 1380 gtcgaaggaa gctgatctcc taatgcaaaa caaatctgaa tatgaagcgc acttatcaca 1440 gcaagagtat ataaggggaa taagcgcttg gaatttcaat ctcgaggacc taaaaactca 1500 agctgccctt atttcagatg atgatacttc acatgctgaa gagcccgatt tcaaccaaaa 1560 gcaatgtgaa agacaggatg aatctgctct ttcccctgaa agggctagca gctcagcaac 1620 agctcctagt caagatgacg aactgaatga tattcatgat ttagagagtt ctttcgcctc 1680 atttccaatc aaacctcttc aagcactaaa aggctgcttt gatatcagtg aggacgagga 1740 taatgcaact actcctgatt ggaaagatgc taatgtaaat tctggacaac agcttttaac 1800 aaaggcttcc attggatctt tggccgaaac cacgaaagaa gaggacactg cagcacaaaa 1860 cacttcttta ccacgtcatg tcatttctga acagaaaaaa tatttgagcg gttcaattat 1920 accagagagt actttctctc caaaaagaat cacatctgat gctgataggg agtttcaaca 1980 gcgtagatat caaacagagc ggagctacag cggatcatta taccgcacca agagagattc 2040 cgtggacgag acgtcagaag tcccgcatgt ggagcacaag ggacggttta aggtcacatc 2100 agcagatctg agtcccaagg gatctacaaa ctctacattc acaccattta gtggtggtac 2160 aagcagccct agttgcctca atgctacaac cgcctcaatc ctcccatcaa ttcagtcgat 2220 tttgcagcaa aatgctatgc aacgggaaga gattttgaga ctaatcaaat acttggagca 2280 aacctctgcc aagcaacctg gatcgcctga gacgaacgtc gatgacctat tgcagacgcc 2340 tcctgcaacc tcacgagaga gagaacttca gtctcaagtc atgctactac aacaaagctt 2400 ttccagccta acagaagaac taaagaaaca gaagcagaaa aatgggcagt tggagaatca 2460 gttgaacgca ttaacacaca gaaatgattg agtctcaaaa gccatcgaga caaggctgag 2520 agatacaact ggggatcttg agttaaaaaa acacaaaatt ccctttcaag gcaaaaagaa 2580 gaaatagaga agatttgtgt gctttatatt tctattgggt gtaatttgtt tgacaggttt 2640 atattatgtg acaactacta cagtgatttt cttatttttg gggaagtttt ccccactttt 2700 cttttttact tatttgtgtt ttatgatatg ctatgtaaac aaaatactat tgtttaatta 2760 tgtttctgtg tg 2772 <210> 12 <211> 674 <212> PRT
<213> Arabidopsis thaliana
<400> 12
Met Glu Ser Ser Ser Glu Lys Lys Phe Pro Leu Asn Ala Lys Asp Tyr 1 5 10 15
Lys Leu Tyr Glu Glu Ile Gly Asp Gly Val Ser Ala Thr Val His Arg 20 25 30
Ala Leu Cys Xle Pro Leu Asn Val Val Val Ala Ile Lys Val Leu Asp 35 40 45
Leu Glu Lys Cys Asn Asn Asp Leu Asp Gly Ile Arg Arg Glu Val Gln 50 55 60
Thr Met Ser Leu Ile Asn His Pro Asn Val Leu Gln Ala His Cys Ser 65 70 75 80
Phe Thr Thr Gly His Gln Leu Trp Val Val Met Pro Tyr Met Ala Gly 85 90 95
Gly Ser Cys Leu His Ile Ile Lys Ser Ser Tyr Pro Asp Gly Phe Glu 100 105 HO
Glu Pro Val Ile Ala Thr Leu Leu Arg Glu Thr Leu Lys Ala Leu Val 115 120 125
Tyr Leu His Ala His Gly His Ile His Arg Asp Val Lys Ala Gly Asn 130 135 140
Ile Leu Leu Asp Ser Asn Gly Ala Val Lys Leu Ala Asp Phe Gly Val 145 150 155 160
Ser Ala Cys Met Phe Asp Thr Gly Asp Arg Gln Arg Ser Arg Asn Thr 165 170 175
Phe Val Gly Thr Pro Cys Trp Met Ala Pro Glu Val Met Gln Gln Leu 180 185 190
His Gly Tyr Asp Phe Lys Ala Asp Val Trp Ser Phe Gly Ile Thr Ala 195 200 205
Leu Glu Leu Ala His Gly His Ala Pro Phe Ser Lys Tyr Pro Pro Met 210 215 220 Lys Val Leu Leu Met Thr Leu Gln Asn Ala Pro Pro Gly Leu Asp Tyr 225 230 235 240
Glu Arg Asp Lys Arg Phe Ser Lys Ala Phe Lys Glu Met Val Gly Thr 245 250 255
Cys Leu Val Lys Asp Pro Lys Lys Arg Pro Thr Ser Glu Lys Leu Leu 260 265 270
Lys His Pro Phe Phe Lys His Ala Arg Pro Ala Asp Tyr Leu Val Lys 275 280 285
Thr Ile Leu Asn Gly Leu Pro Pro Leu Gly Asp Arg Tyr Arg Gln Ile 290 295 300
Lys Ser Lys Glu Ala Asp Leu Leu Met Gln Asn Lys Ser Glu Tyr Glu 305 310 315 320
Ala His Leu Ser Gln Gln Glu Tyr Ile Arg Gly Ile Ser Ala Trp Asn 325 330 335
Phe Asn Leu Glu Asp Leu Lys Thr Gln Ala Ala Leu Ile Ser Asp Asp 340 345 350
Asp Thr Ser His Ala Glu Glu Pro Asp Phe Asn Gln Lys Gln Cys Glu 355 360 365
Arg Gln Asp Glu Ser Ala Leu Ser Pro Glu Arg Ala Ser Ser Ser Ala 370 375 380
Thr Ala Pro Ser Gln Asp Asp Glu Leu Asn Asp Ile His Asp Leu Glu 385 390 395 400
Ser Ser Phe Ala Ser Phe Pro Ile Lys Pro Leu Gln Ala Leu Lys Gly 405 410 415
Cys Phe Asp Ile Ser Glu Asp Glu Asp Asn Ala Thr Thr Pro Asp Trp 420 425 430
Lys Asp Ala Asn Val Asn Ser Gly Gln Gln Leu Leu Thr Lys Ala Ser 435 440 445
Ile Gly Ser Leu Ala Glu Thr Thr Lys Glu Glu Asp Thr Ala Ala Gln 450 455 460
Asn Thr Ser Leu Pro Arg His Val Ile Ser Glu Gln Lys Lys Tyr Leu 465 470 475 480
Ser Gly Ser Ile Ile Pro Glu Ser Thr Phe Ser Pro Lys Arg Ile Thr 485 490 495
Ser Asp Ala Asp Arg Glu Phe Gln Gln Arg Arg Tyr Gln Thr Glu Arg 500 505 510
Ser Tyr Ser Gly Ser Leu Tyr Arg Thr Lys Arg Asp Ser Val Asp Glu 515 520 525
Thr Ser Glu Val Pro His Val Glu His Lys Gly Arg Phe Lys Val Thr 530 535 540
Ser Ala Asp Leu Ser Pro Lys Gly Ser Thr Asn Ser Thr Phe Thr Pro 545 550 555 560
Phe Ser Gly Gly Thr Ser Ser Pro Ser Cys Leu Asn Ala Thr Thr Ala 565 570 575
Ser Ile Leu Pro Ser Ile Gln Ser Ile Leu Gln Gln Asn Ala Met Gln 580 585 590
Arg Glu Glu Ile Leu Arg Leu Ile Lys Tyr Leu Glu Gln Thr Ser Ala 595 600 605
Lys Gln Pro Gly Ser Pro Glu Thr Asn Val Asp Asp Leu Leu Gln Thr 610 615 620
Pro Pro Ala Thr Ser Arg Glu Arg Glu Leu Gln Ser Gln Val Met Leu 625 630 635 640
Leu Gln Gln Ser Phe Ser Ser Leu Thr Glu Glu Leu Lys Lys Gln Lys 645 650 655
Gln Lys Asn Gly Gln Leu Glu Asn Gln Leu Asn Ala Leu Thr His Arg 660 665 670
Asn Asp
<210> 13 <211> 1785 <212> DNA
<213> Arabidopsis thaliana
<400> 13
atggctggtt catcaacgaa acgatttcct ctatatgcta aagattatga gctctttgaa gaggtaggag aaggtgttag tgctactgtg tatagagctc gttgcattgc tcttaacgag 120 attgtcgctg ttaaaatctt ggatctcgaa aaatgcagga atgatttgga aacaatacgc 180 aaggaagttc atataatgag tttgattgat catccgaatt tattgaaagc gcattgttcg 240 tttatcgaca gtagtagttt gtggattgta atgccttata tgtcgggtgg ttcttgtttt 300 catttaatga aatctgtata tccggaaggt cttgagcaac ctataattgc tactttgttg 360 agggaagtgc ttaaagctct tgtttatctt catagacaag gtcacatcca tagagatgtt 420 aaggctggga atatattgat tcactcaaaa ggcgtagtta aacttggaga ctttggagtt 480 tcagcatgta tgtttgatag tggagaaaga atgcaaacaa ggaatacatt cgttgggact 540 ccttgttgga tggcacctga ggttatgcag caactagatg gatatgattt caagtatctt 600 gctcatggtc atgccccatt ttccaaatat ccacctatga aggtgctact aatgacatta 660 caaaatgcac ctcctcgtct agactatgac agagataaga aattctcaaa gtcatttaga 720 gagttaatcg cagcgtgctt agttaaagat ccgaaaaagc gtccaactgc agcaaaactt 780 ctgaaacatc ctttcttcaa acatgctcgg tctacagatt atttgtcccg taaaattctt 840 catggtcttt ctccacttgg tgaacgtttt aaaaagctca aggaggcaga ggctgagttg 900 ttcaaaggca taaatggtga caaagaacag ttgtctcagc atgagtatat gagaggaatt 960 agtgcttgga actttgatct tgaagcattg agaaggcagg catcacttgt aattattcca 1020 aatgaagaaa tctataattc agagatacag gaactgaaca gaaatggaga tgtaccaaaa 1080 ggaaaaccag tgatacaaag gtcacagact atgcctttgg aatatttctc agaaaaggca 1140 agtgatatgg tgagtgagag tagcagtcaa ttaaccggtt cattacttcc ttcgtttcat 1200 cgcaaattcc tcccggctct tggcaatgca tgtaactcga gcgatagagc agcagagaag 1260 ctcgcttttg aagagccacg tcaagtacta cacccattag cggatacaaa gaaaattaga 1320 aaagcaggaa gtgatcagca ggagaaacca aaaaatggtt acgcagatag tcctgtgaac 1380 cgtgaatctt ccacattatc aaaggaacca ttagcggata caaagcaagt tagaaaacca 1440 ggaaatgagc aggagaaacc aaaaaacggc tatatagtta gtcatgtgaa ccgtgaatct 1500 tccacatcag aggaaatcct cccactgttg cagagtctcc tggttcagaa tgacattcaa 1560 agggcgcaag taatcaggtt aattagattt tttgatcgaa ctgcgaaaac ggaaaatcca 1620 atctcaaaaa ccgaaggagt gcaggagaaa gatctgcaat ctcaagttca gtttttggag 1680 caaagtgttg agaagcttgt agaggaagtt cagagaagaa aagatataaa tagtcagcta 1740 gagcaacaga tcagctctct gattagcagc aacaacatct cttaa 1785
<210> 14
<211> 594
<212> PRT
<213> Arabidopsis thaliana <400> 14
Met Ala Gly Ser Ser Thr Lys Arg Phe Pro Leu Tyr Ala Lys Asp Tyr 1 5 10 15
Glu Leu Phe Glu Glu Val Gly Glu Gly Val Ser Ala Thr Val Tyr Arg 20 25 30
Ala Arg Cys Ile Ala Leu Asn Glu Ile Val Ala Val Lys Ile Leu Asp 35 40 45
Leu Glu Lys Cys Arg Asn Asp Leu Glu Thr Ile Arg Lys Glu Val His 50 55 60
Ile Met Ser Leu Ile Asp His Pro Asn Leu Leu Lys Ala His Cys Ser 65 70 75 80
Phe Ile Asp Ser Ser Ser Leu Trp Ile Val Met Pro Tyr Met Ser Gly 85 90 95
Gly Ser Cys Phe His Leu Met Lys Ser Val Tyr Pro Glu Gly Leu Glu 100 105 HO
Gln Pro Ile Ile Ala Thr Leu Leu Arg Glu Val Leu Lys Ala Leu Val 115 120 125
Tyr Leu His Arg Gln Gly His Ile His Arg Asp Val Lys Ala Gly Asn 130 135 140
Ile Leu Ile His Ser Lys Gly Val Val Lys Leu Gly Asp Phe Gly Val 145 150 155 160
Ser Ala Cys Met Phe Asp Ser Gly Glu Arg Met Gln Thr Arg Asn Thr 165 170 175
Phe Val Gly Thr Pro Cys Trp Met Ala Pro Glu Val Met Gln Gln Leu 180 185 190
Asp Gly Tyr Asp Phe Lys Tyr Leu Ala His Gly His Ala Pro Phe Ser 195 200 205
Lys Tyr Pro Pro Met Lys Val Leu Leu Met Thr Leu Gln Asn Ala Pro 210 215 220
Pro Arg Leu Asp Tyr Asp Arg Asp Lys Lys Phe Ser Lys Ser Phe Arg 225 230 235 240 Glu Leu Ile Ala Ala Cys Leu Val Lys Asp Pro Lys Lys Arg Pro Thr 245 250 255
Ala Ala Lys Leu Leu Lys His Pro Phe Phe Lys His Ala Arg Ser Thr 260 265 270
Asp Tyr Leu Ser Arg Lys Ile Leu His Gly Leu Ser Pro Leu Gly Glu 275 280 285
Arg Phe Lys Lys Leu Lys Glu Ala Glu Ala Glu Leu Phe Lys Gly Ile 290 295 300
Asn Gly Asp Lys Glu Gln Leu Ser Gln His Glu Tyr Met Arg Gly Ile 305 310 315 320
Ser Ala Trp Asn Phe Asp Leu Glu Ala Leu Arg Arg Gln Ala Ser Leu 325 330 335
Val Ile Ile Pro Asn Glu Glu Ile Tyr Asn Ser Glu Ile Gln Glu Leu 340 345 350
Asn Arg Asn Gly Asp Val Pro Lys Gly Lys Pro Val Ile Gln Arg Ser 355 360 365
Gln Thr Met Pro Leu Glu Tyr Phe Ser Glu Lys Ala Ser Asp Met Val 370 375 380
Ser Glu Ser Ser Ser Gln Leu Thr Gly Ser Leu Leu Pro Ser Phe His 385 390 395 400
Arg Lys Phe Leu Pro Ala Leu Gly Asn Ala Cys Asn Ser Ser Asp Arg 405 410 415
Ala Ala Glu Lys Leu Ala Phe Glu Glu Pro Arg Gln Val Leu His Pro 420 425 430
Leu Ala Asp Thr Lys Lys Ile Arg Lys Ala Gly Ser Asp Gln Gln Glu 435 440 445
Lys Pro Lys Asn Gly Tyr Ala Asp Ser Pro Val Asn Arg Glu Ser Ser 450 455 460
Thr Leu Ser Lys Glu Pro Leu Ala Asp Thr Lys Gln Val Arg Lys Pro 465 470 475 480
Gly Asn Glu Gln Glu Lys Pro Lys Asn Gly Tyr Ile Val Ser His Val 485 490 495 Asn Arg Glu Ser Ser Thr Ser Glu Glu Ile Leu Pro Leu Leu Gln Ser 500 505 510
Leu Leu Val Gln Asn Asp Ile Gln Arg Ala Gln Val Ile Arg Leu Ile 515 520 525
Arg Phe Phe Asp Arg Thr Ala Lys Thr Glu Asn Pro Ile Ser Lys Thr 530 535 540
Glu Gly Val Gln Glu Lys Asp Leu Gln Ser Gln Val Gln Phe Leu Glu 545 550 555 560
Gln Ser Val Glu Lys Leu Val Glu Glu Val Gln Arg Arg Lys Asp Ile 565 570 575
Asn Ser Gln Leu Glu Gln Gln Ile Ser Ser Leu Ile Ser Ser Asn Asn 580 585 590
Ile Ser
<210> 15 <211> 1422 <212> DNA
<213> Arabidopsis thaliana <400> 15
atgacgagtt caccggaaac gagatttcct ctggttgcga aagattacga gattttagaa
60
gagataggcg atggtgttta cagagctcga tgcattctac ttgatgaaat tgtagccatc 120 aagatctgga accttgaaaa atgcaccaac gatctggaaa ccataaggaa agaagttcat 180 agattgagct taattgatca tccaaatcta ttgagggtgc attgctcttt catagatagt agcagcttgt ggattgtgat gccttttatg tcgtgcggct cttccttgaa cataatgaaa tcagtctatc caaatggtct tgaggaacct gtaattgcta tattgttgcg ggagattctt aaagctcttg tttaccttca tggactagga cacatccatc gaaatgttaa ggctgggaat gtactggttg actcagaagg aactgttaag ctcggtgact ttgaagtttc agcatccatg tttgatagtg tggaaaggat gcgtactagt tctgagaata cttttgttgg aaatccacgc cggatggcac ctgagaagga tatgcagcaa gttgatggct atgatttcaa agtggatatc tggtcgtttg gcatgactgc cctggaactt gcccatggtc attcacctac cacggtgcta ccattgaact tacaaaattc tccctttcct aactatgaag aagacacgaa attctctaag tcttttagag agttggtcgc agcttgcttg atagaagatc cagaaaaacg tccgaccgct tcacaactac tggaatatcc gttcttacag caaactcttt ctactgaata cttggctagt acatttcttg atggcctctc tccgcttggt gagcgttata gaaagctgaa ggaggaaaag 900 gccaagttgg ttaaaggtgt agatggtaac aaggagaaag tatctcagga aaatgttgaa 960 gcgctgctga tggaacctgc tagtcttgtg aaccctgttt cttgtgatac tgctcaagtc 1020 ctcccaatct tacagaatat cctgatccaa aatgatatcc aaagggaaaa tgttgaagcg 1080 ctgctgacgg aacctgctat tcttgtgaac cctgtttctt gtgatactgc tcaagtcctc 1140 ccaatcgtac agaatatcct gatccagaat gatatccaaa ggaaaaggtt aatcggttta 1200 atgcaactct gtgatccaac tgctggtaag tttgctgttc tatcactaga atttgcatct 1260 tctctatgtt acaagttcca tgacctgatc ttgatttttg tacagaaatc agaattccga 1320 ttggcaatac agaagttggg cagatatcaa caacagagac agatctattg tctgaggttc 1380 acgttttgca gcagaggtaa tgataaattc cacaagcttt aa 1422
<210> 16 <211> 473 <212> PRT
<213> Arabidopsis thaliana <400> 16
Met Thr Ser Ser Pro Glu Thr Arg Phe Pro Leu Val Ala Lys Asp Tyr 1 5 10 15
Glu Ile Leu Glu Glu Ile Gly Asp Gly Val Tyr Arg Ala Arg Cys Ile 20 25 30
Leu Leu Asp Glu Ile Val Ala Ile Lys Ile Trp Asn Leu Glu Lys Cys 35 40 45
Thr Asn Asp Leu Glu Thr Ile Arg Lys Glu Val His Arg Leu Ser Leu 50 55 60
Ile Asp His Pro Asn Leu Leu Arg Val His Cys Ser Phe Ile Asp Ser 65 70 75 80
Ser Ser Leu Trp Ile Val Met Pro Phe Met Ser Cys Gly Ser Ser Leu 85 90 95
Asn Ile Met Lys Ser Val Tyr Pro Asn Gly Leu Glu Glu Pro Val Ile 100 105 HO
Ala Ile Leu Leu Arg Glu Ile Leu Lys Ala Leu Val Tyr Leu His Gly 115 120 125
Leu Gly His Ile His Arg Asn Val Lys Ala Gly Asn Val Leu Val Asp 130 135 140 Ser Glu Gly Thr Val Lys Leu Gly Asp Phe Glu Val Ser Ala Ser Met 145 150 155 160
Phe Asp Ser Val Glu Arg Met Arg Thr Ser Ser Glu Asn Thr Phe Val 165 170 175
Gly Asn Pro Arg Arg Met Ala Pro Glu Lys Asp Met Gln Gln Val Asp 180 185 190
Gly Tyr Asp Phe Lys Val Asp Ile Trp Ser Phe Gly Met Thr Ala Leu 195 200 205
Glu Leu Ala His Gly His Ser Pro Thr Thr Val Leu Pro Leu Asn Leu 210 215 220
Gln Asn Ser Pro Phe Pro Asn Tyr Glu Glu Asp Thr Lys Phe Ser Lys 225 230 235 240
Ser Phe Arg Glu Leu Val Ala Ala Cys Leu Ile Glu Asp Pro Glu Lys 245 250 255
Arg Pro Thr Ala Ser Gln Leu Leu Glu Tyr Pro Phe Leu Gln Gln Thr 260 265 270
Leu Ser Thr Glu Tyr Leu Ala Ser Thr Phe Leu Asp Gly Leu Ser Pro 275 280 285
Leu Gly Glu Arg Tyr Arg Lys Leu Lys Glu Glu Lys Ala Lys Leu Val 290 295 300
Lys Gly Val Asp Gly Asn Lys Glu Lys Val Ser Gln Glu Asn Val Glu 305 310 315 320
Ala Leu Leu Met Glu Pro Ala Ser Leu Val Asn Pro Val Ser Cys Asp 325 330 335
Thr Ala Gln Val Leu Pro Ile Leu Gln Asn Ile Leu Ile Gln Asn Asp 340 345 350
Ile Gln Arg Glu Asn Val Glu Ala Leu Leu Thr Glu Pro Ala Ile Leu 355 360 365
Val Asn Pro Val Ser Cys Asp Thr Ala Gln Val Leu Pro Ile Val Gln 370 375 380
Asn Ile Leu Ile Gln Asn Asp Ile Gln Arg Lys Arg Leu Ile Gly Leu 385 390 395 400 Met Gln Leu Cys Asp Pro Thr Ala Gly Lys Phe Ala Val Leu Ser Leu
Glu Phe Ala Ser Ser Leu Cys Tyr Lys Phe His Asp Leu Ile Leu Ile
Phe Val Gln Lys Ser Glu Phe Arg Leu Ala Ile Gln Lys Leu Gly Arg
Tyr Gln Gln Gln Arg Gln Ile Tyr Cys Leu Arg Phe Thr Phe Cys Ser
Arg Gly Asn Asp Lys Phe His Lys Leu
<210> 17 <211> 2085 <212> DNA
<213> Arabidopsis thaliana
<400> 17
atggagaaga agaagtatcc aattggacca gagcattata ctctctacga gtttattgga 60
caaggtgtta gtgctctagt gcatcgtgct ttgtgcattc cgtttgatga agtcgttgct 120
attaagattc ttgattttga acgcgataac tgcgatctga acaacatctc tcgtgaagcg 180
cagacgatga tgcttgttga tcatcccaat gtgttgaagt cacattgttc ctttgttagt 240
gatcacaatt tgtgggtcat catgccatac atgtctggtg gttcttgtct tcacattcta 300
aaagctgcat atcctgatgg ttttgaagaa gctattatag ctactatatt gcgtgaagct 360
ttgaagggat tagactatct ccatcagcat ggccacattc atcgcgatgt caaagctggg 420
aatatattgc ttggtgctcg aggtgcagtc aagttgggag actttggtgt atctgcctgt 480
ctctttgatt caggtgatag gcaacggaca aggaacacat ttgttggaac accttgctgg 540
atggcacctg aagtcatgga gcagctacat ggttatgact tcaaggctga tatttggtcg 600
tttggtataa ctgggctaga gcttgctcat ggtcacgctc ctttctctaa atatccacca 660
atgaaggttc tgcttatgac gttgcaaaat gcaccaccag ggctggatta cgaaagagat 720
aagaagtttt ccaggtcttt caagcagatg atcgccagtt gtctagttaa agacccttcc 780
aaacgcccgt ctgcaaaaaa gttgttaaag cactcctttt tcaagcaagc aagatcaagc 840
gattacattg cacgaaaact tctggatggg ttaccagatc ttgttaatcg tgttcaggca 900
ataaagagaa aggaagaaga tatgcttgca caagagaaaa tggcagatgg agaaaaggaa 960
gaattgtccc agcctttaaa cgcttgtcat agtaccatgc agaatgaata taagagaggt 1020
atcagcgggt ggaatttcaa tcttgatgat atgaaagccc aggcttcatt gatccaggac 1080 atggactgtg gcttttcgga cagtttatcg ggaagtgcaa cttcgttgca ggctctagat 1140 tcacaggata cacaatcgga gattcaggag gatactggtc aaataactaa taagtatctc 1200 caacctctga ttcaccgaag tctaagtatc gcgagggata aatctgatga tgattcaagt 1260 cttgccagcc ccagttatga tagctacgta tattcctccc cccgtcatga ggatttatct 1320 ttaaacaata cacatgttgg tagtacgcat gcaaacaatg ggaaaccaac ggatgccaca 1380 tcaatcccaa ccaatcaacc aacagagatt atagcaggga gctctgtttt ggcagatgga 1440 aatggtgctc ccaataaagg agagagtgat aaaactcaag aacagcttca aaacgggtca 1500 aactgcaatg ggacacatcc tacagtggga ggagatgacg taccaacgga gatggctgtt 1560 aaaccaccca aagcagcatc aagcctagat gaatctgatg acaaatcaaa gccgccagtt 1620 gtgcagcaaa gagggcgttt taaagtaact tctgaaaatc tcgacatcga gaaggtggtg 1680 gcgccttcgc caatactgca aaagagtcac agcatgcagg tgctctgcca acattcctct 1740 gcttctctac ctcactctga tgtcacattg ccaaacctaa ccagctcata tgtttacccg 1800 ctggtgtatc cagttctgca aactaatatt ttggaaaggg ataacatttt gcatatgatg 1860 aaagtactca ccaacagaga gttgacagat ggacgtgcag ttgaacaagg aagtatacaa 1920 caacctactg tgcccccaac tgagaaatcc atgcttgaag cagcacacga aagagagaaa 1980 gaactgctcc atgacataac cgacctgcaa tggaggctca tttgtgcaga agaagagctt 2040 cagaaataca aaaccgaaca cgcccaagta agtatgagta actaa 2085
<210> 18 <211> 694 <212> PRT
<213> Arabidopsis thaliana <400> 18
Met Glu Lys Lys Lys Tyr Pro Ile Gly Pro Glu His Tyr Thr Leu Tyr 1 5 10 15
Glu Phe Ile Gly Gln Gly Val Ser Ala Leu Val His Arg Ala Leu Cys 20 25 30
Ile Pro Phe Asp Glu Val Val Ala Ile Lys Ile Leu Asp Phe Glu Arg 35 40 45
Asp Asn Cys Asp Leu Asn Asn Ile Ser Arg Glu Ala Gln Thr Met Met 50 55 60
Leu Val Asp His Pro Asn Val Leu Lys Ser His Cys Ser Phe Val Ser 65 70 75 80 Asp His Asn Leu Trp Val Ile Met Pro Tyr Met Ser Gly Gly Ser Cys 85 90 95
Leu His Ile Leu Lys Ala Ala Tyr Pro Asp Gly Phe Glu Glu Ala Ile 100 105 HO
Ile Ala Thr Ile Leu Arg Glu Ala Leu Lys Gly Leu Asp Tyr Leu His 115 120 125
Gln His Gly His Ile His Arg Asp Val Lys Ala Gly Asn Ile Leu Leu 130 135 140
Gly Ala Arg Gly Ala Val Lys Leu Gly Asp Phe Gly Val Ser Ala Cys 145 150 155 160
Leu Phe Asp Ser Gly Asp Arg Gln Arg Thr Arg Asn Thr Phe Val Gly 165 170 175
Thr Pro Cys Trp Met Ala Pro Glu Val Met Glu Gln Leu His Gly Tyr 180 185 190
Asp Phe Lys Ala Asp Ile Trp Ser Phe Gly Ile Thr Gly Leu Glu Leu 195 200 205
Ala His Gly His Ala Pro Phe Ser Lys Tyr Pro Pro Met Lys Val Leu 210 215 220
Leu Met Thr Leu Gln Asn Ala Pro Pro Gly Leu Asp Tyr Glu Arg Asp 225 230 235 240
Lys Lys Phe Ser Arg Ser Phe Lys Gln Met Ile Ala Ser Cys Leu Val 245 250 255
Lys Asp Pro Ser Lys Arg Pro Ser Ala Lys Lys Leu Leu Lys His Ser 260 265 270
Phe Phe Lys Gln Ala Arg Ser Ser Asp Tyr Ile Ala Arg Lys Leu Leu 275 280 285
Asp Gly Leu Pro Asp Leu Val Asn Arg Val Gln Ala Ile Lys Arg Lys 290 295 300
Glu Glu Asp Met Leu Ala Gln Glu Lys Met Ala Asp Gly Glu Lys Glu 305 310 315 320
Glu Leu Ser Gln Pro Leu Asn Ala Cys His Ser Thr Met Gln Asn Glu 325 330 335 Tyr Lys Arg Gly Ile Ser Gly Trp Asn Phe Asn Leu Asp Asp Met Lys 340 345 350
Ala Gln Ala Ser Leu Ile Gln Asp Met Asp Cys Gly Phe Ser Asp Ser 355 360 365
Leu Ser Gly Ser Ala Thr Ser Leu Gln Ala Leu Asp Ser Gln Asp Thr 370 375 380
Gln Ser Glu Ile Gln Glu Asp Thr Gly Gln Ile Thr Asn Lys Tyr Leu 385 390 395 400
Gln Pro Leu Ile His Arg Ser Leu Ser Ile Ala Arg Asp Lys Ser Asp 405 410 415
Asp Asp Ser Ser Leu Ala Ser Pro Ser Tyr Asp Ser Tyr Val Tyr Ser 420 425 430
Ser Pro Arg His Glu Asp Leu Ser Leu Asn Asn Thr His Val Gly Ser 435 440 445
Thr His Ala Asn Asn Gly Lys Pro Thr Asp Ala Thr Ser Ile Pro Thr 450 455 460
Asn Gln Pro Thr Glu Ile Ile Ala Gly Ser Ser Val Leu Ala Asp Gly 465 470 475 480
Asn Gly Ala Pro Asn Lys Gly Glu Ser Asp Lys Thr Gln Glu Gln Leu 485 490 495
Gln Asn Gly Ser Asn Cys Asn Gly Thr His Pro Thr Val Gly Gly Asp 500 505 510
Asp Val Pro Thr Glu Met Ala Val Lys Pro Pro Lys Ala Ala Ser Ser 515 520 525
Leu Asp Glu Ser Asp Asp Lys Ser Lys Pro Pro Val Val Gln Gln Arg 530 535 540
Gly Arg Phe Lys Val Thr Ser Glu Asn Leu Asp Ile Glu Lys Val Val 545 550 555 560
Ala Pro Ser Pro Ile Leu Gln Lys Ser His Ser Met Gln Val Leu Cys 565 570 575
Gln His Ser Ser Ala Ser Leu Pro His Ser Asp Val Thr Leu Pro Asn 580 585 590 Leu Thr Ser Ser Tyr Val Tyr Pro Leu Val Tyr Pro Val Leu Gln Thr
Asn Ile Leu Glu Arg Asp Asn Ile Leu His Met Met Lys Val Leu Thr
Asn Arg Glu Leu Thr Asp Gly Arg Ala Val Glu Gln Gly Ser Ile Gln
Gln Pro Thr Val Pro Pro Thr Glu Lys Ser Met Leu Glu Ala Ala His
Glu Arg Glu Lys Glu Leu Leu His Asp Ile Thr Asp Leu Gln Trp Arg
Leu Ile Cys Ala Glu Glu Glu Leu Gln Lys Tyr Lys Thr Glu His Ala
Gln Val Ser Met Ser Asn
690
<210> 19 <211> 2591 <212> DNA
<213> Arabidopsis thaliana <400> 19
gtcacacaag ccgaatccaa aaatgtaaca agaaaaacaa atcttcacaa ggcaaaaaat 60
ccaaaattga gttttttttt tcttcatttt ttacaatggt gtctcggttt cgtcttgctc 120
tagaggctgt tttgggttcg agacgacgta agaagatggc gagtactagt agtggtggtg 180
gtggtggtgg tgataagaag aagaagaaag gtttctctgt aaaccctaaa gattataaac 240
ttatggaaga agttggatat ggtgctagtg ctgttgttca tcgtgctatt tatcttccta 300
ctaatgaagt tgttgctatc aagtctttgg atctcgatcg ctgcaatagt aatctggatg 360
atataaggag ggaggctcag actatgactt tgatagacca tccgaatgtt ataaagtcgt 420
tttgttcgtt tgctgttgat catcatctat gggtcgttat gccatttatg gctcagggtt 480
cgtgtttgca tctaatgaaa gcagcgtatc cagatggatt tgaagaggcg gctatatgtt 540
ctatgctgaa agaaacactt aaagctcttg attatcttca tagacaaggg catatccatc 600
gagatgttaa ggctggaaac atacttcttg atgacactgg cgagattaag ttaggtgatt 660
ttggtgtctc tgcatgtttg tttgacaatg gcgataggca acgtgcaaga aatacatttg 720
ttggtactcc atgctggatg gcaccggaag tcttgcagcc agggagtgga tacaattcaa 780
aggctgatat atggtctttt ggaataacgg cgctggagtt ggctcacggt catgcacctt 840 tctcaaaata tccccctatg aaggtactct taatgactat ccaaaatgca ccacctggcc 900 ttgattatga ccgtgataag aagttttcaa agtcctttaa agaattggta gcattgtgtc 960 tggtgaaaga tcaaacaaaa aggccaactg ctgaaaaatt gttgaaacac tcatttttca 1020 agaatgtgaa gcctccagag atctgtgtaa aaaaattatt tgtcgattta ccacctcttt 1080 ggactcgcgt aaaagctctt caggccaagg atgctgcaca gcttgctttg aaaggaatgg 1140 cctctgctga ccaggatgct atatcacaga gtgaatacca aagaggagta agtgcttgga 1200 acttcaatat cgaagatttg aaagaacaag catctttgct agatgatgat gacattctaa 1260 cagagagtag ggaagaagaa gaatcttttg gcgaacagtt gcataataag gctaggcaag 1320 tatctggtag tcaattgcta tctgaaaaca tgaatggaaa ggaaaaagct tcagatactg 1380 aggtggtaga acctatctgt gaagagaaat ccactctcaa ttcaaccact tcttctgtgg 1440 aacaaccggc atcaagttca gaacaagacg ttccacaggc caagggtaag ccagtgagac 1500 tccagactca tagtggacca ctttcatccg gtgtcgtgtt aatcaattca gactcagaga 1560 aggttcatgg ttatgaaagg tctgagagtg aacggcaact gaaatcatca gtccggaggg 1620 cacccagctt tagtggtcct ttgaatcttc caaatcgtgc ttcagcaaac agtctttcag 1680 ctcctatcaa atcttctgga ggatttcgtg attctataga tgacaagtcg aaggctaatg 1740 tggttcaaat caaaggaaga ttttcagtaa catcagaaaa cttggatctt gcaagggcat 1800 cccctttgag aaaatctgcc agtgttggga attggatact tgattctaaa atgccaacgg 1860 gccaggccat caaggagtca agtagtcatc tctcattcat tatacctcag cttcaaaatc 1920 tgttccagca aaattcaatg cagcaggatc ttattatgaa tctagtgaat accttacaac 1980 aagctgctga aacaacagat ggttctcaaa atggaaagtt gccgcctttg cctcgaggat 2040 ctgacagcaa tggaaccgtt gtagaactta cagcagctga gcgagagagg ttactactta 2100 ccaagataac cgagcttcga gctaggatga aagagttgac ggaagaactt gaagtagaaa 2160 aatcaaaaca gacccaactg cagcagaaat tgaaatcagt caccggtcgc gagcaattgt 2220 aatcagagac cgggaacact gaccttacta cagagaagct ttttaggagg agagaaaagt 2280 atgttttgta cactaagaaa accagagagc tctctgatca tgaaagcaaa aaggacaggt 2340 ttggttctgt tctgtataag tgcagaagca çagtcaccat cggccatttg tttctgacag 2400 aagaagccgg aaacaaaaac agatagagag agataaatag agaagaaagc tctttggcca 2460 tggaaaattg tatttgttta tttaatctaa acactacaaa actttacatt ttttattatt 2520 gttagcaaca aatatagact cttccttttt tgtgtggatt gtaaatgaaa cattatttga 2580 tgtatttgtt 2591 <211> 708 <212> PRT
<213> Arabidopsis thaliana <400> 20
Met Val Ser Arg Phe Arg Leu Ala Leu Glu Ala Val Leu Gly Ser Arg 1 5 10 15
Arg Arg Lys Lys Met Ala Ser Thr Ser Ser Gly Gly Gly Gly Gly Gly 20 25 30
Asp Lys Lys Lys Lys Lys Gly Phe Ser Val Asn Pro Lys Asp Tyr Lys 35 40 45
Leu Met Glu Glu Val Gly Tyr Gly Ala Ser Ala Val Val His Arg Ala 50 55 60
Ile Tyr Leu Pro Thr Asn Glu Val Val Ala Ile Lys Ser Leu Asp Leu 65 70 75 80
Asp Arg Cys Asn Ser Asn Leu Asp Asp Ile Arg Arg Glu Ala Gln Thr 85 90 95
Met Thr Leu Ile Asp His Pro Asn Val Ile Lys Ser Phe Cys Ser Phe 100 105 HO
Ala Val Asp His His Leu Trp Val Val Met Pro Phe Met Ala Gln Gly 115 120 125
Ser Cys Leu His Leu Met Lys Ala Ala Tyr Pro Asp Gly Phe Glu Glu 130 135 140
Ala Ala Ile Cys Ser Met Leu Lys Glu Thr Leu Lys Ala Leu Asp Tyr 145 150 155 160
Leu His Arg Gln Gly His Ile His Arg Asp Val Lys Ala Gly Asn Ile 165 170 175
Leu Leu Asp Asp Thr Gly Glu Ile Lys Leu Gly Asp Phe Gly Val Ser 180 185 190
Ala Cys Leu Phe Asp Asn Gly Asp Arg Gln Arg Ala Arg Asn Thr Phe 195 200 205
Val Gly Thr Pro Cys Trp Met Ala Pro Glu Val Leu Gln Pro Gly Ser 210 215 220
Gly Tyr Asn Ser Lys Ala Asp Ile Trp Ser Phe Gly Ile Thr Ala Leu 230 235 240
Glu Leu Ala His Gly His Ala Pro Phe Ser Lys Tyr Pro Pro Met Lys 245 250 255
Val Leu Leu Met Thr Ile Gln Asn Ala Pro Pro Gly Leu Asp Tyr Asp 260 265 270
Arg Asp Lys Lys Phe Ser Lys Ser Phe Lys Glu Leu Val Ala Leu Cys 275 280 285
Leu Val Lys Asp Gln Thr Lys Arg Pro Thr Ala Glu Lys Leu Leu Lys 290 295 300
His Ser Phe Phe Lys Asn Val Lys Pro Pro Glu Ile Cys Val Lys Lys 305 310 315 320
Leu Phe Val Asp Leu Pro Pro Leu Trp Thr Arg Val Lys Ala Leu Gln 325 330 335
Ala Lys Asp Ala Ala Gln Leu Ala Leu Lys Gly Met Ala Ser Ala Asp 340 345 350
Gln Asp Ala Ile Ser Gln Ser Glu Tyr Gln Arg Gly Val Ser Ala Trp 355 360 365
Asn Phe Asn Ile Glu Asp Leu Lys Glu Gln Ala Ser Leu Leu Asp Asp 370 375 380
Asp Asp Ile Leu Thr Glu Ser Arg Glu Glu Glu Glu Ser Phe Gly Glu 385 390 395 400
Gln Leu His Asn Lys Ala Arg Gln Val Ser Gly Ser Gln Leu Leu Ser 405 410 415
Glu Asn Met Asn Gly Lys Glu Lys Ala Ser Asp Thr Glu Val Val Glu 420 425 430
Pro Ile Cys Glu Glu Lys Ser Thr Leu Asn Ser Thr Thr Ser Ser Val 435 440 445
Glu Gln Pro Ala Ser Ser Ser Glu Gln Asp Val Pro Gln Ala Lys Gly 450 455 460
Lys Pro Val Arg Leu Gln Thr His Ser Gly Pro Leu Ser Ser Gly Val 465 470 475 480 Val Leu IXe Asn Ser Asp Ser Glu Lys Val His Gly Tyr Glu Arg Ser 485 490 495
Glu Ser Glu Arg Gln Leu Lys Ser Ser Val Arg Arg Ala Pro Ser Phe 500 505 510
Ser Gly Pro Leu Asn Leu Pro Asn Arg Ala Ser Ala Asn Ser Leu Ser 515 520 525
Ala Pro Ile Lys Ser Ser Gly Gly Phe Arg Asp Ser Ile Asp Asp Lys 530 535 540
Ser Lys Ala Asn Val Val Gln Ile Lys Gly Arg Phe Ser Val Thr Ser 545 550 555 560
Glu Asn Leu Asp Leu Ala Arg Ala Ser Pro Leu Arg Lys Ser Ala Ser 565 570 575
Val Gly Asn Trp Ile Leu Asp Ser Lys Met Pro Thr Gly Gln Ala Ile 580 585 590
Lys Glu Ser Ser Ser His Leu Ser Phe Ile Ile Pro Gln Leu Gln Asn 595 600 605
Leu Phe Gln Gln Asn Ser Met Gln Gln Asp Leu Ile Met Asn Leu Val 610 615 620
Asn Thr Leu Gln Gln Ala Ala Glu Thr Thr Asp Gly Ser Gln Asn Gly 625 630 635 640
Lys Leu Pro Pro Leu Pro Arg Gly Ser Asp Ser Asn Gly Thr Val Val 645 650 655
Glu Leu Thr Ala Ala Glu Arg Glu Arg Leu Leu Leu Thr Lys Ile Thr 660 665 670
Glu Leu Arg Ala Arg Met Lys Glu Leu Thr Glu Glu Leu Glu Val Glu 675 680 685
Lys Ser Lys Gln Thr Gln Leu Gln Gln Lys Leu Lys Ser Val Thr Gly 690 695 700
Arg Glu Gln Leu 705
<210> 21 <211> 2782 <212> DNA <213> Arabidopsis "haiiana <4CC> 21
aaactactag tctctatctc tctcagctcc
tgat ttgttgtatc tgaagçcgaa
agggcçgttt
ggtggtggta
gactataagc
tatctcccta
aatctggatg
ataaagtcgt
gctcaaggtt
gctatatgtt
catatccatc
cttggcgatt
aacacatttg
tacaattcca
catgcacctt
cctcctgçcc
gcaatgtgtt
tcctgtttca
ccacctcttt
aagagaatgg
agcgcttgga
gatgatctag
aatçacacag
aaçgtttcca
actacttctt
gttaagccat
cactcggctt
ccaacagtcc
tcaaacagtt
aagtcaaagg
taaagcgcicg
gtggtagtgg
taatggaaga
ctaatgaagt
atattaggag
tttgttcatt
cgtgtttgca
gtgtattaaa
gggatgttaa
ttggtgtctc
ttggtactcc
aggctgatat
tctcaaaata
t tgattatga
tggtgaaaga
aacacacgaa
ggacacgtgt
ccactgctga
actttgacgt
aagagagtaa
açcaagtatt
atactgacçt
ctttagaacg
taagacgcca
cagagaaaag
çaagagcacc
tgtctgctcc
ctaatccggt
gaagaagatg
taçtagtaag
aataggccat
cgtcgccatc
ggaatctcag
ctctgtcgac
tcttatgaag
agaaactctt
ggctggaaac
tgcttgcttg
ttgctggatg
ctggtcattt
tcctcccatg
ccgtgataag
tcaaacaaaa
gcctccagag
aaaatctctt
cgaggaagct
cagagacttg
ggaagatgaa
cgataçtctg
OOddÇàcCCà
aatgtcacca aagtcagagt tcatatcttt cagctttagt catcaaatac tcagaaagga
agattttgtt
attactggtt
çtgggagçag
cagcagagag
ggagctagcg
aagtgtttgg
actatgagtt
catagtcttt
actgcgtatt
aaagctcttg
atacttcttg
tttgataacg
gcaccggaag
ggtata acag
aaggtgctcc
aaattttcta
aggccaactg
caaactgtça
caggataagg
atatcacaga
aaaacacaag
gaaatattat
caactatatç
acctçeaaag
aattcagagc
ggaccactta
gaaaçatccg
ggtcctttga
tcaggaggat
cqattttcac
tcttcttctt
tctgattttt
gaççaggtag
gtttctctat
ctgttgtcta
atctcgatcg
tgatagacca
gggttgttat
cagacggatt
attatcttca
atgacaatgg
gtgataggca
ttttgcagcc
cacttgaatt
taatgactat
agtcctttaa
ctgaaaaact
aaattttatt
atgctcaaca
gcgaatacca
catctttgtt
çtgcacagtt
aaaacatgaa
agaaat tcac
atgacatõcc
caagcaggac
agagtgaacc
atctttcaac
tccgtgattc
taacatcagg
ctçtçttaaa
ggtggtattc
tagtggtcgt
gaatcctaaa
tcgagcgatc
ctgcaatagc
tcccaacgtt
gccattcatg
tgaagagtct
tagacaaggc
tgagattaag
acgtgctaga
gggaaatgga
ggcccatggt
tcaaaacgca
agaaatçgtt
gctgaagcac
ttccgattta
gcttgcatta
aagaggagtg
aattgatgat
taataaggtg
cggaaaaçaa
111cgttaca
cgaggccaag
tgtattaagc
gcagacçgca
ccgtgcttct
tctçgatgat
aaatgtaçat
60
120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 114 0 1200 1260 1320 13S0 1440 1500 1560 1620 1680 1740 18CC cttgcgaagg atgttccatt aagtatagtc cctcgtcgat ctccacaggc gacccccctg 1860 agaaaatctg caagtgtggg taactggata cttgagccca aaatgccaac agctcagcct 1920 cagacgatca aggagcatag tagccatcct acgtcttcct cacccatcat gcctcaactt 1980 caacatctat tccagcaaaa ctcaatacaa caggatctta ttatgaattt actaaatagc 2040 ttacaacccg tggaggcaac agaaggttct caatctggga agttaccacc tttgcctcgc 2100 tcagacagta atggaaacgt tgaacctgtg gcttcagaga gggagaggtt acttcttagc 2160 agtatctccg acctccgtgc taggctggac gacttaacgg aggaactcga tatagagaaa 2220 tcaaaataca gccaactgca acagaaattg aaagcattca cgggtcgcga acactaagtg 2280 taaccagagg gaaagcgaca ctggaaacac tgaactgcac agaacctgta ggagaaagag 2340 tgaagtctct tttggttata acagtaataa ccagacaaga gcttagagac agtgaggcat 2400 agagcatatc aatttcttta gttgggttca gtgtaggttc cagacgatga caatgacgac 2460 taaaacaaga tacgaccgat gtctgcttct gatgtaaact actagttgaa gacaacagaa 2520 acgaatacag aaataaaaga aaaggagaag aaagttcctt tggggggtct caaccccaca 2580 tatatttgct tatatattta ttatcacacg ttttgatcat tttttgtttt attttgtttg 2640 gtgtatcata atttactagt gagataaagg agaaagctct tcttttgggt tctttgtgta 2700 ttgtaatttg taaatgcaaa ttgattgatg tacttttgtg ttttcatcac attcttaaac 2760 attatcttct ggttttacct ta 2782
<210> 22 <211> 709
<212> PRT
<213> Arabidopsis thaliana
<400> 22
Met Val Gly Gly Gly Gly Gly Ser Ser Gly Arg Gly Gly Gly Ser Gly 1 5 10 15
Ser Gly Ser Ser Lys Gln Gln Arg Gly Phe Ser Met Asn Pro Lys Asp 20 25 30
Tyr Lys Leu Met Glu Glu Ile Gly His Gly Ala Ser Ala Val Val Tyr 35 40 45
Arg Ala Ile Tyr Leu Pro Thr Asn Glu Val Val Ala Ile Lys Cys Leu 50 55 60
Asp Leu Asp Arg Cys Asn Ser Asn Leu Asp Asp Ile Arg Arg Glu Ser 65 70 75 80
Gln Thr Met Ser Leu Ile Asp His Pro Asn Val Ile Lys Ser Phe Cys 85 90 95
Ser Phe Ser Val Asp His Ser Leu Trp Val Val Met Pro Phe Met Ala 100 105 HO
Gln Gly Ser Cys Leu His Leu Met Lys Thr Ala Tyr Ser Asp Gly Phe 115 120 125
Glu Glu Ser Ala Ile Cys Cys Val Leu Lys Glu Thr Leu Lys Ala Leu 130 135 140
Asp Tyr Leu His Arg Gln Gly His Ile His Arg Asp Val Lys Ala Gly 145 150 155 160
Asn Ile Leu Leu Asp Asp Asn Gly Glu Ile Lys Leu Gly Asp Phe Gly 165 170 175
Val Ser Ala Cys Leu Phe Asp Asn Gly Asp Arg Gln Arg Ala Arg Asn 180 185 190
Thr Phe Val Gly Thr Pro Cys Trp Met Ala Pro Glu Val Leu Gln Pro 195 200 205
Gly Asn Gly Tyr Asn Ser Lys Ala Asp Ile Trp Ser Phe Gly Ile Thr 210 215 220
Ala Leu Glu Leu Ala His Gly His Ala Pro Phe Ser Lys Tyr Pro Pro 225 230 235 240
Met Lys Val Leu Leu Met Thr Ile Gln Asn Ala Pro Pro Gly Leu Asp 245 250 255
Tyr Asp Arg Asp Lys Lys Phe Ser Lys Ser Phe Lys Glu Met Val Ala 260 265 270
Met Cys Leu Val Lys Asp Gln Thr Lys Arg Pro Thr Ala Glu Lys Leu 275 280 285
Leu Lys His Ser Cys Phe Lys His Thr Lys Pro Pro Glu Gln Thr Val 290 295 300
Lvs Ile Leu Phe Ser Asp Leu Pro Pro Leu Trp Thr Arg Val Lys Ser 305 310 315 320
Leu Gln Asp Lys Asp Ala Gln Gln Leu Ala Leu Lys Arg Met Ala Thr 325 330 335 Ala Asp Glu Glu Ala Ile Ser Gln Ser Glu Tyr Gln Arg Gly Val Ser 340 345 350
Ala Trp Asn Phe Asp Val Arg Asp Leu Lys Thr Gln Ala Ser Leu Leu 355 360 365
Ile Asp Asp Asp Asp Leu Glu Glu Ser Lys Glu Asp Glu Glu Ile Leu 370 375 380
Cys Ala Gln Phe Asn Lys Val Asn Asp Arg Glu Gln Val Phe Asp Ser 385 390 395 400
Leu Gln Leu Tyr Glu Asn Met Asn Gly Lys Glu Lys Val Ser Asn Thr 405 410 415
Glu Val Glu Glu Pro Thr Cys Lys Glu Lys Phe Thr Phe Val Thr Thr 420 425 430
Thr Ser Ser Leu Glu Arg Met Ser Pro Asn Ser Glu His Asp Ile Pro 435 440 445
Glu Ala Lys Val Lys Pro Leu Arg Arg Gln Ser Gln Ser Gly Pro Leu 450 455 460
Thr Ser Arg Thr Val Leu Ser His Ser Ala Ser Glu Lys Ser His Ile 465 470 475 480
Phe Glu Arg Ser Glu Ser Glu Pro Gln Thr Ala Pro Thr Val Arg Arg 485 490 495
Ala Pro Ser Phe Ser Gly Pro Leu Asn Leu Ser Thr Arg Ala Ser Ser 500 505 510
Asn Ser Leu Ser Ala Pro Ile Lys Tyr Ser Gly Gly Phe Arg Asp Ser 515 520 525
Leu Asp Asp Lys Ser Lys Ala Asn Leu Val Gln Lys Gly Arg Phe Ser 530 535 540
Val Thr Ser Gly Asn Val Asp Leu Ala Lys Asp Val Pro Leu Ser Ile 545 550 555 560
Val Pro Arg Arg Ser Pro Gln Ala Thr Pro Leu Arg Lys Ser Ala Ser 565 570 575
Val Gly Asn Trp Ile Leu Glu Pro Lys Met Pro Thr Ala Gln Pro Gln 580 585 590 Thr Ile Lys Glu His Ser Ser His Pro Thr Ser Ser Ser Pro Ile Met 595 600 605
Pro Gln Leu Gln His Leu Phe Gln Gln Asn Ser Ile Gln Gln Asp Leu 610 615 620
Ile Met Asn Leu Leu Asn Ser Leu Gln Pro Val Glu Ala Thr Glu Gly 625 630 635 640
Ser Gln Ser Gly Lys Leu Pro Pro Leu Pro Arg Ser Asp Ser Asn Gly 645 650 655
Asn Val Glu Pro Val Ala Ser Glu Arg Glu Arg Leu Leu Leu Ser Ser 660 665 670
Ile Ser Asp Leu Arg Ala Arg Leu Asp Asp Leu Thr Glu Glu Leu Asp 675 680 685
Ile Glu Lys Ser Lys Tyr Ser Gln Leu Gln Gln Lys Leu Lys Ala Phe 690 695 700
Thr Gly Arg Glu His 705
<210> 23
<211> 2286
<212> DNA
<213> Oryza sativa
<400> 23
atggccaagg cgtgggagaa ggtggcgacg gcggcggggt tgggtgggtc gggggagagg 60 cgcaagtacc cgatccgcgt ggaggactac gagctgtacg aggagatcgg gcagggggtc 120 agcgccatcg tgtaccgatc gctctgcaag cccctcgacg agatcgtcgc cgtcaaggtg 180 ctcgacttcg agcgcacaaa cagtgacctg tggttagttg taatgcaagt aggttatact 240 cggattgttg cgatttacgt accgccgctt gatctgtcta aaatgatagt aacacggata 300 tgcttgacgc agaacaacat catgcgtgaa gctcagacga tgattctcat agatcagcct 360 aacgtcatga aggcacattg ttcatttaca aataaccact cgttgtgggt ggtcatgcca 420 tacatggctg gagggtcttg ccttcacata atgaagtcag tctatccaga tggttttgaa 480 gaagctgtca ttgcaactgt acttcgtgaa gtcctgaaag gtttggagta ccttcatcat 540 catgggcata tacatcgtga tgtgaaggca gggaatatac ttgttgattc acggggtgta 600 gtcaagcttg gagattttgg ggtttctgct tgcctttttg attctggtga caggcaacgg 660 gctaggaata ctttcgtggg aactccttgc tggatggcac cagaggttat ggagcagcta 720 catggatacg
catggtcatg
aatgcccctc
atggttgcta
aagcaaccct
ggattgcctg
tctcaaaaga
ggcatcagta
gagtgtgatg
accattttac
gatacggaca
caccccattt
aatggccagg
gattcagatg
agttcttgct
attcataacc
gaagctgttc
tcgaaacctc
ttggataagg
atacaggcaa
accattattg
cagagggagc
tcacctgcct
gacagatcat
gagctgcaat
gcccaggtga
gattga
atttcaaggc
ctcctttctc
cgggccttga
tgtgtctggt
ttttcaagca
gccttggtgc
aaatgcctga
gctggaactt
acagtatatc
cagagcgagc
ccgaaaatga
gtttagcaag
tcaggaaaca
ctattccaac
catctgatgg
gtgacaagtg
caaaggtgcc
ctcttataca
attttcaata
tttcgcacct
gtgggtccct
aaatacttca
gcattgctcc
tgttggaagc
ggcggttagt
ccatatctga
agacatatgg
gaagttccct
ctatgagaga
aaaagaccct
agctcgctcc
cagatattta
tggacagaag
tgatatggat
gtgcaaagat
aacaggacct
tgtgatgagc
gaatacatca
cagctccaca
cagttcattc
atttctttca
caacggagga
taaatcatca
gcaaagaggc
tcgttcgatt
tccttcgtta
ttatatgcag
tgcgatgaaa
tgcaagtcgc
ggcacacgaa
gtgttcgcag
tcttgtggag
tccttcggaa
cccatgaagg
gataagaaat
tcaaaaaggc
agtgatttca
gctctgaagg
gaagaaatct
gacctgaagt
tcagatgcat
catatgtcaa
aatgataagt
atgctcagga
gaaagtagtg
agctcatttc
tccaaagaga
cccttgcaag
gcagcaaatg
cgttttaaag
caagaattga
agtataccat
ctgtacaatg
cagttaagtg
gcatcatctc
aaggagaagg
gacgagatac
atgctgttag
ttactgcact
tcttacttat
tttcaaggca
ctacagcgaa
ttagtcgaaa
aaaaggatga
cacaggatga
ctcaagcttc
catgtttcta
gagttttttc
cagcagtttc
ctacaaacgg
aactggactt
atgaaaggaa
gctcgaagca
ttgcagatga
ttgaggacca
ttacgcctgg
tgccatctgt
cctcaattga
ttctacagac
gttgcgatat
catcatcagc
agctggtcaa
agaggctcaa
atatggaaca
tgaacttgcc
gacacttcag
tttcaagcaa
aaaattgctg
gcttttggag
agttttactt
atacaaaaga
acttattaca
tgacttggac
aattaagtat
atctcctgag
ggtacatgca
gcaagagaaa
gttttctttc
tcaaattaac
accatcccct
cgacgataga
gcatgttgag
tgggagcaat
ggctgcatca
aaatatgctt
ggcaatgacg
attatcaatt
tgagatcact
agcaaaggca
gcacgggaag
780
840
900
960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2286
<210> 24
<211> 534
<212> PRT
<213> Oryza sativa
<400> 24
Met Ala Ala Ala Ala Gly Ser Val Gly Gly Asp Asp His His His His Gln Gln Ala Arg Tyr Pro Leu Asp Ala Gly Ser Tyr Arg Leu Leu Cys 20 25 30
Lys Ile Gly Ser Gly Val Ser Ala Val Val Tyr Lys Ala Ala Cys Val 35 40 45
Pro Leu Gly Ser Ala Val Val Ala Ile Lys Ala Ile Asp Leu Glu Arg
50 55 60
Ser Arg Ala Asn Leu Asp Glu Val Trp Arg Glu Ala Lys Ala Met Ala
65 70 75 80
Leu Leu Ser His Arg Asn Val Leu Arg Ala His Cys Ser Phe Thr Val 85 90 95
Gly Ser His Leu Trp Val Val Met Pro Phe Met Ala Ala Gly Ser Leu 100 105 HO
His Ser Ile Leu Ser His Gly Phe Pro Asp Gly Leu Pro Glu Gln Cys
115 120 125
Ile Ala Val Val Leu Arg Asp Thr Leu Arg Ala Leu Cys Tyr Leu His 130 135 140
Glu Gln Gly Arg Ile His Arg Asp Ile Lys Ala Gly Asn Ile Leu Val 145 150 155 160
Asp Ser Asp Gly Ser Val Lys Leu Ala Asp Phe Gly Val Ser Ala Ser 165 170 175
Ile Tyr Glu Thr Ala Pro Ser Thr Ser Ser Ala Phe Ser Gly Pro Ile 180 185 190
Asn His Ala Pro Pro Pro Ser Gly Ala Ala Leu Ser Ser Ser Cys Phe 195 200 205
Asn Asp Met Ala Gly Thr Pro Tyr Trp Met Ala Pro Glu Val Ile His
210 215 220
Ser His Val Gly Tyr Gly Ile Lys Ala Asp Ile Trp Ser Phe Gly Ile 225 230 235 240
Thr Ala Leu Glu Leu Ala His Gly Arg Pro Pro Leu Ser His Leu Pro 245 250 255 Pro Ser Lys Ser Met Leu Met Arg Ile Thr Ser Arg Val Arg Leu Glu 260 265 270
Val Asp Ala Ser Ser Ser Ser Ser Glu Gly Ser Ser Ser Ala Ala Arg 275 280 285
Lys Lys Lys Lys Phe Ser Lys Ala Phe Lys Asp Met Val Ser Ser Cys 290 295 300
Leu Cys Gln Glu Pro Ala Lys Arg Pro Ser Ala Glu Lys Leu Leu Arg 305 310 315 320
His Pro Phe Phe Lys Gly Cys Arg Ser Arg Asp Tyr Asp Tyr Leu Val 325 330 335
Arg Asn Val Leu Asp Ala Val Pro Thr Val Glu Glu Arg Cys Arg Asp 340 345 350
Ser Thr Gln Leu Cys Gly Cys Ala Arg Gly Ala Arg Cys Val Ser Pro 355 360 365
Cys Arg His Ala Ser Ser Gly Ser Asn Val Val Ala Ala Lys Asn Arg 370 375 380
Arg Ile Ser Gly Trp Asn Phe Asn Glu Glu Ser Phe Glu Leu Asp Pro 385 390 395 400
Thr Asp Lys Pro Pro Glu Gln Gln Gln Gln Gln Pro Cys Phe Pro Phe 405 410 415
His His Asp Asn Asp Asp Asp Met Val Glu His Glu Gln Glu Gln Arg 420 425 430
Arg Arg Gln Asp Gly Asn Asp Gly Ser Ser Asp Val Ala Val Pro His 435 440 445
Leu Val Thr Ile Leu Gly Ser Leu Glu Met Gln Arg Asp Met Val Met 450 455 460
Gln Val Leu Glu Gly Asp Gly Gly Gly Gly Gly Glu Thr Ala Gly Arg 465 470 475 480
Glu Glu Met Leu Val Gly Tyr Val Arg Glu Leu Glu Lys Arg Val Gln 485 490 495
Glu Leu Ser Thr Glu Val Glu Glu Glu Met Ala Arg Asn Ala His Leu 500 505 510 Gln Glu Leu Leu His Glu Arg Ala Cys Glu Asn His Thr Asp Ser Ser 515 520 525
His Thr Ser Gly Ser Arg 530
<210> 25
<211> 3038
<212> DNA
<213> Oryza sativa
<400> 25
gaccttctct tcctccctcg acacctctcc ccacgttacg ctgcctcctc ctcctcctcg 60
cctccctctc gtgggcgtcg tccccctccg ccaccgccgc cgcccgccgc agcagccgca 120
180 240 300
gaaggggact ccacctcctc ccggatctgc tcgatcgccc ccgattctgt agcttctcct ctgctcagat ccgccccctt gcttttcatc cagctcgtgg cacccgagat ccgctgccgc cgccgccgtc tctgcggtcc tcctcccccc tcgccggtgg ggaaccccgc cgccccgaag
cgcgttgcag cgtgtactac tgccggactg ccaaagtacg cttgctgcta gccatttcgg 360
tagcttttgt ggtttctact taactatcgt gtttggcaat acaacacctt ggaccaaagg 420
atgcttgaaa gatagactgg ataattaaga ctggatgcca aagtacgctt gctgctagcc 480
atttcggtag cttttgtggt ttctacttaa ctatcgtgtt tggcaataca acaccttgga 540
ccaaaggatg cttgaaagat agactggata attaagaact atattggact gtacattcgc 600
ctatagactt agtcatgctg ctggttgttc tctgtcgctg ctacaaggtg ttcgtgctat 660
tgccttctgc ttctgtgtgc tatggtaatt gtaactctgt ggttattgcg catgatgctc 720
780 840
tttgaatttg agccatggag catgcaagga gatttccaac agatcccaaa gaatataaat tatgtgagga agttggagat ggtgtagtgc tacggtgtac aaagctcttt gtatcccact
taatattgaa gttgccatta aagttcttga ccttgagaag tgcagtaatg acctggatgg 900
gataagacga gaagtacaaa ccatgagctt gattgatcat ccaaatcttc ttcgagcata 960
ttgctcgttt acaaatggtc atcagctttg ggttattatg ccttacatgg ccgctggatc 1020
tgctctgcac attatgaaaa cttcttttcc agatgggttt gaggagccag tcattgcaac 1080
tcttttgcgg gaggttctta aagctcttgt ctacctacac tcccaagggc atattcacag 1140
agatgtaaag gctggaaata tcctaataga tacaaatgga gctgtcaagc taggagactt 1200
tggagtgtca gcctgcatgt ttgatactgg gaataggcaa agagcacgaa acacttttgt 1260
agggacccct tgctggatgg ctccagaagt tatgcaacaa ctgcatggtt atgattacaa 1320
agctgacatt tggtcctttg gtataacggc attggaacta gcatatggtc atgctccatt 1380
ttcaaagtac cctccaatga aggtattgct tatgaccttg caaaatgcac caccaggtct 1440 agactatgag
agtcaaggat
gcatgcacgt
tgaacgcttt
ttcagagagc
cttcaatctg
ccatttagat
aaatatttac
agaggtcgaa
actaaaatct
ggagcaacca
taaaagtgcc
ggtcaatagt
tccttacagg
caacaggaac
tgttgaacct
tacatcagat
tttaccaatc
attcatgata
tgaggaaata
gcatttcaga
acttgctgag
tgcattgccc
acaatgcact
aattatttgt
agcaaggCga
aaaagcttgg
agggacaagc
ccacgcaagc
acagctgaat
aggacattga
aaggagcaac
gaggacttga
ggtgttaaca
cagggacggg
gatctggatg
tgctttgatg
aatatggaat
aactgtaatg
gggtcccaca
aatgttggca
cgcagtgggc
gaggagcaat
agtattgctc
ggagtaacac
cagcaaaata
tctgatgctg
gagaaggaac
gaagttcaga
aaaaaagatg
tgtaaccccc
attttgttcg
aattatagtt
tactagaaaa
gattttcaaa
gtccatcttc
ttcttgcacg
agggaaaaga
tatcacagaa
aaaatgcagc
gcaaattcaa
ctaaccttgt
gtgctctcgc
tttgtgggga
ctacatcacc
gtgaaagttt
agttcttaag
atgacccagc
ctttattccg
ccgaaggaaa
aaaaggtagc
gatcaactgt
ctatgcaaaa
ctgatgcaag
tgcagtcgta
gattaaagct
aaaggttacg
gctgtaaaat
aagtcaggcc
attttcattt
taccaaatca
gtctttcaag
agaaaagctc
aagtattctt
ggctgacttg
agagtacata
cgcccttata
ggatggttta
tgcttctgca
ctcttctttc
tgatgatccc
tatgcagcag
ggaaagaagt
tggttccctg
aaggaatgag
ccaaatgaaa
agttatccag
ttcatccgca
ccatccatcg
ggaagtgata
tacaactggt
catcgccaac
caaaaacact
aagagaggat
cagttcccca
tggtgtatct
gtacaggata
tctttcct
~Ίί
gatttggttg
ttgaagcatt
gacggcctcc
cttcttagta
cgaggaatca
gacaatacaa
caagaagcta
aggcctgagg
cccagccgcc
cctactgcta
ttccaacaaa
gcctctgtac
atacctgaac
tgtcatcaga
gatccacgcg
cgaagggggc
agcagcagta
acaattcttc
agtagactga
tcatctcagc
ttgcagcaaa
cagctcgagg
acccgacaac
attttgaatt
ttgtaatttg
tttcaatcta
caacttgctt
ctttttttaa
ccccgctggg
ataagcttgg
gtggttggaa
acggaacgtg
atgaaccaga
atgagataca
cccttgaggc
ctgatttgag
ttgagaatca
catcaaattt
atgttctttc
aaaatacatg
cacatctgcc
gttttcaggt
ggtgctcaaa
caacactaca
tttcttcaat
catctggagt
gtgtcaccga
agcagatcaa
aatgatatgc
tggttagcaa
taattatttt
taccaaagtt
1500
1560 1620 1680 1740 1800 1860 1920 1980 204 0 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 2820 2880 2940 3000 3038
<210> 26
<211> 693
<212> PRT
<213> Oryza sativa
<400> 26
Met Glu His Ala Arg Arg Phe Pro Thr Asp Pro Lys Glu Tyr Lys Leu Cys Glu Glu Val Gly Asp Gly Val Ser Ala Thr Val Tyr Lys Ala Leu 20 25 30
Cys Ile Pro Leu Asn Ile Glu Val Ala Ile Lys Val Leu Asp Leu Glu 35 40 45
Lys Cys Ser Asn Asp Leu Asp Gly Ile Arg Arg Glu Val Gln Thr Met 50 55 60
Ser Leu Ile Asp His Pro Asn Leu Leu Arg Ala Tyr Cys Ser Phe Thr 65 70 75 80
Asn Gly His Gln Leu Trp Val Ile Met Pro Tyr Met Ala Ala Gly Ser 85 90 95
Ala Leu His Ile Met Lys Thr Ser Phe Pro Asp Gly Phe Glu Glu Pro 100 105 HO
Val Ile Ala Thr Leu Leu Arg Glu Val Leu Lys Ala Leu Val Tyr Leu 115 120 125
His Ser Gln Gly His Ile His Arg Asp Val Lys Ala Gly Asn Ile Leu 130 135 140
Ile Asp Thr Asn Gly Ala Val Lys Leu Gly Asp Phe Gly Val Ser Ala 145 150 155 160
Cys Met Phe Asp Thr Gly Asn Arg Gln Arg Ala Arg Asn Thr Phe Val 165 170 175
Gly Thr Pro Cys Trp Met Ala Pro Glu Val Met Gln Gln Leu His Gly 180 185 190
Tyr Asp Tyr Lys Ala Asp Ile Trp Ser Phe Gly Ile Thr Ala Leu Glu 195 200 205
Leu Ala His Gly His Ala Pro Phe Ser Lys Tyr Pro Pro Met Lys Val 210 215 220
Leu Leu Met Thr Leu Gln Asn Ala Pro Pro Gly Leu Asp Tyr Glu Arg 225 230 235 240
Asp Lys Arg Phe Ser Lys Ser Phe Lys Asp Leu Val Ala Thr Cys Leu 245 250 255 Val Lys Asp Pro Arg Lys Arg Pro Ser Ser Glu Lys Leu Leu Lys His 260 265 270
Ser Phe Phe Lys His Ala Arg Thr Ala Glu Phe Leu Ala Arg Ser Ile 275 280 285
Leu Asp Gly Leu Pro Pro Leu Gly Glu Arg Phe Arg Thr Leu Lys Gly 290 295 300
Lys Glu Ala Asp Leu Leu Leu Ser Asn Lys Leu Gly Ser Glu Ser Lys 305 310 315 320
Glu Gln Leu Ser Gln Lys Glu Tyr Ile Arg Gly Ile Ser Gly Trp Asn 325 330 335
Phe Asn Leu Glu Asp Leu Lys Asn Ala Ala Ala Leu Ile Asp Asn Thr 340 345 350
Asn Gly Thr Cys His Leu Asp Gly Val Asn Ser Lys Phe Lys Asp Gly 355 360 365
Leu Gln Glu Ala Asn Glu Pro Glu Asn Ile Tyr Gln Gly Arg Ala Asn 370 375 380
Leu Val Ala Ser Ala Arg Pro Glu Asp Glu Ile Gln Glu Val Glu Asp 385 390 395 400
Leu Asp Gly Ala Leu Ala Ser Ser Phe Pro Ser Arg Pro Leu Glu Ala 405 410 415
Leu Lys Ser Cys Phe Asp Val Cys Gly Asp Asp Asp Pro Pro Thr Ala 420 425 430
Thr Asp Leu Arg Glu Gln Pro Asn Met Glu Ser Thr Ser Pro Met Gln 435 440 445
Gln Phe Gln Gln Ile Glu Asn His Lys Ser Ala Asn Cys Asn Gly Glu 450 455 460
Ser Leu Glu Arg Ser Ala Ser Val Pro Ser Asn Leu Val Asn Ser Gly 465 470 475 480
Ser His Lys Phe Leu Ser Gly Ser Leu Ile Pro Glu His Val Leu Ser 485 490 495
Pro Tyr Arg Asn Val Gly Asn Asp Pro Ala Arg Asn Glu Cys His Gln 500 505 510 Lys Asn Thr Cys Asn Arg Asn Arg Ser Gly Pro Leu Phe Arg Gln Met 515 520 525
Lys Asp Pro Arg Ala His Leu Pro Val Glu Pro Glu Glu Gln Ser Glu 530 535 540
Gly Lys Val Ile Gln Arg Arg Gly Arg Phe Gln Val Thr Ser Asp Ser 545 550 555 560
Ile Ala Gln Lys Val Ala Ser Ser Ala Ser Ser Ser Arg Cys Ser Asn 565 570 575
Leu Pro Ile Gly Val Thr Arg Ser Thr Val His Pro Ser Thr Ile Leu 580 585 590
Pro Thr Leu Gln Phe Met Ile Gln Gln Asn Thr Met Gln Lys Glu Val 595 600 605
Ile Ser Arg Leu Ile Ser Ser Ile Glu Glu Ile Ser Asp Ala Ala Asp 610 615 620
Ala Ser Thr Thr Gly Ser Ser Gln Pro Ser Gly Val His Phe Arg Glu 625 630 635 640
Lys Glu Leu Gln Ser Tyr Ile Ala Asn Leu Gln Gln Ser Val Thr Glu 645 650 655
Leu Ala Glu Glu Val Gln Arg Leu Lys Leu Lys Asn Thr Gln Leu Glu 660 665 670
Glu Gln Ile Asn Ala Leu Pro Lys Lys Asp Glu Arg Leu Arg Arg Glu 675 680 685
Asp Thr Arg Gln Gln 690
<210> 27
<211> 2286
<212> DNA
<213> Oryza sativa
<400> 27
atggccaagg cgtgggagaa ggtggcgacg gcggcggggt tgggtgggtc gggggagagg 60
cgcaagtacc cgatccgcgt ggaggactac gagctgtacg aggagatcgg gcagggggtc 120
agcgccatcg tgtaccgatc gctctgcaag cccctcgacg agatcgtcgc cgtcaaggtg 180
ctcgacttcg agcgcacaaa cagtgacctg tggttagttg taatgcaagt aggttatact 240 cggattgttg cgatttacgt accgccgctt gatctgtcta aaatgatagt aacacggata 300 tgcttgacgc agaacaacat catgcgtgaa gctcagacga tgattctcat agatcagcct 360 aacgtcatga aggcacattg ttcatttaca aataaccact cgttgtgggt ggtcatgcca 420 tacatggctg gagggtcttg ccttcacata atgaagtcag tctatccaga tggttttgaa 480 gaagctgtca ttgcaactgt acttcgtgaa gtcctgaaag gtttggagta ccttcatcat 540 catgggcata tacatcgtga tgtgaaggca gggaatatac ttgttgattc acggggtgta 600 gtcaagcttg gagattttgg ggtttctgct tgcctttttg attctggtga caggcaacgg 660 gctaggaata ctttcgtggg aactccttgc tggatggcac cagaggttat ggagcagcta 720 catggatacg atttcaaggc agacatatgg tccttcggaa ttactgcact tgaacttgcc 780 catggtcatg ctcctttctc gaagttccct cccatgaagg tcttacttat gacacttcag 840 aatgcccctc cgggccttga ctatgagaga gataagaaat tttcaaggca tttcaagcaa 900 atggttgcta tgtgtctggt aaaagaccct tcaaaaaggc ctacagcgaa aaaattgctg 960 aagcaaccct ttttcaagca agctcgctcc agtgatttca ttagtcgaaa gcttttggag 1020 ggattgcctg gccttggtgc cagatattta gctctgaagg aaaaggatga agttttactt 1080 tctcaaaaga aaatgcctga tggacagaag gaagaaatct cacaggatga atacaaaaga 1140 ggcatcagta gctggaactt tgatatggat gacctgaagt ctcaagcttc acttattaca 1200 gagtgtgatg acagtatatc gtgcaaagat tcagatgcat catgtttcta tgacttggac 1260 accattttac cagagcgagc aacaggacct catatgtcaa gagttttttc aattaagtat 1320 gatacggaca ccgaaaatga tgtgatgagc aatgataagt cagcagtttc atctcctgag 1380 caccccattt gtttagcaag gaatacatca atgctcagga ctacaaacgg ggtacatgca 1440 aatggccagg tcaggaaaca cagctccaca gaaagtagtg aactggactt gcaagagaaa 1500 gattcagatg ctattccaac cagttcattc agctcatttc atgaaaggaa gttttctttc 1560 agttcttgct catctgatgg atttctttca tccaaagaga gctcgaagca tcaaattaac 1620 attcataacc gtgacaagtg caacggagga cccttgcaag ttgcagatga accatcccct 1680 gaagctgttc caaaggtgcc taaatcatca gcagcaaatg ttgaggacca cgacgataga 1740 tcgaaacctc ctcttataca gcaaagaggc cgttttaaag ttacgcctgg gcatgttgag 1800 ttggataagg attttcaata tcgttcgatt caagaattga tgccatctgt tgggagcaat 1860 atacaggcaa tttcgcacct tccttcgtta agtataccat cctcaattga ggctgcatca 1920 accattattg gtgggtccct ttatatgcag ctgtacaatg ttctacagac aaatatgctt 1980 cagagggagc aaatacttca tgcgatgaaa cagttaagtg gttgcgatat ggcaatgacg 2040 tcacctgcct gcattgctcc tgcaagtcgc gcatcatctc catcatcagc attatcaatt 2100 gacagatcat tgttggaagc ggcacacgaa aaggagaagg agctggtcaa tgagatcact 2160 gagctgcaat ggcggttagt gtgttcgcag gacgagatac agaggctcaa agcaaaggca 2220 gcccaggtga ccatatctga tcttgtggag atgctgttag atatggaaca gcacgggaag 2280 gattga 2286
<210> 28
<211> 761
<212> PRT
<213> Oryza sativa
<400> 28
Met Ala Lys Ala Trp Glu Lys Val Ala Thr Ala Ala Gly Leu Gly Gly
1 5 10 15
Ser Gly Glu Arg Arg Lys Tyr Pro Ile Arg Val Glu Asp Tyr Glu Leu
20 25 30
Tyr Glu Glu Ile Gly Gln Gly Val Ser Ala Ile Val Tyr Arg Ser Leu 35 40 45
Cys Lys Pro Leu Asp Glu Ile Val Ala Val Lys Val Leu Asp Phe Glu
50 55 60
Arg Thr Asn Ser Asp Leu Trp Leu Val Val Met Gln Val Gly Tyr Thr
65 70 75 80
Arg Ile Val Ala Ile Tyr Val Pro Pro Leu Asp Leu Ser Lys Met Ile
85 90 95
Val Thr Arg Ile Cys Leu Thr Gln Asn Asn Ile Met Arg Glu Ala Gln 100 105 HO
Thr Met Ile Leu Ile Asp Gln Pro Asn Val Met Lys Ala His Cys Ser 115 120 125
Phe Thr Asn Asn His Ser Leu Trp Val Val Met Pro Tyr Met Ala Gly 130 135 140
Gly Ser Cys Leu His Ile Met Lys Ser Val Tyr Pro Asp Gly Phe Glu 145 150 155 160
Glu Ala Val Ile Ala Thr Val Leu Arg Glu Val Leu Lys Gly Leu Glu 165 170 175
Tyr Leu His His His Gly His Ile His Arg Asp Val Lys Ala Gly Asn 180 185 190 Ile Leu Val Asp Ser Arg Gly Val Val Lys Leu Gly Asp Phe Gly Val 195 200 205
Ser Ala Cys Leu Phe Asp Ser Gly Asp Arg Gln Arg Ala Arg Asn Thr 210 215 220
Phe Val Gly Thr Pro Cys Trp Met Ala Pro Glu Val Met Glu Gln Leu 225 230 235 240
His Gly Tyr Asp Phe Lys Ala Asp Ile Trp Ser Phe Gly Ile Thr Ala 245 250 255
Leu Glu Leu Ala His Gly His Ala Pro Phe Ser Lys Phe Pro Pro Met 260 265 270
Lys Val Leu Leu Met Thr Leu Gln Asn Ala Pro Pro Gly Leu Asp Tyr 275 280 285
Glu Arg Asp Lys Lys Phe Ser Arg His Phe Lys Gln Met Val Ala Met 290 295 300
Cys Leu Val Lys Asp Pro Ser Lys Arg Pro Thr Ala Lys Lys Leu Leu 305 310 315 320
Lys Gln Pro Phe Phe Lys Gln Ala Arg Ser Ser Asp Phe Ile Ser Arg 325 330 335
Lys Leu Leu Glu Gly Leu Pro Gly Leu Gly Ala Arg Tyr Leu Ala Leu 340 345 350
Lys Glu Lys Asp Glu Val Leu Leu Ser Gln Lys Lys Met Pro Asp Gly 355 360 365
Gln Lys Glu Glu Ile Ser Gln Asp Glu Tyr Lys Arg Gly Ile Ser Ser 370 375 380
Trp Asn Phe Asp Met Asp Asp Leu Lys Ser Gln Ala Ser Leu Ile Thr 385 390 395 400
Glu Cys Asp Asp Ser Ile Ser Cys Lys Asp Ser Asp Ala Ser Cys Phe 405 410 415
Tyr Asp Leu Asp Thr Ile Leu Pro Glu Arg Ala Thr Gly Pro His Met 420 425 430
Ser Arg Val Phe Ser Ile Lys Tyr Asp Thr Asp Thr Glu Asn Asp Val 435 440 445 Met Ser Asn Asp Lys Ser Ala Val Ser Ser Pro Glu His Pro Ile Cys
450 455 460
Leu Ala Arg Asn Thr Ser Met Leu Arg Thr Thr Asn Gly Val His Ala
465 470 475 480
Asn Gly Gln Val Arg Lys His Ser Ser Thr Glu Ser Ser Glu Leu Asp 485 490 495
Leu Gln Glu Lys Asp Ser Asp Ala Ile Pro Thr Ser Ser Phe Ser Ser 500 505 510
Phe His Glu Arg Lys Phe Ser Phe Ser Ser Cys Ser Ser Asp Gly Phe 515 520 525
Leu Ser Ser Lys Glu Ser Ser Lys His Gln Ile Asn Ile His Asn Arg 530 535 540
Asp Lys Cys Asn Gly Gly Pro Leu Gln Val Ala Asp Glu Pro Ser Pro 545 550 555 560
Glu Ala Val Pro Lys Val Pro Lys Ser Ser Ala Ala Asn Val Glu Asp 565 570 575
His Asp Asp Arg Ser Lys Pro Pro Leu Ile Gln Gln Arg Gly Arg Phe 580 585 590
Lys Val Thr Pro Gly His Val Glu Leu Asp Lys Asp Phe Gln Tyr Arg 595 600 605
Ser Ile Gln Glu Leu Met Pro Ser Val Gly Ser Asn Ile Gln Ala Ile 610 615 620
Ser His Leu Pro Ser Leu Ser Ile Pro Ser Ser Ile Glu Ala Ala Ser 625 630 635 640
Thr Ile Ile Gly Gly Ser Leu Tyr Met Gln Leu Tyr Asn Val Leu Gln 645 650 655
Thr Asn Met Leu Gln Arg Glu Gln Ile Leu His Ala Met Lys Gln Leu 660 665 670
Ser Gly Cys Asp Met Ala Met Thr Ser Pro Ala Cys Ile Ala Pro Ala 675 680 685
Ser Arg Ala Ser Ser Pro Ser Ser Ala Leu Ser Ile Asp Arg Ser Leu 690 695 700 Leu Glu Ala Ala His Glu Lys Glu Lys Glu Leu Val Asn Glu Ile Thr 705 710 715 720
Glu Leu Gln Trp Arg Leu Val Cys Ser Gln Asp Glu Ile Gln Arg Leu 725 730 735
Lys Ala Lys Ala Ala Gln Val Thr Ile Ser Asp Leu Val Glu Met Leu 740 745 750
Leu Asp Met Glu Gln His Gly Lys Asp
755 760
<210> 29
<211> 1623
<212> DNA
<213> Oryza sativa
<400> 29
atggggagga acgggagcgt caagcgtacg tcgtcgtcgg gggcggcggc ggcgttcacg 60
gcgaatcccc gcgactacca gctcatggag gaggtcgggt acggggcgca cgccgtcgtg 120 taccgcgcgc tgttcgtccc caggaacgac gtcgtggctg tcaagtgcct ggatctcgat cagctcaaca acaacatcga tgaaatccaa cgggaggctc aaatcatgag cttgatagag catcctaatg tcatcagggc ttactgctca tttgttgttg agcacagcct ttgggtagta atgccattta tgactgaggg ttcatgtctg cacctaatga agattgcata tcctgatggt ttcgaggaac ctgttattgg ctctattcta aaggaaacac ttaaggcttt ggagtacctt cacaggcaag gacaaatcca tcgtgatgtc aaggccggca atatccttgt tgataatgct
180
240 300 360 420 480
ggtatagtga agcttgggga cttcggcgtg tctgcttgta tgtttgatag aggtgatcga 540
600 660
caaagatcta ggaacacatt tgtgggaaca ccgtgttgga tggctccaga agtgctccag ccaggcactg gatataactt caaagctgac atatggtcat ttggaatcac tgcacttgaa cttgcccatg gccatgcacc gttttcaaag tatcccccta tgaaggttct tctcatgacc 720 ctccagaatg ctccacctgg tctcgactat gatcgagacc gaagattctc aaagtcattt 780 aaggagatgg ttgcaatgtg cttggtaaaa gatcaaacaa agagaccaac agctgagaag ttgctaaagc attcattttt caaaaatgca aaacctccag aattgacaat gaagggtatc ttaactgatt tacctcctct atgggaccgt gtaaaggctc tccagcttaa agatgcagca cagttggcct tgaagaaaat gccttcttct gagcaggagg cactctccat gagtgaatac 1020 caacgaggtg ttagtgcatg gaacttcgat gttgaagatc tcaaggccca agcatcacta 1080 attcgtgatg atgaaccccc tgaaataaaa gaagacgatg atactgcaag aaccattgaa 1140 gttgaaaagg attcattttc taggaatcat ttggggaagt cgtcgagtac aattgaaaat 1200
840 900 960 ttcttcagtg gacggacctc taccactgca gcaaattcgg atggaaaagg cgatttttca 1260 tttgaagctt ttgattttgg tgaaaacaac gttgatacta aaattatgcc caatgggtat 1320 gaaaacgcta gatcagagaa tagctca-tca ccctctacat caaagcaaga tccagagtca 1380 aaatattgga gaagtacttc tggacagaaa caacaaactt ctggcactcc agctgtccat 1440 tctggtgggg ttaatagctc aacaactgaa aagggccatg gtgttgaaag ggatgcaact 1500 gttcaattgg catctgataa acttaggact gaaacgagaa gagcaacaaa tcttagtggt 1560 ccattgtcac tgccaactcg tgcttctgca aacagtctgt cagctcctat tcgatcttca 1620 gga 1623
<210> 30
<211> 541
<212> PRT
<213> Oryza sativa
<400> 30
Met Gly Arg Asn Gly Ser Val Lys Arg Thr Ser Ser Ser Gly Ala Ala 1 5 10 15
Ala Ala Phe Thr Ala Asn Pro Arg Asp Tyr Gln Leu Met Glu Glu Val 20 25 30
Gly Tyr Gly Ala His Ala Val Val Tyr Arg Ala Leu Phe Val Pro Arg 35 40 45
Asn Asp Val Val Ala Val Lys Cys Leu Asp Leu Asp Gln Leu Asn Asn 50 55 60
Asn Ile Asp Glu Ile Gln Arg Glu Ala Gln Ile Met Ser Leu Ile Glu 65 70 75 80
His Pro Asn Val Ile Arg Ala Tyr Cys Ser Phe Val Val Glu His Ser 85 90 95
Leu Trp Val Val Met Pro Phe Met Thr Glu Gly Ser Cys Leu His Leu 100 105 HO
Met Lys Ile Ala Tyr Pro Asp Gly Phe Glu Glu Pro Val Ile Gly Ser 115 120 125
Ile Leu Lys Glu Thr Leu Lys Ala Leu Glu Tyr Leu His Arg Gln Gly 130 135 140
Gln Ile His Arg Asp Val Lys Ala Gly Asn Ile Leu Val Asp Asn Ala 145 150 155 160 Gly Ile Val Lys Leu Gly Asp Phe Gly Val Ser Ala Cys Met Phe Asp 165 170 175
Arg Gly Asp Arg Gln Arg Ser Arg Asn Thr Phe Val Gly Thr Pro Cys 180 185 190
Trp Met Ala Pro Glu Val Leu Gln Pro Gly Thr Gly Tyr Asn Phe Lys 195 200 205
Ala Asp Ile Trp Ser Phe Gly Ile Thr Ala Leu Glu Leu Ala Eis Gly 210 215 220
His Ala Pro Phe Ser Lys Tyr Pro Pro Met Lys Val Leu Leu Met Thr 225 230 235 240
Leu Gln Asn Ala Pro Pro Gly Leu Asp Tyr Asp Arg Asp Arg Arg Phe 245 250 255
Ser Lys Ser Phe Lys Glu Met Val Ala Met Cys Leu Val Lys Asp Gln 260 265 270
Thr Lys Arg Pro Thr Ala Glu Lys Leu Leu Lys His Ser Phe Phe Lys 275 280 285
Asn Ala Lys Pro Pro Glu Leu Thr Met Lys Gly Ile Leu Thr Asp Leu 290 295 300
Pro Pro Leu Trp Asp Arg Val Lys Ala Leu Gln Leu Lys Asp Ala Ala 305 310 315 320
Gln Leu Ala Leu Lys Lys Met Pro Ser Ser Glu Gln Glu Ala Leu Ser 325 330 335
Met Ser Glu Tyr Gln Arg Gly Val Ser Ala Trp Asn Phe Asp Val Glu 340 345 350
Asp Leu Lys Ala Gln Ala Ser Leu Ile Arg Asp Asp Glu Pro Pro Glu 355 360 365
Ile Lys Glu Asp Asp Asp Thr Ala Arg Thr Ile Glu Val Glu Lys Asp 370 375 380
Ser Phe Ser Arg Asn His Leu Gly Lys Ser Ser Ser Thr Ile Glu Asn 385 390 395 400
Phe Phe Ser Gly Arg Thr Ser Thr Thr Ala Ala Asn Ser Asp Gly Lys Gly Asp Phe Ser Phe Glu Ala Phe Asp Phe Gly Glu Asn Asn Val Asp
Thr Lys Ile Met Pro Asn Gly Tyr Glu Asn Ala Arg Ser Glu Asn Ser
Ser Ser Pro Ser Thr Ser Lys Gln Asp Pro Glu Ser Lys Tyr Trp Arg
Ser Thr Ser Gly Gln Lys Gln Gln Thr Ser Gly Thr Pro Ala Val His
Ser Gly Gly Val Asn Ser Ser Thr Thr Glu Lys Gly His Gly Val Glu
Arg Asp Ala Thr Val Gln Leu Ala Ser Asp Lys Leu Arg Thr Glu Thr
Arg Arg Ala Thr Asn Leu Ser Gly Pro Leu Ser Leu Pro Thr Arg Ala
Ser Ala Asn Ser Leu Ser Ala Pro Ile Arg Ser Ser Gly
<210> 31 <211> 1938 <212> DNA <213> Oryza sativa
<400> 31
atggtgagga gcgggagtgt gcggcggacg gccgcgtcgt cgtcgcccgc cgcggcggcg 60
gtgccgacgg ccttcaccgc ctcgcccggc gactaccgcc ttctggagga ggtcggctac 120
ggcgcgaacg ccgtcgtgta ccgggcggtg ttcctgccat ccaaccggac cgtcgccgtc 180
aagtgcctgg atctcgatcg tgtcaacagt aacctcgatg atataagaaa agaggcacaa 240
acgatgagct tgatagatca ccctaatgtc atcagggctt actgctcatt tgttgtggat 300
cataacctct gggtgataat gccattcatg tcagagggtt catgtttaca cctgatgaag 360
gttgcatatc ctgatggttt tgaggagcct gttatcgcct ctatcctaaa ggaaacactt 420
aaggctctag agtacctcca tcggcaagga catatccata gggatgtcaa gcgtaatatt 480
atacaggcgg gtaatatcct tatggacagt cctggtatag tgaaacttgg ggactttggt 540
gtctctgctt gtatgtttga tagaggtgat agacaaagat ccaggaatac attcgtggga 600
acaccatgct ggatggctcc agaagttctc cagcctggag caggatataa tttcaagaaa 660 tatgtttcaa accatttgtt taccaactta atttggttat ttaaaatttc cttaaggggt 720 aagaactcta actaccataa aaatactggg aataaggttc ttctcatgac ccttcaaaat 780 gcaccaccag gccttgacta tgaccgtgat aaaagattct caaagtcttt caaggaaatg 840 gttgcaatgt gcctggtcaa agatcaaaca aagaggccaa cggctgaaaa gttactaaag 900 cactcatttt tcaagaacgc aaaacctcca gagctgactg ttaagagtat tttaactgat 960 ttgccccctc tgtgggatcg tgtaaaagcg ctccagctaa aagatgcagc acaattagct 1020 ttgaagaaaa tgccttcttc tgaacaggag gcactttcta tgattcatga tgatgatcca 1080 cctgaaataa aggaagatgt tgacaatgat agaataaatg aagctgataa ggagccgttt 1140 tctggcaatc attttggaca accaaaaatt ttgagtggaa agcacttcag gttgaatcat 1200 gaacaaactt gtgtcactgc agtaagtcca ggggggaata tgcatgagac aagcagagga 1260 ttggtttctg aacctggtga tgctgatagt gaaaggaaag ttgatggata tagaaaacaa 1320 ggggaagcgg cagttaagtt ggcatctgat aaacaaaaga gttgtacaaa aagaaccaca 1380 aatctcagtg gtcctcttgc actccctact cgtgcttctg caaatagtct gtctgctcct 1440 attcggtctt ctggaggcta tgtgggctcc ttgggagata agtctaagcg tagtgtggtg 1500 gagataaaag gacgtttttc agtgacatct gagaatgtgg atcttgcaaa ggttcaggaa 1560 gttccaacaa gcggcatttc acgcaaatta caggagggat cttcactgag aaaatcagcc 1620 agcgttggtc attggccggt ggatgctaag ccaatggatc tcatcacaaa cctcctaagt 1680 agcttgcaac agaatgagaa agctgacgca acacagtata gacttggtaa tatggatggt 1740 gatacagagg ttgaaacgtc tatttccgag ggagaacggt cattacttgt caaaatattt 1800 gaattgcaat ctagaatgat ttcattaacc gatgaactga tcacaacaaa actgcaacat 1860 gtccagctac aagaagagct aaaaatactg tactgtcacg aagaaataat cgacactagg 1920 gaggtggaca atgcttga 1938
<210> 32
<211> 645
<212> PRT
<213> Oryza sativa
<400> 32
Met Val Arg Ser Gly Ser Val Arg Arg Thr Ala Ala Ser Ser Ser Pro
1 5 10 15
Ala Ala Ala Ala Val Pro Thr Ala Phe Thr Ala Ser Pro Gly Asp Tyr 20 25 30
Arg Leu Leu Glu Glu Val Gly Tyr Gly Ala Asn Ala Val Val Tyr Arg 35 40 45 Ala Val Phe Leu Pro Ser Asn Arg Thr Val Ala Val Lys Cys Leu Asp 50 55 60
Leu Asp Arg Val Asn Ser Asn Leu Asp Asp Ile Arg Lys Glu Ala Gln 65 70 75 80
Thr Met Ser Leu Ile Asp His Pro Asn Val Ile Arg Ala Tyr Cys Ser 85 90 95
Phe Val Val Asp His Asn Leu Trp Val Ile Met Pro Phe Met Ser Glu 100 105 110
Gly Ser Cys Leu His Leu Met Lys Val Ala Tyr Pro Asp Gly Phe Glu 115 120 125
Glu Pro Val Ile Ala Ser Ile Leu Lys Glu Thr Leu Lys Ala Leu Glu 130 135 140
Tyr Leu His Arg Gln Gly His Ile His Arg Asp Val Lys Arg Asn Ile 145 150 155 160
Ile Gln Ala Gly Asn Ile Leu Met Asp Ser Pro Gly Ile Val Lys Leu 165 170 175
Gly Asp Phe Gly Val Ser Ala Cys Met Phe Asp Arg Gly Asp Arg Gln 180 185 190
Arg Ser Arg 'Asn Thr Phe Val Gly Thr Pro Cys Trp Met Ala Pro Glu 195 200 205
Val Leu Gln Pro Gly Ala Gly Tyr Asn Phe Lys Lys Tyr Val Ser Asn 210 215 220
His Leu Phe Thr Asn Leu Ile Trp Leu Phe Lys Ile Ser Leu Arg Gly 225 230 235 240
Lys Asn Ser Asn Tyr His Lys Asn Thr Gly Asn Lys Val Leu Leu Met 245 250 255
Thr Leu Gln Asn Ala Pro Pro Gly Leu Asp Tyr Asp Arg Asp Lys Arg 260 265 270
Phe Ser Lys Ser Phe Lys Glu Met Val Ala Met Cys Leu Val Lys Asp 275 280 285
Gln Thr Lys Arg Pro Thr Ala Glu Lys Leu Leu Lys His Ser Phe Phe 290 295 300 Lys Asn Ala Lys Pro Pro Glu Leu Thr Val Lys Ser Ile Leu Thr Asp 305 310 315 320
Leu Pro Pro Leu Trp Asp Arg Val Lys Ala Leu Gln Leu Lys Asp Ala 325 330 335
Ala Gln Leu Ala Leu Lys Lys Met Pro Ser Ser Glu Gln Glu Ala Leu 340 345 350
Ser Met Ile His Asp Asp Asp Pro Pro Glu Ile Lys Glu Asp Val Asp 355 360 365
Asn Asp Arg Ile Asn Glu Ala Asp Lys Glu Pro Phe Ser Gly Asn His 370 375 380
Phe Gly Gln Pro Lys Ile Leu Ser Gly Lys His Phe Arg Leu Asn His 385 390 395 400
Glu Gln Thr Cys Val Thr Ala Val Ser Pro Gly Gly Asn Met His Glu 405 410 415
Thr Ser Arg Gly Leu Val Ser Glu Pro Gly Asp Ala Asp Ser Glu Arg 420 425 430
Lys Val Asp Gly Tyr Arg Lys Gln Gly Glu Ala Ala Val Lys Leu Ala 435 440 445
Ser Asp Lys Gln Lys Ser Cys Thr Lys Arg Thr Thr Asn Leu Ser Gly 450 455 460
Pro Leu Ala Leu Pro Thr Arg Ala Ser Ala Asn Ser Leu Ser Ala Pro 465 470 475 480
Ile Arg Ser Ser Gly Gly Tyr Val Gly Ser Leu Gly Asp Lys Ser Lys 485 490 495
Arg Ser Val Val Glu Ile Lys Gly Arg Phe Ser Val Thr Ser Glu Asn 500 505 510
Val Asp Leu Ala Lys Val Gln Glu Val Pro Thr Ser Gly Ile Ser Arg 515 520 525
Lys Leu Gln Glu Gly Ser Ser Leu Arg Lys Ser Ala Ser Val Gly His 530 535 540
Trp Pro Val Asp Ala Lys Pro Met Asp Leu Ile Thr Asn Leu Leu Ser 545 550 555 560
Ser Leu Gln Gln Asn Glu Lys Ala Asp Ala Thr Gln Tyr Arg Leu Gly 565 570 575
Asn Met Asp Gly Asp Thr Glu Val Glu Thr Ser Ile Ser Glu Gly Glu 580 585 590
Arg Ser Leu Leu Val Lys Ile Phe Glu Leu Gln Ser Arg Met Ile Ser 595 600 605
Leu Thr Asp Glu Leu Ile Thr Thr Lys Leu Gln His Val Gln Leu Gln 610 615 620
Glu Glu Leu Lys Ile Leu Tyr Cys His Glu Glu Ile Ile Asp Thr Arg 625 630 635 640
Glu Val Asp Asn Ala 645
<210> 33 <211> 2040
<212> DNA
<213> Medicago sativa <400> 33
atttattaaa attgatgtga cggtctctat agggccgttt catctaaatt tattaaaatt 60
tagatccaac tatcttataa tccgttgcac tgtgcaacag ttatagagaa tccaaattcc 120 gtaacaggag cttaaattct ctatgattgt tgcacatctc cggtagagta tctaaattta agaaatacaa catatcagag atattatgta gaaacacata ttatcaagtt aattaactag taggactatt agcagcagag gaaattaggt gaagcttgat attctccagc tgcatctcca gctgcaagtt cttcttcttc tcattttcca attctgtcct caacttagag atctcttgca ccattttctc atcactttca gccacatgaa tctcctctcc accaattaga ttcattagaa
180 240 300 360 420
acttaacttg tcccaactct tgttccaagc tctctttcaa cacattcaac gttgccaacg 4:
540
600 660
tagcttcacg gttcttaaca acaccaccga cattttcatg atcaaccaca tcagaagtat tggtctttgg ctccatcaca gttcctgatg ctgtaacaac agcatcctct tggatcactt tttcttcttc gaaccgaact tgtttcacaa cttcatcatc tttgctttga tcctttggga atacaggcac aagttccaat ccatcttcat tgaaattcca gccactgatt cttctctgtt 720 tcacattttt cactgactcg tcatcatcgt cgtctccatc atccttgcac tttgaatctg 780 gatccattat agctttgatc tctttatacc ttttctcaac actaggcaat ccattcaaca cattcttcac caaaacatct gatcccttgc agtttttaaa gaatgaatgc ttaagtaact
840 900 tctcagcaga gggtcttttt gtaggatctt gattcaaaca taaagcaacc atatccttaa 960
aagccttaga gaatttgtta ctaccaccat gacccttgta actatgttta tcaaaatcag 1020
aaaacttaaa cctctttgta atgtttagca tcaatgactt agaaggagga agatgagaaa 1080
gtggtggtct tccatgtgct aactccaaag ctgttatccc aaaagaccag atatcagctt 1140
tgaaactgta accattatga gagtgaataa cctcaggagc catccaataa ggtgttccag 1200
caaaatcagt aaatatatga gaagaagaag aattcgaaga cgaagatgaa taagaagaac 1260
atgctcctac agagttgttt gattcataaa tggaagcaga aacaccaaaa tctgcaagtt 1320
tcactaatcc atttgagtca acaaggatgt taccagattt gatatctcta tgaagatgtc 1380
cttgtccatg aaggtaagaa agagcattga gagtgtcttt gagaataaca gctatggatt 1440
gttctgttaa gccgttttgg aaagagtgag agataatgga ttgtaatgaa cctccagcca 1500
tgaatggcat aaccacccaa agacggttgt caacggtgaa agaacagtga gctttgagga 1560
tgttggggtg ggaaagaagt gataatgtct ttgcttcacg tctaacatcg tcaaggtcgg 1620
ggcgcgaacg atccaagtct atggatttga tagctactgg tgtggagttt atagggatgc 1680
agattgcttt gtagacgacg gcgctgttac cggcgccaat ctcgtcgacg attttatagg 1740
aggaagagtc taatggatat tgcactcttt ctgctatgtt ggtagccatg gaaataatgg 1800
aagttgagat ataagagtgt gtgtgtgtgt gtgtgttaga ggttgaaaat ggttgtttga 18 60
aaatatataa gatgaatgaa ttgcatggat tggtgatgga tggatggatg gtgaaattaa 1920
ttgataaaga gagtggtagg ttgagtttga gcagttttct tgtgaaggtt gatgaaaaaa 1980
gaagaaaata tcattaggca gaggtgattt atttctcaat gatctatcag tggttgtgaa 2040
<210> 34 <211> 518 <212> PRT
<213> Medicago sativa <400> 34
Met Ala Thr Asn Ile Ala Glu Arg Val Gln Tyr Pro Leu Asp Ser Ser
Glu Ala Lys Thr Leu Ser Leu Leu Ser His Pro Asn Ile Leu Lys Ala
Ser Tyr Lys Ile Val Asp Glu Ile Gly Ala Gly Asn Ser Ala Val Val
20 25 30
Tyr Lys Ala Ile Cys Ile Pro Ile Asn Ser Thr Pro Val Ala Ile Lys
35 40 45
Ser Ile Asp Leu Asp Arg Ser Arg Pro Asp Leu Asp Asp Val Arg Arg His Cys Ser Phe Thr Val Asp Asn Arg Leu Trp Val Val Met Pro Phe 85 90 95
Met Ala Gly Gly Ser Leu Gln Ser Ile Ile Ser His Ser Phe Gln Asn 100 105 HO
Gly Leu Thr Glu Gln Ser Ile Ala Val Ile Leu Lys Asp Thr Leu Asn 115 120 125
Ala Leu Ser Tyr Leu His Gly Gln Gly His Leu His Arg Asp Ile Lys 130 135 140
Ser Gly Asn Ile Leu Val Asp Ser Asn Gly Leu Val Lys Leu Ala Asp 145 150 155 160
Phe Gly Val Ser Ala Ser Ile Tyr Glu Ser Asn Asn Ser Val Gly Ala 165 170 175
Cys Ser Ser Tyr Ser Ser Ser Ser Ser Asn Ser Ser Ser Ser His Ile 180 185 190
Phe Thr Asp Phe Ala Gly Thr Pro Tyr Trp Met Ala Pro Glu Val Ile 195 200 205
His Ser His Asn Gly Tyr Ser Phe Lys Ala Asp Ile Trp Ser Phe Gly 210 215 220
Ile Thr Ala Leu Glu Leu Ala His Gly Arg Pro Pro Leu Ser His Leu 225 230 235 240
Pro Pro Ser Lys Ser Leu Met Leu Asn Ile Thr Lys Arg Phe Lys Phe 245 250 255
Ser Asp Phe Asp Lys His Ser Tyr Lys Gly His Gly Gly Ser Asn Lys 260 265 270
Phe Ser Lys Ala Phe Lys Asp Met Val Ala Leu Cys Leu Asn Gln Asp 275 280 285
Pro Thr Lys Arg Pro Ser Ala Glu Lys Leu Leu Lys His Ser Phe Phe 290 295 300
Lys Asn Cys Lys Gly Ser Asp Val Leu Val Lys Asn Val Leu Asn Gly 305 310 315 320 Leu Pro Ser Val Glu Lys Arg Tyr Lys Glu Ile Lys Ala Ile Met Asp 325 330 335
Pro Asp Ser Lys Cys Lys Asp Asp Gly Asp Asp Asp Asp Asp Glu Ser 340 345 350
Val Lys Asn Val Lys Gln Arg Arg Ile Ser Gly Trp Asn Phe Asn Glu 355 360 365
Asp Gly Leu Glu Leu Val Pro Val Phe Pro Lys Asp Gln Ser Lys Asp 370 375 380
Asp Glu Val Val Lys Gln Val Arg Phe Glu Glu Glu Lys Val Ile Gln 385 390 395 400
Glu Asp Ala Val Val Thr Ala Ser Gly Thr Val Met Glu Pro Lys Thr 405 410 415
Asn Thr Ser Asp Val Val Asp His Glu Asn Val Gly Gly Val Val Lys 420 425 430
Asn Arg Glu Ala Thr Leu Ala Thr Leu Asn Val Leu Lys Glu Ser Leu 435 440 445
Glu Gln Glu Leu Gly Gln Val Lys Phe Leu Met Asn Leu Ile Gly Gly 450 455 460
Glu Glu Ile His Val Ala Glu Ser Asp Glu Lys Met Val Gln Glu Ile 465 470 475 480
Ser Lys Leu Arg Thr Glu Leu Glu Asn Glu Lys Lys Lys Asn Leu Gln 485 490 495
Leu Glu Met Gln Leu Glu Asn Ile Lys Leu His Leu Ile Ser Ser Ala 500 505 510
Ala Asn Ser Pro Thr Ser 515

Claims (27)

1. Método para aumentar o rendimento de plantas com relação às plantas de controle, caracterizado pelo fato de compreender modular a expressão em uma planta de um ácido nucleico codificando um polipeptídeo de tipo Ste20 ou seu homólogo, e opcionalmente selecionar plantas tendo rendimento aumentado.
2. Método de acordo com a reivindicação 1, caracterizado pelo fato de que referida expressão modulada é efetuada por introdução de uma modificação genética preferivelmente no locus de um gene codificando um polipeptídeo de tipo Ste20 ou um seu homólogo.
3. Método de acordo com a reivindicação 2, caracterizado pelo fato de que referida modificação genética é efetuada por um dentre: ativação de T-DNA, TILLING, mutagênese sítio-dirigida ou evolução dirigida.
4. Método para aumentar o rendimento de plantas com relação às plantas de controle, caracterizado pelo fato de compreender introduzir e expressar em uma planta um ácido nucleico de tipo Ste20 ou uma variante do mesmo.
5. Método de acordo com a reivindicação 4, caracterizado pelo fato de que referido ácido nucleico codifica um ortólogo ou parálogo da proteína Ste20 de SEQ ID NO: 2.
6. Método de acordo com a reivindicação 4, caracterizado pelo fato de que referida variante é uma porção de um ácido nucleico de tipo Ste20 ou uma seqüência capaz de hibridizar a um ácido nucleico de tipo Ste20, cuja porção ou seqüência de hibridização codifica um polipeptídeo compreendendo um domínio quinase e a seqüência de assinatura Ste20 de SEQ ID NO: 6.
7. Método de acordo com a reivindicação 5 ou 6, caracterizado pelo fato de que referido ácido nucleico de tipo Ste20 ou variante do mesmo é superexpressado em uma planta.
8. Método de acordo com qualquer uma das reivindicações 5 a -7, caracterizado pelo fato de que referido ácido nucleico de tipo Ste20 ou variante do mesmo é de origem de plantas, preferivelmente de uma planta dicotiledônea, ainda preferivelmente da família Brassicaceae7 mais preferivelmente o ácido nucleico é de Arabidopsis thaliana.
9. Método de acordo com qualquer uma das reivindicações 5 a -8, caracterizado pelo fato de que referido ácido nucleico de tipo StelO ou variante do mesmo é ligado operativamente a um promotor constitutivo.
10. Método de acordo com a reivindicação 9, caracterizado pelo fato de que referido promotor constitutivo é um promotor GOS2.
11. Método de acordo com qualquer uma das reivindicações 1 a 10, caracterizado pelo fato de que referido rendimento aumentado é rendimento de sementes aumentado.
12. Método de acordo com qualquer uma das reivindicações - 10 a 11, caracterizado pelo fato de que referido rendimento aumentado é selecionado dentre: peso total aumentado de sementes, número aumentado de sementes cheias ou índice de colheita aumentado.
13. Planta, caracterizada pelo fato de ser obtenível por um método como definido em qualquer uma das reivindicações 1 a 12.
14. Construção, caracterizada pelo fato de compreender: (i) um ácido nucleico de tipo StelO ou variante do mesmo; (ii) uma ou mais seqüências de controle capazes de dirigir a expressão da seqüência de ácido nucleico de (a); e opcionalmente (iii) uma seqüência de terminação de transcrição.
15. Construção de acordo com a reivindicação 14, caracterizada pelo fato de que a referida seqüência de controle é um promotor constitutivo.
16. Construção de acordo com a reivindicação 15, caracterizada pelo fato de que referido promotor constitutivo é um promotor G0S2.
17. Construção de acordo com a reivindicação 16, caracterizado pelo fato de que referido promotor .GOS2 é como representado por nucleotídeos 1 a 2193 de SEQ ID NO: 5.
18. Planta, caracterizada pelo fato de ser transformada com uma construção como definida em qualquer uma das reivindicações 14 a 17.
19. Método para produzir uma planta transgênica tendo rendimento aumentado, o método caracterizado pelo fato de compreender: (i) introduzir e expressar em uma planta ou célula de planta um ácido nucleico de tipo Ste20 ou variante do mesmo; (ii) cultivar a célula de planta sob condições promovendo o crescimento e desenvolvimento da planta.
20. Planta transgênica, caracterizada pelo fato de ter um rendimento aumentado resultante de um ácido nucleico de tipo Ste20 ou uma variante do mesmos introduzida na referida planta.
21. Planta transgênica de acordo com a reivindicação 13, 18 ou - 20, caracterizada pelo fato de que a referida planta é uma planta monocotiledônea, como cana de açúcar ou em que a planta é um cereal, como arroz, milho, trigo, cevada, milheto, centeio, aveia ou sorgo.
22. Partes coletáveis de uma planta, caracterizadas pelo fato de serem de acordo com qualquer uma das reivindicações 13, 18, 20 ou 21.
23. Partes coletáveis de uma planta de acordo com a reivindicação 22, caracterizadas pelo fato de que referidas partes coletáveis são sementes.
24. Produtos, caracterizados pelo fato de serem diretamente derivados de uma planta como definida na reivindicação 21 e/ou de partes coletáveis de uma planta como definidas nas reivindicações 22 ou 23.
25. Uso de um ácido nucleico /gene de tipo Ste20 ou variante do mesmo, ou uso de um polipeptídeo de tipo Ste20 ou seu homólogo, caracterizado pelo fato de ser na melhora do rendimento, especialmente rendimento de sementes, com relação às plantas de controle.
26. Uso de acordo com a reivindicação 25, caracterizado pelo fato de que referido rendimento de sementes é um ou mais dentre: peso total aumentado de sementes, número aumentado de sementes cheias e índice de colheita aumentado.
27. Uso de um ácido nucleico /gene de tipo Ste20 ou variante do mesmo, ou uso de um polipeptídeo de tipo Ste20 ou seu homólogo, caracterizado pelo fato de ser como um marcador molecular.
BRPI0612710-0A 2005-07-06 2006-07-06 método para aumentar o rendimento de plantas com relação às plantas de controle, e para produzir uma planta transgênica tendo rendimento aumentado, planta, construção, partes coletáveis de uma planta, produtos, e, uso de um ácido nucleico / gene de tipo ste20 ou variante do mesmo, ou uso de um polipeptìdeo de tipo ste20 ou seu homólogo BRPI0612710A2 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP05106135.6 2005-07-06
EP05106135 2005-07-06
US69733805P 2005-07-08 2005-07-08
US60/697338 2005-07-08
PCT/EP2006/063976 WO2007003660A1 (en) 2005-07-06 2006-07-06 Plant yield improvement by ste20-like gene expression

Publications (1)

Publication Number Publication Date
BRPI0612710A2 true BRPI0612710A2 (pt) 2012-10-02

Family

ID=35094589

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0612710-0A BRPI0612710A2 (pt) 2005-07-06 2006-07-06 método para aumentar o rendimento de plantas com relação às plantas de controle, e para produzir uma planta transgênica tendo rendimento aumentado, planta, construção, partes coletáveis de uma planta, produtos, e, uso de um ácido nucleico / gene de tipo ste20 ou variante do mesmo, ou uso de um polipeptìdeo de tipo ste20 ou seu homólogo

Country Status (9)

Country Link
US (2) US8119858B2 (pt)
EP (2) EP2431472A1 (pt)
CN (1) CN101258246B (pt)
AR (1) AR054161A1 (pt)
AU (1) AU2006264937B2 (pt)
BR (1) BRPI0612710A2 (pt)
CA (1) CA2612116A1 (pt)
WO (1) WO2007003660A1 (pt)
ZA (1) ZA200800066B (pt)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AR054161A1 (es) * 2005-07-06 2007-06-06 Cropdesign Nv Plantas con aumento del rendimiento y un metodo para prepararlas
BRPI0820439A2 (pt) * 2007-11-27 2019-09-24 Basf Plant Science Gmbh planta transgênica, polinucleotídeo isolado, e, métodos para produzir uma planta transgênica, e para aumentar o crescimento ou rendimento de uma planta em condições normais ou limitadas de água ou aumentar tolerância de uma planta a um estresse ambiental.
EP2706836A4 (en) * 2011-05-11 2014-12-03 Basf Plant Science Co Gmbh PLANTS HAVING IMPROVED PERFORMANCE-RELATED CHARACTERS AND PROCESS FOR PRODUCTION THEREOF
US9713332B2 (en) 2013-03-13 2017-07-25 Pioneer Hi-Bred International, Inc. Glyphosate application for weed control in Brassica
CN108998471B (zh) 2013-03-14 2022-11-04 先锋国际良种公司 用以防治昆虫害虫的组合物和方法
MX360160B (es) 2013-03-15 2018-10-24 Pioneer Hi Bred Int Polipeptidos phi-4 y metodos para su uso.
CA2920339C (en) 2013-08-16 2023-10-24 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
ES2776730T3 (es) 2013-09-13 2020-07-31 Pioneer Hi Bred Int Proteínas insecticidas y métodos para su uso
EP3705489A1 (en) 2014-02-07 2020-09-09 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
US9101100B1 (en) * 2014-04-30 2015-08-11 Ceres, Inc. Methods and materials for high throughput testing of transgene combinations
US20170247719A1 (en) 2014-09-17 2017-08-31 Pioneer Hi-Bred International, Inc. Compositions and methods to control insect pests
MX2017004745A (es) 2014-10-16 2017-10-20 Pioner Hi-Bred Int Inc Proteinas insecticidas y metodos de uso.
WO2016099916A1 (en) 2014-12-19 2016-06-23 E. I. Du Pont De Nemours And Company Polylactic acid compositions with accelerated degradation rate and increased heat stability
WO2016186986A1 (en) 2015-05-19 2016-11-24 Pioneer Hi Bred International Inc Insecticidal proteins and methods for their use
BR112017027382A2 (pt) 2015-06-16 2018-08-28 Pioneer Hi-Bred International, Inc. elemento de silenciamento, construto de dna, construto de expressão, cassete de expressão, célula hospedeira, composição, célula vegetal, planta ou parte de planta, semente transgênica, método para controlar um inseto-praga de planta, kit para controlar insetos-praga
UA124495C2 (uk) 2015-08-06 2021-09-29 Піонір Хай-Бред Інтернешнл, Інк. Інсектицидний білок рослинного походження та спосіб його застосування
AU2016315655A1 (en) 2015-08-28 2018-02-01 E. I. Du Pont De Nemours And Company Ochrobactrum-mediated transformation of plants
US20180325119A1 (en) 2015-12-18 2018-11-15 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
EA201892293A1 (ru) 2016-05-04 2019-04-30 Пайонир Хай-Бред Интернэшнл, Инк. Инсектицидные белки и способы их применения
BR112018076047A2 (pt) 2016-06-16 2019-03-26 Pioneer Hi Bred Int elemento de silenciamento, construto de dna, cassete de expressão, célula hospedeira, composição, célula vegetal, planta ou parte de planta, semente transgênica, método para controlar um inseto-praga de planta e kit
BR112018077339A2 (pt) 2016-07-01 2019-04-24 Pioneer Hi-Bred International, Inc. polipeptídeo inseticida recombinante, composição, polinucleotídeo recombinante, construto de dna, planta transgênica e métodos
WO2018013333A1 (en) 2016-07-12 2018-01-18 Pioneer Hi-Bred International, Inc. Compositions and methods to control insect pests
BR112019008800A2 (pt) 2016-11-01 2019-07-16 Pioneer Hi Bred Int polipeptídeo inseticida, composição inseticida, polinucleotídeo recombinante, construto de dna, célula de planta ou planta transgênica, método para inibir o crescimento ou exterminar uma população de praga de inseto agrícola, método para inibir o crescimento ou exterminar uma praga de inseto, método para controlar infestação de inseto lepidoptera e/ou coleoptera em uma planta transgênica e fornecer gerenciamento de resistência de inseto e uso de pelo menos um polipeptídeo inseticida
WO2020076888A1 (en) 2018-10-10 2020-04-16 Pioneer Hi-Bred International, Inc. Plant growth-promoting microbes, compositions, and uses
EP4182466A2 (en) 2020-07-14 2023-05-24 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5352605A (en) 1983-01-17 1994-10-04 Monsanto Company Chimeric genes for transforming plant cells using viral promoters
DE3484215D1 (de) 1983-01-17 1991-04-11 Monsanto Co Chimaerische gene geeignet zur expression in pflanzenzellen.
US5504200A (en) 1983-04-15 1996-04-02 Mycogen Plant Science, Inc. Plant gene expression
US4630393A (en) * 1984-09-21 1986-12-23 Uf Genetics, Inc. Production of hybrid "improved supersweet" sweet corn
US5420034A (en) 1986-07-31 1995-05-30 Calgene, Inc. Seed-specific transcriptional regulation
DK162399C (da) 1986-01-28 1992-03-23 Danisco Fremgangsmaade til ekspression af gener i baelgplanteceller, dna-fragment, rekombineret dna-fragment samt plasmid til brug ved udoevelsen af fremgangsmaaden
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
US5614395A (en) 1988-03-08 1997-03-25 Ciba-Geigy Corporation Chemically regulatable and anti-pathogenic DNA sequences and uses thereof
NZ228320A (en) 1988-03-29 1991-06-25 Du Pont Nucleic acid promoter fragments of the promoter region homologous to the em gene of wheat, dna constructs therefrom and plants thereof
CA1341467C (en) 1988-07-29 2004-12-07 John C. Rogers Producing commercially valuable polypeptides with genetically transformed endosperm tissue
DE3843628A1 (de) 1988-12-21 1990-07-05 Inst Genbiologische Forschung Wundinduzierbare und kartoffelknollenspezifische transkriptionale regulation
KR920701453A (ko) 1989-03-17 1992-08-11 미리엄 디. 멕코나헤이 유전자발현의 외부조절
WO1991013980A1 (en) 1990-03-16 1991-09-19 Calgene, Inc. Novel sequences preferentially expressed in early seed development and methods related thereto
US5187267A (en) 1990-06-19 1993-02-16 Calgene, Inc. Plant proteins, promoters, coding sequences and use
DE4208050A1 (de) 1992-03-13 1993-09-23 Bayer Ag Azolylmethyl-fluorcyclopropyl-derivate
CA2092069A1 (en) 1992-03-27 1993-09-28 Asako Iida An expression plasmid for seeds
ES2164659T3 (es) 1992-04-13 2002-03-01 Syngenta Ltd Construcciones de dna y plantas que las incorporan.
CA2118513A1 (en) 1992-04-24 1993-11-11 David A. Zarling In vivo homologous sequence targeting in eukaryotic cells
JPH0662870A (ja) 1992-08-18 1994-03-08 Mitsui Giyousai Shokubutsu Bio Kenkyusho:Kk 大豆ホスホエノールピルビン酸カルボキシラーゼ遺伝子のプロモーター領域及び5’非翻訳領域
JPH08503853A (ja) 1992-11-30 1996-04-30 チューア,ナム−ハイ 植物における組織−及び発生−特異的な発現を付与する発現モチーフ
US5656451A (en) * 1993-07-30 1997-08-12 Yale University OspE, OspF, and S1 polypeptides in borrelia burgdorferi
CA2174954C (en) 1993-11-19 2005-03-15 Stanton B. Gelvin Chimeric regulatory regions and gene cassettes for expression of genes in plants
GB9324707D0 (en) 1993-12-02 1994-01-19 Olsen Odd Arne Promoter
ATE196311T1 (de) 1993-12-09 2000-09-15 Univ Jefferson Verbindungen und verfahren zur ortsspezifischen mutation in eukaryotischen zellen
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6395547B1 (en) 1994-02-17 2002-05-28 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
GB9403512D0 (en) 1994-02-24 1994-04-13 Olsen Odd Arne Promoter
GB9421286D0 (en) 1994-10-21 1994-12-07 Danisco Promoter
US5689040A (en) 1995-02-23 1997-11-18 The Regents Of The University Of California Plant promoter sequences useful for gene expression in seeds and seedlings
WO1997002353A1 (fr) 1995-07-05 1997-01-23 Sapporo Breweries Limited Promoteur specifique des tissus
GB9516241D0 (en) 1995-08-08 1995-10-11 Zeneca Ltd Dna constructs
US5912415A (en) 1996-05-16 1999-06-15 Regents Of The University Of Minnesota Arabidopsis spindly gene, methods of identification and use
US5981841A (en) 1996-08-30 1999-11-09 Monsanto Company Early seed 5' regulatory sequence
DE19644478A1 (de) 1996-10-25 1998-04-30 Basf Ag Blattspezifische Expression von Genen in transgenen Pflanzen
US6613959B1 (en) * 1998-08-10 2003-09-02 The General Hospital Corporation Transgenic plants expressing a MAPKKK protein kinase domain
US5977436A (en) 1997-04-09 1999-11-02 Rhone Poulenc Agrochimie Oleosin 5' regulatory region for the modification of plant seed lipid composition
DE69836552T3 (de) 1997-09-30 2014-10-09 The Regents Of The University Of California Herstellung von proteinen in pflanzensamen
US6555732B1 (en) 1998-09-14 2003-04-29 Pioneer Hi-Bred International, Inc. Rac-like genes and methods of use
US6504083B1 (en) 1998-10-06 2003-01-07 Pioneer Hi-Bred International, Inc. Maize Gos-2 promoters
DE19852195C2 (de) 1998-11-04 2000-11-02 Inst Pflanzengenetik & Kultur Neue Expressionskassette zur Expression von beliebigen Genen in Pflanzensamen
CA2366104C (en) 1999-07-22 2010-07-06 Japan As Represented By Director General Of National Institute Of Agrobiological Resources, Ministry Of Agriculture, Forestry And Fisheries Ultra-fast transformation technique for monocotyledons
JP2003507074A (ja) 1999-08-26 2003-02-25 ビーエーエスエフ プランド サイエンス ゲーエムベーハー 構成的植物v−atpアーゼプロモーターにより制御される植物遺伝子発現
US20040172685A1 (en) 1999-12-06 2004-09-02 John Mundy Method of using MAPK4 and orthologues thereof to control plant disease resistance and plant growth
US20110131679A2 (en) * 2000-04-19 2011-06-02 Thomas La Rosa Rice Nucleic Acid Molecules and Other Molecules Associated with Plants and Uses Thereof for Plant Improvement
US7834146B2 (en) * 2000-05-08 2010-11-16 Monsanto Technology Llc Recombinant polypeptides associated with plants
US20060134630A1 (en) * 2002-10-09 2006-06-22 Novozymes A/S Method for screening for an antimicrobial polypeptide
US20060150283A1 (en) * 2004-02-13 2006-07-06 Nickolai Alexandrov Sequence-determined DNA fragments and corresponding polypeptides encoded thereby
AR054161A1 (es) * 2005-07-06 2007-06-06 Cropdesign Nv Plantas con aumento del rendimiento y un metodo para prepararlas

Also Published As

Publication number Publication date
EP1902135A1 (en) 2008-03-26
WO2007003660A1 (en) 2007-01-11
CA2612116A1 (en) 2007-01-11
CN101258246B (zh) 2012-09-05
US20090025101A1 (en) 2009-01-22
ZA200800066B (en) 2009-08-26
US20120110695A1 (en) 2012-05-03
US8119858B2 (en) 2012-02-21
EP2431472A1 (en) 2012-03-21
AU2006264937A1 (en) 2007-01-11
AR054161A1 (es) 2007-06-06
CN101258246A (zh) 2008-09-03
AU2006264937B2 (en) 2011-01-27

Similar Documents

Publication Publication Date Title
BRPI0612710A2 (pt) método para aumentar o rendimento de plantas com relação às plantas de controle, e para produzir uma planta transgênica tendo rendimento aumentado, planta, construção, partes coletáveis de uma planta, produtos, e, uso de um ácido nucleico / gene de tipo ste20 ou variante do mesmo, ou uso de um polipeptìdeo de tipo ste20 ou seu homólogo
ES2390919T3 (es) Plantas que tienen rasgos relacionados con el rendimiento mejorados y un método para elaborar las mismas
US8071840B2 (en) Plants having increase yield and method for making the same
KR101255415B1 (ko) 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법
BRPI0718977A2 (pt) Método para aumentar rendimento de sementes em plantas em relação às plantas de controle, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica tendo redimento aumentado de sementes em relação às plantas de controle, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico
WO2006131547A1 (en) Plants having improved growth characteristics and method for making the same
CN101415829A (zh) 具有增强的产量相关性状的植物和用于产生该植物的方法
US8273952B2 (en) Plants having improved growth characteristics and method for making the same
MX2010012720A (es) Plantas que tienen rasgos mejorados relacionados con el rendimiento y un metodo para obtenerlas.
MX2007000408A (es) Plantas que tienen caracteristicas de crecimiento mejoradas y metodo para hacer las mismas.
EP1819822A2 (en) Plants having improved growth characteristics and method for making the same
CN101874116B (zh) 具有增强的产量相关性状的植物及其生产方法
CN101595222B (zh) 具有改良的种子产量相关性状的植物及其制备方法
CN104099368A (zh) 具有改良特征的植物及其制备方法
BRPI0708259A2 (pt) métodos para aumentar o rendimento de planta em relação às plantas de controle, e para produzir uma planta transgênica, plantas, partes de planta, ou células de planta, construto, usos de um construto, e de uma seqüência de ácido nucléico, planta transgênica, partes colhìveis de uma planta, e, produtos
BRPI0714723A2 (pt) mÉtodos para aumentar o rendimento de semente de plantas e o rendimento da planta, para melhorar vÁrios traÇos e para intensificar traÇos relacionados co o rendimento em plantas, para modificar o teor de compostos de armazenagem em sementes, e para a produÇço de uma planta transgÊnica, construÇço, partes colhÍveis, produtos, usos de um Ácido nucleico/gene de az ou variante dos mesmos ou uso de um polipeptÍdeo de az ou um homàlogo do mesmo, de uma construÇço, de uma seqÜÊncia de Ácido nucleico de syt ou uso de um polipeptÍdeo de syt, de uma seqÜÊncia de Ácido nucleico e de um Ácido nucleico, planta, parte de planta ou cÉlula vegetal, seqÜÊncia de Ácido nucleico isolada, planta, partes e cÉlulas de tais plantas
BRPI0718898A2 (pt) Método para melhorar características relacionadas ao rendimento em plantas, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico
MX2008006975A (en) Plants having improved growth characteristics and methods for making the same

Legal Events

Date Code Title Description
B06G Technical and formal requirements: other requirements [chapter 6.7 patent gazette]

Free format text: SOLICITA-SE A REGULARIZACAO DA PROCURACAO, UMA VEZ QUE BASEADO NO ARTIGO 216 1O DA LPI, O DOCUMENTO DE PROCURACAO DEVE SER APRESENTADO NO ORIGINAL, TRASLADO OU FOTOCOPIA AUTENTICADA.

B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B11E Dismissal acc. art. 34 of ipl - requirements for examination incomplete
B11T Dismissal of application maintained [chapter 11.20 patent gazette]