BRPI0718898A2 - Método para melhorar características relacionadas ao rendimento em plantas, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico - Google Patents

Método para melhorar características relacionadas ao rendimento em plantas, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico Download PDF

Info

Publication number
BRPI0718898A2
BRPI0718898A2 BRPI0718898-6A BRPI0718898A BRPI0718898A2 BR PI0718898 A2 BRPI0718898 A2 BR PI0718898A2 BR PI0718898 A BRPI0718898 A BR PI0718898A BR PI0718898 A2 BRPI0718898 A2 BR PI0718898A2
Authority
BR
Brazil
Prior art keywords
plant
pro
seq
nucleic acid
wing
Prior art date
Application number
BRPI0718898-6A
Other languages
English (en)
Inventor
Christophe Reuzeau
Original Assignee
Basf Plant Science Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Basf Plant Science Gmbh filed Critical Basf Plant Science Gmbh
Priority claimed from PCT/EP2007/062443 external-priority patent/WO2008059048A1/en
Publication of BRPI0718898A2 publication Critical patent/BRPI0718898A2/pt

Links

Landscapes

  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Description

“MÉTODO PARA MELHORAR CARACTERÍSTICAS RELACIONADAS AO RENDIMENTO EM PLANTAS, CONSTRUÇÃO, USO DA MESMA, PLANTA, PARTE DE PLANTA OU CÉLULA DE PLANTA, MÉTODO PARA O RENDIMENTO DE UMA PLANTA TRANSGÊNICA, PLANTA TRANSGÊNICA, PARTES COLHÍVEIS DE UMA PLANTA, PRODUTOS, E, USO DE UM ÁCIDO NUCLEICO”
A presente invenção geralmente se refere ao campo de biologia molecular e se relaciona a um método para melhorar várias características relacionadas ao rendimento economicamente importantes em plantas. Mais especificamente, a presente invenção se relaciona a um método para melhorar características relacionadas ao rendimento em plantas cultivadas em condições de estresse abiótico, modulando expressão em uma planta de um ácido nucleico codificando um polipeptídeo associado a CRC.
A sempre crescente população mundial e a oferta minguante de terra arável disponível para agricultura impulsionam pesquisa para aumentar a eficiência de agricultura. Meios convencionais para melhoramentos culturais e horticulturais utilizam técnicas de melhoramento seletivo para identificar plantas tendo características desejáveis. Entretanto, tais técnicas de melhoramento seletivo têm diversas desvantagens, quer dizer que estas técnicas são tipicamente de trabalho intensivo e resultam em plantas que freqüentemente contêm componentes genéticos heterogêneos que podem nem sempre resultar na característica desejável sendo passada adiante a partir de plantas parentais. Avanços em biologia molecular permitiram ao ser humano modificar o germoplasma de animais e plantas. Engenharia genética de plantas exige o isolamento e manipulação de material genético (tipicamente na forma de DNA ou RNA) e a subseqüente introdução de tal material genético em uma planta. Tal tecnologia tem a capacidade de gerar culturas ou plantas tendo várias características econômicas, agronômicas ou horticulturais melhoradas. Uma característica de particular interesse econômico é rendimento aumentado. Rendimento normalmente é definida como o rendimento mensurável de valor econômico de uma cultura. Isto pode ser definido em termos de quantidade e/ou qualidade. Rendimento é diretamente 5 dependente de diversos fatores, por exemplo, o número e tamanho dos órgãos, arquitetura vegetal (por exemplo, o número de galhos), rendimento de sementes, senescência foliar e mais. Desenvolvimento de raiz, absorção de nutrientes, tolerância a estresse e vigor inicial também podem ser fatores importantes para determinar rendimento. Aperfeiçoar os fatores mencionados 10 acima pode, portanto contribuir para aumentar rendimento de cultura.
Rendimento de sementes é uma característica particularmente importante, uma vez que as sementes de muitas plantas são importantes para nutrição humana e animal. Culturas tal como, milho, arroz, trigo, canola e soja respondem por mais da metade do consumo calórico humano total, quer através de consumo direto das próprias sementes ou através de consumo de produtos de carne criados com sementes processadas. Elas também são uma fonte de açúcares, óleos e muitos tipos de metabólitos usados em processos industriais. Sementes contêm um embrião (a fonte de novas partes aéreas e raízes) e um endosperma (a fonte de nutrientes para crescimento de embrião durante germinação e durante crescimento inicial de plântulas). O desenvolvimento de uma semente envolve muitos genes, e requer a transferência de metabólitos das raízes, folhas e caules para a semente em crescimento. O endosperma, em particular, assimila os precursores metabólicos de carboidratos, óleos e proteínas e sintetiza estes em macromoléculas de armazenamento para preencher o grão.
Outra importante característica para muitas culturas é vigor inicial. Melhorar vigor inicial é um importante objetivo de programas modernos de melhoramento de arroz tanto em cultivares de arroz temperadas como tropicais. Raízes longas são importantes para ancoramento apropriado ao solo em arroz semeado em água. Onde arroz é semeado diretamente em campos alagados, e onde plantas devem emergir rapidamente através de água, partes aéreas maiores estão relacionadas com vigor. Onde sementeira em sulcos é praticada, mesocótilos e coleóptilos maiores são importantes para boa 5 emergência de plântula. A capacidade de manipular vigor inicial em plantas seria de grande importância em agricultura. Por exemplo, vigor inicial fraco tem sido uma limitação para a introdução de híbridos de milho (Zea mays L.) baseados em germoplasma de Cinturão do Milho no Atlântico Europeu.
Uma característica importante adicional é aquela de tolerância melhorada a estresse abiótico. Estresse abiótico é uma causa primária de perda de cultura ao redor do mundo, reduzindo produções médias para a maioria das principais cultivares em mais do que 50% (Wang et al., Planta
(2003) 218: 1-14). Estresses abióticos podem ser causados por seca, salinidade, extremos de temperatura, toxicidade química e estresse oxidativo. 15 A capacidade de melhorar tolerância vegetal a estresse abiótico seria de grande vantagem econômica para fazendeiros ao redor do mundo e iria permitir o cultivo de culturas durante condições adversas e em territórios onde cultivo de culturas não pode ser possível de outra maneira.
Rendimento de cultura, portanto pode ser aumentada aperfeiçoando um dos fatores mencionados acima.
Dependendo da finalidade, a modificação de certas características de rendimento pode ser favorecida sobre outras. Por exemplo, para aplicações tal como rendimento de forragem ou madeira, ou recurso de biocombustível, um aumento nas partes vegetativas de uma planta pode ser 25 desejável, e para aplicações tal como rendimento de trigo, amido ou óleo, um aumento em parâmetros de sementes pode ser particularmente desejável. Mesmo entre os parâmetros de sementes, alguns podem ser favorecidos sobre outros, dependendo da aplicação. Vários mecanismos podem contribuir para aumentar rendimento de sementes, quer isto seja na forma de tamanho aumentado de semente ou número aumentado de sementes.
Um método para aumentar rendimento (rendimento de sementes e/ou biomassa) em plantas pode ser através de modificação dos mecanismos inerentes de crescimento de uma planta, tal como o ciclo celular 5 ou várias vias de sinalização envolvidas em crescimento vegetal ou em mecanismos de defesa.
Foi agora encontrado que várias características de crescimento podem ser melhoradas em plantas modulando expressão em uma planta de um ácido nucleico codificando uma POI (Proteína de Interesse) em uma planta.
Histórico
Folhas de angiospermas tipicamente exibem uma assimetria adaxial-abaxial (dorsoventral). O estabelecimento de polaridade abaxial- adaxial em órgãos laterais envolve fatores intrínsecos aos primórdios e interações com o meristema apical do qual eles são derivados. Entre estes 15 fatores estão membros da família de genes YABBY. Proteínas YABBY são relatadas como promovendo destino de célula abaxial em órgãos laterais. CRABS CLAW (CRC) e INNER NO OUTER (INO) são duas proteínas YABBY que são expressas em órgãos reprodutivos e promove desenvolvimento de nectário e fusão de carpelo (CRC) ou está envolvida em 20 desenvolvimento de óvulo (INO). Outros genes YABBY são expressos em órgãos vegetativos e reprodutivos e estão envolvidos em desenvolvimento de folhas (sensu lato, incluindo cotilédones, sépalas e pétalas). Proteínas YABBY exibem uma estrutura típica com um domínio de dedo de zinco C2C2 e um domínio hélice-alça-hélice YABBY. O padrão de expressão dos vários 25 genes YABBY indica que pelo menos algumas das funções estão se sobrepondo.
Genes YABBY vegetais também foram relatados como sendo responsivos a estresse, em particular a estresse por frio (Patente Internacional 200216655), mas não foi fornecido nenhum dado de que expressão ectópica de genes YABBY resultou em resistência aumentada a estresse. Genes YABBY são, além disso, postulados como sendo úteis para modificar a composição de lignina, composição de madeira ou composição de fibras de plantas (Patente Internacional 2005001050).
Sumário
Surpreendentemente, foi descoberto agora que modular expressão em uma planta de um ácido nucleico codificando um polipeptídeo associado a CRC gera plantas tendo tolerância melhorada a estresse abiótico em relação a plantas de controle. A classe particular de polipeptídeos 10 associados a CRC adequados para melhorar tolerância a estresse em plantas é descrita em detalhe abaixo.
A presente invenção fornece um método para melhorar tolerância a estresse abiótico em plantas em relação a plantas de controle, compreendendo modular expressão em uma planta de um ácido nucleico codificando um polipeptídeo associado a CRC.
Definições
Polipeptídeof sVProteínaf s)
Os termos “polipeptídeo” e “proteína” são usados permutavelmente neste lugar e se referem a aminoácidos em uma forma polimérica de qualquer comprimento, unidos por ligações peptídicas.
PolinucleotídeofsyÁcidofs) nucleico(s)/Seqüência(s) de ácidos nucleicos/seqüênciafs) de nucleotídeos
Os termos "polinucleotídeo(s)", "seqüência(s) de ácidos nucleicos", "seqüência(s) de nucleotídeos", “ácido(s) nucleico(s)”, “molécula 25 de ácido nucleico” são usados permutavelmente neste lugar e se referem a nucleotídeos, ou ribonucleotídeos ou desoxirribonucleotídeos ou uma combinação de ambos, em uma forma polimérica não ramificada de qualquer comprimento.
Plantafs) de controle A escolha de plantas de controle adequadas é uma parte de rotina de uma estrutura experimental e pode incluir plantas tipo selvagem correspondentes ou plantas correspondentes sem o gene de interesse. A planta de controle é tipicamente da mesma espécie de planta ou mesmo da mesma 5 variedade do que a planta a ser verificada. A planta de controle também pode ser um nulizigoto da planta a ser verificada. Nulizigotos são indivíduos carecendo do transgene por segregação. Uma “planta de controle” como usado neste lugar se refere não apenas a plantas inteiras, mas também a partes vegetais, incluindo sementes e partes de sementes.
Homólogo(s)
“Homólogos” de uma proteína abrangem peptídeos, oligopeptídeos, polipeptídeos, proteínas e enzimas tendo substituições, deleções e/ou inserções de aminoácidos em relação à proteína não modificada em questão e tendo atividade biológica e funcional similar à proteína não modificada da qual eles são derivados.
Uma deleção se refere à remoção de um ou mais aminoácidos de uma proteína.
Uma inserção se refere a um ou mais resíduos de aminoácidos sendo introduzidos em um sítio pré-determinado em uma proteína. Inserções 20 podem compreender fusões N-terminais e/ou C-terminais assim como inserções intra-seqüência de aminoácido únicos ou múltiplos. Geralmente, inserções dentro da seqüência de aminoácido serão menores do que fusões N- ou C-terminais, da ordem de cerca de 1 a 10 resíduos. Exemplos de proteínas ou peptídeos de fusão N- ou C-terminais incluem o domínio de ligação ou 25 domínio de ativação de um ativador transcricional como usado no sistema de dois híbridos de levedura, proteínas de revestimento de fago, etiqueta de (histidina)-6, etiqueta de glutationa S-transferase, proteína A, proteína de ligação de maltose, dihidrofolato redutase, epítopo Etiqueta· 100, epítopo c- myc, epítopo FLAG®, IacZ, CMP (peptídeo de ligação calmodulina), epítopo HA, epítopo de proteína C e epítopo VSV. Uma substituição se refere à substituição de aminoácidos da proteína por outros aminoácidos tendo propriedades similares (tal como hidrofobicidade, hidrofilicidade, antigenicidade, propensão para formar ou quebrar estruturas α-helicoidais ou estruturas de folha β similar). Substituições de aminoácidos tipicamente são de resíduos únicos, mas podem ser agrupadas dependendo de restrições funcionais colocadas no polipeptídeo; inserções normalmente serão da ordem de cerca de 1 a 10 resíduos de aminoácidos. As substituições de aminoácidos são preferivelmente substituições de aminoácidos conservativas. Tabelas de Substituição Conservativa são bem conhecidas na arte (veja, por exemplo, Creighton (1984) Proteins. W.H. Freeman and Company e Tabela 1 abaixo).
Tabela 1: Exemplos de substituições conservadas de aminoácidos
Resíduo Substituições Conservativas Resíduo Substituições Conservativas Ala Ser Leu Ile; Val Arg Lys Lys Arg; Gln Asn Gin; His Met Leu; Ile Asp Glu Phe Met; Leu; Tyr Gln Asn Ser Thr; Gly Cys Ser Thr Ser; Val Glu Asp Trp Tyr Gly Pro Tyr Trp; Phe His Asn; Gln Val Ile; Leu Ue Leu, Val Substituições, deleções e/ou inserções de aminoácidos podem
ser prontamente feitas usando técnicas sintéticas de peptídeo bem conhecidas na arte, tal como síntese de peptídeo em fase sólida e as semelhantes, ou por manipulação de DNA recombinante. Métodos para a manipulação de seqüências de DNA para produzir variantes de substituição, inserção ou deleção de uma proteína são bem conhecidos na arte. Por exemplo, técnicas para fazer mutações por substituição em sítios pré-determinados em DNA são bem conhecidas por aqueles versados na arte e incluem mutagênese Ml3, mutagênese in vitro T7-Gen (USB, Cleveland, OH), mutagênese sítio dirigida QuickChange (Stratagene, San Diego, CA), mutagênese sítio dirigida mediada por PCR ou outros protocolos de mutagênese sítio dirigida.
Derivados
“Derivados” incluem peptídeos, oligopeptídeos, polipeptídeos que, comparados com a seqüência de aminoácido da forma naturalmente 5 ocorrente da proteína, tal como a proteína de interesse, podem compreender substituições de aminoácidos com resíduos de aminoácidos não naturalmente ocorrentes, ou adições de resíduos de aminoácidos não naturalmente ocorrentes. “Derivados” de uma proteína também abrangem peptídeos, oligopeptídeos, polipeptídeos que compreendem resíduos de aminoácidos 10 naturalmente ocorrentes alterados (glicosilados, acilados, prenilados, fosforilados, miristoilados, sulfatados etc.) ou resíduos de aminoácidos não naturalmente alterados comparado com a seqüência de aminoácido de uma forma naturalmente ocorrente do polipeptídeo. Um derivado também pode compreender um ou mais substituintes ou adições de não aminoácidos 15 comparado com a seqüência de aminoácido da qual ele é derivado, por exemplo, uma molécula repórter ou outro ligante, covalentemente ou não covalentemente ligado à seqüência de aminoácido, tal como uma molécula repórter que é ligada para facilitar sua detecção, e resíduos de aminoácidos não naturalmente ocorrentes em relação à seqüência de aminoácido de uma 20 proteína naturalmente ocorrente. Além disso, “derivados” também incluem fusões da forma naturalmente ocorrente da proteína com peptídeos de identificação tal como FLAG, HIS6 ou tiorredoxina (para uma revisão de peptídeos de identificação, veja Terpe, Appl. Microbiol. Biotechnol. 60, 523- 533, 2003).
Ortólogof sVParálogof s)
Ortólogos e parálogos abrangem conceitos evolutivos usados para descrever as relações ancestrais de genes. Parálogos são genes dentro da mesma espécie que se originaram através de duplicação de um gene ancestral; ortólogos são genes de organismos diferentes que se originaram através de especiação, e também são derivados de um gene ancestral comum.
Domínio
O termo “domínio" se refere a um conjunto de aminoácidos conservados em posições específicas ao longo de um alinhamento de 5 seqüências de proteínas evolutivamente relacionadas. Enquanto que aminoácidos em outras posições podem variar entre homólogos, aminoácidos que são altamente conservados em posições específicas indicam aminoácidos que provavelmente são essenciais na estrutura, estabilidade ou função de uma proteína. Identificados por seu alto grau de conservação em seqüências 10 alinhadas de uma família de homólogos de proteína, eles podem ser usados como identificadores para determinar se qualquer polipeptídeo em questão pertence a uma família de polipeptídeo previamente identificada.
Motivo/Seqüência consenso/Assinatura
O termo “motivo” ou “seqüência consenso” ou “assinatura” se 15 refere a uma região conservada curta na seqüência de proteínas evolutivamente relacionadas. Motivos freqüentemente são partes altamente conservadas de domínios, mas também podem incluir apenas parte do domínio, ou estarem localizados fora de domínio conservado (se todos os aminoácidos do motivo caem fora de um domínio definido).
Hibridização
O termo "hibridização" como definido neste lugar é um processo caracterizado pelo fato de que seqüências de nucleotídeos complementares substancialmente homólogas se anelam uma a outra. O processo de hibridização pode ocorrer inteiramente em solução, i.e. ambos os 25 ácidos nucleicos complementares estão em solução. O processo de hibridização também pode ocorrer com um dos ácidos nucleicos complementares imobilizado a uma matriz tal como microesferas magnéticas, microesferas de Sepharose ou qualquer outra resina. O processo de hibridização, além disso, pode ocorrer com um dos ácidos nucleicos complementares imobilizado a um suporte sólido tal como uma membrana de nitrocelulose ou de náilon ou imobilizado por e.g. fotolitografia a, por exemplo, um suporte de vidro silicioso (o último conhecido como arranjos ou microarranjos de ácido nucleico ou como chips de ácido nucleico). A fim de 5 permitir que hibridização ocorra, as moléculas de ácidos nucleicos geralmente são termicamente ou quimicamente desnaturadas para derreter uma dupla fita em duas fitas simples e/ou para remover estruturas em forma de grampo ou outras estruturas secundárias de ácidos nucleicos de fita simples.
O termo “estringência” se refere às condições nas quais uma hibridização ocorre. A estringência de hibridização é influenciada por condições tal como temperatura, concentração salina, força iônica e composição de tampão de hibridização. Geralmente, condições de baixa estringência são selecionadas para ser cerca de 3 0°C menores do que o ponto de fusão térmica (Tm) para a seqüência específica em uma força iônica e pH definidos. Condições de média estringência são quando a temperatura é 20°C abaixo de Tm, e condições de alta estringência são quando a temperatura é 10°C abaixo de Tm. Condições de hibridização de alta estringência tipicamente são usadas para isolar seqüências hibridizantes que têm alta similaridade de seqüência com a seqüência de ácido nucleico alvo. Entretanto, ácidos nucleicos podem desviar em seqüência e ainda codificar um polipeptídeo substancialmente idêntico, devido à degenerescência do código genético. Portanto condições de hibridização de média estringência podem ser algumas vezes necessárias para identificar tais moléculas de ácidos nucleicos.
A Tm é a temperatura em força iônica e pH definidos, na qual 25 50% da seqüência alvo hibridiza com uma sonda perfeitamente compatível. A Tm é dependente das condições de solução e da composição de base e comprimento da sonda. Por exemplo, seqüências maiores hibridizam especificamente em temperaturas superiores. A taxa máxima de hibridização é obtida a partir de cerca de 16°C até 32°C abaixo de Tm. A presença de cátions monovalentes na solução de hibridização reduz a repulsão eletrostática entre as duas fitas de ácidos nucleicos com isso promovendo formação de híbrido; este efeito é visível para concentrações de sódio de até 0,4M (para concentrações maiores, este efeito pode ser ignorado). Formamida reduz a 5 temperatura de fusão de duplexes DNA-DNA e DNA-RNA com 0,6 a 0,7°C para cada formamida percentual, e adição de 50% de formamida permite que hibridização seja realizada a 30 a 45°C, embora a taxa de hibridização seja diminuída. Pareamento incorreto de bases reduz a taxa de hibridização e a estabilidade térmica dos duplexes. Em média e para sondas grandes, a Tm
diminui cerca de I0C por % de pareamento incorreto de bases. A Tm pode ser calculada usando as seguintes equações, dependendo dos tipos de híbridos:
1) Híbridos de DNA-DNA (Meinkoth and Wahl, Anal. Biochem., 138: 267-284, 1984):
Tm= 81,5°C + 16,6xlog]0[Na+]a + 0,41x%[G/Cb] - SOOxfLc]'1 - 0,6 lx% formamida
2) Híbridos de DNA-RNA ou RNA-RNA:
Tm= 79,8 + 18,5 (logio[Na+]a) + 0,58 (%G/Cb) +11,8 (%G/Cb)2 - 820/Lc
3) Híbridos de oligo-DNA ou oligo-RNAd:
Para <20 nucleotídeos: Tm= 2 (In)
Para 20-35 nucleotídeos: Tm= 22 + 1,46 (In)
a ou para outro cátion monovalente, mas apenas acurado no intervalo 0,01-0,4 M.
b apenas acurado para %GC no intervalo de 30% a 75%. cL = comprimento de duplex em pares de bases.
d Oligo, oligonucleotídeo; ln, comprimento efetivo de iniciador
= 2x(no. de G/C)+(no. de A/T).
Ligação não específica pode ser controlada usando qualquer uma das diversas técnicas conhecidas tal como, por exemplo, bloqueando a membrana com soluções contendo proteína, adições de RNA, DNA, e SDS heterólogo ao tampão de hibridização, e tratamento com Rnase. Para sondas não homólogas, uma série de hibridizações podem ser realizadas variando um de (i) diminuindo progressivamente a temperatura de anelamento (por 5 exemplo, de 68°C para 42°C) ou (ii) diminuindo progressivamente a concentração de formamida (por exemplo, de 50% para 0%»). O artesão versado está ciente de vários parâmetros que podem ser alterados durante hibridização e que irão ou manter ou mudar as condições de estringência.
Além das condições de hibridização, especificidade de hibridização tipicamente também depende da função de lavagens pós hibridização. Para remover antecedentes resultando de hibridização não específica, amostras são lavadas com soluções salinas diluídas. Fatores críticos de tais lavagens incluem a força iônica e temperatura da solução de lavagem final: quanto menor a concentração salina e maior a temperatura de lavagem, maior é a estringência da lavagem. Condições de lavagem são tipicamente realizadas em ou abaixo de estringência de hibridização. Uma hibridização positiva gera um sinal que é pelo menos duas vezes aquele do antecedente. Geralmente, condições estringentes adequadas para ensaios de hibridização de ácidos nucleicos ou procedimentos de detecção de amplificação de gene são como apresentados acima. Condições mais ou menos estringentes também podem ser selecionadas. O artesão versado está ciente de vários parâmetros que podem ser alterados durante lavagem e que irão ou manter ou mudar as condições de estringência.
Por exemplo, condições de hibridização de alta estringência 25 típicas para híbridos de DNA maiores do que 50 nucleotídeos abrangem hibridização a 65°C em Ix SSC ou a 42°C em Ix SSC e 50% formamida, seguido por lavagem a 65°C em 0,3x SSC. Exemplos de condições de hibridização de média estringência para híbridos de DNA maiores do que 50 nucleotídeos abrangem hibridização a 50°C em 4x SSC ou a 40°C em 6x SSC e 50% formamida, seguido por lavagem a 50°C em 2x SSC. O comprimento do híbrido é o comprimento antecipado para o ácido nucleico hibridizante. Quando ácidos nucleicos de seqüência conhecida são hibridizados, o comprimento de híbrido pode ser determinado alinhando as seqüências e 5 identificando as regiões conservadas descritas neste lugar. IxSSC é 0,15M de NaCl e 15mM de citrato de sódio; a solução de hibridização e soluções de lavagem podem incluir adicionalmente 5 χ de reagente de Denhardt, 0,5-1,0% de SDS, 100 μg/ml de DNA de esperma de salmão fragmentado desnaturado, 0,5% de pirofosfato de sódio.
Para os propósitos de definir o nível de estringência, referência
pode ser feita a Sambrook et al. (2001) Molecular Cloning: a laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York ou a Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989 e atualizações anuais).
Variante de processamento
O termo “variante de processamento” como usado neste lugar abrange variantes de uma seqüência de ácido nucleico nas quais íntrons e/ou éxons selecionados foram cortados, substituídos, deslocados ou adicionados, ou nas quais íntrons foram encurtados ou alongados. Tais variantes serão 20 umas nas quais a atividade biológica da proteína é substancialmente mantida; isto pode ser atingido mantendo seletivamente segmentos funcionais da proteína. Tais variantes de processamento podem ser encontradas na natureza ou podem ser feitas pelo homem. Métodos para prever e isolar tais variantes de processamento são bem conhecidos na arte (veja, por exemplo, Foissac and 25 Schiex, BMC Bioinformatics. 2005; 6: 25).
Variante alélica
Alelos ou variantes alélicas são formas alternativas de um dado gene, localizados na mesma posição cromossômica. Variantes alélicas abrangem Polimorfismos de Nucleotídeos Únicos (SNPs), assim como Polimorfismos de Pequena Inserção/Deleção (INDELs). O tamanho de INDELs normalmente é menor do que 100 bp. SNPs e INDELs formam o maior conjunto de variantes de seqüência em linhagens polimórficas naturalmente ocorrentes da maioria dos organismos.
5 Embaralhamento gênico/Evolução dirigida
Embaralhamento gênico ou evolução dirigida consiste de repetições de embaralhamento de DNA seguido por triagem e/ou seleção apropriada para gerar variantes de ácidos nucleicos ou porções destes codificando proteínas tendo uma atividade biológica modificada (Castle et al., 10 (2004) Science 304(5674): 1151-4; Patentes Norte-Americanas 5.811.238 e 6.395.547).
Elemento regulador/Seqüência de controle/Promotor Os termos “elemento regulador”, “seqüência de controle” e “promotor” são todos usados permutavelmente neste lugar e devem ser adotados em um amplo contexto para se referir a seqüências reguladoras de ácidos nucleicos capazes de efetuar expressão das seqüências aos quais eles são ligados. O termo “promotor” tipicamente se refere a uma seqüência de controle de ácidos nucleicos localizada antes do início transcricional de um gene e que está envolvida em reconhecimento e ligação de RNA polimerase e outras proteínas, com isso dirigindo transcrição de um ácido nucleico operacionalmente ligado. Abrangidas pelos termos mencionados acima são seqüências reguladoras transcricionais derivadas de um gene genômico eucariótico clássico (incluindo a caixa TATA que é requerida para iniciação acurada de transcrição, com ou sem uma seqüência de caixa CCAAT) e elementos reguladores adicionais (i.e. seqüências situadas acima dos promotores gênicos, acentuadores e silenciadores) que alteram expressão gênica em resposta a desenvolvimento e/ou estímulos externos, ou de uma maneira tecido específica. Também incluída dentro do termo é uma seqüência reguladora transcricional de um gene procariótico clássico, em cujo caso ela pode incluir uma seqüência de caixa -35 e/ou seqüências reguladoras transcricionais de caixa -10. O termo “elemento regulador” também abrange uma molécula de fusão sintética ou derivado que confere, ativa ou acentua expressão de uma molécula de ácido nucleico em uma célula, tecido ou órgão.
5 Um “promotor de planta” compreende elementos reguladores,
que mediam a expressão de um segmento de seqüência de codificação em células vegetais. Por conseguinte, um promotor de planta não precisa ser de origem vegetal, mas pode se originar de vírus ou microorganismos, por exemplo, de vírus que atacam células vegetais. O “promotor de planta” também pode se originar de uma célula vegetal, e.g. da planta que é transformada com a seqüência de ácido nucleico a ser expressa no processo inventivo e descrito neste lugar. Isto também se aplica a outros sinais reguladores “vegetais”, tal como terminadores “vegetais”. Os promotores antes das seqüências de nucleotídeos úteis nos métodos da presente invenção podem ser modificados por uma ou mais substituição(ões), inserção(ões) e/ou deleção(ões) de nucleotídeos sem interferir na funcionalidade ou atividade de qualquer dos promotores, do quadro aberto de leitura (ORF) ou da região reguladora 3' tal como terminadores ou outras regiões reguladoras 3' que estão localizadas fora do ORF. Além disso, é possível que a atividade dos promotores seja aumentada por modificação de sua seqüência, ou que eles sejam completamente substituídos por promotores mais ativos, mesmo promotores de organismos heterólogos. Para expressão em plantas, a molécula de ácido nucleico, como descrito acima, deve ser operacionalmente ligada a ou compreender um promotor adequado que expressa o gene no momento certo e com o padrão de expressão espacial requerido.
Para a identificação de promotores funcionalmente equivalentes, a força de promotor e/ou padrão de expressão de um promotor candidato pode ser analisado, por exemplo, ligando operacionalmente o promotor a um gene repórter e ensaiando o nível e padrão de expressão do gene repórter em vários tecidos da planta. Genes repórteres bem conhecidos adequados incluem, por exemplo, beta-glucuronidase ou beta galactosidase. A atividade de promotor é ensaiada medindo a atividade enzimática da beta- glucuronidase ou beta-galactosidase. A força de promotor e/ou padrão de expressão podem ser então comparados com aqueles de um promotor de referência (tal como aquele usado nos métodos da presente invenção). Alternativamente, força de promotor pode ser ensaiada quantificando níveis de mRNA ou comparando níveis de mRNA do ácido nucleico usado nos métodos da presente invenção, com níveis de mRNA de genes responsáveis pela manutenção do metabolismo celular tal como rRNA de 18S, usando métodos conhecidos na arte, tal como Northern blotting com análise densitométrica de autoradiogramas, PCR quantitativo em tempo real ou RT- PCR (Heid et al., 1996 Genome Methods 6: 986-994). Geralmente por “promotor fraco” é pretendido um promotor que dirige expressão de uma seqüência de codificação em um nível baixo. Por “nível baixo” é pretendido em níveis de cerca de 1/10.000 transcritos a cerca de 1/100.000 transcritos a cerca de 1/500.0000 transcritos por célula. Inversamente, um “promotor forte” dirige expressão de uma seqüência de codificação em nível alto, ou em cerca de 1/10 transcritos a cerca de 1/100 transcritos a cerca de 1/1.000 transcritos por célula.
Operacionalmente ligado
O termo “operacionalmente ligado” como usado neste lugar se refere a uma ligação funcional entre a seqüência de promotor e o gene de interesse, de forma que a seqüência de promotor é capaz de iniciar transcrição do gene de interesse.
Promotor constitutivo
Um “promotor constitutivo” se refere a um promotor que é transcricionalmente ativo durante a maioria, mas não necessariamente todas, fases de crescimento e desenvolvimento e na maioria das condições ambientais, em pelo menos uma célula, tecido ou órgão. Tabela 2 abaixo fornece exemplos de promotores constitutivos.
Tabela 2: Exemplos de promotores constitutivos
Fonte Gênica Referência Actina McElroy et al, Plant Cell, 2: 163-171, 1990 HMGP Patente Internacional 2004/070039 CAMV 35S Odell et al,Nature, 313: 810-812, 1985 CaMV 19S Nilssonetal., Physiol. Plant. 100:456-462, 1997 GOS2 de Pater et al, Plant J Nov;2(6):837-44, 1992, Patente Internacional 2004/065596 Ubiquitina Christensen et al, Plant Mol. Biol. 18: 675-689, 1992 Ciclofilina de arroz Buchholz et al, Plant Mol Biol. 25(5): 837-43, 1994 Histona H3 de milho Lepetit et al, Mol. Gen. Genet. 231:276-285, 1992 Histona H3 de alfafa Wu et al. Plant Mol. Biol. 11:641-649, 1988 Actina 2 An et al, Plant J. 10(1); 107-121, 1996 34S FMV Sanger et al., Plant. Mol. Biol., 14, 1990: 433-443 Subunidade pequena de Patente U.S. 4.962.028 rubisco OCS Leisner (1988) Proc Natl Aead Sci USA 85(5): 2553 SADl Jain et al., Crop Science, 39 (6), 1999: 1696 SAD2 Jain et al., Crop Science, 39 (6), 1999: 1696 nos Shaw et al. (1984) Nueleic Acids Res. 12(20):7831-7846 V-ATPase Patente Internacional 01/14572 Super promotor Patente Internacional 95/14098 Proteínas G-box Patente Internacional 94/12015 Promotor ubíquo
Um promotor ubíquo é ativo em substancialmente todos os
tecidos ou células de um organismo.
Promotor regulado por desenvolvimento
Um promotor regulado por desenvolvimento é ativo durante certos estágios de desenvolvimento ou em partes da planta que passam por IO mudanças evolutivas.
Promotor induzível
Um promotor induzível tem início de transcrição induzido ou aumentado em resposta a um estímulo químico (para uma revisão veja Gatz 1997, Annu. Rev. Plant Physiol. Plant Mol. Biol., 48:89-108), ambiental ou físico, ou pode ser “induzível por estresse”, i.e. ativado quando uma planta é exposta a várias condições de estresse, ou um “induzível por patógeno" i.e. ativado quando uma planta é exposta à exposição a vários patógenos.
Promotor Órgão específico/Tecido específico
Um promotor órgão específico ou tecido específico é um que é capaz de iniciar preferencialmente transcrição em certos órgãos ou tecidos, tal 5 como as folhas, raízes, tecido de semente etc. Por exemplo, um “promotor raiz específico” é um promotor que é transcricionalmente ativo predominantemente em raízes vegetais, substancialmente para a exclusão de quaisquer outras partes de uma planta, enquanto que ainda permitindo qualquer expressão evasiva nestas outras partes vegetais. Promotores capazes 10 de iniciar transcrição em certas células apenas são referidos neste lugar como “específicos para célula”.
Um promotor específicos para semente é transcricionalmente ativo predominantemente em tecido de semente, mas não necessariamente em tecido de semente (em casos de expressão evasiva). O promotor específicos para semente pode estar ativo durante desenvolvimento de semente e/ou durante germinação.
Um promotor específico para tecido verde como definido neste lugar é um promotor que é transcricionalmente ativo predominantemente em tecido verde, substancialmente para a exclusão de quaisquer outras partes de uma planta, enquanto que ainda permitindo qualquer expressão evasiva nestas outras partes vegetais.
Outro exemplo de um promotor tecido específico é um promotor meristema específico, que é transcricionalmente ativo predominantemente em tecido meristemático, substancialmente para a exclusão de quaisquer outras partes de uma planta, enquanto que ainda permitindo qualquer expressão evasiva nestas outras partes vegetais.
Terminador
O termo “terminador” abrange uma seqüência de controle que é uma seqüência de DNA na extremidade de uma unidade transcricional que sinaliza processamento 3’ e poliadenilação de um transcrito primário e término de transcrição. O terminador pode ser derivado do gene natural, de uma variedade de outros genes vegetais, ou de T-DNA. O terminador a ser adicionado pode ser derivado, por exemplo, dos genes de nopalina sintase ou 5 octopina sintase, ou alternativamente de outro gene vegetal, ou menos preferivelmente de qualquer outro gene eucariótico.
Modulação
O termo “modulação” significa em relação à expressão ou expressão gênica, um processo no qual o nível de expressão é alterado por 10 dita expressão gênica em comparação com a planta de controle, o nível de expressão pode ser aumentado ou diminuído. A expressão original não modulada pode ser de qualquer tipo de expressão de um RNA estrutural (rRNA, tRNA) ou mRNA com subseqüente tradução. O termo “modular a atividade” deve significar qualquer mudança da expressão das seqüências de 15 ácidos nucleicos inventivas ou proteínas codificadas, que leva o rendimento aumentado e/ou crescimento aumentado das plantas.
Expressão
O termo “expressão” ou “expressão gênica” significa a transcrição de um gene específico ou genes específicos ou construções 20 genéticas específicas. O termo “expressão” ou “expressão gênica” em particular significa a transcrição de um gene ou genes ou construção genética em RNA estrutural (rRNA, tRNA) ou mRNA com ou sem subseqüente tradução do último em uma proteína. O processo inclui transcrição de DNA e processamento do produto de mRNA resultante.
Expressão aumentada/superexpressão
O termo “expressão aumentada” ou “superexpressão” como usado neste lugar significa qualquer forma de expressão que é adicional ao nível de expressão original de tipo selvagem.
Métodos para aumentar expressão de genes ou produtos de gene são bem documentados na arte e incluem, por exemplo, superexpressão dirigida por promotores apropriados, o uso de acentuadores de transcrição ou acentuadores de tradução. Ácidos nucleicos isolados que servem como elementos promotores ou acentuadores podem ser introduzidos em uma 5 posição apropriada (tipicamente antes) de uma forma não heteróloga de um polinucleotídeo de forma a aumentar expressão de um ácido nucleico codificando o polipeptídeo de interesse. Por exemplo, promotores endógenos podem ser alterados in vivo por mutação, deleção, e/ou substituição (veja, Kmiec, Patente U.S. No. 5.565.350; Zarling et al., PCT/US93/03868), ou 10 promotores isolados podem ser introduzidos em uma célula vegetal na orientação e distância apropriada de um gene da presente invenção de forma a controlar a expressão do gene.
Se expressão de polipeptídeo é desejada, geralmente é desejável incluir uma região de poliadenilação na extremidade 3' de uma 15 região de codificação de polinucleotídeo. A região de poliadenilação pode ser derivada do gene natural, de uma variedade de outros genes vegetais, ou de T- DNA. A seqüência de extremidade 3' a ser adicionada pode ser derivada, por exemplo, dos genes de nopalina sintase ou octopina sintase, ou alternativamente de outro gene vegetal, ou menos preferivelmente de qualquer 20 outro gene eucariótico.
Uma seqüência intrônica também pode ser adicionada à região 5’ não traduzida (UTR) ou à seqüência de codificação da seqüência de codificação parcial para aumentar a quantidade da mensagem madura que se acumula no citosol. Inclusão de um íntron processável na unidade de 25 transcrição tanto em construções de expressão vegetais como animais mostrou aumentar expressão gênica tanto no nível de mRNA como protéico em até 1000 vezes (Buchman and Berg (1988) Mol. Cell biol. 8: 4395-4405; Callis et al. (1987) Genes Dev 1:1183-1200). Tal estimulação intrônica de expressão gênica tipicamente é maior quando colocada perto da extremidade 5' da unidade de transcrição. Uso dos íntrons de milho íntron Adhl-S 1, 2, e 6, o íntron Bronze-I são conhecidos na arte. Para informação geral veja: The Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).
Gene endógeno
Referência neste lugar a um gene “endógeno” se refere não apenas ao gene em questão como encontrado em uma planta em sua forma natural (i.e., sem haver qualquer intervenção humana), mas também se refere ao mesmo gene (ou um ácido nucleico/gene substancialmente homólogo) em 10 uma forma isolada subseqüentemente (re)introduzido em uma planta (um transgene). Por exemplo, uma planta transgênica contendo um tal transgene pode confrontar uma redução substancial da expressão de transgene e/ou redução substancial de expressão do gene endógeno. O gene isolado pode ser isolado de um organismo ou pode ser fabricado pelo homem, por exemplo, 15 por síntese química.
Expressão diminuída
Referência neste lugar a “expressão diminuída” ou “redução ou eliminação substancial” de expressão é adotada para significar uma diminuição em expressão de gene endógeno e/ou níveis de polipeptídeo e/ou 20 atividade de polipeptídeo em relação a plantas de controle. A redução ou eliminação substancial é em ordem crescente de preferência pelo menos 10%, 20%, 30%, 40% ou 50%, 60%, 70%), 80%, 85%, 90%, ou 95%, 96%, 97%, 98%>, 99% ou mais reduzida comparada com aquela de plantas de controle. Métodos para diminuir expressão são conhecidos pela pessoa versada na arte. 25 Marcador selecionável (geneVGene repórter
"Marcador selecionável", "gene marcador selecionável" ou “gene repórter” inclui qualquer gene que confere um fenótipo em uma célula na qual ele é expresso para facilitar a identificação e/ou seleção de células que são transfectadas ou transformadas com uma construção de ácido nucleico da invenção. Estes genes marcadores possibilitam a identificação de uma transferência bem sucedida das moléculas de ácido nucleico através de uma série de princípios diferentes. Marcadores adequados podem ser selecionados a partir de marcadores que conferem resistência a antibiótico ou herbicida, 5 que introduzem uma nova característica metabólica ou que permitem seleção visual. Exemplos de genes marcadores selecionáveis incluem genes conferindo resistência a antibióticos (tal como nptll que fosforila neomicina e canamicina, ou hpt, fosforilando higromicina, ou genes conferindo resistência a, por exemplo, bleomicina, estreptomicina, tetraciclina, cloranfenicol, 10 ampicilina, gentamicina, geneticina (G418), espectinomicina ou blasticidina), a herbicidas (por exemplo, bar que fornece resistência a Basta®; aroA ou gox fornecendo resistência contra glifosato, ou os genes conferindo resistência a, por exemplo, imidazolinona, fosfinotricina ou sulfoniluréia), ou genes que fornecem uma característica metabólica (tal como manA que permite que 15 plantas usem manose como única fonte de carbono ou xilose isomerase para a utilização de xilose, ou marcadores antinutritivos tal como a resistência a 2- deoxiglicose). Expressão de genes marcadores visuais resulta na formação de cor (por exemplo, β-glucuronidase, GUS ou β-galactosidase com seus substratos coloridos, por exemplo, X-Gal), luminescência (tal como o sistema 20 de luciferina/luciferase) ou fluorescência (Proteína Fluorescente Verde, GFP, e derivados desta). Esta lista representa apenas um pequeno número de possíveis marcadores. O trabalhador versado é familiar com tais marcadores. Diferentes marcadores são preferidos, dependendo do organismo e do método de seleção.
Sabe-se que mediante integração estável ou transiente de
ácidos nucleicos em células vegetais, apenas uma minoria das células absorve o DNA exógeno e, se desejado, o integra em seu genoma, dependendo do vetor de expressão usado e da técnica de transfecção usada. Para identificar e selecionar estes integrantes, um gene codificando para um marcador selecionável (tal como aqueles descritos acima) normalmente é introduzido nas células hospedeiras junto com o gene de interesse. Estes marcadores podem ser, por exemplo, usados em mutantes nos quais estes genes não são funcionais, por exemplo, por deleção por métodos convencionais. Além disso, 5 moléculas de ácido nucleico codificando um marcador selecionável podem ser introduzidas em uma célula hospedeira no mesmo vetor que compreende a seqüência codificando os polipeptídeos da invenção ou usados nos métodos da invenção, ou ainda em um vetor separado. Células que foram estavelmente transfectadas com o ácido nucleico introduzido podem ser identificadas, por 10 exemplo, por seleção (por exemplo, células que integraram o marcador selecionável sobrevivem ao passo que as outras células morrem).
Uma vez que os genes marcadores, particularmente genes para resistência a antibióticos e herbicidas, não são mais requeridos ou são indesejados na célula hospedeira transgênica uma vez os ácidos nucleicos 15 tenham sido introduzidos com sucesso, o processo de acordo com a invenção para introduzir os ácidos nucleicos vantajosamente emprega técnicas que possibilitam a remoção ou excisão destes genes marcadores. Um tal método é o que é conhecido como co-transformação. O método de co-transformação emprega dois vetores simultaneamente para a transformação, um vetor 20 carregando o ácido nucleico de acordo com a invenção e um segundo carregando o(s) gene(s) marcador(es). Uma grande proporção de transformantes recebe ou, no caso de plantas, compreende (até 40% ou mais dos transformantes), ambos os vetores. Em caso de transformação com Agrobactérias, os transformantes normalmente recebem apenas uma parte do 25 vetor, i.e. a seqüência flanqueada pelo T-DNA, que normalmente representa a gaveta de expressão. Os genes marcadores podem ser subseqüentemente removidos da planta transformada realizando cruzamentos. Em outro método, genes marcadores integrados em um transposon são usados para a transformação junto com ácido nucleico desejado (conhecida como a tecnologia Ac/Ds). Os transformantes podem ser cruzados com uma fonte de transposase ou os transformantes são transformados com uma construção de ácido nucleico conferindo expressão de uma transposase, transientemente ou estavelmente. Em alguns casos (aprox. 10%), o transposon pula fora do 5 genoma da célula hospedeira uma vez que transformação tenha ocorrido com sucesso e é perdido. Em diversos casos adicionais, o transposon pula para uma localização diferente. Nestes casos o gene marcador deve ser eliminado realizando cruzamentos. Em microbiologia, foram desenvolvidas técnicas que tomam possível, ou facilitam, a detecção de tais eventos. Um método 10 vantajoso adicional se fia no que é conhecido como sistemas de recombinação; cuja vantagem é de que eliminação por cruzamento pode ser dispensada. O sistema mais conhecido deste tipo é o que é conhecido como o sistema Cre/lox. Crel é uma recombinase que remove as seqüências localizadas entre as seqüências IoxP. Se o gene marcador está integrado entre 15 as seqüências IoxP, ele é removido uma vez que transformação tenha ocorrido com sucesso, por expressão da recombinase. Sistemas de recombinação adicionais são os sistemas HIN/HIX, FLP/FRT e REP/STB (Tribble et al., J. Biol. Chem., 275, 2000: 22255-22267; Velmurugan et al., J. Cell Biol., 149, 2000: 553-566). Uma integração sítio específica no genoma vegetal das 20 seqüências de ácidos nucleicos de acordo com a invenção é possível. Naturalmente, estes métodos também podem ser aplicados a microorganismos tal como levedura, fungos ou bactérias.
Transgênico/Transgene/Recombinante
Para os propósitos da invenção, "transgênico", “transgene” ou 25 "recombinante" significa com relação a, por exemplo, uma seqüência de ácido nucleico, uma gaveta de expressão, construção gênica ou um vetor compreendendo a seqüência de ácido nucleico ou um organismo transformado com as seqüências de ácidos nucleicos, gavetas de expressão ou vetores de acordo com a invenção, todas aquelas construções produzidas por métodos recombinantes nas quais ou
(a) as seqüências de ácidos nucleicos codificando proteínas úteis nos métodos da invenção, ou
(b) seqüência(s) de controle genético que é(são) operacionalmente ligada(s) com a seqüência de ácido nucleico de acordo com
a invenção, por exemplo, um promotor, ou
(c) a) e b)
não estão localizadas em seu ambiente genético natural ou foram modificadas por métodos recombinantes, sendo possível para a modificação tomar a forma de, por exemplo, uma substituição, adição, deleção, inversão ou inserção de um ou mais resíduos de nucleotídeos. O ambiente genético natural é entendido como significando o locus genômico ou cromossômico natural na planta original ou a presença em uma biblioteca genômica. No caso de uma biblioteca genômica, o ambiente genético natural da seqüência de ácido nucleico é preferivelmente mantido, pelo menos em parte. O ambiente flanqueia a seqüência de ácido nucleico pelo menos em um lado e tem um comprimento de seqüência de pelo menos 50 bp, preferivelmente pelo menos 500 bp, especialmente preferivelmente pelo menos 1000 bp, mais preferivelmente pelo menos 5000 bp. Uma gaveta de expressão naturalmente ocorrente - por exemplo, a combinação naturalmente ocorrente do promotor natural das seqüências de ácidos nucleicos com a seqüência de ácido nucleico correspondente codificando um polipeptídeo útil nos métodos da presente invenção, como definido acima - se toma uma gaveta de expressão transgênica quando esta gaveta de expressão é modificada por métodos não naturais, sintéticos ("artificiais") tal como, por exemplo, tratamento mutagênico. Métodos adequados são descritos, por exemplo, em Patente U.S. 5.565.350 ou Patente Internacional 00/15815.
Uma planta transgênica para os propósitos da invenção é assim entendida como significando, como acima, que os ácidos nucleicos usados no método da invenção não estão em seu locus natural no genoma de dita planta, sendo possível para os ácidos nucleicos serem expressos homologamente ou heterologamente. Entretanto, como mencionado, transgênico também significa que, embora os ácidos nucleicos de acordo com a invenção ou 5 usados no método inventivo estejam em sua posição natural no genoma de uma planta, a seqüência foi modificada com relação à seqüência natural, e/ou que as seqüências reguladoras das seqüências naturais foram modificadas. Transgênica é preferivelmente entendida como significando a expressão dos ácidos nucleicos de acordo com a invenção em um locus não natural no 10 genoma, i.e. expressão homóloga ou, preferivelmente, heteróloga dos ácidos nucleicos ocorre. Plantas transgênicas preferidas são mencionadas neste lugar.
Transformação
O termo “introdução” ou “transformação” como referido neste lugar abrange a transferência de um polinucleotídeo exógeno para uma célula 15 hospedeira, independente do método usado para transferência. Tecido vegetal capaz de subseqüente propagação clonal pode ser transformado com uma construção genética da presente invenção, quer por organogênese ou embriogênese, e uma planta inteira regenerada a partir daí. O tecido particular escolhido irá variar dependendo dos sistemas de propagação clonal 20 disponíveis para, e melhor adequados para, a espécie particular sendo transformada. Alvos de tecido exemplares incluem discos foliares, pólen, embriões, cotilédones, hipocótilos, megagametófitos, tecido de calo, tecido meristemático existente (e.g., meristema apical, gemas axilares, e meristemas de raiz), e tecido de meristema induzido (e.g., meristema de cotilédone e 25 meristema de hipocótilo). O polinucleotídeo pode ser transientemente ou estavelmente introduzido em uma célula hospedeira e pode ser mantido não integrado, por exemplo, como um plasmídeo. Alternativamente, ele pode ser integrado no genoma hospedeiro. A célula vegetal transformada resultante pode então ser usada para regenerar uma planta transformada de uma maneira conhecida por pessoas versadas na arte.
A transferência de genes exógenos para o genoma de uma planta é chamada transformação. Transformação de espécies vegetais é agora uma técnica bastante rotineira. Vantajosamente, qualquer dos diversos 5 métodos de transformação pode ser usado para introduzir o gene de interesse em uma célula ancestral adequada. Os métodos descritos para a transformação e regeneração de plantas a partir de tecidos vegetais ou células vegetais podem ser utilizados para transformação transiente ou estável. Métodos de transformação incluem o uso de lipossomos, eletroporação, produtos químicos 10 que aumentam absorção de DNA livre, injeção do DNA diretamente na planta, bombardeamento por pistola de partícula, transformação usando vírus ou pólen e microprojeção. Métodos podem ser selecionados a partir do método de cálcio/polietilenoglicol para protoplastos (Krens, F.A. et al., (1982) Nature 296, 72-74; Negrutiu I et al. (1987) Plant Mol Biol 8: 363-373); 15 eletroporação de protoplastos (Shillito R.D. et al. (1985) Bio/Technol 3, 1099- 1102); microinjeção em material vegetal (Crossway A et al., (1986) Mol. Gen Genet 202: 179-185); bombardeamento de partícula revestida de DNA ou RNA (Klein TM et al., (1987) Nature 327: 70) infecção com (não integrativa) vírus e os semelhantes. Plantas transgênicas, incluindo plantas cultiváveis 20 transgênicas, preferivelmente são produzidas através de transformação mediada por Agrobacterium. Um método de transformação vantajoso é a transformação in planta. Para esta finalidade, é possível, por exemplo, permitir que as agrobactérias atuem em grãos vegetais ou inocular o meristema vegetal com agrobactérias. Provou-se particularmente adequado 25 em conformidade com a invenção permitir que uma suspensão de agrobactérias transformadas atue na planta intacta ou pelo menos nos primórdios florais. A planta é subseqüentemente cultivada até que as sementes da planta tratada sejam obtidas (Clough and Bent, Plant J. (1998)
16, 735-743). Métodos para transformação mediada por Agrobacterium de arroz incluem métodos bem conhecidos para transformação de arroz, tal como aqueles descritos em qualquer dos seguintes: pedido da Patente Européia EP 1198985 Al, Aldemita and Hodges (Planta 199: 612-617, 1996); Chan et al. (Plant Mol Biol 22 (3): 491-506, 1993), Hiei et al. (Plant J 6 (2): 271-282, 5 1994), cujas descrições são incorporadas por referência neste lugar como se completamente apresentadas. No caso de transformação de milho, o método preferido é como descrito ou em Ishida et al. (Nat. Biotechnol 14(6): 745-50, 1996) ou Frame et al. (Plant Physiol 129(1): 13-22, 2002), cujas descrições são incorporadas por referência neste lugar como se completamente 10 apresentadas. Ditos métodos são adicionalmente descritos como forma de exemplo em B. Jenes et al., Techniques for Gene Transfer, in: Transgenic Plants, Vol. I, Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press (1993) 128-143 e em Potrykus Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 (1991) 205-225). Os ácidos nucleicos ou a construção a 15 ser expressa é preferivelmente clonada em um vetor, que é adequado para transformar Agrobacterium tumefaciens, por exemplo, pBinl9 (Bevan et al., Nucl. Acids Res. 12 (1984) 8711). Agrobactérias transformadas por um tal vetor podem ser então usadas de uma maneira conhecida para a transformação de plantas, tal como plantas usadas como um modelo, como Arabidopsis 20 (Arabidopsis thaliana está dentro do escopo da presente invenção não considerada como uma planta cultivável), ou plantas cultiváveis tal como, como forma de exemplo, plantas de tabaco, por exemplo, imergindo folhas machucadas ou folhas picadas em uma solução agrobacteriana e então as cultivando em meio adequado. A transformação de plantas por meio de 25 Agrobaeterium tumefaciens é descrita, por exemplo, por Hõfgen e Willmitzer em Nucl. Acid Res. (1988) 16, 9877 ou é conhecida entre outras maneiras a partir de F.F. White, Vectors for Gene Transfer in Higher Plants; in Transgenic Plants, Vol. I, Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press, 1993, pp. 15-38. Em adição à transformação de células somáticas, que então têm que ser regeneradas em plantas intactas, também é possível transformar as células de meristemas vegetais e em particular aquelas células que se desenvolvem em gametas. Neste caso, os gametas transformados seguem o 5 desenvolvimento vegetal natural, gerando plantas transgênicas. Assim, por exemplo, sementes de Arabidopsis são tratadas com agrobactérias e sementes são obtidas a partir das plantas em desenvolvimento das quais uma certa proporção é transformada e assim transgênica [Feldman, KA and Marks MD (1987). Mol Gen Genet 208:274-289; Feldmann K (1992). In: C Koncz, N-H 10 Chua and J Shell, eds, Methods in Arabidopsis Research. Word Scientific, Singapore, pp. 274-289]. Métodos alternativos são baseados na remoção repetida das inflorescências e incubação do sítio de excisão no centro da roseta com agrobactérias transformadas, através do que sementes transformadas podem da mesma maneira ser obtidas em um momento 15 posterior (Chang (1994). Plant J. 5: 551-558; Katavic (1994). Mol Gen Genet, 245: 363-370). Entretanto, um método especialmente efetivo é o método de infiltração a vácuo com suas modificações tal como o método de “botão floral”. No caso de infiltração a vácuo de Arabidopsis, plantas intactas sob pressão reduzida são tratadas com uma suspensão agrobacteriana [Bechthold, 20 N (1993). C R Acad Sci Paris Life Sei, 316: 1194-1199], enquanto no caso do método de ”botão floral” o tecido floral em desenvolvimento é incubado brevemente com uma suspensão agrobacteriana tratada com tensoativo [Clough, SJ and Bent, AF (1998). The Plant J. 16, 735-743]. Uma certa proporção de sementes transgênicas são coletadas em ambos os casos, e estas 25 sementes podem ser distinguidas de sementes não transgênicas cultivando nas condições seletivas descritas acima. Em adição, a transformação estável de plastídeos é vantajosa pelo fato de plastídeos serem herdados maternalmente reduzindo ou eliminando o risco de fluxo de transgene através de pólen na maioria das culturas. A transformação do genoma de cloroplasto geralmente é atingida por um processo que foi esquematicamente apresentado em Klaus et al., 2004 [Nature Biotechnology 22 (2), 225-229]. Resumidamente as seqüências a serem transformadas são clonadas junto com um gene marcador selecionável entre seqüências flanqueadoras homólogas ao genoma de 5 cloroplasto. Estas seqüências flanqueadoras homólogas dirigem integração sítio específica no plastoma. Transformação plastidial foi descrita para muitas espécies de plantas diferentes e uma visão geral é dada em Bock (2001) Transgenic plastids in basic research and plant biotechnology. J Mol Biol. 2001 Sep 21; 312 (3):425-38 ou Maliga, P (2003) Progress towards 10 commercialization of plastid transformation technology. Trends Biotechnol.
21, 20-28. Progresso biotecnológico adicional foi recentemente relatado em forma de transformantes de plastídeos livres de marcador, que podem ser produzidos por um gene marcador co-integrado transiente (Klaus et al., 2004, Nature Biotechnology 22(2), 225-229).
Identificação por ativação de T-DNA
Identificação por ativação de T-DNA (Hayashi et al. Science (1992) 1350-1353), envolve inserção de T-DNA, normalmente contendo um promotor (também pode ser um acentuador de tradução ou um íntron), na região genômica do gene de interesse ou 10 kb antes ou depois da região de 20 codificação de um gene em uma configuração de forma que o promotor dirige expressão do gene dirigido. Tipicamente, regulação de expressão do gene dirigido por seu promotor natural é interrompida e o gene cai sob o controle do promotor recentemente introduzido. O promotor é tipicamente embebido em um T-DNA. Este T-DNA é aleatoriamente inserido no genoma vegetal, 25 por exemplo, através de infecção por Agrobacterium e leva a expressão modificada de genes perto do T-DNA inserido. As plantas transgênicas resultantes mostram fenótipos dominantes devido à expressão modificada de genes próximos ao promotor introduzido.
TILLING O termo “TILLING” é uma abreviação de “Lesões Locais Induzidas Dirigidas em Genomas” e se refere a uma tecnologia de mutagênese útil para gerar e/ou identificar ácidos nucleicos codificando proteínas com expressão e/ou atividade modificada. TILLING também permite seleção de plantas carregando tais variantes mutantes. Estas variantes mutantes podem exibir expressão modificada, ou em força ou em localização ou em momento (se as mutações afetam o promotor, por exemplo). Estas variantes mutantes podem exibir atividade maior do que aquela exibida pelo gene em sua forma natural. TILLING combina mutagênese de alta densidade IO com métodos de triagem rápida. As etapas tipicamente seguidas em TILLING são: (a) mutagênese EMS (Redei GP and Koncz C (1992) In Methods in Arabidopsis Research, Koncz C, Chua NH, Schell J, eds. Singapore, World Scientific Publishing Co, pp. 16-82; Feldmann et al., (1994) In Meyerowitz EM, Somerville CR, eds, Arabidopsis. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, pp 137-172; Lightner J and Caspar T (1998) In J Martinez-Zapater, J Salinas, eds, Methods on Molecular Biology, Vol. 82. Humana Press, Totowa, NJ, pp 91-104); (b) preparação de DNA e combinação de indivíduos; (c) amplificação por PCR de uma região de interesse; (d) desnaturação e anelamento para permitir formação de heteroduplexes; (e) DHPLC, onde a presença de um heteroduplex em uma combinação é detectada como um pico extra no cromatograma; (f) identificação do mutante individual; e (g) seqüenciamento do produto de PCR mutante. Métodos para TILLING são bem conhecidos na arte (McCallum et al., (2000) Nat Biotechnol 18: 455-457; revisto por Stemple (2004) Nat Rev Genet 5(2): 145-50).
Recombinação homóloga
Recombinação homóloga permite introdução em um genoma de um ácido nucleico selecionado em uma posição selecionada definida. Recombinação homóloga é uma tecnologia padrão usada rotineiramente em ciências biológicas para organismos inferiores tal como levedura ou o musgo Physcomitrella. Métodos para realizar recombinação homóloga em plantas foram descritos não apenas para plantas modelo (Offringa et al. (1990) EMBO J 9(10): 3077-84), mas também para plantas cultiváveis, por exemplo, arroz (Terada et al. (2002) Nat Biotech 20(10): 1030-4; Iida and Terada
(2004) Curr Opin Biotech 15(2): 132-8), e há métodos que geralmente são aplicáveis independente do organismo alvo (Miller et al, Nature Biotechnol.
25, 778-785, 2007).
Rendimento
O termo “rendimento” em geral significa um rendimento
mensurável de valor econômico, tipicamente relacionada a uma cultura especificada, a uma área, e a um período de tempo. Partes vegetais individuais contribuem diretamente paro rendimento baseada em seu número, tamanho e/ou peso, ou o rendimento atual é o rendimento por metro quadrado para uma 15 cultura e ano, que é determinada dividindo rendimento total (inclui tanto rendimento coletada como avaliada) por metros quadrados plantados. O termo “rendimento” de uma planta pode se referir à biomassa vegetativa (biomassa de raiz e/ou parte aérea), a órgãos reprodutivos, e/ou a propágulos (tal como sementes) de tal planta.
Vigor inicial
Vigor inicial se refere a crescimento bem equilibrado saudável ativo especialmente durante estágios iniciais de crescimento vegetal, e pode resultar de aptidão vegetal aumentada devido a, por exemplo, as plantas serem melhor adaptadas a seu ambiente (i.e. aperfeiçoando o uso de recursos 25 energéticos e particionamento entre parte aérea e raiz). Plantas tendo vigor inicial também mostram uma sobrevivência de plântula aumentada e um melhor estabelecimento da cultura, o que freqüentemente resulta em campos altamente uniformes (com a cultura crescendo de maneira uniforme, i.e. com a maioria das plantas atingindo os vários estágios de desenvolvimento substancialmente ao mesmo tempo), e freqüentemente rendimento melhor e maior. Portanto, vigor inicial pode ser determinado medindo vários fatores, tal como peso de mil sementes, porcentagem de germinação, porcentagem de emergência, crescimento de plântula, altura de plântula, comprimento de raiz, biomassa de raiz e parte aérea e muito mais.
Aumento/Melhora/Acentuação
Os termos “aumento”, “melhora” ou “acentuação” são permutáveis e devem significar no sentido do pedido pelo menos uns 3%, 4%, 5%, 6%, 7%, 8%, 9% ou 10%, preferivelmente pelo menos 15% ou 20%, mais preferivelmente 25%, 30%, 35% ou 40% mais rendimento e/ou crescimento em comparação com plantas de controle como definido neste lugar.
Rendimento de sementes
Rendimento aumentado de sementes pode ser manifestada como um ou mais dos seguintes: a) um aumento em biomassa de semente (peso total de semente) que pode ser em uma base de semente individual e/ou por planta e/ou por metro quadrado; b) número aumentado de flores por planta; c) número aumentado de grãos (cheios); d) taxa aumentada de enchimento de grãos (que é expressa como a proporção entre o número de grãos cheios dividido pelo número total de grãos); e) índice de colheita aumentado, que é expresso como uma proporção do rendimento de partes aptas para corte, tal como sementes, dividida pela biomassa total; e f) Peso de Mil Sementes (TKW) aumentado, que é extrapolado a partir do número de grãos cheios contados e seu peso total. Um TKW aumentado pode resultar de um tamanho de semente e/ou peso de semente aumentado, e também pode resultar de um aumento em tamanho de embrião e/ou endosperma.
Um aumento em rendimento de sementes também pode ser manifestado como um aumento em tamanho de semente e/ou volume de semente. Além disso, um aumento em rendimento de sementes também pode ser manifestado como um aumento em área de semente e/ou comprimento de semente e/ou largura de semente e/ou perímetro de semente. Rendimento aumentado também pode resultar em arquitetura modificada, ou pode ocorrer por causa de arquitetura modificada.
índice Verde
O “índice verde” como usado neste lugar é calculado a partir de imagens digitais de plantas. Para cada pixel pertencendo ao objeto vegetal na imagem, a proporção do valor de verde versus o valor de vermelho (no modelo RGB para codificar cor) é calculada. O índice verde é expresso como a porcentagem de pixels para a qual a proporção de verde para vermelho excede um dado limiar. Em condições normais de crescimento, em condições de crescimento com estresse salino, e em condições de crescimento com disponibilidade reduzida de nutrientes, o índice verde de plantas é medido no último tratamento de imagens antes de florescimento. Em contraste, em condições de crescimento com estresse por seca, o índice verde de plantas é medido no primeiro tratamento de imagens depois de seca.
Planta
O termo “planta” como usado neste lugar abrange plantas inteiras, ancestrais e progênie das plantas e partes vegetais, incluindo sementes, partes aéreas, caules, folhas, raízes (incluindo tubérculos), flores, e tecidos e órgãos, caracterizado pelo fato de que cada um dos mencionados acima compreende o gene/ácido nucleico de interesse. O termo “planta” também abrange células vegetais, culturas em suspensão, tecido de calo, embriões, regiões meristemáticas, gametófitos, esporófitos, pólen e micrósporos, de novo caracterizado pelo fato de que cada um dos mencionados acima compreende o gene/ácido nucleico de interesse.
Plantas que são particularmente úteis nos métodos da invenção incluem todas as plantas que pertencem à superfamília Viridiplantae, em particular plantas monocotiledôneas e dicotiledôneas incluindo forragem ou legumes de forragem, plantas ornamentais, cultivos alimentares, árvores ou arbustos selecionados a partir da lista compreendendo Acer spp., Actinidia spp., Abelmoschus spp., Agave sisalana, Agropyron spp., Agrostis stolonifera, Allium spp., Amaranthus spp., Ammophila arenaria, Ananas comosus, Annona spp., Apium graveolens, Arachis spp, Artoearpus spp., Asparagus offieinalis, Avena spp. (e.g. Avena sativa, Avena fatua, Avena byzantina, Avena fatua var. sativa, Avena hybrida), Averrhoa earambola, Bambusa sp., Benineasa hispida, Bertholletia exeelsea, Beta vulgaris, Brassiea spp. (e.g. Brassiea napus, Brassiea rapa ssp. [canola, colza, nabo]), Cadaba farinosa, Camellia sinensis, Canna indica, Cannabis sativa, Capsicum spp., Carex elata, Carica papaya, Carissa macrocarpa, Carya spp., Carthamus tinctorius, Castanea spp., Ceiba pentandra, Cichorium endivia, Cinnamomum spp., Citrullus lanatus, Citrus spp., Cocos spp., Coffea spp., Colocasia esculenta, Cola spp., Corchorus sp., Coriandrum sativum, Corylus spp., Crataegus spp., Crocus sativus, Cucurbita spp., Cucumis spp., Cynara spp., Daucus carota, Desmodium spp., Dimocarpus longan, Dioscorea spp., Diospyros spp., Echinochloa spp., Elaeis (e.g. Elaeis guineensis, Elaeis oleifera), Eleusine coracana, Erianthus sp., Eriobotrya japonica, Eucalyptus sp., Eugenia uniflora, Fagopyrum spp., Fagus spp., Festuca arundinacea, Ficus carica, Fortunella spp., Fragaria spp., Ginkgo biloba, Glycine spp. (e.g. Glycine max, Soja hispida ou Soja max), Gossypium hirsutum, Helianthus spp. (e.g. Helianthus annuus), Hemerocallis fulva, Hibiscus spp., Hordeum spp. (e.g. Hordeum vulgare), Ipomoea batatas, Juglans spp., Lactuca sativa, Lathyrus spp., Lens culinaris, Linum usitatissimum, Litehi ehinensis, Lotus spp., Luffa acutangula, Lupinus spp., Luzula sylvatiea, Lyeopersieon spp. (e.g. Lyeopersieon eseulentum, Lycopersicon lyeopersieum, Lyeopersieon pyriforme), Maerotyloma spp., Malus spp., Malpighia emarginata, Mammea americana, Mangifera indica, Manihot spp., Manilkara zapota, Medicago sativa, Melilotus spp., Mentha spp., Miscanthus sinensis, Momordica spp., Morus nigra, Musa spp., Nicotiana spp., Olea spp., Opuntia spp., Ornithopus spp., Oryza spp. (e.g. Oryza sativa, Oryza latifolia), Panieum miliaeeum, Panieum virgatum, Passiflora edulis, Pastinaea sativa, Pennisetum sp., Persea spp., Petroselinum erispum, Phalaris arundinaeea, 5 Phaseolus spp., Phleum pratense, Phoenix spp., Phragmites australis, Physalis spp., Pinus spp., Pistacia vera, Pisum spp., Poa spp., Populus spp., Prosopis spp., Prunus spp., Psidium spp., Puniea granatum, Pyrus eommunis, Quereus spp., Raphanus sativus, Rheum rhabarbarum, Ribes spp., Rieinus eommunis, Rubus spp., Saeeharum spp., Salix sp., Sambueus spp., Seeale 10 eereale, Sesamum spp., Sinapis sp., Solanum spp. (e.g. Solanum tuberosum, Solanum integrifolium ou Solanum lyeopersieum), Sorghum bieolor, Spinaeia spp., Syzygium spp., Tagetes spp., Tamarindus indica, Theobroma cacao, Trifolium spp., Triticosecale rimpaui, Triticum spp. (e.g. Triticum aestivum, Triticum durum, Triticum turgidum, Triticum hybernum, Triticum macha, 15 Triticum sativum ou Triticum vulgare), Tropaeolum minus, Tropaeolum majus, Vaccinium spp., Vicia spp., Vigna spp., Viola odorata, Vitis spp., Zea mays, Zizaniapalustris, Ziziphus spp., entre outras.
Descrição Detalhada da Invenção
Surpreendentemente, foi descoberto agora que modular 20 expressão em uma planta de um ácido nucleico codificando um polipeptídeo associado a CRC gera plantas tendo características de rendimento melhoradas em relação a plantas de controle, quando estas plantas são cultivadas em condições de estresse abiótico. De acordo com uma primeira forma de realização, a presente invenção fornece um método para melhorar 25 características de rendimento em plantas cultivadas em condições de estresse abiótico, em relação a plantas de controle, compreendendo modular expressão em uma planta de um ácido nucleico codificando um polipeptídeo associado a CRC. O termo “estresse abiótico” como usado neste lugar não abrange estresse por frio. Um método preferido para modular (preferivelmente, aumentar) expressão de um ácido nucleico codificando um polipeptídeo associado a CRC é introduzir e expressar em uma planta um ácido nucleico codificando um polipeptídeo associado a CRC.
5 Qualquer referência daqui por diante a uma “proteína útil nos
métodos da invenção” é adotada para significar um polipeptídeo associado a CRC como definido neste lugar. Qualquer referência daqui por diante a um “ácido nucleico útil nos métodos da invenção” é adotada para significar um ácido nucleico capaz de codificar um tal polipeptídeo associado a CRC. O 10 ácido nucleico a ser introduzido em uma planta (e, portanto, útil para realizar os métodos da invenção) é qualquer ácido nucleico codificando o tipo de proteína que será agora descrito, daqui pra frente também chamado “ácido nucleico associado a CRC’ ou “gene associado a CRC\
Um polipeptídeo “associado a CRC” como definido neste lugar se refere a qualquer seqüência de aminoácido compreendendo, de término N a término C, um domínio de dedo de zinco Cys2Cys2, um domínio de transativação e um domínio YABBY (hélice-alça-hélice). O domínio de transativação está envolvido em ligação de DNA e é preferivelmente enriquecidos em resíduos Ser e Pro. O domínio YABBY, como definido por Bowman e Smyth (Development 126, 2387-2396, 1999) parece o domínio de hélice-alça-hélice em proteínas HMG. O domínio YABBY definido em SMART (equivalentes em InterPro: IPR006780, e Pfam: PF04690) é mais amplo e abrange o domínio de dedo de zinco mencionado acima, a região rica em Ser e Pro e o domínio de hélice-alça-hélice. O termo “domínio YABBY” como usado neste lugar se refere ao domínio YABBY definido nos bancos de dados SMART/InterPro/Pfam.
Preferivelmente o domínio de dedo de zinco Cys2Cys2 compreende um ou ambos os motivos seguintes:
(E/G/D)(Q/R/H)(I/L)(C/G/Y)(H/Y/C)V(Q/R)C(G/S/N/T)(F/I/Y)(C/R)(T/ A/D/Q/N/S)T(I/V/L)L(L/A/S)V(S/N/G)(V/I)P (motivo I, SEQ ID NO: 56);
(V/A/T)V(T/A/P)V(R/Q/K)CG(H/C)C(T/G/S/N) (motivo 2, SEQ ID NO: 57).
Preferivelmente, motivo 1 tem a seqüência: (E/G/D)(Q/R/H)(I/L)(C/G/Y)(H/Y/C)V(Q/R)C(G/S/N/T)(F/I/Y)(C/R)(T/ A/D/N/S)T(I/V/L)L(L/A/S)V(S/G)(V/I)P (SEQ ID NO: 45);
mais preferivelmente, motivo 1 tem a seqüência (E/D)HL(C/Y)YVRC(S/N/T)(F/I/Y)(C/R)(N/S)T(I/V/L)L(A/S)VG(V/I)
p;
e motivo 2 preferivelmente tem a seqüência:
(V/A/T)V(T/A/P)V(R/Q/K)CGHC(T/G/S/N) (SEQ ID NO: 46);
mais preferivelmente, a seqüência de motivo 2 é :TVTVKCGHC(G/S/N).
Mais preferivelmente, motivos 1 e 2 têm respectivamente as
seqüências
EHLYYVRC SICNTILAVGIP e TVTVKCGHCG.
Ainda preferivelmente a seqüência de domínio de dedo de zinco Cys2Cys2 também compreende um dos seguintes motivos:
LLVSV (motivo 3, SEQ ID NO: 47)
(K/D/E)TVTV (motivo 4, SEQ ID NO: 58),
preferivelmente motivo 4 é
(D/E)TVTV (SEQ ID NO: 48).
Preferivelmente o domínio de hélice-alça-hélice compreende um ou mais dos motivos 5 a 7:
(K/R)PPE(K/R)(R/K)(Q/H)R(A/T/V/L)PSAYN (motivo 5, SEQ ID NO:
59)
(K/R)(E/K/D)EI(R/K/Q)R(L/I)(K/E)( A/I/ S/T)(Q/E/M/ S/AJ G)(N/Y/E/K) P (motivo 6, SEQ ID NO: 50)
H(K/R)(E/Q)AFS(L/A/T/S/M)AAKNWA(H/K/R) (motivo 7, SEQ ID NO: 51)
Preferivelmente, motivo 5 tem a seqüência KPPE(K/R)(R/K)(Q/H)R(A/T/L)PSAYN (SEQ ID NO: 49), mais preferivelmente, motivo 5 tem a seqüência KPPEKK(Q/H)RLPSAYN,
motivo 6 tem a seqüência (K/R)(E/D)EI(K/Q)RIK(A/S/T)(E/A/G)(N/K)P, e motivo 7 tem a seqüência HREAFS(A/T/S/M)AAKNWA(K/R)
Mais preferivelmente, motivos 5, 6 e 7 têm as seqüências
KPPEKKQRLPSAYN (motivo 5),
RDEIQRIKSANP (motivo 6),
HREAFSAAAKNWAK (motivo 7).
Em ordem crescente de preferência a seqüência de polipeptídeo “associado a CRC” compreende 1, 2, 3, 4, 5, 6 ou todos os 7 dos motivos mencionados acima.
Alternativamente, a proteína relacionada a CRC tem em ordem crescente de preferência pelo menos 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, ou 99% de identidade total de seqüência com o aminoácido representado por SEQ ID NO: 2, contanto que a proteína compreenda um ou mais dos motivos conservados como descrito acima. A identidade total de seqüência é determinada usando um algoritmo de alinhamento global, tal como o algoritmo de Needleman Wunsch no programa GAP (GCG Wisconsin Package, Accelrys), preferivelmente com parâmetros padrão. Comparada com identidade total de seqüência, a identidade total de seqüência geralmente será maior quando apenas domínios ou motivos conservados (tal como motivos 1 a 7) são considerados.
Exemplos de proteínas úteis nos métodos da invenção e ácidos nucleicos codificando as mesmas são como dado abaixo em tabela A de Exemplo 1. Preferivelmente, a proteína relacionada a CRC tem uma seqüência de aminoácido que, quando usada na construção de uma árvore filogenética relacionada a CRC de acordo com Lee et al. (Development 132, 5021-5032, 2005), tende a se agrupar com o grupo de proteínas relacionadas a CRC ou relacionadas a INO como definido em Lee et al. (2005) ao invés de com qualquer outro grupo.
O termo “domínio” e “motivo” é definido na seção “definições” neste lugar. Há bancos de dados especialistas para a identificação de domínios, por exemplo, SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318), Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAI Press, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137, (2004)), ou Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280 (2002)). Um conjunto de ferramentas para análise in silico de seqüências protéicas está disponível no servidor de proteômica (Swiss Institute of Bioinformatics (Gasteiger et al., ExPASy: the proteomies server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31:3784-3788(2003)). Domínios ou motivos também podem ser identificados usando técnicas de rotina, tal como por alinhamento de seqüências. Métodos para o alinhamento de seqüências para comparação são bem conhecidos na arte, tais métodos incluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o algoritmo de Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar o alinhamento global (i.e. abrangendo 5 as seqüências completas) de duas seqüências que maximiza o número de pareamentos e minimiza o número de lacunas. O algoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-10) calcula identidade de seqüência percentual e realiza uma análise estatística da similaridade entre as duas seqüências. O aplicativo computacional para realizar análise BLAST está 10 publicamente disponível através do National Centre for Biotechnology Information (NCBI). Homólogos podem ser prontamente identificados usando, por exemplo, o algoritmo de alinhamento de múltiplas seqüências ClustalW (versão 1.83), com os parâmetros padrão de alinhamento pareado, e um método de pontuação em porcentagem. Porcentagens globais de 15 similaridade e identidade também podem ser determinadas usando um dos métodos disponíveis no pacote de aplicativo computacional MatGAT (Campanella et al., BMC Bioinformatics. 2003 Jul 10;4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences.). Edição manual secundária pode ser realizada para aperfeiçoar 20 alinhamento entre motivos conservados, como deve ser perceptível para uma pessoa versada na arte. Além disso, ao invés de usar seqüências de comprimento completo para a identificação de homólogos, domínios específicos também podem ser usados. Os valores de identidade de seqüência podem ser determinados ao longo da seqüência inteira de ácidos nucleicos ou 25 de aminoácidos ou ao longo de domínios selecionados ou motivo(s) conservado(s), usando os programas mencionados acima usando os parâmetros padrão.
Além disso, proteínas relacionadas a CRC (pelo menos em sua forma nativa) são postuladas serem fatores de transcrição. Métodos para ensaiar atividade biológica de fatores de transcrição são conhecidos na arte, detalhes adicionais são fornecidos em Exemplo 6. Em adição, proteínas relacionadas a CRC tipicamente são expressas em tecidos associados a flor e não em tecidos vegetativos, em contraste com outras proteínas 5 compreendendo um domínio YABBY.
A presente invenção é ilustrada transformando plantas com a seqüência de ácido nucleico representada por SEQ ID NO: 1, codificando a seqüência de polipeptídeo de SEQ ID NO: 2. Entretanto, desempenho da invenção não é restrito a estas seqüências; os métodos da invenção podem ser 10 vantajosamente realizados usando qualquer ácido nucleico codificando POI ou polipeptídeo associado a CRC como definido neste lugar.
Exemplos de ácidos nucleicos codificando polipeptídeos associados a CRC são dados em Tabela A de Exemplo 1 neste lugar. Tais ácidos nucleicos são úteis para realizar os métodos da invenção. As 15 seqüências de aminoácidos dadas em Tabela A de Exemplo 1 são seqüências exemplares de ortólogos e parálogos do polipeptídeo associado a CRC representado por SEQ ID NO: 2, os termos “ortólogos” e “parálogos” sendo como definidos neste lugar. Ortólogos e parálogos adicionais podem ser prontamente identificados realizando uma assim chamada busca blast 20 recíproca. Tipicamente, isto envolve um primeiro BLAST envolvendo BLASTing uma seqüência de consulta (por exemplo usando qualquer das seqüências listadas em Tabela A de Exemplo 1) contra qualquer banco de dados de seqüências, tal como o banco de dados publicamente disponível de NCBI. BLASTN ou TBLASTX (usando valores pré-determinados padrão) 25 geralmente são usados ao iniciar de uma seqüência de nucleotídeos, e BLASTP ou TBLASTN (usando valores pré-determinados padrão) ao iniciar de uma seqüência protéica. Os resultados de BLAST podem ser opcionalmente filtrados. As seqüências de comprimento completo ou dos resultados filtrados ou dos resultados não filtrados são então BLASTed de volta (segundo BLAST) contra seqüências do organismo do qual a seqüência de consulta é derivada (onde a seqüência de consulta é SEQ ID NO: I ou SEQ ID NO: 2, o segundo BLAST deve portanto ser contra seqüências de Arabidopsis thaliana). Os resultados do primeiro e segundo BLAST são então 5 comparados. Um parálogo é identificado se um acerto de alto ranqueamento do primeiro blast é da mesma espécie da qual a seqüência de consulta é derivada, um BLAST de retomo então idealmente resulta na seqüência de consulta entre os maiores acertos; um ortólogo é identificado se um acerto de alto ranqueamento no primeiro BLAST é da mesma espécie da qual a 10 seqüência de consulta é derivada, e preferivelmente resulta mediante BLAST de retomo na seqüência de consulta estando entre os maiores acertos.
Acertos de alto ranqueamento são aqueles tendo um baixo valor E. Quanto menor o valor E, mais significante é o escore (ou em outras palavras menor a chance de que o acerto tenha sido encontrado ao acaso). 15 Computação do valor E é bem conhecida na arte. Em adição a valores E, comparações também são pontuadas por identidade percentual. Identidade percentual se refere ao número de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüências de ácidos nucleicos (ou polipeptídeos) comparadas ao longo de um comprimento particular. No caso de famílias grandes, 20 ClustalW pode ser usado, seguido por uma árvore de agrupamento de vizinhos, para ajudar a visualizar agrupamento de genes relacionados e para identificar ortólogos e parálogos.
Variantes de ácidos nucleicos também podem ser úteis para praticar os métodos da invenção. Exemplos de tais variantes incluem ácidos 25 nucleicos codificando homólogos e derivados de qualquer uma das seqüências de aminoácidos dadas em Tabela A de Exemplo 1, os termos “homólogo” e “derivado” sendo como definidos neste lugar. Também úteis nos métodos da invenção são ácidos nucleicos codificando homólogos e derivados de ortólogos ou parálogos de qualquer uma das seqüências de aminoácidos dadas em Tabela A de Exemplo 1. Homólogos e derivados úteis nos métodos da presente invenção têm substancialmente a mesma atividade biológica e funcional que a proteína não modificada da qual eles são derivados.
Variantes de ácidos nucleicos adicionais úteis para praticar os 5 métodos da invenção incluem porções de ácidos nucleicos codificando polipeptídeos associados a CRC, ácidos nucleicos hibridizando com ácidos nucleicos codificando polipeptídeos associados a CRC, variantes de processamento de ácidos nucleicos codificando polipeptídeos associados a CRC, variantes alélicas de ácidos nucleicos codificando polipeptídeos 10 associados a CRC e variantes de ácidos nucleicos codificando polipeptídeos associados a CRC obtidos por embaralhamento gênico. Os termos seqüência hibridizante, variante de processamento, variante alélica e embaralhamento gênico são como descritos neste lugar.
Ácidos nucleicos codificando polipeptídeos associados a CRC 15 não precisam ser ácidos nucleicos de comprimento completo, uma vez que desempenho dos métodos da invenção não se fia no uso de seqüências de ácidos nucleicos de comprimento completo. De acordo com a presente invenção, é fornecido um método para melhorar características de rendimento em plantas, compreendendo introduzir e expressar em uma planta uma porção 20 de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1, ou uma porção de um ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer das seqüências de aminoácidos dadas em Tabela A de Exemplo 1.
Uma porção de um ácido nucleico pode ser preparada, por 25 exemplo, fazendo uma ou mais deleções ao ácido nucleico. As porções podem ser usadas em forma isolada ou elas podem ser füsionadas com outras seqüências de codificação (ou não codificantes) a fim de, por exemplo, produzir uma proteína que combina diversas atividades. Quando fusionado com outras seqüências de codificação, o polipeptídeo resultante produzido mediante tradução pode ser maior do que aquele previsto para a porção de proteína.
Porções úteis nos métodos da invenção, codificam um polipeptídeo associado a CRC como definido neste lugar, e têm substancialmente a mesma atividade biológica que as seqüências de aminoácidos dadas em Tabela A de Exemplo 1. Preferivelmente, a porção é uma porção de qualquer um dos ácidos nucleicos dados em Tabela A de Exemplo 1, ou é uma porção de um ácido nucleico codificando um ortólogo ou parálogo de qualquer uma das seqüências de aminoácidos dadas em Tabela A de Exemplo 1. Preferivelmente a porção é de pelo menos 400, 450, 500, 550, 600, 650, 700, nucleotídeos consecutivos de comprimento, os nucleotídeos consecutivos sendo de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1, ou de um ácido nucleico codificando um ortólogo ou parálogo de qualquer uma das seqüências de aminoácidos dadas em Tabela A de Exemplo I. Mais preferivelmente a porção é uma porção do ácido nucleico de SEQ ID NO: 1. Preferivelmente, a porção codifica um fragmento de uma seqüência de aminoácido que, quando usada na construção de uma árvore filogenética relacionada a CRC de acordo com Lee et al. (Development 132, 5021-5032, 2005), tende a se agrupar com o grupo de proteínas relacionadas a CRC ou relacionadas a INO como definido em Lee et al. (2005) ao invés de com qualquer outro grupo.
Outra variante de ácido nucleico útil nos métodos da invenção é um ácido nucleico capaz de hibridizar, em condições de estringência reduzida, preferivelmente em condições estringentes, com um ácido nucleico codificando um polipeptídeo associado a CRC como definido neste lugar, ou com uma porção como definido neste lugar.
De acordo com a presente invenção, é fornecido um método para melhorar características de rendimento em plantas, compreendendo introduzir e expressar em uma planta um ácido nucleico capaz de hibridizar com qualquer um dos ácidos nucleicos dados em Tabela A de Exemplo 1, ou compreendendo introduzir e expressar em uma planta um ácido nucleico capaz de hibridizar com um ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer das seqüências de ácidos nucleicos dadas em 5 Tabela A de Exemplo 1.
Seqüências hibridizantes úteis nos métodos da invenção codificam um polipeptídeo associado a CRC como definido neste lugar, tendo substancialmente a mesma atividade biológica que as seqüências de aminoácidos dadas em Tabela A de Exemplo 1. Preferivelmente, a seqüência 10 hibridizante é capaz de hibridizar com qualquer um dos ácidos nucleicos dados em Tabela A de Exemplo 1, ou com uma porção de qualquer uma destas seqüências, uma porção sendo como definido acima, ou a seqüência hibridizante é capaz de hibridizar com um ácido nucleico codificando um ortólogo ou parálogo de qualquer uma das seqüências de aminoácidos dadas 15 em Tabela A de Exemplo I. Mais preferivelmente, a seqüência hibridizante é capaz de hibridizar com um ácido nucleico como representado por SEQ ID NO: 1 ou com uma porção deste.
Preferivelmente, a seqüência hibridizante codifica um polipeptídeo com uma seqüência de aminoácido que, quando de comprimento 20 completo e usada na construção de uma árvore filogenética relacionada a CRC de acordo com Lee et al. (Development 132, 5021-5032, 2005), tende a se agrupar com o grupo de proteínas relacionadas a CRC ou relacionadas a INO como definido em Lee et al. (2005) ao invés de com qualquer outro grupo.
Outra variante de ácido nucleico útil nos métodos da invenção
é uma variante de processamento codificando um polipeptídeo associado a CRC como definido acima, uma variante de processamento sendo como definido neste lugar.
De acordo com a presente invenção, é fornecido um método para melhorar características de rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante de processamento de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1, ou uma variante de processamento de um ácido nucleico 5 codificando um ortólogo, parálogo ou homólogo de qualquer das seqüências de aminoácidos dadas em Tabela A de Exemplo 1.
Variantes de processamento preferidas são variantes de processamento de um ácido nucleico representado por SEQ ID NO: 1, ou uma variante de processamento de um ácido nucleico codificando um ortólogo ou 10 parálogo de SEQ ID NO: 2. Preferivelmente, a seqüência de aminoácido codificada pela variante de processamento, quando usada na construção de uma árvore filogenética relacionada a CRC de acordo com Lee et al. (Development 132, 5021-5032, 2005), tende a se agrupar com o grupo de proteínas relacionadas a CRC ou relacionadas a INO como definido em Lee et 15 al. (2005) ao invés de com qualquer outro grupo.
Outra variante de ácido nucleico útil para realizar os métodos da invenção é uma variante alélica de um ácido nucleico codificando um polipeptídeo associado a CRC como definido acima, uma variante alélica sendo como definido neste lugar.
De acordo com a presente invenção, é fornecido um método
para melhorar características de rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante alélica de qualquer um dos ácidos nucleicos dados em Tabela A de Exemplo 1, ou compreendendo introduzir e expressar em uma planta uma variante alélica de um ácido 25 nucleico codificando um ortólogo, parálogo ou homólogo de qualquer das seqüências de aminoácidos dadas em Tabela A de Exemplo 1.
As variantes alélicas úteis nos métodos da presente invenção têm substancialmente a mesma atividade biológica que o polipeptídeo associado a CRC de SEQ ID NO: 2 e qualquer dos aminoácidos descritos em Tabela A de Exemplo 1. Variantes alélicas existem na natureza, e abrangido dentro dos métodos da presente invenção é o uso destes alelos naturais. Preferivelmente, a variante alélica é uma variante alélica de SEQ ID NO: 1 ou uma variante alélica de um ácido nucleico codificando um ortólogo ou 5 parálogo de SEQ ID NO: 2. Preferivelmente, a seqüência de aminoácido codificada pela variante alélica, quando usada na construção de uma árvore filogenética relacionada a CRC de acordo com Lee et al. (Development 132, 5021-5032, 2005), tende a se agrupar com o grupo de proteínas relacionadas a CRC ou relacionadas a INO como definido em Lee et al. (2005) ao invés de 10 com qualquer outro grupo.
Embaralhamento gênico ou evolução dirigida também podem ser usados para gerar variantes de ácidos nucleicos codificando polipeptídeos associados a CRC como definido acima; o termo “embaralhamento gênico” sendo como definido neste lugar.
De acordo com a presente invenção, é fornecido um método
para melhorar características de rendimento em plantas, compreendendo introduzir e expressar em uma planta uma variante de qualquer uma das seqüências de ácidos nucleicos dadas em Tabela A de Exemplo 1, ou compreendendo introduzir e expressar em uma planta uma variante de um 20 ácido nucleico codificando um ortólogo, parálogo ou homólogo de qualquer das seqüências de aminoácidos dadas em Tabela A de Exemplo 1, cujo ácido nucleico variante é obtido por embaralhamento gênico.
Preferivelmente, a seqüência de aminoácido codificada pelo ácido nucleico variante obtido por embaralhamento gênico, quando usada na 25 construção de uma árvore filogenética relacionada a CRC de acordo com Lee et al. (Development 132, 5021-5032, 2005), tende a se agrupar com o grupo de proteínas relacionadas a CRC ou relacionadas a INO como definido em Lee et al. (2005) ao invés de com qualquer outro grupo.
Além disso, variantes de ácidos nucleicos também podem ser obtidas por mutagênese sítio dirigida. Diversos métodos estão disponíveis para atingir mutagênese sítio dirigida, o mais comum sendo métodos baseados em PCR (Current Protocols in Molecular Biology. Wiley Eds.).
r
Acidos nucleicos codificando polipeptídeos associados a CRC podem ser derivadas de qualquer fonte natural ou artificial. O ácido nucleico pode ser modificado a partir de sua forma nativa em composição e/ou ambiente genômico através de deliberada manipulação humana. Preferivelmente o ácido nucleico codificando polipeptídeo associado a CRC é de uma planta, ainda preferivelmente de uma planta dicotiledônea, mais preferivelmente da família Brassicaceae, mais preferivelmente o ácido nucleico é de Oryza sativa.
Desempenho dos métodos da invenção gera plantas tendo características de rendimento melhoradas. Em particular desempenho dos métodos da invenção gera plantas tendo rendimento aumentado, especialmente rendimento aumentado de sementes em relação a plantas de controle. Os termos “rendimento” e “rendimento de sementes” são descritos em mais detalhe na seção “definições” neste lugar.
Referência neste lugar a características de rendimento melhoradas é adotada para significar um aumento em biomassa (peso) de uma ou mais partes de uma planta, o que pode incluir partes (aptas para corte) acima do solo e/ou partes (aptas para corte) abaixo do solo. Em particular, tais partes aptas para corte são sementes, e desempenho dos métodos da invenção resulta em plantas tendo rendimento aumentado de sementes em relação à rendimento de sementes de plantas de controle.
Adotando milho como um exemplo, um aumento de rendimento pode ser manifestado como um ou mais dos seguintes: aumento no número de plantas estabelecidas por metro quadrado, um aumento no número de espigas por planta, um aumento no número de fileiras, número de sementes por fileira, peso de semente, peso de mil sementes, comprimento/diâmetro de espiga, aumento na taxa de enchimento de grãos (que é o número de grãos cheios dividido pelo número total de grãos e multiplicado por 100), entre outros. Adotando arroz como um exemplo, um aumento de rendimento pode se manifestar como um aumento em um ou mais 5 dos seguintes: número de plantas por metro quadrado, número de panícuias por planta, número de espiguilhas por panícula, número de flores (floretes) por panícula (que é expresso como uma proporção do número de grãos cheios pelo número de panículas primárias), aumento na taxa de enchimento de grãos (que é o número de grãos cheios dividido pelo número total de grãos e 10 multiplicado por 100), aumento em peso de mil sementes, entre outros.
A presente invenção fornece um método para aumentar rendimento, especialmente rendimento de sementes de plantas, em relação a plantas de controle, cujo método compreende modular expressão em uma planta de um ácido nucleico codificando um polipeptídeo associado a CRC como definido neste lugar.
Uma vez que as plantas transgênicas de acordo com a presente invenção têm rendimento aumentado, é provável que estas plantas exibam uma taxa de crescimento aumentada (durante pelo menos parte de seu ciclo de vida), em relação à taxa de crescimento de plantas de controle em um estágio correspondente em seu ciclo de vida.
A taxa de crescimento aumentada pode ser específica para uma ou mais partes de uma planta (incluindo sementes), ou pode estar substancialmente ao longo de toda a planta. Plantas tendo uma taxa de crescimento aumentada podem ter um ciclo de vida mais curto. O ciclo de 25 vida de uma planta pode ser adotado para significar o tempo necessário para crescer de semente madura seca até o estágio onde a planta produziu sementes maduras secas, similares ao material inicial. Este ciclo de vida pode ser influenciado por fatores tal como vigor inicial, taxa de crescimento, índice relativo ao verde, tempo de florescimento e velocidade de maturação de sementes. O aumento em taxa de crescimento pode ocorrer em um ou mais estágios no ciclo de vida de uma planta ou durante substancialmente o ciclo de vida inteiro de planta. Taxa de crescimento aumentada durante os estágios iniciais no ciclo de vida de uma planta pode refletir vigor melhorado. O 5 aumento em taxa de crescimento pode alterar o ciclo de colheita de uma planta permitindo que plantas sejam semeadas mais tarde e/ou colhidas mais cedo do que de outra maneira seria possível (um efeito similar pode ser obtido com tempo de florescimento anterior). Se a taxa de crescimento é suficientemente aumentada, ela pode permitir semeadura adicional de 10 sementes da mesma espécie de planta (por exemplo semeadura e colheita de plantas de arroz seguido por semeadura e colheita de plantas de arroz adicionais todas dentro de um período de cultivo convencional). Similarmente, se a taxa de crescimento é suficientemente aumentada, ela pode permitir semeadura adicional de sementes de espécies vegetais diferentes (por 15 exemplo a semeadura e colheita de plantas de milho seguido por, por exemplo, a semeadura e colheita opcional de soja, batata ou qualquer outra planta adequada). Tempos de colheita adicionais do mesmo porta-enxerto no caso de algumas plantas cultiváveis também podem ser possíveis. Alterar o ciclo de colheita de uma planta pode levar a um aumento em rendimento 20 anual de biomassa por metro quadrado (devido a um aumento no número de vezes (digamos que em um ano) que qualquer planta particular pode ser cultivada e colhida). Um aumento em taxa de crescimento também pode permitir o cultivo de plantas transgênicas em uma área geográfica mais ampla do que suas contrapartes tipo selvagem, uma vez que as limitações territoriais 25 para cultivar uma cultura freqüentemente são determinadas por condições ambientais adversas ou no momento de plantio (ciclo precoce) ou no momento de colheita (ciclo tardio). Tais condições adversas podem ser evitadas se o ciclo de colheita é encurtado. A taxa de crescimento pode ser determinada derivando vários parâmetros de curvas de crescimento, tais parâmetros podem ser: T-Mid (o tempo usado por plantas para atingir 50% de seu tamanho máximo) e T-90 (tempo usado por plantas para atingir 90% de seu tamanho máximo), entre outros.
De acordo com uma característica preferida da presente 5 invenção, desempenho dos métodos da invenção gera plantas tendo uma taxa de crescimento aumentada em relação a plantas de controle. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar a taxa de crescimento de plantas, cujo método compreende modular expressão em uma planta de um ácido nucleico codificando um polipeptídeo associado a 10 CRC como definido neste lugar.
Um aumento em rendimento e/ou taxa de crescimento ocorre quer a planta esteja em condições sem estresse ou quer a planta seja exposta a vários estresses comparada com plantas de controle. Plantas tipicamente respondem a exposição a estresse crescendo mais lentamente. Em condições 15 de estresse severo, a planta pode até parar de crescer no geral. Estresse brando por outro lado é definido neste lugar como sendo qualquer estresse ao qual uma planta é exposta que não resulta em parada de crescimento de planta no geral sem a capacidade de retomar crescimento. Estresse brando no sentido da invenção leva a uma redução no crescimento das plantas estressadas de menos 20 do que 40%, 35% ou 30%, preferivelmente menos do que 25%, 20% ou 15%, mais preferivelmente menos do que 14%, 13%, 12%, 11% ou 10% ou menos em comparação com a planta de controle em condições sem estresse. Devido a avanços em práticas agrícolas (irrigação, fertilização, tratamentos com pesticidas) estresses severos não são freqüentemente encontrados em plantas 25 cultiváveis cultivadas. Como uma conseqüência, o crescimento comprometido induzido por estresse brando freqüentemente é uma característica indesejável para agricultura. Estresses brandos são os estresses (ambientais) bióticos e/ou abióticos do dia-a-dia aos quais uma planta é exposta. Estresses abióticos podem ser devido a seca ou excesso de água, estresse anaeróbico, estresse salino, toxicidade química, estresse oxidativo e temperaturas quentes, frias ou congelantes. O estresse abiótico pode ser um estresse osmótico causado por um estresse hídrico (particularmente devido à seca), estresse salino, estresse oxidativo ou um estresse iônico. No contexto da presente invenção entretanto, 5 o termo “estresse abiótico” não abrange estresse por frio. Estresses bióticos são tipicamente aqueles estresses causados por patógenos, tal como bactérias, vírus, fungos e insetos.
Em particular, os métodos da presente invenção podem ser realizados em condições sem estresse ou em condições de seca branda a 10 severa para gerar plantas tendo rendimento aumentado em relação a plantas de controle. Como relatado em Wang et al. (Planta (2003) 218: 1-14), estresse abiótico leva a uma série de mudanças morfológicas, fisiológicas, bioquímicas e moleculares que afetam adversamente crescimento e produtividade vegetal. Seca, salinidade, temperaturas extremas e estresse 15 oxidativo são conhecidos por serem interconectados e podem induzir dano de crescimento e celular através de mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133: 1755-1767) descreve um grau particularmente alto de “interferência” entre estresse por seca e estresse por alta salinidade. Por exemplo, seca e/ou salinização são manifestadas primariamente como estresse 20 osmótico, resultando na ruptura de homeostase e distribuição iônica na célula. Estresse oxidativo, que freqüentemente acompanha temperatura alta ou baixa, salinidade ou estresse por seca, pode causar desnaturação de proteínas funcionais e estruturais. Como uma conseqüência, estes diversos estresses ambientais freqüentemente ativam vias de sinalização celular e respostas 25 celulares similares, tal como o rendimento de proteínas de estresse, aumento de antioxidantes, acumulação de solutos compatíveis e suspensão de crescimento. O termo condições “sem estresse” como usado neste lugar são aquelas condições ambientais que permitem crescimento ótimo de plantas. Pessoas versadas na arte estão cientes de condições de solo e condições climáticas normais para uma dada localização.
Desempenho dos métodos da invenção gera plantas cultivadas em condições sem estresse ou em condições de seca branda a severa com rendimento aumentado em relação a plantas de controle cultivadas em 5 condições comparáveis. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar rendimento em plantas cultivadas em condições sem estresse ou em condições de seca branda a severa, cujo método compreende modular expressão em uma planta de um ácido nucleico codificando um polipeptídeo associado a CRC. O termo “condições de seca 10 severa” ou “estresse por seca severa” como usado neste lugar se refere àquelas condições caracterizadas pelo fato de que plantas de controle têm uma perda de rendimento de pelo menos 50% comparadas com plantas de controle cultivadas em condições sem estresse.
Desempenho dos métodos da invenção gera plantas cultivadas 15 em condições de deficiência de nutrientes, particularmente em condições de deficiência de nitrogênio, rendimento aumentado em relação a plantas de controle cultivadas em condições comparáveis. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar rendimento em plantas cultivadas em condições de deficiência de nutrientes, cujo método 20 compreende modular expressão em uma planta de um ácido nucleico codificando um polipeptídeo associado a CRC. Deficiência de nutrientes pode resultar de uma carência de nutrientes tal como nitrogênio, fosfatos e outros compostos contendo fósforo, potássio, cálcio, cádmio, magnésio, manganês, ferro e boro, entre outros.
A presente invenção abrange plantas ou partes destas
(incluindo sementes) viáveis pelos métodos de acordo com a presente invenção. As plantas ou partes destas compreendem um ácido nucleico transgênico codificando um polipeptídeo associado a CRC como definido acima. A invenção também fomece construções genéticas e vetores para facilitar introdução e/ou expressão em plantas de ácidos nucleicos codificando polipeptídeos associados a CRC. As construções genéticas podem ser inseridas em vetores, que podem ser comercialmente disponíveis, 5 adequados para transformar em plantas e adequados para expressão do gene de interesse nas células transformadas. A invenção também fomece uso de uma construção gênica como definido neste lugar nos métodos da invenção.
Mais especificamente, a presente invenção fomece uma construção compreendendo:
(a) um ácido nucleico codificando um polipeptídeo associado
a CRC como definido acima;
(b) uma ou mais seqüências de controle capazes de dirigir expressão da seqüência de ácido nucleico de (a); e opcionalmente
(c) uma seqüência de término de transcrição.
Preferivelmente, o ácido nucleico codificando um polipeptídeo
associado a CRC é como definido acima. Os termos “seqüência de controle” e “seqüências de terminação” são como definidos neste lugar.
Plantas são transformadas com um vetor compreendendo qualquer dos ácidos nucleicos descritos acima. O artesão versado está ciente 20 dos elementos genéticos que devem estar presentes no vetor a fim de transformar, selecionar e propagar com sucesso células hospedeiras contendo a seqüência de interesse. A seqüência de interesse é operacionalmente ligada a uma ou mais seqüências de controle (pelo menos a um promotor).
Vantajosamente, qualquer tipo de promotor, quer natural ou 25 sintético, pode ser usado para dirigir expressão da seqüência de ácido nucleico. Um promotor constitutivo é particularmente útil nos métodos. Preferivelmente o promotor constitutivo também é um promotor ubíquo. Veja a seção “Definições” neste lugar para definições dos vários tipos de promotores. Deve ser claro que a aplicabilidade da presente invenção não é restrita ao ácido nucleico codificando polipeptídeo associado a CRC representado por SEQ ID NO: 1, nem é a aplicabilidade da invenção restrita a expressão de um ácido nucleico codificando polipeptídeo associado a CRC 5 quando dirigida por um promotor constitutivo.
O promotor constitutivo é preferivelmente um promotor GOS2, preferivelmente um promotor GOS2 de arroz. Ainda preferivelmente o promotor constitutivo é representado por uma seqüência de ácido nucleico substancialmente similar a SEQ ID NO: 56 ou SEQ ID NO: 52, mais 10 preferivelmente o promotor constitutivo é como representado por SEQ ID NO: 56 ou SEQ ID NO: 52. Outro promotor constitutivo que é útil nos métodos da presente invenção é um promotor de proteína do grupo de alta mobilidade (HMGP); preferivelmente, o promotor de HMGP é do gene HMGBl de arroz, mais preferivelmente, o promotor de HMGP é como 15 representado em SEQ ID NO: 60. Veja Tabela 2 na seção “definições” neste lugar para exemplos adicionais de promotores constitutivos.
Opcionalmente, uma ou mais seqüências terminadoras podem ser usadas na construção introduzida em uma planta. Preferivelmente, a construção compreende uma gaveta de expressão essencialmente similar ou idêntica a SEQ ID NO 55, compreendendo o promotor GOS2 e o ácido nucleico codificando o polipeptídeo associado a CRC.
Elementos reguladores adicionais podem incluir acentuadores transcricionais assim como traducionais. Aqueles versados na arte estarão cientes de seqüências terminadoras e acentuadoras que podem ser adequadas 25 para uso para realizar a invenção. Uma seqüência intrônica também pode ser adicionada à região não traduzida (UTR) 5’ ou na seqüência de codificação para aumentar a quantidade da mensagem madura que se acumula no citosol, como descrito na seção de definições. Outras seqüências de controle (além de promotor, acentuador, silenciador, seqüências intrônicas, regiões 3'UTR e/ou 5'UTR) podem ser proteína e/ou elementos estabilizantes de RNA. Tais seqüências devem ser conhecidas ou podem ser prontamente obtidas por uma pessoa versada na arte.
As construções genéticas da invenção podem incluir 5 adicionalmente uma seqüência de origem de replicação que é requerida para manutenção e/ou replicação em um tipo específico de célula. Um exemplo é quando é requerido que uma construção genética seja mantida em uma célula bacteriana como um elemento genético epissomal (e.g. molécula de plasmídeo ou cosmídeo). Origens de replicação preferidas incluem, mas não 10 são limitadas a, a fl-ori e colEl.
Para a detecção da transferência bem sucedida das seqüências de ácidos nucleicos como usadas nos métodos da invenção e/ou seleção de plantas transgênicas compreendendo estes ácidos nucleicos, é vantajoso usar genes marcadores (ou genes repórteres). Portanto, a construção genética pode 15 opcionalmente compreender um gene marcador selecionável. Marcadores selecionáveis são descritos em mais detalhe na seção “definições” neste lugar. Os genes marcadores podem ser removidos ou excisados da célula transgênica uma vez que eles não sejam mais necessários. Técnicas para remoção de marcador são conhecidas na arte, técnicas úteis são descritas acima na seção 20 de definições.
A invenção também fomece um método para o rendimento de plantas transgênicas tendo características de rendimento melhoradas em relação a plantas de controle, compreendendo introdução e expressão em uma planta de qualquer ácido nucleico codificando um polipeptídeo associado a CRC como definido acima.
Mais especificamente, a presente invenção fomece um método para o rendimento de plantas transgênicas tendo características de rendimento aumentado melhoradas, particularmente rendimento (de sementes) aumentada, cujo método compreende: (i) introduzir e expressar em uma planta ou célula vegetal um ácido nucleico codificando polipeptídeo associado a CRC; e
(ii) cultivar a célula vegetal em condições que promovem crescimento e desenvolvimento vegetal.
5 O ácido nucleico de (i) pode ser qualquer dos ácidos nucleicos
capazes de codificar um polipeptídeo associado a CRC como definido neste lugar.
O ácido nucleico pode ser introduzido diretamente em uma célula vegetal ou na própria planta (incluindo introdução em um tecido, órgão 10 ou qualquer outra parte de uma planta). De acordo com uma característica preferida da presente invenção, o ácido nucleico é preferivelmente introduzido em uma planta por transformação. O termo “transformação” é descrito em mais detalhe na seção “definições” neste lugar.
As células vegetais geneticamente modificadas podem ser regeneradas através de todos os métodos com os quais o trabalhador versado é familiar. Métodos adequados podem ser encontrados nas publicações mencionadas acima por S.D. Kung e R. Wu, Potrykus ou Hõfgen e Willmitzer.
Geralmente depois de transformação, células vegetais ou 20 agrupamentos celulares são selecionados para a presença de um ou mais marcadores que são codificados por genes exprimíveis em plantas co- transferidos com o gene de interesse, seguindo o que o material transformado é regenerado em uma planta inteira. Para selecionar plantas transformadas, o material vegetal obtido na transformação é, como uma regra, sujeito a 25 condições seletivas de forma que plantas transformadas podem ser distinguidas de plantas não transformadas. Por exemplo, as sementes obtidas da maneira descrita acima podem ser plantadas e, depois de um período inicial de crescimento, sujeitas a uma seleção adequada por pulverização. Uma possibilidade adicional consiste em cultivar as sementes, se apropriado depois de esterilização, em placas de ágar usando um agente de seleção adequado de forma que apenas as sementes transformadas podem crescer até plantas. Alternativamente, as plantas transformadas são triadas para a presença de um marcador selecionável tal como aqueles descritos acima.
5 Seguindo transferência de DNA e regeneração, plantas
putativamente transformadas também podem ser avaliadas, por exemplo usando análise Southern, para a presença do gene de interesse, número de cópias e/ou organização genômica. Alternativamente ou adicionalmente, níveis de expressão do DNA recentemente introduzido podem ser 10 monitorados usando análise Northern e/ou Western, ambas as técnicas sendo bem conhecidas por pessoas tendo habitual verso na arte.
As plantas transformadas geradas podem ser propagadas por uma variedade de maneira, tal como por propagação clonal ou técnicas clássicas de melhoramento. Por exemplo, uma planta transformada de 15 primeira geração (ou Tl) pode ser autofecundada e transformantes homozigotos de segunda geração (ou T2) selecionados, e as plantas T2 podem ser então adicionalmente propagadas através de técnicas clássicas de melhoramento. Os organismos transformados gerados podem adotar uma variedade de formas. Por exemplo, eles podem ser quimeras de células 20 transformadas e células não transformadas; transformantes clonais (e.g., todas as células transformadas para conter a gaveta de expressão); enxertos de tecidos transformados e não transformados (e.g., em plantas, um porta- enxerto transformado enxertado em uma prole não transformada).
A presente invenção claramente se estende a qualquer célula 25 vegetal ou planta produzida por dos métodos descritos neste lugar, e a todas a partes vegetais e propágulos destas. A presente invenção se estende adicionalmente para abranger a progênie de uma célula, tecido, órgão ou planta inteira primária transformada ou transfectada que foi produzida por qualquer dos métodos mencionados acima, o único requerimento sendo que a progênie exiba a(s) mesmas(s) característica(s) genotípica(s) e/ou fenotípica(s) que aquelas produzidas pelo ancestral nos métodos de acordo com a invenção.
A invenção também inclui células hospedeiras contendo um 5 ácido nucleico isolado codificando um polipeptídeo associado a CRC como definido acima. Células hospedeiras preferidas de acordo com a invenção são células vegetais. Plantas hospedeiras para os ácidos nucleicos ou o vetor usado no método de acordo com a invenção, a gaveta de expressão ou construção ou vetor são, em princípio, vantajosamente todas as plantas, que 10 são capazes de sintetizar os polipeptídeos usados no método inventivo.
Os métodos da invenção são vantajosamente aplicáveis a qualquer planta. Plantas que são particularmente úteis nos métodos da invenção incluem todas as plantas que pertencem à superfamília Viridiplantae, em particular plantas monocotiledôneas e dicotiledôneas 15 incluindo forragem ou legumes de forragem, plantas ornamentais, cultivos alimentares, árvores ou arbustos. De acordo com uma forma de realização preferida da presente invenção, a planta é uma planta cultivável. Exemplos de plantas cultiváveis incluem soja, girassol, canola, alfafa, colza, algodão, tomate, batata e tabaco. Ainda preferivelmente, a planta é uma planta 20 monocotiledônea. Exemplos de plantas monocotiledôneas incluem cana-de- açúcar. Mais preferivelmente a planta é um cereal. Exemplos de cereais incluem arroz, milho, trigo, cevada, milheto, centeio, triticale, sorgo e aveia.
A invenção também se estende a partes aptas para corte de uma planta tal como, mas não limitado a sementes, folhas, frutos, flores, 25 caules, raízes, rizomas, tubérculos e bulbo. A invenção, além disso, se refere a produtos derivados, preferivelmente diretamente derivados, de uma parte apta para corte de uma tal planta, tal como péletes ou pós secos, óleo, gordura e ácidos graxos, amido ou proteínas.
De acordo com uma característica preferida da invenção, a expressão modulada é expressão aumentada. Métodos para aumentar expressão de ácidos nucleicos ou genes, ou produtos gênicos, são bem documentados na arte e exemplos são fornecidos na seção de definições.
Como mencionado acima, um método preferido para modular 5 expressão de um ácido nucleico codificando um polipeptídeo associado a CRC é introduzir e expressar em uma planta um ácido nucleico codificando um polipeptídeo associado a CRC; entretanto os efeitos de realizar o método, i.e. melhorar características de rendimento também pode ser atingido usando outras técnicas bem conhecidas, incluindo mas não limitado a identificação 10 por ativação de T-DNA, TILLING, recombinação homóloga. Uma descrição de algumas destas técnicas é fornecida na seção de definições.
A presente invenção também abrange uso de ácidos nucleicos codificando polipeptídeos associados a CRC como descrito neste lugar e uso destes polipeptídeos associados a CRC para melhorar qualquer das características de rendimento mencionadas acima em plantas.
Ácidos nucleicos codificando polipeptídeo associado a CRC descritos neste lugar, ou os próprios polipeptídeos associados a CRC, podem encontrar uso em programas de melhoramento nos quais é identificado um marcador de DNA que pode ser geneticamente ligado a um gene codificando 20 polipeptídeo associado a CRC. Os ácidos nucleicos/genes, ou os próprios polipeptídeos associados a CRC podem ser usados para definir um marcador molecular. Este marcador de DNA ou proteína pode então ser usado em programas de melhoramento para selecionar plantas tendo características de rendimento melhoradas como definido acima nos métodos da invenção.
Variantes alélicas de um ácido nucleico/gene codificando
polipeptídeo associado a CRC também podem encontrar uso em programas de melhoramento auxiliados por marcador. Tais programas de melhoramento algumas vezes requerem introdução de variação alélica por tratamento mutagênico das plantas, usando por exemplo mutagênese EMS; alternativamente, o programa pode começar com uma coleção de variantes alélicas de assim chamada origem “natural” causadas não intencionalmente. Identificação de variantes alélicas então ocorre, por exemplo, por PCR. Isto é seguido por uma etapa para seleção de variantes alélicas superiores da 5 seqüência em questão e que geram rendimento aumentado. Seleção tipicamente é realizada monitorando desempenho de crescimento de plantas contendo diferentes variantes alélicas da seqüência em questão. Desempenho de crescimento pode ser monitorado em uma casa de vegetação ou no campo. Etapas opcionais adicionais incluem cruzar plantas nas quais a variante alélica 10 superior foi identificada com outra planta. Isto pode ser usado, por exemplo, para fazer uma combinação de características fenotípicas interessantes.
r
Acidos nucleicos codificando polipeptídeos associados a CRC também podem ser usados como sondas para mapear geneticamente e fisicamente os genes dos quais eles são uma parte de, e como marcadores para 15 características ligadas a tais genes. Tal informação pode ser útil em melhoramento vegetal a fim de desenvolver linhagens com fenótipos desejados. Tal uso de ácidos nucleicos codificando polipeptídeo associado a CRC requer apenas uma seqüência de ácido nucleico de pelo menos 15 nucleotídeos de comprimento. Os ácidos nucleicos codificando polipeptídeo 20 associado a CRC podem ser usados como marcadores de polimorfismo de comprimento de fragmento de restrição (RFLP). Southern blots (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de DNA genômico vegetal digerido por restrição podem ser sondados com os ácidos nucleicos codificando POI. Os padrões de bandeamento resultantes 25 podem ser então sujeitos a análises genéticas usando programas computacionais tal como MapMaker (Lander et al. (1987) Genomics 1: 174- 181) a fim de construir um mapa genético. Em adição, os ácidos nucleicos podem ser usados para sondar Southern blots contendo DNAs genômicos tratados com endonuclease de restrição de um conjunto de indivíduos representando ancestral e progênie de um cruzamento genético definido. Segregação dos polimorfismos de DNA é observada e usada para calcular a posição do ácido nucleico codificando polipeptídeo associado a CRC no mapa genético previamente obtido usando esta população (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).
O rendimento e uso de sondas derivadas de genes vegetais para uso em mapeamento genético é descrita em Bematzky and Tanksley (1986) Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevem mapeamento genético de clones específicos de cDNA usando a metodologia descrita acima ou variações desta. Por exemplo, populações de intercruzamento de F2, populações endocruzadas, populações cruzadas aleatoriamente, linhagens quase isogênicas, e outros conjuntos de indivíduos podem ser usados para mapeamento. Tais metodologias são bem conhecidas por aqueles versados na arte.
As sondas de ácido nucleico também podem ser usadas para mapeamento físico (i.e., alocação de seqüências em mapas físicos; veja Hoheisel et al. In: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346, e referências citadas neste).
Em outra forma de realização, as sondas de ácido nucleico podem ser usadas em mapeamento direto por hibridização in situ por fluorescência (FISH) (Trask (1991) Trends Genet. 7:149-154). Embora métodos atuais de mapeamento por FISH favoreçam uso de clones grandes (diversos kb a diversas centenas de kb; veja Laan et al. (1995) Genome Res. 5:13-20), melhoras em sensibilidade podem permitir desempenho de mapeamento por FISH usando sondas menores.
Diversos métodos baseados em amplificação de ácidos nucleicos para mapeamento genético e físico podem ser realizados usando os ácidos nucleicos. Exemplos incluem amplificação alelo específica (Kazazian (1989) J. Lab. Clin. Med 11:95-96), polimorfismo de fragmentos amplificados por PCR (CAPS; Sheffield et al. (1993) Genomics 16:325-332), ligação alelo específica (Landegren et al. (1988) Science 241:1077-1080), reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acid Res. 18:3671), Mapeamento de Híbrido de Radiação (Walter et al. (1997) Nat.
Genet. 7:22-28) e Mapeamento Apropriado (Dear and Cook (1989) Nucleic Acid Res. 17:6795-6807). Para estes métodos, a seqüência de um ácido nucleico é usada para conceber e produzir pares de iniciadores para uso na reação de amplificação ou em reações de extensão de iniciador. A concepção de tais iniciadores é bem conhecida por aqueles versados na arte. Em métodos 10 empregando mapeamento genético baseado em PCR, pode ser necessário identificar diferenças de seqüências de DNA entre os ancestrais do cruzamento de mapeamento na região correspondendo à atual seqüência de ácido nucleico. Isto, entretanto, geralmente não é necessário para métodos de mapeamento.
Os métodos de acordo com a presente invenção resultam em
plantas tendo características de rendimento melhoradas, como descrito acima. Estas características também podem ser combinadas com outras características economicamente vantajosas, tal como características acentuadoras de rendimento adicionais, tolerância a outros estresses abióticos 20 e bióticos, características modificando várias características de arquitetura e/ou características bioquímicas e/ou fisiológicas.
Descrição de fisuras
A presente invenção será agora descrita com referência às figuras seguintes nas quais:
Fig. 1 mostra a estrutura de domínio da proteína relacionada a
CRC representada por SEQ ID NO: 2: em negrito o domínio de dedo de zinco caracterizado pelo fato de que os resíduos de Cys conservados são sublinhados, o domínio de hélice-alça-hélice em itálico e sublinhado, e domínio rico em Ser/Pro localizado entre estas duas regiões. Fig. 2 mostra um alinhamento múltiplo de proteínas relacionadas a CRC. Os asteriscos indicam aminoácidos idênticos, dois pontos indicam substituições altamente conservadas e os pontos indicam substituições menos conservadas.
Fig. 3 mostra o vetor binário para expressão aumentada em Oryza sativa de um ácido nucleico codificando proteína relacionada a CRC de Arabidopsis thaliana sob o controle de um promotor GOS2 (SEQ ID NO: 52 ou SEQ ID NO: 56).
Fig. 4 detalha exemplos de seqüências úteis para realizar os métodos de acordo com a presente invenção.
Exemplos
A presente invenção será agora descrita com referência aos exemplos seguintes, que são como forma de ilustração apenas. Os exemplos seguintes não são pretendidos para definir completamente ou de outra maneira limitar o escopo da invenção.
Manipulação de DNA: a menos que de outra forma determinado, técnicas de DNA recombinante são realizadas de acordo com protocolos padrão descrito em (Sambrook (2001) Molecular Cloning: a laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York) ou em Volumes 1 e 2 de Ausubel et al. (1994), Current Protocols in Molecular Biology, Current Protocols. Materiais e métodos padrão para trabalho molecular com plantas são descritos em Plant Molecular Biology Labfax (1993) por R.D.D. Croy, publicado por BIOS Scientific Publications Ltd (UK) e Blackwell Scientific Publications (UK).
Exemplo 1: Identificação de seqüências relacionadas à seqüência de ácido nucleico usada nos métodos da invenção
Seqüências (cDNA de comprimento completo, ESTs ou genômicas) relacionadas a SEQ ID NO: 1 e/ou seqüências de proteínas relacionadas a SEQ ID NO: 2 foram identificadas entre aquelas mantidas no banco de dados Entrez Nucleotides no National Center for Biotechnology Information (NCBI) usando ferramentas de busca de seqüência de banco de dados, tal como a Ferramenta Básica de Alinhamento Local (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215:403-410; and Altschul et al. (1997) Nucleic Acids Res. 25:3389-3402). O programa é usado para encontrar regiões de similaridade local entre seqüências comparando seqüências de ácidos nucleicos ou polipeptídeos com banco de dados de seqüências e calculando a significância estatística de pareamentos. O polipeptídeo codificado por SEQ ID NO: 1 foi usado para o algoritmo TBLASTN, com configurações padrão e o filtro para ignorar acionamento de seqüências de baixa complexidade. O resultado da análise foi visto por comparação pareada, e ranqueado de acordo com o escore de probabilidade (valor E), onde o escore reflete a probabilidade de que um alinhamento particular ocorra ao acaso (quanto menor o valor E, mais significante o acerto). Em adição a valores E, comparações também foram pontuadas por identidade percentual. Identidade percentual se refere ao número de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüências de ácidos nucleicos (ou polipeptídeos) comparadas ao longo de um comprimento particular. Em algumas instâncias, os parâmetros padrão podem ser ajustados para modificar a estringência da busca.
Em adição às publicamente disponíveis seqüências de ácidos nucleicos disponíveis em NCBI, bancos de dados privados de seqüências também foram procurados seguindo o mesmo procedimento como descrito neste lugar acima.
Tabela A fomece uma lista de seqüências de ácidos nucleicos e de proteínas relacionadas à seqüência de ácido nucleico como representada por SEQ ID NO: 1 e à seqüência de proteína representada por SEQ ID NO: 2. Tabela A: Seqüências de ácidos nucleicos relacionadas à seqüência de ácido nucleico (SEQ ID NO: 1) úteis nos métodos da presente invenção, e os
polipeptídeos deduzidos correspondentes.
Nome Organismo Aeido Polipeptídeo Número de Estado fonte nucleico SEQ ID NO: acesso de SEQ ID NO: banco de dados AtCRC- Arabidopsis 1 2 NM_105585 Comprimento related-1 thaliana completo AmtCRC- Amborella 3 4 AJ877257 Comprimento related trichopoda completo AmCRC- Antirrhinum 5 6 AJ559642 Comprimento re lated-1 majus completo AfCRC- Aquilegia 7 8 AY854797 Comprimento related formosa completo CfCRC- Capparis 9 10 AY854798 Comprimento re lated flexuosa completo CsCRC- Citrus sinensis 11 12 CN185168 Comprimento related completo ClsCRC- Cleome 13 14 AY854803 Comprimento related sparsifolia completo GhCRC- Gossypium 15 16 AY854804 Comprimento related-1 hirsutum completo GhCRC- Gossypium 17 18 AY854805 Comprimento related-2 hirsutum completo HcCRC- Hedyotis 19 20 CB088054 Comprimento related centranthoides completo AtCRC- Arabidopsis 21 22 AF195047 Comprimento related-2 thaliana completo LaCRC- Lepidium 23 24 AY854802 Comprimento related africanum completo SlCRC- Solanum 25 26 AI771643 Comprimento related-1 lycopersicum completo SlCRC- Solanum 27 28 AI483816 Comprimento related2 lycopersicum completo NtCRC- Nicotiana 29 30 AY854799 Comprimento related-1 tabacum completo NtCRC- Nicotiana 31 32 AY854800 Comprimento related2 tabacum completo AmCRC- Antirrhinum 33 34 AY451400 Comprimento related-2 majus completo NaCRC- Nymphaea alba 35 36 AB092980 Comprimento re lated completo OsCRC- Oryza sativa 37 38 AB106553 Comprimento related completo PhCRC- Petunia x 39 40 AY854801 Comprimento re lated hybrida completo TaCRC- Triticum 41 42 AF545436 Comprimento related aestivum completo ZmCRC- Zea mays 43 44 AY104291 Comprimento related completo Em algumas instâncias, seqüências relacionadas foram experimentalmente relacionadas e descritas publicamente por instituições de pesquisa, tal como The Institute for Genomic Research (TIGR). O banco de dados Eukaryotic Gene Orthologs (EGO) pode ser usado para identificar tais seqüências relacionadas, ou por busca de palavra-chave ou usando o 5 algoritmo BLAST com a seqüência de ácido nucleico ou polipeptídeo de interesse.
Exemplo 2: Alinhamento de seqüências de polipeptídeo associado a CRC
AlignX do Vetor NTI (Invitrogen) é baseado no algoritmo 10 popular Clustal de alinhamento progressivo (Thompson et al. (1997) Nucleic Acids Res 25:4876-4882; Chenna et al. (2003). Nucleic Acids Res 31:3497- 3500). Uma árvore filogenética pode ser construída usando um algoritmo de agrupamento de vizinhos. Valores padrão são para a penalidade de abertura de lacuna de 10, para a penalidade de extensão de lacuna de 0,1 e a matriz de 15 peso selecionada é Blosum 62 (se polipeptídeos estão alinhados). Edição manual secundária pode ser feita para aperfeiçoar o alinhamento.
O resultado do alinhamento múltiplo de seqüências usando polipeptídeos relevantes para identificar aquelas úteis para realizar os métodos da invenção é mostrado em Figura 2. O dedo de zinco Cys2Cys2 e o domínio de hélice-alça-hélice como indicados em figura 1 são prontamente reconhecíveis devido à conservação de seqüência.
Exemplo 3: Cálculo de identidade percentual global entre seqüências de polipeptídeos úteis para realizar os métodos da invenção
Porcentagens globais de similaridade e identidade entre 25 seqüências de polipeptídeos de comprimento completo úteis para realizar os métodos da invenção foram determinadas usando um dos métodos disponíveis na arte, o aplicativo computacional MatGAT (Ferramenta de Alinhamento Global de Matriz) (BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences. Campanella JJ, Bitincka L, Smalley J; software hosted by Ledion Bitincka). Aplicativo computacional MatGAT gera matrizes de similaridade/identidade para seqüências de DNA ou proteína sem precisar de pré-alinhamento dos dados. O programa realiza uma série de alinhamentos pareados usando o 5 algoritmo de alinhamento global de Myers e Miller (com uma penalidade de abertura de lacuna de 12, e uma penalidade de extensão de lacuna de 2), calcula similaridade e identidade usando por exemplo Blosum 62 (para polipeptídeos), e então coloca os resultados em uma matriz de distância. Similaridade de seqüências é mostrada na metade de baixo da linha divisora e 10 identidade de seqüência é mostrada na metade de cima da linha divisora diagonal.
Parâmetros usados na comparação foram:
Matriz de pontuação: Blosum62 Primeira lacuna: 12 Lacuna de extensão: 2
Resultados da análise de aplicativo computacional são mostrados em Tabela B para a similaridade e identidade global no comprimento completo das seqüências de polipeptídeos (excluindo as seqüências de polipeptídeos parciais). Identidade percentual é dada acima da diagonal e similaridade percentual é dada abaixo da diagonal.
A identidade percentual entre as seqüências de polipeptídeos úteis para realizar os métodos da invenção pode ser tão baixa quanto 28 % de identidade de aminoácidos comparada com SEQ ID NO: 2. Entretanto, quando identidades entre domínios específicos são comparadas (tal como o domínio YABBY), então estas porcentagens podem se tomar maiores. Tabela B: Resultados de MatGAT para similaridade e identidade global no comprimento completo das seqüências de Dolipeptídeos.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 1. SEQID02 46,9 60,2 58,6 72,7 63,6 80,9 58,7 59,7 57,2 30,3 84,7 56,6 58,2 60,8 59,5 28,4 33,5 46,4 63r0 44,8 42,2 2. SEQID04 64,3 52,0 51,3 50,9 53,1 47,6 53,3 53,3 48,6 35,7 45,2 50,3 50,3 48,2 48,2 31,9 37,9 52,5 52,8 47,1 48,8 3. SEQID06 77,9 63,3 66,1 68,8 72,7 62,0 76,0 73,7 69,3 30,7 57,8 77,1 77,7 70,3 70,8 30,8 35,3 54,0 80,0 52,0 51,9 4. SEQID08 74,6 67,3 77,0 64,6 62,5 60,9 64,8 64,4 55,7 29,0 57,1 64,0 64,0 58,9 58,9 30,0 34,9 51,8 66,9 50,0 49,5 5. SEQID10 82,8 67,3 79,6 78,0 73,3 77,5 74,2 75,5 66,5 32,0 67,5 65,1 65,6 66,5 65,7 33,2 36,7 50,9 69,9 50,0 48,4 6. SEQID12 77,3 64,8 80,1 78,2 81,2 61,3 74,6 72,4 71,1 31,6 59,7 69,2 70,3 69,7 69,7 29,8 39,2 52,9 71,9 46,9 49,8 7. SEQID14 88,6 62,8 76,8 73,0 86,0 75,1 64,3 64,7 58,3 31,8 73,3 57,8 59,5 59,7 57,7 29,2 34,4 44,3 62,4 45,3 42,9 8. SEQID16 73,5 63,3 84,3 78,2 79,6 81,9 74,1 94,7 66,7 32,5 56,0 69,2 71,6 66,5 67,0 28,5 37,1 55,0 76,9 51,5 51,4 9. SEQID18 74,6 63,8 81,8 78,7 82,3 81,9 76,2 95,3 65,5 33,8 57,1 67,6 68,8 65,1 65,6 30,2 37,6 54,0 74,0 51,0 52,4 10. SEQID20 72,6 66,8 76,8 73,7 79,5 75,3 73,2 73,7 72,1 31,4 56,3 67,0 69,6 75,0 74,4 29,4 36,4 50,9 71,4 48,4 47,4 11. SEQID22 47,2 50,2 45,9 44,2 48,9 45,0 48,1 44,2 44,6 47,2 31,2 27,7 29,0 29,3 29,3 42,5 44,2 33,5 32,0 30,6 34,0 12. SEQID24 93,1 61,2 73,4 72,3 78,7 71,8 84,0 71,3 71,3 71,6 50,2 53,4 56,6 58,5 57,4 30,0 36,1 48,3 61,3 44,3 42,9 13. SEQID26 67,4 62,8 83,6 75,9 73,7 75,4 68,6 78,9 77,1 72,6 39,4 64,4 95,6 68,1 68,1 29,0 34,8 52,6 77,3 48,8 48,8 14. SEQID28 69,6 63,8 86,7 77,0 76,3 78,9 71,4 82,5 80,6 75,8 40,7 67,6 95,6 69,2 69,2 29,4 36,1 53,1 79,1 48,8 49,3 15. SEQID30 75,7 62,2 80,7 78,5 81,2 77,3 75,7 77,3 76,2 84,2 46,3 73,4 76,8 79,0 98,3 27,7 34,1 46,5 81,0 46,2 44,9 16. SEQID32 73,5 62,2 80,7 78,5 78,5 77,3 74,6 77,3 76,2 83,2 45,5 71,8 76,8 79,0 99,4 28,6 34,1 46,5 82,1 46,2 44,9 17. SEQID34 41,3 46,8 44,3 45,1 47,2 41,7 46,8 39,1 40,9 42,1 63,4 43,0 40,4 41,3 40,4 42,6 40,3 30,4 31,2 28,3 28,0 18. SEQID36 51,0 55,4 49,5 53,5 51,5 55,0 51,5 50,0 51,0 51,0 60,6 53,0 46,0 48,0 51,5 51,5 56,6 35,7 38,0 35,0 34,9 19. SEOID38 63,9 69,9 65,5 63,9 67,5 62,9 59,8 65,5 64,9 64,9 46,8 63,4 61,9 62,4 61,3 61,3 43,4 54,5 54,1 86,6 82,4 20. SEQID40 73,5 63,8 90,3 80,5 78,0 78,4 74,1 84,9 81,2 76,3 44,2 71,3 85,8 88,3 85,6 86,2 42,6 50,0 63,4 51,3 49,5 21. SEQID42 62,3 65,8 61,8 61,8 67,8 59,3 60,3 61,8 61,8 62,8 45,5 60,8 57,8 59,3 63,3 63,3 46,0 56,4 91,0 63,3 77,4 22. SEQID44 60,0 68,3 63,9 61,5 63,9 61,0 58,0 61,0 61,5 62,9 47,2 60,0 58,0 59,5 59,5 59,5 44,3 55,6 86,8 59,5 85,9 Exemplo 4: Identificação de domínios compreendidos em seqüências de polipeptídeos úteis para realizar os métodos da invenção
O banco de dados Integrated Resource of Protein Families, Domains and Sites (InterPro) é uma interface integrada para os bancos de dados de assinatura comumente usados para buscas baseadas em texto e seqüência. O banco de dados InterPro combina estes bancos de dados, que usam diferentes metodologias e graus variados de informação biológica sobre proteínas bem caracterizadas para derivar assinaturas de proteínas. Bancos de dados colaboradores incluem SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom e Pfam, Smart e TIGRFAMs. Pfam é uma grande coleção de alinhamentos múltiplos de seqüências e modelos ocultos de Markov cobrindo muitos domínios e famílias comuns de proteínas. Pfam está hospedado no servidor do Sanger Institute no Reino Unido. Interpro está hospedado no European Bioinformatics Institute no Reino Unido.
Os resultados da varredura de InterPro da seqüência de polipeptídeo como representada por SEQ ID NO: 2 são apresentados em Tabela C.
Tabela C: Resultados de varredura de InterPro da seqüência de polipeptídeo como representada SEQ ID NO: 2
Banco de dados Número de acesso Nome de acesso Pfam PF04690 YABBY SUPERF AMILY SSF47095 HMG-box SUPERF AMILY SSF57850 RING/U-box Exemplo 5: Previsão de topologia das seqüências de polipeptídeos úteis para realizar os métodos da invenção
TargetP 1.1 prevê a localização subcelular de proteínas eucarióticas. A designação de localização é baseada na presença prevista de qualquer das pré-seqüências N-terminais: peptídeo de trânsito de cloroplasto (cTP), peptídeo de direcionamento mitocondrial (mTP) ou peptídeo sinal de via secretora (SP). Escores nos quais a previsão final está baseada não são probabilidades realmente, e eles não necessariamente acrescentam uma. Entretanto, a localização com o maior escore é a mais provável de acordo com TargetP, e a relação entre os escores (a classe de confiança) pode ser uma indicação de quão certa é a previsão. A classe de confiança (RC) varia de 1 a 5, onde 1 indica a previsão mais forte. TargetP é mantido no servidor da TechnicalUniversityofDenmark.
Para as seqüências previstas conterem uma pré-seqüência N- terminal um sítio de clivagem potencial também pode ser previsto.
Diversos parâmetros foram selecionados, tal como grupo de organismo (não vegetal ou vegetal), conjuntos de atalhos (nenhum, conjunto IO pré-definido de atalhos, ou conjunto de atalhos especificado por usuário), e o cálculo de previsão de sítios de clivagem (sim ou não).
Os resultados de análise TargetP 1.1 da seqüência de polipeptídeo como representada por SEQ ID NO: 2 são apresentados em Tabela D. O grupo de organismo “vegetal” foi selecionado, nenhum atalho 15 definido, e o comprimento previsto do peptídeo de trânsito requisitado. Não existe previsão clara da localização subcelular, apenas uma fraca previsão para uma localização mitocondriana. Proteínas relacionadas a CRC portanto estão localizadas provavelmente no núcleo ou citoplasma.
Tabela D: Análise TargetP 1.1 não existe previsão clara da localização subcelular, apenas uma fraca previsão para uma localização mitocondriana SEQ ID NO: 2
Comprimento (AA) 181 Peptídeo de trânsito cloroplástico 0,035 Peptídeo de trânsito mitocondriano 0,186 Peptídeo sinal de via secretora 0,010 Outro direcionamento subcelular 0,882 Localização Prevista / Classe de confiança 2 Comprimento previsto de peptídeo de / trânsito Muitos outros algoritmos podem ser usados para realizar tais análises, incluindo:
• ChloroP 1.1 hospedado no servidor da Technical University of Denmark;
• Protein Prowler Subcellular Loealisation Predietor versão 1.2 hospedado no servidor do Institute for Molecular Bioscience, University of Queensland, Brisbane, Austrália;
· PENCE Proteome Analyst PA-GOSUB 2.5 hospedado no
servidor da University of Alberta, Edmonton, Alberta, Canadá;
Exemplo 6: Ensaio funcional para o polipeptídeo associado a
CRC
A seqüência de polipeptídeo como representada por SEQ ID 10 NO: 2 pode interagir com ácidos nucleicos assim como com proteínas, em virtude da presença dos domínios de dedo de Zinco. Ensaios de ligação de DNA são bem conhecidos na arte, incluindo seleção de sítio de ligação DNA auxiliada por PCR e um ensaio de mobilidade em gel de ligação de DNA; para uma referência geral, veja Current Protocols in Molecular Biology, 15 Volumes 1 and 2, Ausubel et al. (1994), Current Protocols.
A proteína representada por SEQ ID NO: 2 é prevista interagir com outras proteínas (resultados de análise com o banco de dados SMART), como mostrado em Tabela E. A funcionalidade de uma proteína relacionada a CRC pode ser assim testada em uma triagem de dois híbridos de levedura 20 com proteínas ligantes candidatas. Ensaios de dois híbridos são conhecidos na arte (Fields and Song, Nature, 340: 245-246, 1989).
Tabela E: Interactores putativos de SEQ ID NO: 2 em Arabidopsis thaliana
Descrição Identificador actina 11 At3gl2110 AFO At2g45190 Exemplo 7: Clonagem da seqüência de ácido nucleico usada nos métodos da invenção O gene relacionado a CRC de Arabidopsis thaliana foi
amplificado por PCR usando como modelo uma biblioteca de cDNA de plântulas de Arabidopsis thaliana (Invitrogen, Paisley, UK). Iniciadores prm9238 (SEQ ID NO: 53; sentido, códon de início em negrito, sítio AttBl em itálico: 5,-ggggacaagtttgtacaaaaaagcaggcttaaacaa.t.gaac ctagaagagaaacca- 3’) e prm9239 (SEQ ID NO: 54; sentido, códon de início em negrito, sítio AttBl em itálico: S^ggggaccactttgtaca agaaagetgggtttatttttaqqcttcttttcc-y), que incluem os sítios AttB para recombinação Gateway, foram usados para amplificação por PCR. PCR foi realizado usando Hifi Taq DNA polimerase em condições padrão. Um fragmento de PCR de 644 bp (incluindo sítios attB) foi amplificado e purificado também usando métodos padrão. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada, durante a qual o fragmento de PCR se recombina in vivo com o plasmídeo pDONR201 para produzir, de acordo com a terminologia Gateway, um “clone de entrada”, pCRCr. Plasmídeo pDONR201 foi adquirido a partir de Invitrogen, como parte da tecnologia Gateway®.
O clone de entrada foi subseqüentemente usado em uma reação LR com pGOS2, um vetor de destinação usado para transformação de Oryza sativa. Este vetor contém como elementos funcionais dentro dos limites de T-DNA: um marcador selecionável vegetal; uma gaveta de expressão de marcador triável; e uma gaveta Gateway pretendida para recombinação in vivo LR com a seqüência de ácido nucleico de interesse já clonada no clone de entrada. Um promotor GOS2 de arroz (SEQ ID NO: 52 ou como na gaveta de expressão SEQ ID NO: 55) para expressão constitutiva foi localizado antes desta gaveta Gateway.
Depois da etapa de recombinação LR, o vetor de expressão resultante pGOS2::CRCr (Figura 3) foi transformado em linhagem LBA4044 de Agrobacterium de acordo com métodos bem conhecidos na arte.
Exemplo 8: Transformação vegetal
Transformação de arroz
A Agrobacterium contendo o vetor de expressão foi usada para transformar plantas de Oryza sativa. Sementes maduras secas da cultivar japonesa de arroz Nipponbare foram descascadas. Esterilização foi realizada incubando por um minuto em etanol a 70%, seguido por 30 minutos em 0,2% de HgCl2, seguido por uma lavagem de 15 minutos por 6 vezes com água 5 destilada estéril. As sementes estéreis foram então germinadas em um meio contendo 2,4-D (meio de indução de calo). Depois de incubação no escuro por quatro semanas, calos embriogênicos derivados de escutelo foram excisados e propagados no mesmo meio. Depois de duas semanas, os calos foram multiplicados ou propagados por subcultura no mesmo meio por outras 2 10 semanas. Pedaços de calo embriogênico foram sub-cultivados em meio fresco 3 dias antes de co-cultivo (para estimular atividade de divisão celular).
Linhagem LBA4404 de Agrobacterium contendo o vetor de expressão foi usada para co-cultivo. Agrobaeterium foi inoculada em meio AB com os antibióticos apropriados e cultivada por 3 dias a 28°C. As 15 bactérias foram então coletadas e suspensas em meio de co-cultivo líquido para uma densidade (OD6oo) de cerca de 1. A suspensão foi então transferida para uma placa de Petri e os calos imersos na suspensão por 15 minutos. Os tecidos de calos foram então secados em um papel filtro e transferidos para um meio de co-cultivo solidificado e incubados por 3 dias no escuro a 25°C. 20 Calos co-cultivados foram cultivados em meio contendo 2,4-D por 4 semanas no escuro a 28°C na presença de um agente de seleção. Durante este período, ilhas de calos resistentes que crescem rapidamente se desenvolveram. Depois de transferência deste material para um meio de regeneração e incubação na luz, o potencial embriogênico foi liberado e partes aéreas se desenvolveram 25 nas próximas quatro a cinco semanas. Partes aéreas foram excisadas dos calos e incubadas por 2 a 3 semanas em um meio contendo auxina a partir do qual elas foram transferidas para o solo. Partes aéreas endurecidas foram cultivadas em alta umidade e dias curtos em uma casa de vegetação.
Aproximadamente 35 transformantes TO de arroz independentes foram gerados para uma construção. Os transformantes primários foram transferidos de uma câmara de cultura de tecido para uma casa de vegetação. Depois de uma análise de PCR quantitativo para verificar número de cópias do inserto de T-DNA, apenas plantas transgênicas de cópia 5 única que exibem tolerância ao agente de seleção foram mantidas para colheita de semente Tl. Sementes foram então coletadas três a cinco meses depois de transplante. O método produziu transformantes de locus único em uma taxa de até 50 % (Aldemita and Hodges 1996, Chan et al. 1993, Hiei et al. 1994).
Transformação de milho
Transformação de milho (Zea mays) é realizada com uma modificação do método descrito por Ishida et al. (1996) Nature Biotech 14(6): 745-50. Transformação é dependente de genótipo em milho e apenas genótipos específicos são receptivos para transformação e regeneração. A
linhagem natural Al88 (University of Minnesota) ou híbridos com Al88 como um ancestral são boas fontes de material doador para transformação, mas outros genótipos também podem ser usados com sucesso. Espigas são coletadas de planta de milho aproximadamente 11 dias depois de polinização (DAP) quando o comprimento do embrião imaturo é de cerca de 1 a 1,2 mm.
Embriões imaturos são co-cultivados com Agrobaeterium tumefaeiens contendo o vetor de expressão, e plantas transgênicas são recuperadas através de organogênese. Embriões excisados são cultivados em meio de indução de calo, então meio de regeneração de milho, contendo o agente de seleção (por exemplo imidazolinona mas vários marcadores de seleção podem ser usados).
As placas de Petri são incubadas na luz a 25 0C por 2-3 semanas, ou até que partes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cada embrião para meio de enraizamento de milho e incubadas a 25 0C por 2-3 semanas, até que raízes se desenvolvam. As partes aéreas com raiz são transplantadas para solo na casa de vegetação. Sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma única cópia do inserto de T-DNA.
Transformação de trigo
Transformação de trigo é realizada com o método descrito por 5 Ishida et al. (1996) Nature Biotech 14(6): 745-50. A cultivar Bobwhite (disponível a partir de CIMMYT, México) é comumente usada em transformação. Embriões imaturos são co-cultivados com Agrobaeterium tumefaeiens contendo o vetor de expressão, e plantas transgênicas são recuperadas através de organogênese. Depois de incubação com 10 Agrobaeterium, os embriões são cultivados in vitro em meio de indução de calo, então meio de regeneração, contendo o agente de seleção (por exemplo imidazolinona mas vários marcadores de seleção podem ser usados). As placas de Petri são incubadas na luz a 25 0C por 2-3 semanas, ou até que partes aéreas se desenvolvam. As partes aéreas verdes são transferidas de cada 15 embrião para meio de enraizamento e incubadas a 25 0C por 2-3 semanas, até que raízes se desenvolvam. As partes aéreas com raiz são transplantadas para solo na casa de vegetação. Sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma única cópia do inserto de T-DNA.
Transformação de soja
Soja é transformada de acordo com uma modificação do método descrito na Patente U.S. de Texas A&M 5.164.310. Diversas variedades comerciais de soja são receptivas para transformação por este método. A cultivar Jack (disponível a partir da Illinois Seed foundation) é 25 comumente usada para transformação. Sementes de soja são esterilizadas para semeadura in vitro. O hipocótilo, a radícula e um cotilédone são excisados a partir de plântulas jovens de sete dias de idade. O epicótilo e o cotilédone remanescente são adicionalmente cultivados para desenvolver nós axilares. Estes nós axilares são excisados e incubados com Agrobaeterium tumefaeiens contendo o vetor de expressão. Depois do tratamento de co-cultivo, os explantes são lavados e transferidos para meio de seleção. Partes aéreas regeneradas são excisadas e colocadas em um meio de prolongamento de parte aérea. Partes aéreas de não mais do que 1 cm são colocadas em meio de 5 enraizamento até que raízes se desenvolvam. As partes aéreas com raiz são transplantadas para solo na casa de vegetação. Sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma única cópia do inserto de T-DNA.
Transformação de colza/canola Pecíolos cotiledonares e hipocótilos de plântulas jovens de 5-6
dias de idade são usados como explantes para cultura de tecido e transformados de acordo com Babic et al. (1998, Plant Cell Rep 17: 183-188). A cultivar comercial Westar (Agriculture Canada) é a variedade padrão usada para transformação, mas outras variedades também podem ser usadas. 15 Sementes de canola são esterilizadas em superfície para semeadura in vitro. Os explantes de pecíolo de cotilédone com o cotilédone acoplado são excisados das plântulas in vitro, e inoculados com Agrobaeterium (contendo o vetor de expressão) banhando a extremidade de corte do explante de pecíolo na suspensão bacteriana. Os explantes são então cultivados por 2 dias em 20 meio MSBAP-3 contendo 3 mg/l de BAP, 3 % de sacarose, 0,7 % de Phytagar a 23 °C, 16 hr de luz. Depois de dois dias de co-cultivo com Agrobaeterium, os explantes de pecíolo são transferidos para meio MSBAP-3 contendo 3 mg/l de BAP, cefotaxima, carbenicilina, ou timentina (300 mg/l) por 7 dias, e então cultivados em meio MSBAP-3 com cefotaxima, carbenicilina, ou timentina e 25 agente de seleção até regeneração de parte aérea. Quando as partes aéreas estão com 5-10 mm de comprimento, elas são cortadas e transferidas para meio de alongamento de parte aérea (MSBAP-0.5, contendo 0,5 mg/l de BAP). Partes aéreas de cerca de 2 cm de comprimento são transferidas para o meio de enraizamento (MSO) para indução de raiz. As partes aéreas com raiz são transplantadas para solo na casa de vegetação. Sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma única cópia do inserto de T-DNA.
Transformação de alfafa
Um clone regenerante de alfafa (Medieago sativa) é transformado usando o método de (McKersie et al., 1999 Plant Physiol 119: 839-847). Regeneração e transformação de alfafa é dependente de genótipo e portanto uma planta regenerante é requerida. Métodos para obter plantas regenerantes foram descritos. Por exemplo, estas podem ser selecionadas a partir da cultivar Rangelander (Agriculture Canada) ou qualquer outra variedade comercial de alfafa como descrito por Brown DCW e A Atanassov (1985. Plant Cell Tissue Organ Culture 4: 111-112). Alternativamente, a variedade RA3 (University of Wisconsin) foi selecionada para uso em cultura de tecido (Walker et al., 1978 Am J Bot 65:654-659). Explantes de pecíolo são co-cultivados com uma cultura noturna de Agrobaeterium tumefaeiens C58C1 pMP90 (McKersie et al., 1999 Plant Physiol 119: 839-847) ou LBA4404 contendo o vetor de expressão. Os explantes são co-cultivados por
3 d no escuro em meio de indução SH contendo 288 mg/ L de Pro, 53 mg/ L de tioprolina, 4,35 g/ L de K2S04, e 100 μτη de acetoseringona. Os explantes são lavados em meio Murashige-Skoog com meia força (Murashige and Skoog, 1962) e colocados no mesmo meio de indução SH sem acetoseringona mas com um agente de seleção adequado e antibiótico adequado para inibir crescimento de Agrobaeterium. Depois de diversas semanas, embriões somáticos são transferidos para meio de desenvolvimento BOÍ2Y não contendo nenhum regulador de crescimento, nenhum antibiótico, e 50 g/ L de sacarose. Embriões somáticos são subseqüentemente germinados em meio Murashige-Skoog com meia força. Plântulas enraizadas foram transplantadas em potes e cultivadas em uma casa de vegetação. Sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma única cópia do inserto de T-DNA. Transformação de algodão
Algodão é transformado usando Agrobaeterium tumefaeiens de acordo com o método descrito em Patente U.S. 5.159.135. Sementes de algodão são esterilizadas em superfície em solução de hipoclorito de sódio a 3% durante 20 minutos e lavadas em água destilada com 500 μg/ml de cefotaxima. As sementes são então transferidas para meio SH com 50μg/ml de benomil para germinação. Hipocótilos de plântulas de 4 a 6 dias são removidos, cortados em pedaços de 0,5 cm e são colocados em ágar 0,8%. Uma suspensão de Agrobaeterium (aprox. 108 células por ml, diluída a partir de uma cultura noturna transformada com o gene de interesse e marcadores de seleção adequados) é usada para inoculação dos explantes de hipocótilo. Depois de 3 dias em temperatura ambiente e iluminação artificial, os tecidos são transferidos para um meio sólido (1,6 g/l de Gelrite) com sais Murashige e Skoog com vitaminas B5 (Gamborg et al., Exp. Cell Res. 50:151-158 (1968)), 0,1 mg/l de 2,4-D, 0,1 mg/l de 6-fúrfurilaminopurina e 750 μg/ml de MgCL2, e com 50 a 100 μg/ml de cefotaxima e 400-500 μg/ml de carbenicilina para matar bactérias residuais. Linhagens celulares individuais são isoladas depois de dois a três meses (com subculturas a cada quatro a seis semanas) e são adicionalmente cultivadas em meio seletivo para amplificação de tecido (30°C, fotoperíodo de 16 hr). Tecidos transformados são subseqüentemente cultivados adicionalmente em meio não seletivo durante 2 a 3 meses para gerar embriões somáticos. Embriões aparentemente saudáveis de pelo menos
4 mm de comprimento são transferidos para tubos com meio SH em vermiculita fina, suplementado com 0,1 mg/l de ácido indolacético, 6 furfúrilaminopurina e ácido giberélico. Os embriões são cultivados a 30°C com um fotoperíodo de 16 hrs, e plântulas no estágio de 2 a 3 folhas são transferidas para potes com vermiculita e nutrientes. As plantas são endurecidas e subseqüentemente movidas para a casa de vegetação para cultivo adicional. Exemplo 9: Procedimento de avaliação fenotípiea
9.1 Configuração de avaliação
Aproximadamente 35 transformantes TO de arroz independentes foram gerados. Os transformantes primários foram transferidos de uma câmara de cultura de tecido para uma casa de vegetação para cultivo e colheita de semente Tl. Seis eventos, dos quais a progênie Tl segregou 3:1 para presença/ausência do transgene, foram mantidos. Para cada um destes eventos, aproximadamente 10 plântulas Tl contendo o transgene (hetero e homozigotas) e aproximadamente 10 plântulas Tl carecendo do transgene (nulizigotos) foram selecionadas monitorando expressão de marcador visual. As plantas transgênicas e os nulizigotos correspondentes foram cultivados lado a lado em posições aleatórias. Condições de casa de vegetação foram de dias curtos (12 horas de luz), 28°C no claro e 22°C no escuro, e uma umidade relativa de 70%.
Quatro a seis eventos Tl foram adicionalmente avaliados na geração T2 seguindo o mesmo procedimento de avaliação que para a geração Tl mas com mais indivíduos por evento. Do estágio de semeadura até o estágio de maturidade as plantas foram passadas diversas vezes através de um gabinete de imagem digital. Em cada momento imagens digitais (2048x1536 pixels, 16 milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulos diferentes.
Triagem de seca
Plantas de sementes T2 foram cultivadas em solo de vaso em condições normais até elas terem atingido o estágio de espigamento. Elas foram então transferidas para uma seção “seca” onde irrigação foi retida. Sondas de umidade foram inseridas em potes aleatoriamente escolhidos para monitorar o teor hídrico do solo (SWC). Quando SWC ficou abaixo de certos limiares, as plantas foram automaticamente re-irrigadas continuamente até que um nível normal fosse novamente atingido. As plantas foram então re- transferidas de novo para condições normais. O resto do cultivo (maturação vegetal, coleta de sementes) foi o mesmo que para plantas não cultivadas em condições de estresse abiótico. Parâmetros de crescimento e rendimento foram registrados como detalhado para crescimento em condições normais.
Triagem de eficiência de uso de nitrogênio
Plantas de arroz de sementes T2 são cultivadas em solo de vaso em condições normais exceto para a solução de nutrientes. Os potes são irrigados de transplante até maturação com uma solução de nutrientes específica contendo teor reduzido de nitrogênio N (N), normalmente entre 7 a 8 vezes menos. O resto do cultivo (maturação vegetal, coleta de sementes) é o mesmo que para plantas não cultivadas em condições de estresse abiótico. Parâmetros de crescimento e rendimento são registrados como detalhado para crescimento em condições normais.
9.2 Análise estatística: teste F
Uma ANOVA de dois fatores (análise de variantes) foi usada como um modelo estatístico para a avaliação geral de características fenotípicas vegetais. Um teste F foi realizado em todos os parâmetros medidos de todas as plantas de todos os eventos transformadas com o gene da presente invenção. O teste F foi realizado para verificar por um efeito do gene sobre todos os eventos de transformação e para verificar por um efeito geral do gene, também conhecido como efeito gênico global. O limiar para significância para um verdadeiro efeito gênico global foi ajustado em 5% de nível de probabilidade para o teste F. Um valor significante de teste F aponta para um efeito gênico, significando que não é apenas a mera presença ou a posição do gene que está causando as diferenças em fenótipo.
Pelo fato de dois experimentos com eventos sobrepostos terem sido realizados, uma análise combinada foi realizada. Isto é útil para verificar consistência dos efeitos nos dois experimentos, e se este é o caso, para acumular evidência de ambos os experimentos a fim de aumentar confiança na conclusão. O método usado foi uma abordagem de modelo misto que leva em conta a estrutura multinível dos dados (i.e. experimento - evento - segregantes). Valores de P foram obtidas comparando teste da razão de 5 máxima verossimilhança com distribuições qui quadrado.
9.3 Parâmetros medidos
Medidas de parâmetros associados a biomassa Do estágio de semeadura até o estágio de maturidade as plantas foram passadas diversas vezes através de um gabinete de imagem digital. Em cada momento imagens digitais (2048x1536 pixels, 16 milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulos diferentes.
A parte aérea de planta (ou biomassa de folhas) foi determinada contando o número total de pixels nas imagens digitais de partes aéreas vegetais discriminadas do fundo. Foi tirada a média deste valor para as 15 fotos tiradas no mesmo momento dos diferentes ângulos e foi convertido para um valor de superfície física expresso em mm quadrados por calibração. Experimentos mostram que a parte aérea de planta medida desta maneira se correlaciona com a biomassa de partes aéreas de planta. A área aérea é a área medida no momento no qual a planta atingiu sua biomassa máxima de folhas. 20 Medidas de parâmetros associados a sementes
As panículas primárias maduras foram coletadas, contadas, ensacadas, etiquetadas com código de barras e então secas por três dias em um forno a 37°C. As panículas foram então trilhadas e todas as sementes foram coletadas e contadas. As cascas cheias foram separadas daquelas vazias 25 usando um dispositivo que sopra ar. As cascas vazias foram descartadas e a fração remanescente foi contada novamente. As cascas cheias foram pesadas em uma balança analítica. O número de grãos cheios foi determinado contando o número de cascas cheias que permaneceram depois da etapa de separação. O rendimento total de sementes foi medida pesando todas as cascas cheias coletadas de uma planta. Número total de sementes por planta foi medido contando o número de cascas coletadas de uma planta. Peso de Mil Sementes (TKW) é extrapolado a partir do número de grãos cheios contados e seu peso total. O índice de Colheita (HI) na presente invenção é definido como a proporção entre o rendimento total de sementes e a parte aérea (mm2), multiplicada por um fator IO6. O número total de flores por panícula como definido em a presente invenção é a proporção entre o número total de sementes e o número de panículas primárias maduras. A taxa de enchimento de grãos como definida na presente invenção é a proporção (expressa como uma %) do número de grãos cheios sobre o número total de sementes (ou floretes).
Exemplo 10: Resultados da avaliação fenotípica das plantas
transgênicas
Os resultados da avaliação de plantas transgênicas de arroz expressando a seqüência de ácido nucleico útil para realizar os métodos da invenção (pGOS::CRCr) são apresentados em Tabela F. A diferença percentual entre os transgênicos e os nulizigotos correspondentes também é mostrada, com um valor de P do teste F abaixo de 0,05.
Rendimento total de sementes, número de grãos cheios, taxa de enchimento de grãos e índice de colheita foram significativamente aumentados nas plantas transgênicas expressando a seqüência de ácido nucleico útil para realizar os métodos da invenção, comparadas com as plantas de controle (neste caso, os nulizigotos) (Tabela F).
Tabela F: Resultados da avaliação de plantas transgênicas de arroz expressando a seqüência de ácido nucleico útil para realizar os métodos da invenção. _
Característica % de aumento em geração Tl Rendimento total de sementes 41 Número de grãos cheios 35 Taxa de enchimento 37 índice de colheita 42 Peso de Mil Sementes 4 Seis Tl eventos foram adicionalmente testados na geração T2. Rendimento total de sementes, número de grãos cheios e índice de colheita foram significativamente aumentados nas plantas transgênicas (valor de P para a análise combinada menor do que 0,005) comparadas com as plantas de controle (Tabela G).
Tabela G: Resultados da avaliação de plantas transgênicas de arroz T2 expressando a seqüência de ácido nucleico útil para realizar os métodos da invenção.
Característica % de aumento em geração T2 Rendimento total de sementes 24 Número de grãos cheios 16 índice de colheita 6 Peso de Mil Sementes 3 Também em plantas transgênicas expressando o ácido nucleico codificando CRC sob controle do promotor HMGB1, um aumento em rendimento de sementes foi observado (em particular para Peso de Mil Sementes, aumento de 4,8 % com um valor de P abaixo de 5%)
Exemplo 11: Resultados da avaliação fenotípica das plantas transgênicas cultivadas em condições de estresse por seca severa Mediante análise das sementes como descrito acima, os
requerentes encontraram que plantas transformadas com a construção gênica pGOS2:: CRCr e cultivadas em condições de estresse por seca severa, tiveram uma maior rendimento de sementes, expressa como peso total de sementes (aumento de mais do que 5%), um número aumentado de grãos cheios (aumento de mais do que 5%), uma maior taxa de enchimento (aumento de
r
mais do que 5%) e um índice de colheita aumentado (aumento de mais do que 5%), comparadas com plantas carecendo do transgene CRC cultivadas nas mesmas condições. Estes aumentos foram significantes (valor de P < 0,0001).
Exemplo 12: Resultados da avaliação fenotípica das plantas transgênicas cultivadas em condições de estresse por limitação de nitrogênio
Plantas transformadas com a construção gênica pGOS2v.CRCr e cultivadas em condições de limitação de nitrogênio, têm uma eficiência melhorada de absorção de nutrientes (medida como maior rendimento de sementes, tal como peso total de sementes, número de grãos cheios, uma maior taxa de enchimento e/ou índice de colheita aumentado), comparadas
com plantas carecendo do transgene CRC cultivadas nas mesmas condições. I LISTAGEM DE SEOUENCIA
<110> CropDesign N.V.
<120> Plantas tendo características relacionadas ao rendimento melhoradas e um método
para fazer as mesmas.
<130> PF58575 <150> EP 06124181.6 <151> 2006-11-16 <150> US 60/866,611 <151> 2006-11-21 <150> EP 07116518.7 <151> 2007-09-14 <150> US 60/975,848 <151> 2007-09-28 <160> 60
<170> PatentIn version 3.3 <210> 1 <211> 934 <212> DNA
<213> Arabidopsis thaliana <400> 1
ataaatacaa gcctcctaac tcataaaata agcataaccc taactctaca aagttcttct gattctttct ctctctctct ttctttcaag agcggttttc aatccattcg ctaaagacca tgaacctaga agagaaacca accatgacgg cttcaagggc ttcccctcaa gccgaacatc tctactacgt ccggtgtagc atctgcaaca ccatcctcgc ggttgggata ccattgaaga gaatgcttga cacggtaacg gtgaaatgcg gccattgtgg taacctctcg tttctcacca caactcctcc tcttcaaggc catgttagcc tcacccttca gatgcagagc tttggtggaa gtgactataa gaagggaagc tcttcttctt cctcttcctc cacctccagc gaccagcccc catctccctc acctcccttt gtcgtcaaac ctcctgagaa gaagcagagg ctcccatctg catacaaccg cttcatgagg gatgagatcc aacgcatcaa aagtgccaat ccggaaatac cacaccgtga agctttcagt gctgctgcca aaaattgggc taagtacata cccaactctc ctacttccat tacttccgga ggccacaaca tgatccatgg cttgggattc ggtgagaaga agtgaacaaa actcagggga aaagaagcct aaaaataaca aacgcatgca cgtgtgcgag tggctgcgtc gtttttctca tcttgtgttg ttcttctgtg taattttctt atgtatgtca tgttgcagaa aatgatgttg ccttagtttt tatgacttta tatttctgtc tgtctttaga tttgaaagta acgtcacttg ctatgtccct ttggacgttt atgtctggtc tttatttgtc ttaatcctat caaaatttta tatgcgtatt cctt <210> 2 <211> 181 <212> PRT
<213> Arabidopsis thaliana <4 00> 2
Met Asn Leu Glu Glu Lys Pro Thr Met Thr Ala Ser Arg Ala Ser Pro 10 15
Gln Ala Glu His Leu Tyr Tyr Val Arg Cys Ser Ile Cys Asn Thr Ile 20 25 30
Leu Ala Val Gly Ile Pro Leu Lys Arg Met Leu Asp Thr Val Thr Val 35 40 45
Lys Cys Gly His Cys Gly Asn Leu Ser Phe Leu Thr Thr Thr Pro Pro 50 55 60
Leu Gln Gly His Val Ser Leu Thr Leu Gln Met Gln Ser Phe Gly Gly 65 70 75 80
Ser Asp Tyr Lys Lys Gly Ser Ser Ser Ser Ser Ser Ser Ser Thr Ser 85 90 95
Ser Asp Gln Pro Pro Ser Pro Ser Pro Pro Phe Val Val Lys Pro Pro 100 105 110
Glu Lys Lys Gln Arg Leu Pro Ser Ala Tyr Asn Arg Phe Met Arg Asp 115 120 125
Glu Ile Gln Arg Ile Lys Ser Ala Asn Pro Glu Ile Pro His Arg Glu 130 135 140
Ala Phe Ser Ala Ala Ala Lys Asn Trp Ala Lys Tyr Ile Pro Asn Ser
60
120
180
240
300
360
420
480
540
600
660
720
780
840
900
934 145 150 155
Pro Thr Ser Ile Thr Ser Gly Gly His Asn Met
165 170
Phe Gly Glu Lys Lys 180
<210> 3 <211> 828 <212> DNA
<213> Amborella trichopoda <400> 3
actcactata gggctcgagc ggccgcccgg ggaggtgaaa ggatccaccg accatctttg ctacgttcgc tgcaacttct ggtgttccat gcagaaggtt aatggacaca gtgacagtga ctctcattcc tcagcgccag accccttctg caaaatcagt cagaactttt gcggggataa caaaaagagc caacagtctt cccaaccagc aggttgtccc aaaagtaccc aatgttgtaa aggctccctt cagcttacaa tcggttcatg aaggaggaga aacccggaaa taccacatag agaagcgttc agcatggctg gatcctcaac tgctgcatgg ctcaacaact tctacacaaa aaccaagaga ttcatgagat ggtgaccgct gggggaaggg caattgcaag ctgctgctag gtcgcaaatt acgtagcctg gcatttgtta gtaaggattt attgtgttga tgagttatag atgtttttaa agtcttttat tgaagagttc ttaaggtaag ttcaagggtt ctccgtgtaa gggtatctca aaaaaaaaaa <210> 4 <211> 196 <212> PRT
<213> Amborella trichopoda <400> 4
Met Asp Phe Leu Pro Gly Ser Thr Asp His Leu 10
Asn Phe Cys Asp Thr Leu Leu Ala Val Gly Val
25
Met Asp Thr Val Thr Val Lys Cys Gly His Cys
40
Leu Ser Ala Arg Pro Leu Leu Gln Asn Gln Ser
50 55
Thr Gln Asn Phe Cys Gly Asp Asn Lys Lys Ser 65 70 75
Ser Ser Pro Leu Thr Pro Asn Gln Gln Val Val
85 90
Val Val Lys Pro Pro Glu Lys Lys His Arg Leu
100 105
Arg Phe Met Lys Glu Glu Ile Lys Arg Ile Lys
115 120
Ile Pro His Arg Glu Ala Phe Ser Met Ala Ala
130 135
Phe Asp Pro Gln Leu Leu His Gly Ser Thr Thr 145 150 155
Lys Gln Val Lys Pro Asn Gln Glu Ile His Glu
165 170
Gly Arg Val Lys Gln Glu Asp Met Arg Gln Leu
180 185
Ser Gln Ile Thr
195 <210> 5 <211> 732 <212> DNA
<213> Antirrhinum majus <4 00> 5
tattataagt agaattaatc accatggata tggctaatca gctatgtccg ttgcaacttc tgcagcactg ttcttgcggt tgatggacac agtgactgtg aaatgtgggc actgcagcaa
160
Ile His Gly Leu Gly 175
aaagcatgga gcgacaccct agtgtgggca cacttgaact cttcctcttc agcctcctga taaagagaat caaagaattg ttgaaaagca tcaaacaaga ctttcgagtt tttttaatga ggtatcccat aaaaaaaa
ttttcttccg tctcgctgtt ttgcagccat cttaagcact tccattgaca gaagaaacac caaagctgga ggccaggttc agtgaaacca ggacatgagg aaataattac cgagttcttg cttattttta
Cys Tyr Val
Pro Cys Arg 30
Ser His Leu 45
Leu Glu Leu 60
Gln Gln Ser
Pro Lys Val
Pro Ser Ala 110
Ala Gly Asn 125
Lys Asn Trp 140
Ser Thr Gln
Met Val Thr
Gln Ala Ala 190
Arg Cys 15
Arg Leu
Ser Phe
Leu Ser
Ser Ser 80 Pro Asn 95
Tyr Asn
Pro Glu
Ala Arg
Ile Glu 160 Ala Gly 175
Ala Arg
60 120 180 240 300 360 420 480 540 600 660 720 780 828
atcatcatct gagcatcttt tgggattcca tgcaagaggc tctctcattt ctcagcacaa
60 120 180 ggcctccaat tcaaggacaa tactatgatc atcagacaag gcagtgaatt taagaagggt ggatcttcgt cgttttcttc tgtctccaaa agctccattt gttgtgaaac ctcctgagaa cctacaatcg gttcatgaaa gaggagatac agcgtatcaa cacatcgaga ggctttcagt gcagctgcaa aaaattgggc caccaccagt gcctgttacc accagcaacc acaatatata cagaagaggg atgcatgtca gaagaatgtt actggtctgg tttagtttta attctcaagc ttgtctcgtg taatgtttgc tccatctacg ggataggata taatttcatt atacggtact taattatgtt tt <210> 6
165 PRT
Antirrhinum majus 6
Met Asp Met Ala Asn Gln Ser Ser Ser Glu His 10
Cys Asn Phe Cys Ser Thr Val Leu Ala Val Gly
25
Leu Met Asp Thr Val Thr Val Lys Cys Gly His
tcttcatcat ttccacgtcc gaagcacagg agcagccaat taggtacatt attctgaatg tttctaagtg tgtactaagt agacatagat
cagagtctct 240 agcgagccct 300 cttccatcag 360 ccggagatac 420 ccaaacactc 480 gaagctgaag 540 cattaggtta 600 ggaatttgta 660 tattggatat 720 732
<211> <2 12> <213> <4 00>
Leu lie Cys
35
40
Cys
Pro
Ser 45
Tyr Val Arg 15
Cys Lys Arg 30
Asn Leu Ser
Phe Leu Ser Thr Arg Pro Pro Ile Gln Gly Gln Tyr Tyr Asp His Gln 50 55 60 Thr Ser Leu His His Gln Ser Leu Cys Ser Glu Phe Lys Lys Gly Gly 65 70 75 80 Ser Ser Ser Phe Ser Ser Ser Thr Ser Ser Glu Pro Leu Ser Pro Lys 85 90 95 Ala Pro Phe Val Val Lys Pro Pro Glu Lys Lys His Arg Leu Pro Ser 100 105 110 Ala Tyr Asn Arg Phe Met Lys Glu Glu Ile Gln Arg Ile Lys Ala Ala 115 120 125 Asn Pro Glu Ile Pro His Arg Glu Ala Phe Ser Ala Ala Ala Lys Asn 130 135 140 Trp Ala Arg Tyr Ile Pro Asn Thr Pro Pro Pro Val Pro Val Thr Thr 145 150 155 160
Ser Asn His Asn Ile 165
<210> 7 <211> 525 <212> DNA
<213> Aquilegia formosa <4 00> 7
atggatctca ttccatctcc tgagcatctt tgctatgttc gttcttgcgg ttggaatccc atgcaaacga actttggaca cactgtggta atatatcttt ccttagcact aggcctccaa caccaagtgg atgcttttca gagttttcgc aatgagtatc tcatcttcat caacctcttg tggacagcct acaagcccaa aaaccacctg agaggaaaca cagacttcca tctgcctata atacagcgca taaaatctgc gaaccctgag atccctcacc gccaaaaatt gggcaaaata tgttccacat tcacaggctg aagaatgaac gagttcctgc aaaggaaagc cttgacggtg <210> 8 <211> 174 <212> PRT
<213> Aquilegia formosa <4 00> 8
Met Asp Leu Ile Pro Ser Pro Glu His Leu Cys 1 5 10
Phe Cys Ser Thr Val Leu Ala Val Gly Ile Pro
25
Asp Thr Val Thr Val Lys Cys Gly His Cys Gly
40
Ser Thr Arg Pro Pro Ile Gln Gly Gln Cys Leu
gctgcaattt ctgtgactgt ttcaaggcca gaaagggaca atgaacctaa atcgatatat gagaagcatt gaacagtttc cctaa
ctgtagcact caaatgtggt gtgtctggat atcttcttcg ctatgttgtc gaaggaggag cagcagtgca tggtggtaag
Tyr Val Arg Cys Asn 15
Cys Lys Arg Thr Leu 30
Asn Ile Ser Phe Leu 45
Asp His Gln Val Asp
60 120 180 240 300 360 420 480 525 50 55
Ala Phe Gln Ser Phe Arg Asn Glu Tyr Arg Lys 65 70 75
Ser Ser Ser Ser Thr Ser Cys Gly Gln Pro Thr
85 90
Asn Tyr Val Val Lys Pro Pro Glu Arg Lys His
100 105
Tyr Asn Arg Tyr Met Lys Glu Glu Ile Gln Arg
115 120
Pro Glu Ile Pro His Arg Glu Ala Phe Ser Ser
130 135
Ala Lys Tyr Val Pro His Ser Gln Ala Gly Thr 145 150 155
Lys Asn Glu Arg Val Pro Ala Lys Glu Ser Leu 165 170
<210> 9 <211> 561 <212> DNA
<213> Capparis flexuosa <4 00> 9
atgaatctag aagagaaatc cgtcatggat tcacaggctc tgttatgttc gctgcaactt ctgcaacacc gttctggcgg atgcttgaca ccgtgacagt gaaatgcggc cattgcagca aggcctcctc ttcatggcca gtgccttgat caccaagtca agcttctgtg gcaatgagtt aaagaaggga agttcgtctt tccagcgatc agccatcgtc ccctaaagca cctttcgtgg cacaggcttc cgtcggctta caatcggttt atgaaagagg gcaaatccgg agataccaca tcgcgaagca ttcagcgctg tacatcccga attctcctcc cggttccatt tctgctggga gacttcggag aaatgaaatg a <210> 10 <211> 186 <212> PRT
<213> Capparis flexuosa <4 00> 10
Met Asn Leu Glu Glu Lys Ser Val Met Asp Ser 10
Ser Glu His Leu Cys Tyr Val Arg Cys Asn Phe
25
Ala Val Gly Ile Pro Cys Lys Arg Met Leu Asp
40
Cys Gly His Cys Ser Asn Leu Ser Phe Leu Ser
50 55
His Gly Gln Cys Leu Asp His Gln Val Asn Leu 65 70 75
Ser Phe Cys Gly Asn Glu Leu Lys Lys Gly Ser
85 90
Ser Ser Ser Thr Ser Ser Asp Gln Pro Ser Ser
100 105
Val Val Lys Pro Pro Glu Lys Lys His Arg Leu
115 120
Arg Phe Met Lys Glu Glu Ile Gln Arg Ile Lys
130 135
Ile Pro His Arg Glu Ala Phe Ser Ala Ala Ala 145 150 155
Tyr Ile Pro Asn Ser Pro Pro Gly Ser Ile Ser
165 170
Ile Asn Gly Phe Asp Phe Gly Glu Met Lys 180 185
<210> 11 <211> 840 <212> DNA
<213> Citrus sinensis
60
Gly Gln Ser Ser Ser 80
Ser Pro Asn Glu Pro 95
Arg Leu Pro Ser Ala 110
Ile Lys Ser Ala Asn 125
Ala Ala Lys Asn Trp 140
Val Ser Gly Gly Lys 160
Asp Gly Ala
cgactcagtc tggggatacc acctctcgtt acctcaccct cttcgtcttc ttaaaccacc agatacaacg ctgctaaaaa gcagcagcat
cgagcatctt atgcaagaga tctctctgta tcagacgcag ctcttcaact tgagaagaag catcaaagct ctgggcaagg caacggtttc
Gln Ala Pro Cys Thr
Val 60 Thr
Ser
Pro
Pro
Ala 140 Lys
Ala
Asn Thr
30 Val Thr 45
Arg Pro
Leu Gln
Ser Ser
Lys Ala 110 Ser Ala 125
Ala Asn Asn Trp Gly Ser
Thr Gln 15
Val Leu
Val Lys
Pro Leu
Thr Gln 80
Ser Ser 95
Pro Phe
Tyr Asn
Pro Glu
Ala Arg 160 Ser Ser 175
60 120 180 240 300 360 420 480 540 561 <4 00> 11
gaggctctca ccacttctct cttcttctta tcaattatta tctgaaaccc taaaagctcc atcttctttt ttctcaaaac ttaaacctag ctgcttgtaa aaaacttagt cccctcttct tctttgaaaa tgaaccttga agacaacatc tctacggacc ttcaagttcc acaatctgag catctctgct atgtccgctg caacttctgc aacactgttc ttgcggttgg cattccatgc aaacggctgc tggacacagt gactgtgaaa tgtggtcact gcagtaacct ctcctttctc agcaccaggc ctccacaaca aggtccatct caaatgagtc tcagatttca ggaaaagcag agcttttgca atgacttcaa attgggcaat gcctcatcat cgtcttcatc aacttctagc gagccattgt ccccaaaggc cccatttgtc gtgaaaccac ctgagaagaa acacaggctt ccatcagctt acaatcgatt catgaaggag gagattcagc gcattaaagc agccaatcct gagataccac acagagaagc ttttagcaca gctgcgaaaa attgggcaag gtacattcca aattcgctag ctgggtcaac ttctgggagc agcagccatg aatgatataa atctatgttt caagcaaaaa cgctgagccg acactggatg ttttcaaaaa gcatgcactt gaagttgaaa gatgatcggt tcagtttgtt aatttggatt ttcgcctcat caaaacttta ctgtctttta ctactttatc atgtcttgtt ttatttgtta tttgatgatg ctactcgttt catgacaact <210> 12 <211> 171 <212> PRT
<213> Citrus sinensis <400> 12
Met Asn Leu Glu Asp Asn Ile Ser Thr Asp Leu Gln Val Pro 10
Glu His Leu Cys Tyr Val Arg Cys Asn Phe Cys Asn Thr Val
25 30
Val Gly Ile Pro Cys Lys Arg Leu Leu Asp Thr Val Thr Val
40 45
Gly His Cys Ser Asn Leu Ser Phe Leu Ser Thr Arg Pro Pro
50 55 60
Gly Pro Ser Gln Met Ser Leu Arg Phe Gln Glu Lys Gln Ser 65 70 75
Asn Asp Phe Lys Leu Gly Asn Ala Ser Ser Ser Ser Ser Ser
85
90
<210> <211> <212> <213> <4 00>
Val Lys Pro 110
Phe Met Lys 125
Pro His Arg 140
Ile Pro Asn
Gln Ser 15
Leu Ala
Lys Cys
Gln Gln
Phe Cys 80 Thr Ser 95
Pro Glu
Glu Glu
Glu Ala
Ser Leu 160
Ser Glu Pro Leu Ser Pro Lys Ala Pro Phe Val
100 105
Lys Lys His Arg Leu Pro Ser Ala Tyr Asn Arg
115 120
Ile Gln Arg Ile Lys Ala Ala Asn Pro Glu Ile
130 135
Phe Ser Thr Ala Ala Lys Asn Trp Ala Arg Tyr 145 150 155
Ala Gly Ser Thr Ser Gly Ser Ser Ser His Glu 165 170
13 558 DNA
Cleome sparsifolia 13
atgaaccttg aagagaaacc cgccatggct tcgcgggcaa tacgtccgct gcaacttctg cagcactatt ctagcggtgg ctcgacactg tgacagtgaa atgcggccat tgtggcaacc aagccacttc aaggccaatg tctcgatcgc catgtcagcc tttggtggga gtaatgagct gaagaaggga ggttcttcat tcgagcgacc agccaccatt tcccacagca gctttcgtgg cagaggcttc catccgctta taataggttc atgagggaag gcgaacccgg agatcccaca tcgcgaagct ttcagcgccg tacatcccga attctcctac ttccatctct accggaggca ttgggagcaa tgaagtga <210> 14 <211> 185 <212> PRT
<213> Cleome sparsifolia <4 00> 14
Met Asn Leu Glu Glu Lys Pro Ala Met Ala Ser Arg Ala Asn Gln Ser
accagtccga ggataccatt tttcgtttct tcactcttca cgtcatcgtc ttaaaccacc agatacaacg ctgccaaaaa acgccatcac
ccatctttgt gacgagaatg cacaacaaca gatgcagagc ctcatctact cgagaagaag catcaaagct ctgggctaag tggcttgggc
60 120 180 240 300 360 420 480 540 600 660 720 780 840
60 120 180 240 300 360 420 480 540 558 10 15
Asp His Leu Cys Tyr Val Arg Cys Asn Phe Cys Ser Thr Ile Leu Ala
25 30
Val Gly Ile Pro Leu Thr Arg Met Leu Asp Thr Val Thr Val Lys Cys
40 45
Gly His Cys Gly Asn Leu Ser Phe Leu Thr Thr Thr Lys Pro Leu Gln
50 55 60
Gly Gln Cys Leu Asp Arg His Val Ser Leu Thr Leu Gln Met Gln Ser 65 70 75 80
Phe Gly Gly Ser Asn Glu Leu Lys Lys Gly Gly Ser Ser Ser Ser Ser
85 90 95
Ser Ser Ser Thr Ser Ser Asp Gln Pro Pro Phe Pro Thr Ala Ala Phe
100 105 110
Val Val Lys Pro Pro Glu Lys Lys Gln Arg Leu Pro Ser Ala Tyr Asn
115 120 125
Arg Phe Met Arg Glu Glu Ile Gln Arg Ile Lys Ala Ala Asn Pro Glu
130 135 140
Ile Pro His Arg Glu Ala Phe Ser Ala Ala Ala Lys Asn Trp Ala Lys 145 150 155 160
Tyr Ile Pro Asn Ser Pro Thr Ser Ile Ser Thr Gly Gly Asn Ala Ile
165 170 175
Thr Gly Leu Gly Leu Gly Ala Met Lys 180 185
<210> 15 <211> 502 <212> DNA
<213> Gossypium hirsutum <4 00> 15
ggttccacaa tccgagcatc tttgctatgt ccgctgcaac ttctgcaaca ctgttcttgc ggttgggatc ccatgcaaaa gattgcttga aacagtgaca gtgaaatgtg gtcattgcag 120 taacctttct tttctcagca ccagacctcc actgcaaggt caatgcctcg atccccaaac 180 cagcctcact ctccagagtt tctgcggtga tttcaggaaa ggtactcagt ttccatcgcc 240 atcttcatca acatcgagcg agccatcatc ccctaaagcg ccatttgttg taaaacctcc 300 cgagaagaaa cacaggcttc catctgctta caatcggttt atgaaggagg aaatacagcg
60
360
cattaaagca gcaaatcctg agatacccca tcgagaagct ttcagcgcag ctgctaaaaa 420 ttgggctcgg tacatcccaa attctccagc agcatcatcc gtttgtggaa gtagcagcaa 480 tgaacaaaat gataatgtgt ga 502
<210> 16 <211> 166 <212> PRT
<213> Gossypium hirsutum <4 00> 16
Val Pro Gln Ser Glu His Leu Cys Tyr Val Arg Cys Asn Phe Cys Asn 10 15
Thr Val Leu Ala Val Gly Ile Pro Cys Lys Arg Leu Leu Glu Thr Val
25 30
Thr Val Lys Cys Gly His Cys Ser Asn Leu Ser Phe Leu Ser Thr Arg
40 45
Pro Pro Leu Gln Gly Gln Cys Leu Asp Pro Gln Thr Ser Leu Thr Leu
50 55 60
Gln Ser Phe Cys Gly Asp Phe Arg Lys Gly Thr Gln Phe Pro Ser Pro 65 70 75 80
Ser Ser Ser Thr Ser Ser Glu Pro Ser Ser Pro Lys Ala Pro Phe Val
85 90 95
Val Lys Pro Pro Glu Lys Lys His Arg Leu Pro Ser Ala Tyr Asn Arg
100 105 HO
Phe Met Lys Glu Glu Ile Gln Arg Ile Lys Ala Ala Asn Pro Glu Ile
115 120 125
Pro His Arg Glu Ala Phe Ser Ala Ala Ala Lys Asn Trp Ala Arg Tyr
130 135 140
Ile Pro Asn Ser Pro Ala Ala Ser Ser Val Cys Gly Ser Ser Ser Asn 145 150 155 160
Glu Gln Asn Asp Asn Val 165
<210> 17 <211> 514 <212> DNA
<213> Gossypium hirsutum <4 00> 17
ggttccacaa tccgagcatc tttgctatgt ccgctgcaac ttctgcaaca ctgttcttgc 60
ggttgggatc ccatgcaaaa gattgcttga aacagtgaca gtgaaatgtg gtcattgcag 120 taacctttct tttctcagca ccagacctcc actgcaaggt caatgcctcg atccccaaac 180 cagcctcact ctccagagtt tctgcggtga tttcaggaaa ggtactcagt ttccatcgcc 240 atcttcatca acatcgagcg agccatcatc ccctaaagcg ccatttgttg taaaacctcc 300 cgagaagaaa cacaggcttc catctgctta caatcggttt atgaaggagg aaatacagcg 360 cattaaagca gcaaatcctg agatacccca tcgagaagct ttcagcgcag ctgctaaaaa 420 ttgggctcgg tacatcccaa attctccagc agcatcatcc gtttgtggaa gtagcagcaa 480 tggcttctat gaaaattttg caggaacaaa atga 514
<210> 18 <211> 170 <212> PRT
<213> Gossypium hirsutum <4 00> 18
Val Pro Gln Ser Glu His Leu Cys Tyr Val Arg Cys Asn Phe Cys Asn 10 15
Thr Val Leu Ala Val Gly Ile Pro Cys Lys Arg Leu Leu Glu Thr Val
25 30
Thr Val Lys Cys Gly His Cys Ser Asn Leu Ser Phe Leu Ser Thr Arg
40 45
Pro Pro Leu Gln Gly Gln Cys Leu Asp Pro Gln Thr Ser Leu Thr Leu
50 55 60
Gln Ser Phe Cys Gly Asp Phe Arg Lys Gly Thr Gln Phe Pro Ser Pro 65 70 75 80
Ser Ser Ser Thr Ser Ser Glu Pro Ser Ser Pro Lys Ala Pro Phe Val
85 90 95
Val Lys Pro Pro Glu Lys Lys His Arg Leu Pro Ser Ala Tyr Asn Arg
100 105 HO
Phe Met Lys Glu Glu Ile Gln Arg Ile Lys Ala Ala Asn Pro Glu Ile
115 120 125
Pro His Arg Glu Ala Phe Ser Ala Ala Ala Lys Asn Trp Ala Arg Tyr
130 135 140
Ile Pro Asn Ser Pro Ala Ala Ser Ser Val Cys Gly Ser Ser Ser Asn 145 150 155 160
Gly Phe Tyr Glu Asn Phe Ala Gly Thr Lys 165 170
<210> 19 <211> 746 <212> DNA
<213> Hedyotis centranthoides <4 00> 19
tggatccaaa gcaggcttct actttcatcc ctgagaaaaa cagactctca tcatcatcat 60
catcatcatc atcatctaac ttgaagctct ctctagctag ctcatctaca taaacatgtc 120 ttctcattct tcctcttcat cttctttcaa ctttgatgac aaagccaaca ccatggattt 180 ggtccaacaa tctgagcacc tttgctatgt ccgctgcaac ttttgcaaca ctgttctcgc 240 agtcggaata ccgtgcaaga ggctgttaga tactgtgacg gtgaaatgcg ggcattgcag 300 caacttatcc tttctgagca cccgcccacc tccacctccg ccgccgccca cgcttcaacc 360 tcagtctttt gatcatccac caagcattca gagcttcttc agtaaattca agaagggtca 420 aacttcatca tcggcctcat catcaacatc ctctgaacca ctgtctccaa aagcaccctt 480 tgttgtcaaa cccccagaga aaaaacacag gcttccatct gcctacaatc gcttcatgaa 540 ggaggaaatc caacgcatca aagctgcgaa tccagaaatt ccacaccgag aggcattcag 600 cgcggcagcc aaaaactggg ctaggtatat tcctcacaac ggaccagcag gatccattac 660 tgagagcagc aacaccaaca atatgtagat gctgcgaaag tgaagcgaaa cctcaaaatc 720 catgcgtgat atgccatgta atggag 746
<210> 20 <211> 190 <212> PRT <213> Hedyotis centranthoides <400> 20
Met Ser Ser His Ser Ser Ser Ser Ser Ser Phe 10
Ala Asn Thr Met Asp Leu Val Gln Gln Ser Glu
25
Arg Cys Asn Phe Cys Asn Thr Val Leu Ala Val
40
Arg Leu Leu Asp Thr Val Thr Val Lys Cys Gly
50 55
Ser Phe Leu Ser Thr Arg Pro Pro Pro Pro Pro 65 70 75
Gln Pro Gln Ser Phe Asp His Pro Pro Ser Ile
85 90
Lys Phe Lys Lys Gly Gln Thr Ser Ser Ser Ala
100 105
Ser Glu Pro Leu Ser Pro Lys Ala Pro Phe Val
115 120
Lys Lys His Arg Leu Pro Ser Ala Tyr Asn Arg
130 135
Ile Gln Arg Ile Lys Ala Ala Asn Pro Glu Ile 145 150 155
Phe Ser Ala Ala Ala Lys Asn Trp Ala Arg Tyr
165 170
Pro Ala Gly Ser Ile Thr Glu Ser Ser Asn Thr 180 185
<210> 21 <211> 1102 <212> DNA
<213> Arabidopsis thaliana <4 00> 21
atcattcatc gtacacacac actctctatg acaaagctcc aaccatctat ttgatctgcc ggggcagatt tgccatgtcc attttgctgg tgagtgtacc gtttacaagc ttgtcaatgg cattgcacaa gccttctctc tgtcaatttg atgaaggctt cttgcttctc tctcccatct tgatgagacc gggaaagagg gtggaagaag aagcatggaa ggtgaatcag gagaaggaga tcatcttcag acaatgaaga tgaagatgtg tctcgtgttt cctgagaagc gacaaagagc tccttcagct tacaattgct aggttaaagg ctcagaatcc aagcatggct cacaaggaag aattgggccc attttcctcc agctcacaac aagagagctg gaggaagata acaatgcgat actaccatgc aatgtttttg aatgggttcc gagagagaaa ggctcagagg cattccattt taataacaat ttgggatatg aaaatttaac aaaaaaataa atggtgactc ttttcttcta gggtttgatt atgttggttt gagatagaga gaagaagaat ctgaaacgga agtaggattt cttgggaatg agcgagtttg ttcagtaatt tcgtagtact tgaagagaca tgcattgact ctataaaaaa aattctactt attccatgaa tgttttaaca ttccatgaaa cagtacttta atcataataa agatccttct tg <210> 22 <211> 231 <212> PRT
<213> Arabidopsis thaliana <400> 22
Met Thr Lys Leu Pro Asn Met Thr Thr Thr Leu 10
Leu Pro Gly Gln Ile Cys His Val Gln Cys Gly
25
Leu Leu Val Ser Val Pro Phe Thr Ser Leu Ser
40
Arg Cys Gly His Cys Thr Ser Leu Leu Ser Val 50 55
Asn Phe
His Leu
Gly Ile
45 His Cys 60
Pro Pro
Gln Ser
Ser Ser
Val Lys 125 Phe Met 140
Pro His Ile Pro Asn Asn
Asp Asp Lys 15
Cys Tyr Val 30
Pro Cys Lys
Ser Asn Leu
Pro Thr Leu 80
Phe Phe Ser 95
Ser Thr Ser 110
Pro Pro Glu
Lys Glu Glu
Arg Glu Ala 160
His Asn Gly 175
Met 190
ccaacatgac agtgtggttt tggtgactgt ccttcattcc aggttgcagc acagtccaac accaagttgt tcatcaagga ctttcagctt cttcagatca aggaccatga ggggaaaatc ataatggcgt agggtttctg gtgtgtgttc tgtcaacttt ttgcattcat gtaagaatct
gacaacactc ttgcaccact gagatgtggg tctccatctc tacagatggt gactttggtt caataaacca agagatcagg agctgccaaa atgtttttgt agaaagcaat tccatttgag atgacatgtg ttgttggaga gagaagagtc gaacttaatt gactactctt ttgttaacct
Asn His Leu Phe Asp 15
Phe Cys Thr Thr Ile 30
Met Val Val Thr Val 45
Asn Leu Met Lys Ala 60
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1102 60
Ser Phe Ile Pro Leu His Leu Leu Ala Ser Leu Ser His Leu Asp Glu 65 70 75 80
Thr Gly Lys Glu Glu Val Ala Ala Thr Asp Gly Val Glu Glu Glu Ala
85 90 95
Trp Lys Val Asn Gln Glu Lys Glu Asn Ser Pro Thr Thr Leu Val Ser
100 105 110
Ser Ser Asp Asn Glu Asp Glu Asp Val Ser Arg Val Tyr Gln Val Val
115 120 125
Asn Lys Pro Pro Glu Lys Arg Gln Arg Ala Pro Ser Ala Tyr Asn Cys
130 135 140
Phe Ile Lys Glu Glu Ile Arg Arg Leu Lys Ala Gln Asn Pro Ser Met 145 150 155 160
Ala His Lys Glu Ala Phe Ser Leu Ala Ala Lys Asn Trp Ala His Phe
165 170 175
Pro Pro Ala His Asn Lys Arg Ala Ala Ser Asp Gln Cys Phe Cys Glu
180 185 190
Glu Asp Asn Asn Ala Ile Leu Pro Cys Asn Val Phe Glu Asp His Glu
195 200 205
Glu Ser Asn Asn Gly Phe Arg Glu Arg Lys Ala Gln Arg His Ser Ile
210 215 220
Trp Gly Lys Ser Pro Phe Glu 225 230
<210> 23 <211> 567 <212> DNA
<213> Lepidium africanum <4 00> 23
atgaaccttg atcaagaaaa accaacaatg acttcaaggg cttcacctca agctgagcat ctctattacg tccggtgtag catctgcaac acaatcctcg cggttgggat accaatgaag 120 agaatgcttg acacagtaac ggtgaaatgt ggccattgtg gtaatctttc attcctcacc 180 acaagccttc cccttcatgg ccatgttagc ctcacccttc agatgcagag ctttggtggg 240 agtgagtata agaaaggaag ctcttcttct tcatcttcct ctacctccag cgaccagcca 300 ccatctccca caccaccttt tgtcgttaaa cctcctgaga agaagcagag acttccatcg 360 gcttacaatc gctttatgag ggatgagata cagcgcatca aaactgcaaa tccggaaatt 420 ccacatcgtg aagctttcag tgctgctgcc aaaaattggg ctaagtacat acccaattcc 480 cctacttccc ttacttccgg aggcaaccac atgatgaatg taagctatac aaataacccc 540 tcagagaagg ctagattata tttctag 567
<210> 24 <211> 188 <212> PRT
<213> Lepidium africanum <4 00> 24
Met Asn Leu Asp Gln Glu Lys Pro Thr Met Thr Ser Arg Ala Ser Pro 10 15
Gln Ala Glu His Leu Tyr Tyr Val Arg Cys Ser Ile Cys Asn Thr Ile
25 30
Leu Ala Val Gly Ile Pro Met Lys Arg Met Leu Asp Thr Val Thr Val
40 45
Lys Cys Gly His Cys Gly Asn Leu Ser Phe Leu Thr Thr Ser Leu Pro
50 55 60
Leu His Gly His Val Ser Leu Thr Leu Gln Met Gln Ser Phe Gly Gly 65 70 75 80
Ser Glu Tyr Lys Lys Gly Ser Ser Ser Ser Ser Ser Ser Ser Thr Ser
85 90 95
Ser Asp Gln Pro Pro Ser Pro Thr Pro Pro Phe Val Val Lys Pro Pro
100 105 HO
Glu Lys Lys Gln Arg Leu Pro Ser Ala Tyr Asn Arg Phe Met Arg Asp
115 120 125
Glu Ile Gln Arg Ile Lys Thr Ala Asn Pro Glu Ile Pro His Arg Glu
130 135 140
Ala Phe Ser Ala Ala Ala Lys Asn Trp Ala Lys Tyr Ile Pro Asn Ser 145 150 155 160
Pro Thr Ser Leu Thr Ser Gly Gly Asn His Met Met Asn Val Ser Tyr 165 170
Thr Asn Asn Pro Ser Glu Lys Ala Arg Leu Tyr 180 185
<210> 25 <211> 540 <212> DNA
<213> Solanum lycopersicum <4 00> 25
cccctaccca ataaatatat tttgttcttt aaaaccccca tctccatctg aaaaaaaaaa aactccatgg attatgttca acgtccgttg caatttttgt aacactgttt tagcggttgg tggatactgt gacagtgaaa tgtggccatt gtagcaatct ctccaattca aggtcaatgc tttgatcatc aacccaatat taaaaaataa ggggcaagct tcatcatcta cctcatcaac caaaggcacc ttttgttgta aaacctcctg agaagaaaca atcgattcat gaaggaagag atacaacgta tcaaatctga gagaagcttt cagtgcagct gctaaaaatt gggctaggta <210> 26 <211> 151 <212> PRT
<213> Solanum lycopersicum <4 00> 26
Met Asp Tyr Val Gln Ser Ser Glu His Leu Cys 10
Phe Cys Asn Thr Val Leu Ala Val Gly Ile Pro
25
Asp Thr Val Thr Val Lys Cys Gly His Cys Ser
40
Thr Thr Arg Pro Pro Ile Gln Gly Gln Cys Phe
50 55
Ile Gln Gly Tyr Cys Ser Glu Leu Lys Asn Lys 65 70 75
Ser Thr Ser Ser Thr Ser Ser Glu Pro Leu Ser
85 90
Val Val Lys Pro Pro Glu Lys Lys His Arg Leu
100 105
Arg Phe Met Lys Glu Glu Ile Gln Arg Ile Lys
115 120
Ile Pro His Arg Glu Ala Phe Ser Ala Ala Ala
175
Phe
aaaaaacatt atcttctgag aattccatac ttcattttta tcagggctat ttctagtgaa caggcttcca aaatccagag ccttcctaat
ttttttcttt catctttgct aagaggctaa actactagac tgtagtgaat cctttatctc tctgcctaca ataccacata ccaccaaatt
130
135
Tyr Val Arg
Tyr Lys Arg 30
Asn Leu Ser 45
Asp His Gln 60
Gly Gln Ala
Pro Lys Ala
Pro Ser Ala 110
Ser Glu Asn 125
Lys Asn Trp 140
Cys Asn 15
Leu Met
Phe Leu
Pro Asn
Ser Ser 80
Pro Phe 95
Tyr Asn Pro Glu Ala Arg
Tyr Leu Pro Asn Pro Pro Asn 145 150
<210> 27 <211> 562 <212> DNA
<213> Solanum lycopersicum <4 00> 27
gcacgagaat atattttgtt ctttaaaacc cccaaaaaaa tctgaaaaaa aaaaaactcc atggattatg ttcaatcttc gttgcaattt ttgtaacact gttttagcgg ttggaattcc ctgtgacagt gaaatgtggc cattgtagca atctttcatt ttcaaggtca atgctttgat catcaaccca atattcaggg ataaggggca agcttcatca tctacctcat caacttctag caccttttgt tgtaaaacct cctgagaaga aacacaggct tcatgaagga agagatacaa cgtatcaaat ctgaaaatcc ctttcagtgc agctgctaaa aattgggcta ggtaccttcc ataccaacaa tgtttagatg tt <210> 28 <211> 158 <212> PRT
<213> Solanum lycopersicum <4 00> 28
Met Asp Tyr Val Gln Ser Ser Glu His Leu Cys Tyr Val Arg Cys Asn
catttttttt tgagcatctt atacaagagg tttaactact ctattgtagt tgaaccttta tccatctgcc agagatacca taatccacca
cttttctcca tgctacgtcc ctaatggata agacctccaa gaattaaaaa tctccaaagg tacaatcgat catagagaag aattctggaa
60 120 180 240 300 360 420 480 540
60 120 180 240 300 360 420 480 540 562 10 15
Phe Cys Asn Thr Val Leu Ala Val Gly Ile Pro Tyr Lys Arg Leu Met
25 30
Asp Thr Val Thr Val Lys Cys Gly His Cys Ser Asn Leu Ser Phe Leu
40 45
Thr Thr Arg Pro Pro Ile Gln Gly Gln Cys Phe Asp His Gln Pro Asn
50 55 60
Ile Gln Gly Tyr Cys Ser Glu Leu Lys Asn Lys Gly Gln Ala Ser Ser 65 70 75 80
Ser Thr Ser Ser Thr Ser Ser Glu Pro Leu Ser Pro Lys Ala Pro Phe
85 90 95
Val Val Lys Pro Pro Glu Lys Lys His Arg Leu Pro Ser Ala Tyr Asn
100 105 110
Arg Phe Met Lys Glu Glu Ile Gln Arg Ile Lys Ser Glu Asn Pro Glu
115 120 125
Ile Pro His Arg Glu Ala Phe Ser Ala Ala Ala Lys Asn Trp Ala Arg
130 135 140
Tyr Leu Pro Asn Pro Pro Asn Ser Gly Asn Thr Asn Asn Val 145 150 155
<210> 29 <211> 546 <212> DNA
<213> Nicotiana tabacum <4 00> 29
atgtcttcct cttctcctag ttctgctagc tcttgtgtca acttggaagc tgctgataaa 60
aactccatgg atttggttca atcttctgaa catctttgtt atgtccgttg cagtttttgc 120 aacactgttc ttgcggttgg aattccatac aagaggctgt tggatacagt gacagtgaaa 180 tgtggtcatt gcagtaacct ttccttttta agcactagac ctccactcca aggccaatgt 240 tttgatcacc aaagcgctct tcagcatcaa actttcttca gcgatttcaa gaagggccag 300 tcttcttctt catcttcaag tgaaccctcg tcaccaaagg caccttttgt tgtaaaacct 360 cctgagaaga agcacaggct cccatctgcc tacaatcggt tcatgaagga tgagatacaa 420 cgcatcaaag cagcaaatcc agagattcca caccgagagg ctttcagtgc agcagctaaa 480 aattgggcta ggtacattcc taatactcca aatgggacct tggctgagag cagcaacaat 540 gcctag 546
<210> 30 <211> 181 <212> PRT
<213> Nicotiana tabacum <4 00> 30
Met Ser Ser Ser Ser Pro Ser Ser Ala Ser Ser Cys Val Asn Leu Glu 10 15
Ala Ala Asp Lys Asn Ser Met Asp Leu Val Gln Ser Ser Glu His Leu
25 30
Cys Tyr Val Arg Cys Ser Phe Cys Asn Thr Val Leu Ala Val Gly Ile
40 45
Pro Tyr Lys Arg Leu Leu Asp Thr Val Thr Val Lys Cys Gly His Cys
50 55 60
Ser Asn Leu Ser Phe Leu Ser Thr Arg Pro Pro Leu Gln Gly Gln Cys 65 70 75 80
Phe Asp His Gln Ser Ala Leu Gln His Gln Thr Phe Phe Ser Asp Phe
85 90 95
Lys Lys Gly Gln Ser Ser Ser Ser Ser Ser Ser Glu Pro Ser Ser Pro
100 105 110
Lys Ala Pro Phe Val Val Lys Pro Pro Glu Lys Lys His Arg Leu Pro
115 120 125
Ser Ala Tyr Asn Arg Phe Met Lys Asp Glu Ile Gln Arg Ile Lys Ala
130 135 140
Ala Asn Pro Glu Ile Pro His Arg Glu Ala Phe Ser Ala Ala Ala Lys 145 150 155 160
Asn Trp Ala Arg Tyr Ile Pro Asn Thr Pro Asn Gly Thr Leu Ala Glu
165 170 175
Ser Ser Asn Asn Ala 180 <210> 31 <211> 546 <212> DNA
<213> Nicotiana tabacum <4 00> 31
atgtcttcct cttctcctag ttctgctagc tcttgtgtca acttggaagc aactccatgg atttggttca atcttctgaa catctttgtt atgtccgttg aacactgttc ttgcggttgg aattccatac aagaggctgt tggatacagt tgtgggcatt gcagtaacct ttccttttta agcacaagac ctccacttca tttgatcacc aaaccgctct tcagcatcaa gctttcttca gcgatttcaa tcttcatctt catcttcaag tgaaccctcg tctccaaagg caccttttgt cctgagaaga agcacaggct cccatctgcc tacaatcggt tcatgaagga cgcatcaaag cagcaaatcc agagattcct caccgagaag ctttcagtgc aattgggcta ggtacattcc taatactcca aatgggacct tggctgagag gcctag <210> 32 <211> 181 <212> PRT
<213> Nicotiana tabacum <4 00> 32
Met Ser Ser Ser Ser Pro Ser Ser Ala Ser Ser Cys Val 10
Ala Ala Asp Arg Asn Ser Met Asp Leu Val Gln Ser Ser
25
Cys Tyr Val Arg Cys Ser Phe Cys Asn Thr Val Leu Ala
40 45
Pro Tyr Lys Arg Leu Leu Asp Thr Val Thr Val Lys Cys
50 55 60
Ser Asn Leu Ser Phe Leu Ser Thr Arg Pro Pro Leu Gln 65 70 75
Phe Asp His Gln Thr Ala Leu Gln His Gln Ala 85
tgctgataga cagcttctgc gacagtgaaa aggccaatgt gaagggccag tgtaaaacct tgagatacaa agcagctaaa cagcaacaat
Phe Phe
Lys Lys Gly Gln Ser Ser Ser Ser Ser Ser Ser Glu Pro
90
100
105
Lys Ala Pro Phe Val Val Lys Pro Pro Glu Lys
115
120
Ser Ala Tyr Asn Arg Phe Met Lys Asp Glu Ile
130
135
Ala Asn Pro Glu Ile Pro His Arg Glu Ala Phe
Lys His 125 Gln Arg 140
Ser Ala
145
150
155
Asn Trp Ala Arg Tyr Ile Pro Asn Thr Pro Asn Gly Thr
165
Ser Ser Asn Asn Ala 180
170
Asn Leu Glu 15
Glu His Leu 30
Val Gly Ile
Gly His Cys
Gly Gln Cys 80
Ser Asp Phe 95
Ser Ser Pro 110
Arg Leu Pro
Ile Lys Ala
Ala Ala Lys 160
Leu Ala Glu 175
<210> 33 <211> 765 <212> DNA <213> Antirrhinum ma j us <220> <221> misc feature <222> (6) . . (6) <223> η é a, c, g, ou t <220> <221> misc feature <222> (609)..(609) <223> η é a, c, g, ou t <4 00> 33
ccaccnttat ggccgggcag ggaaaaagag agaaaaatgt gacttccaag aacaaatttg ctatgtgcaa tgtggatttt agtgttccaa aaaactgctt atcgatggca gtgacagtga atactctccg tcaacatacc agacgcctat tttgttccat aaccagcaag aacaaatgtc cattcaaccg aaacaagaag ggtgatcaca agaaggcagg aatgacacta tgcttctcat
tgactttaga gcacaaccat gatgtggcca tgcatttctt cctgctctgt cagatgaaga
tagtttgttt tttactagtt ctgcagtacc ttcttcaatc agaaatggct agaatatgaa
60 120 180 240 300 360 420 480 540 546
60 120 180 240 300 360 gattctcttc atctcaatca acttgtccac aaacccccag agaagaaaca acgtgctcca tctgcctaca atcacttcat caagaaagaa atcaagaggc tgaagattga gtatccaaac atgactcaca agcaagcttt cagtgctgct gctaaaaatt gggcccacaa cccccaaagt caatacaaac gaggagaagt tcaaggccgt ggagaagtag gcagaacgat gcatgatgtt gatgaagang tgccttgttc tgacagcagt ttcccgaaac aaaggcattc aatcaaccta tttgctccag taaaacttta tgctgaatcg ggctattttt ctttctatgg tttgctcaag ctgctatatg gcttaaacac ttaaattttc aatcattttt ctttt <210> 34 235 PRT
Antirrhinum majus
<211> <212> <213> <22 0> <221> <222> <223> <4 00>
INCERTO (191)..(191)
Xaa pode ser qualguer aminoácido ocorrendo naturalmente
34
Met Leu Thr Leu Asp Ser Leu Phe Asp Phe Gln Glu Gln Ile Cys Tyr 10 15
Val Gln Cys Gly Phe Cys Thr Thr Ile Leu Leu Val Ser Val Pro Lys
25 30
Asn Cys Leu Ser Met Ala Val Thr Val Arg Cys Gly His Cys Ser Thr
40 45
Ile Leu Ser Val Asn Ile Pro Asp Ala Tyr Phe Val Pro Leu His Phe
50 55 60
Phe Ser Ser Ile Asn Gln Gln Glu Gln Met Ser Ile Gln Pro Lys Gln 65 70 75 80
Glu Ala Cys Ser Val Glu Met Ala Gly Asp His Lys Lys Ala Gly Met
85 90 95
Thr Leu Cys Phe Ser Ser Asp Glu Glu Glu Tyr Glu Asp Ser Leu His
100 105 110
Leu Asn Gln Leu Val His Lys Pro Pro Glu Lys Lys Gln Arg Ala Pro
115 120 125
Ser Ala Tyr Asn His Phe Ile Lys Lys Glu Ile Lys Arg Leu Lys Ile
130 135 140
Glu Tyr Pro Asn Met Thr His Lys Gln Ala Phe Ser Ala Ala Ala Lys 145 150 155 160
Asn Trp Ala His Asn Pro Gln Ser Gln Tyr Lys Arg Gly Glu Val Gln
165 170 175
Gly Arg Gly Glu Val Gly Arg Thr Met His Asp Val Asp Glu Xaa Val
180 185 190
Pro Cys Ser Asp Ser Ser Phe Pro Lys Gln Arg His Ser Ile Asn Leu
195 200 205
Phe Ala Pro Val Lys Leu Tyr Ala Glu Ser Gly Tyr Phe Ser Phe Tyr
210 215 220
Gly Leu Leu Lys Leu Leu Tyr Gly Leu Asn Thr 225 230 235
<210> 35 <211> 1019 <212> DNA <213> Nymphaea alba <4 00> 35
aatctgctca ctaaaaaaga aacagaactt ctcaaaaatt ctgtagcttg tgtgccattc ttctagcaag ctatgtctca acttcttgat cttacagagc aactctgcta tgtgcagtgc agtttctgtg ataccatctt gctggtaagt gtcccttgca gtagcttgct gaaagtggtg cctgtcagat gtggccattg tagcaacctt ttttcggtaa acatgctgaa ggcttctttt cttcctcttc agcttcttgc ttcaatcaac aatgaggcaa agcaggacag tttcgaaaat gcacctgtca agattggaga tactaccttc atggaatcac tctatgagga agaaagaaga cctgcattta ctgtcaataa gcctccagag aagagacaca gagctccttc tgcttacaac cgtttcataa aggaagagat ccagaggctt aagaccagtg agccaaacat cagccacagg gaggcattca gcactgctgc taaaaattgg gcacacatgc ctagaattca gcataaacca gatgcggaaa gtggcagcca gagacagagc aacaaaggca aagacaagca tgttgaccgc gaggataaag aaggaaatca aattttccag cagagaaagg tgtcaaggca atgcttcttg acgaaagtac cccagcaatg aagcttaaat tacaaaagca atccactgag ttttggtcta
420 480 540 600 660 720 765
60 120 180 240 300 360 420 480 540 600 660 720 atgatcagag aagatggtaa aagcttcggg aatatgaggg atctgagttt cccagtctta
tccacagatt gctgagttct tggcacaaaa tacccttctt ttcttcctct cactagggca
aggtctctta gggtttcatt agctagaaaa tcaagcagtt ttaccatttt gtattgatct
gaaagacttc tctgtatctc ttattttggt tgttttggta atttggggtc tcagttagtt
taagaatggt aaaacttttc tttctcaaca tgaaaaatta tgaaagctac ttcaattcc
<210> 36
<211> 202
<212> PRT
<213> Nymphaea alba
<400> 36
Met Ser Gln Leu Leu Asp Leu Thr Glu Gln Leu Cys Tyr Val Gln Cys 10 15
Ser Phe Cys Asp Thr Ile Leu Leu Val Ser Val Pro Cys Ser Ser Leu
25 30
Leu Lys Val Val Pro Val Arg Cys Gly His Cys Ser Asn Leu Phe Ser
40 45
Val Asn Met Leu Lys Ala Ser Phe Leu Pro Leu Gln Leu Leu Ala Ser
50 55 60
Ile Asn Asn Glu Ala Lys Gln Asp Ser Phe Glu Asn Ala Pro Val Lys 65 70 75 80
Ile Gly Asp Thr Thr Phe Met Glu Ser Leu Tyr Glu Glu Glu Arg Arg
85 90 95
Pro Ala Phe Thr Val Asn Lys Pro Pro Glu Lys Arg His Arg Ala Pro
100 105 HO
Ser Ala Tyr Asn Arg Phe Ile Lys Glu Glu Ile Gln Arg Leu Lys Thr
115 120 125
Ser Glu Pro Asn Ile Ser His Arg Glu Ala Phe Ser Thr Ala Ala Lys
130 135 140
Asn Trp Ala His Met Pro Arg Ile Gln His Lys Pro Asp Ala Glu Ser 145 150 155 160
Gly Ser Gln Arg Gln Ser Asn Lys Gly Lys Asp Lys His Val Asp Arg
165 170 175
Glu Asp Lys Glu Gly Asn Gln Ile Phe Gln Gln Arg Lys Val Ser Arg
180 185 190
Gln Cys Phe Leu Thr Lys Val Pro Gln Gln
195 200
<210> 37 <211> 1037 <212> DNA <213> Oryza sativa <400> 37
ccccgcacca ccgctcacac ttgctcctcc tcctcctcct cctccgcctc agtgctaggg ctagcttgct tgtcgccgtc gccgccgtcg tcgccgccgc aatggatctc gtgtcgccgt ccgagcacct gtgctacgtg cgctgcacct actgcaacac cgtgctcgcg gttggagtcc catgcaagag gctgatggac accgtgaccg tgaaatgtgg ccactgcaac aacctctcct tcctcagccc gcggccgccg atggtgcagc cgctctcccc aactgatcac cccttgggcc cgtttcaggg accttgcact gactgcagga ggaaccagcc gctgccgctg gtctcgccga catcaaatga gggtagccca agagcaccct tcgttgtgaa gcccccagag aagaaacacc gcctcccatc tgcttacaac cgcttcatga gggaggaaat acagcgtatc aaagctgcca agccagatat ccctcacagg gaggccttca gcatggctgc caagaactgg gcgaagtgcg acccccgctg ctcatcgacg gtttccacct ccaacagcaa ccccgagccc agagtagtag ctgctcccat tcctcatcag gagagggcca acgagcaggt ggtcgagagc ttcgacatct tcaagcagat ggagcgcagc ggctagggcg gcggcggcgg ccggagccgg cggcgatcta tatcggcggt gaagctcgta tgaagctagc tagcctgcag gccggccact ggggagagta ccaaatttca gatccccctt attatcaccg tcgtcagctc agctcatgca tgcatgctca tcgttcccct ttagcatata tctgtgctcg ttttgtgttt attagttaat tatgtttgat cttgttaatt tgttgttgca tggagtatgt accccctata agacccagct gctgctaccg tacgatatac gtacgtatgc tatatatata tatatatata tatatatatt tgtcatctaa aaaaaaaaaa aaaaaaa <210> 38 <211> 194 <212> PRT <213> Oryza sativa
780 840 900 960 1019
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1037 <4 00> 38
Met Asp Leu Val Ser Pro Ser Glu His Leu Cys Tyr Val Arg Cys Thr 10 15
Tyr Cys Asn Thr Val Leu Ala Val Gly Val Pro Cys Lys Arg Leu Met
25 30
Asp Thr Val Thr Val Lys Cys Gly His Cys Asn Asn Leu Ser Phe Leu
40 45
Ser Pro Arg Pro Pro Met Val Gln Pro Leu Ser Pro Thr Asp His Pro
50 55 60
Leu Gly Pro Phe Gln Gly Pro Cys Thr Asp Cys Arg Arg Asn Gln Pro 65 70 75 80
Leu Pro Leu Val Ser Pro Thr Ser Asn Glu Gly Ser Pro Arg Ala Pro
85 90 95
Phe Val Val Lys Pro Pro Glu Lys Lys His Arg Leu Pro Ser Ala Tyr
100 105 110
Asn Arg Phe Met Arg Glu Glu Ile Gln Arg Ile Lys Ala Ala Lys Pro
115 120 125
Asp Ile Pro His Arg Glu Ala Phe Ser Met Ala Ala Lys Asn Trp Ala
130 135 140
Lys Cys Asp Pro Arg Cys Ser Ser Thr Val Ser Thr Ser Asn Ser Asn 145 150 155 160
Pro Glu Pro Arg Val Val Ala Ala Pro Ile Pro His Gln Glu Arg Ala
165 170 175
Asn Glu Gln Val Val Glu Ser Phe Asp Ile Phe Lys Gln Met Glu Arg 180 185 190
Ser Gly
<210> 39 <211> 489 <212> DNA
<213> Petunia χ hybrida <4 00> 39
atggatttgg ctcaaacttc agaacatctt tgttatgtcc gttgtagctt ctgcaacact 60
gttcttgcgg tcggaatacc attcaagagg ctattggata cagtaacagt aaaatgtggc 120 cattgtagta acctttcctt tctaagtact agaccaccac ttcaaggaca atgttttgat 180 caccaaaccg ctcttcagca tcaagctttc ttcagtgatt acaagaaagg ccagtcttca 240 tcatcctttt cgtcatcttc aagtgaaccc tcctctccaa aggcaccttt tgttgtaaaa 300 cctcctgaga agaagcacag gcttccatct gcctacaatc ggttcatgaa ggaagagata 360 caacgtatta aagcagcaaa tccagagatt ccacaccgag aagctttcag tgcagcagct 420 aaaaattggg ctaggtatat tcctaatact ccaaacgggc cattgtctga gagcaggaat 480 aatgcttag 489
<210> 40 <211> 162 <212> PRT
<213> Petunia χ hybrida <4 00> 40
Met Asp Leu Ala Gln Thr Ser Glu His Leu Cys Tyr Val Arg Cys Ser 10 15
Phe Cys Asn Thr Val Leu Ala Val Gly Ile Pro Phe Lys Arg Leu Leu
25 30
Asp Thr Val Thr Val Lys Cys Gly His Cys Ser Asn Leu Ser Phe Leu
40 45
Ser Thr Arg Pro Pro Leu Gln Gly Gln Cys Phe Asp His Gln Thr Ala
50 55 60
Leu Gln His Gln Ala Phe Phe Ser Asp Tyr Lys Lys Gly Gln Ser Ser 65 70 75 80
Ser Ser Phe Ser Ser Ser Ser Ser Glu Pro Ser Ser Pro Lys Ala Pro
85 90 95
Phe Val Val Lys Pro Pro Glu Lys Lys His Arg Leu Pro Ser Ala Tyr
100 105 110
Asn Arg Phe Met Lys Glu Glu Ile Gln Arg Ile Lys Ala Ala Asn Pro
115 120 125
Glu Ile Pro His Arg Glu Ala Phe Ser Ala Ala Ala Lys Asn Trp Ala 130 135 140
Arg Tyr Ile Pro Asn Thr Pro Asn Gly Pro Leu Ser Glu Ser Arg Asn 145 150 155 160
Asn Ala
<210> 41 <211> 1105 <212> DNA
<213> Triticum aestivum <4 00> 41
tgcgggcgtt catgctcaga aacaaggttg ggacaagcac ttccaggcta aaatcgaaac gtactcteaa cagttcgctt aggcatggaa gttttgcggc cacaataaca agggaagact tactcgtggc tgcaacccta ctagctcaaa acatggttac gctttgggga aattatgagg ggatctctca gtgcagagca gtcgccgtcc gagcacctct gctacgtgcg ctgcacgtac cgcaacaccg gcaggttggg gttccatgca agaggctgat ggacacggtg actgtgaaat caacaacctc tcctttctca gcccacggcc gccgcccatg gtgcagcccc tgaccaccac caccccatgg ggccgttcca gggatggact gactgcagga gctgccaccg ctggcctcgc cgacatcaag tgatgccagc cccagagctc caagccccca gagaagaaac accgcctgcc atctgcctac aatcgcttca aatacaacgt atcaaagctg caaagccaga catccctcac agagaagcct tgctaagaac tgggcgaagt gcgaccctcg ctgctcatcg actgtctctg cgccccggag cccagaataa tagtgcccgg tcctcagctg caggagaggg agtggttgag agcttcgaca tcttcaagca gatggagcgc agcgcctaag catggtggga ttaattagta ctgctaccgc atgcatcggt cacttatcag atcatcatcc gtcgctatgc atatatataa tgcataagcg cacgcgtttt ggttacttcg ttgctgctgc tgctgtgtcg ttaagttgat ggtgttgtct ttgttggagc gtacgtactc acactttaat tatgaacagc tgctacctta catcgaaaaa aaaaaaaaaa aaaaa <210> 42 <211> 199 <212> PRT
<213> Triticum aestivum <4 00> 42
Met Asp Leu Val Ser Pro Ser Glu His Leu Cys Tyr Val 10
Tyr Arg Asn Thr Val Leu Ser Leu Gln Val Gly Val Pro
25
Leu Met Asp Thr Val Thr Val Lys Cys Gly His Cys Asn
40 45
Phe Leu Ser Pro Arg Pro Pro Pro Met Val Gln Pro Leu
50 55 60
Asp His His His Pro Met Gly Pro Phe Gln Gly Trp Thr 65 70 75
Arg Asn Gln Pro Leu Pro Pro Leu Ala Ser Pro Thr Ser
85 90
Ser Pro Arg Ala Pro Phe Val Val Lys Pro Pro Glu Lys
100 105
Leu Pro Ser Ala Tyr Asn Arg Phe Met Arg Glu Glu Ile 115 120 125
Lys Ala Ala Lys Pro Asp Ile Pro His Arg Glu Ala Phe
130 135 140
Ala Lys Asn Trp Ala Lys Cys Asp Pro Arg Cys Ser Ser 145 150 155
Ala Ser Asn Ser Ala Pro Glu Pro Arg Ile Ile Val Pro
165 170
Leu Gln Glu Arg Ala Thr Glu Gln Val Val Glu Ser Phe
180 185
Lys Gln Met Glu Arg Ser Ala
195 <210> 43 <211> 1001 <212> DNA
acacagtcag attctggcta atttattcac tggatttggt tgctctcgct gcggccactg tctccccaaa ggaaccagcc cctttgttgt tgagggagga tcagcatggc cttccaacag ctaccgagca gaatcataag ctagctcatc atttgtgttt gttatatttg taatattttt
Arg Cys Thr 15
Cys Lys Arg 30
Asn Leu Ser
Ser Pro Asn
Asp Cys Arg 80
Ser Asp Ala 95
Lys His Arg 110
Gln Arg Ile
Ser Met Ala
Thr Val Ser 160
Gly Pro Gln 175
Asp Ile Phe 190
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1105 <213> Zea mays <4 00> 43
gcacgagcac acagctagca gacagccaga cacgcgctgc cggaggctcc tcccaacata ccaccctgcc agccgcgccg caccaagcaa gcatggatat ggtttcgcag tccgagcacc tactgcaaca ccgtgctcgc ggttggggtt ccatgcaaga gtcaagtgcg gccactgcaa caacctctcc tacctcagtc ccgctctcgc cgactgatca ccctttgggg ccattccagt tgcaggagga accaaccgct gccgctggct tcgccgtcat atgcccttcg tagtcaagcc cccggagaag aaacaccgcc ttcatgaggg aggagattca gcgcatcaaa gctgcgaagc gccttcagca tggctgccaa gaattgggca aagtgtgacc tctaccgaaa cttctaacag cgctcctgct gagcctagag actgagccac gctttgacct ggaggatagg gccaaggggc atcttcaagc atattgagcg cagcatctag aggtcgttcg tatcgatcga gtaccatcag ctatatgtat aacctatccc caatcatgca tccccatcct gtacttttac ccccgtacgt cgttatggtt ggattgtacg caccatttaa ttatgaacag atttgccttc ttttttgttc ctaaaaaaaa aaaaaaaaaa <210> 44 <211> 205 PRT
Zea mays 44
Met Asp Met Val Ser Gln Ser Glu His Leu Cys 10
Tyr Cys Asn Thr Val Leu Ala Val Gly Val Pro
25
Asp Thr Val Thr Val Lys Cys Gly His Cys Asn
tttctgatct ccacgtccac tgtgctacgt ggctgatgga cacggccccc gtcagggacc caactgagct tcccatctgc cagatatccc cgcgctgctc ttgtgcccac aagtcattga atgccgctgt gtatcgccgt gttactgttg ctgctaccta a
ctccccggat gccggccggc ccgctgcacc cacggtgact catggtgcag ctgcaacgac aagcccgaga ttataatcgc tcacagggag gacggctgcc tccccagtta gagcttcgac tgtagcccag cgtcgcctcg ctgttattct tatatataat
<212> <213> <4 00>
Tyr Val Arg Cys Asn
35
40
Ser Pro Arg Pro Pro Met Val Gln Pro Leu Ser
50
55
Leu Gly Pro Phe Gln Cys Gln Gly Pro Cys Asn
Pro 60 Asp
Lys Arg 30
Leu Ser 45
Thr Asp
65 Gln
70
75
Pro Leu Pro Leu Ala Ser Pro Ser Ser Thr Glu 85 90
Met Pro Phe Val Val Lys Pro Pro Glu Lys Lys His
Arg
100
105
Ala Tyr Asn Arg Phe Met Arg Glu Glu Ile Gln
115 120
Lys Pro Asp Ile Pro His Arg Glu Ala Phe Ser Met 130 135 140
Trp Ala Lys Cys Asp Pro Arg Cys Ser Thr Ala Ala 145 150 155
Ser Asn Ser Ala Pro Ala Glu Pro Arg Val Val Pro
165 170
Thr Glu Pro Arg Phe Asp Leu Glu Asp Arg Ala Lys
180 185
Glu Ser Phe Asp Ile Phe Lys His Ile Glu Arg Ser 195 200
45 20 PRT
Seqüência artificial
Cys Arg
Leu Ser
Arg Leu 110 Ile Lys 125
Ala Ala
Ser Thr
Thr Pro
Gly Gln 190
Ile 205
Cys Thr 15
Leu Met
Tyr Leu
His Pro
Arg Asn 80
Pro Arg 95
Pro Ser
Ala Ala
Lys Asn
Glu Thr 160 Gln Leu 175
Val Ile
<210> <211> <212> <213> <220> <223> <220> <221> <222> <22 3> <220> <221> <222>
motivo 1
VARIANTE (1) - · (1)
/substituir="Gly" /substituir="Asp"
VARIANTE (2) . . (2)
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1001 <223> /substituir="Arg" /substituir="His" <220>
<221> VARIANTE
<222> (3)..(3)
<223> /substituir="Leu" <22 0>
<221> VARIANTE
<222> (4) . . (4)
<223> /substituir="Gly" /substituir="Tyr" <220>
<221> VARIANTE
<222> (5)..(5)
<223> /substituir="Tyr" /substituir="Cys" <220>
<221> VARIANTE
<222> (7)..(7)
<223> /substituir="Arg"
<220>
<2 21> VARIANTE
<222> (9)..(9)
<223> /substituir="Ser" /substituir="Asn" /substituir="Thr" <220>
<221> VARIANTE
<222> (10)..(10)
<223> /substituir="Ile" /substituir="Tyr" <220>
<2 21> VARIANTE
<222> (11)..(11)
<22 3> /substituir="Arg"
<220>
<221> VARIANTE
<222> (12)..(12)
<223> /substituir="Ala" /substituir="Asp" /substituir="Asn" /substituir="Ser" <22 0>
<221> VARIANTE
<222> (14)..(14)
<223> /substituir="Val" /substituir="Leu" <220>
<221> VARIANTE
<222> (16)..(16)
<223> /substituir="Ala" /substituir="Ser" <220>
<221> VARIANTE
<222> (18)..(18)
<223> /substituir="Gly" <220>
<221> VARIANTE
<222> (19)..(19)
<223> /substituir="Ile"
<4 00> 45
Glu Gln Ile Cys His Val Gln Cys Gly Phe Cys Thr Thr Ile Leu Leu 10 15
Val Ser Val Pro 20
<210> 46
<211> 10
<212> PRT
<213> Seqüência artificial <220>
<223> motivo 2 <220>
<221> VARIANTE <222> (1)..(1)
<223> /substituir="Ala" /substituir="Thr" <22 0>
<221> VARIANTE
<222> (3)..(3)
<223> /substituir="Ala" /substituir="Pro" <22 0>
<221> VARIANTE
<222> (5)..(5)
<223> /substituir="Gln" /substituir="Lys" <220>
<221> VARIANTE
<222> (10)..(10)
<223> /substituir="Gly" /substituir="Ser" /substituir="Asn"
<400> 46
Val Val Thr Val Arg Cys Gly His Cys Thr 10
<210> 47
<211> 5
<212> PRT
<213> Seqüência artificial <220>
<223> motivo 3
<400> 47 Leu Leu Val Ser Val 1 5
<210> 48 <211> 5 <212> PRT <213> Seqüência artificial <220> <223> motivo 4 <220> <221> VARIANTE <222> (1) - - (1) <223> /substituir="Glu" <400> 48 Asp Thr Val Thr Val 1 5 <210> 49 <211> 14 <212> PRT <213> Seqüência artificial <22 0> <223> motivo 5 <220> <221> VARIANTE <222> (5) . . (5) <223> /substituir="Arg" <220> <221> VARIANTE <222> (6) . . (6) <223> /substituir="Lys" <22 0> <221> VARIANTE <222> (7) . . (7) <223> /substituir="His" <220> <221> VARIANTE <222> (9) . . (9) <223> /substituir="Thr" /substituir <400> 49 Lys Pro Pro Glu Lys Arg Gln Arg Ala Pro Ser Ala Tyr Asn
10
<210> 50
<211> 12
<212> PRT
<213> Seqüência artificial <220>
<223> motivo 6 <220>
<221> VARIANTE
<222> (1) . . (1)
<223> /substituir="Arg" <220>
<221> VARIANTE
<222> (2)..(2)
<223> /substituir="Lys" /substituir="Asp" <220>
<221> VARIANTE
<222> (5)..(5)
<223> /substituir="Lys" /substituir="Gln" <22 0>
<221> VARIANTE
<222> (7)..(7)
<223> /substituir="Ile" <220>
<221> VARIANTE
<222> (8)..(8)
<223> /substituir="Glu" <220>
<221> VARIANTE
<222> (9)..(9)
<223> /substituir="Ile" /substituir="Ser" /substituir="Thr" <220>
<221> VARIANTE
<222> (10) .. (10)
<223> /substituir="Glu" /substituir="Met" /substituir="Ser" /substituir="Ala"
/substituir="Gly"
<220>
<221> VARIANTE
<222> (11) . . (11)
<223> /substituir="Tyr" /substituir="Glu" /substituir="Lys"
<4 00> 50
Lys Glu Glu Ile Arg Arg Leu Lys Ala Gln Asn Pro 10
<210> 51 <211> 14 <212> PRT <213> Seqüência artifi <220> <223> motivo 7 <220> <221> VARIANTE <222> (2) . . (2) <223> /substituir="Arg <220> <221> VARIANTE <222> (3) . . (3) <223> /substituir="Gln <220> <221> VARIANTE <222> (7) . . (7) <223> /substituir="Ala" /substituir="Thr" /substituir="Ser" /substituir="Met" <22 0>
<221> VARIANTE <222> (14)..(14)
<223> /substituir="Lys" /substituir="Arg" <400> 51
His Lys Glu Ala Phe Ser Leu Ala Ala Lys Asn Trp Ala His
10
<210> 52
<211> 2193
<212> DNA
<213> Oryza sativa
<4 00> 52
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120 catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180 tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240 tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300 aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360 atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420 ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480 ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540 gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600 tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660 tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720 aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780 aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840 acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900 tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960 aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020 ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080 cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140 cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200 tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260 gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320 ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380 gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440 aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500 ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560 atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620 acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680 cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740 ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800 gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860 tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920 attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980 tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040 cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100 agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160 tggtgtagct tgccactttc accagcaaag ttc 2193
<210> 53 <211> 56 <212> DNA
<213> Seqüência artificial <220>
<223> iniciador: prm9238 <4 00> 53
ggggacaagt ttgtacaaaa aagcaggctt aaacaatgaa cctagaagag aaacca 56
<210> 54 <211> 50 <212> DNA
<213> Seqüência artificial <220>
<223> iniciador: prm9239 <4 00> 54
ggggaccact ttgtacaaga aagctgggtt <210> 55
2794 DNA
Seqüência artificial
tatttttagg cttcttttcc
50
<211> <212> <213> <220> <223> <4 0 0>
cassete de expressão 55
aatccgaaaa gtttctgcac cgttttcacc aaatataaaa tgagacctta tatatgtagc catccaccta ctttagtggc aatcgggcta tttccttagt aattaagtgg gaaaatgaaa tctgtcatga agttaaatta ttcgaggtag aaaaaatctt tctagctgaa ctcaatgggt atgaagatat tctgaacgta ttggcaaaga ttgtgcattc gtcatatcgc acatcattaa ttagtaatta aagacaattg acttattttt gtacttacgc acacactttg tgctcatgtg tcaactagca acacatctct aatatcactc tgaattcaag cactccacca tcaccagacc aattttacag aatagcatga aaagtatgaa aaaaaaagaa ttttgctcgt gcgcgagcgc acagagtggc tgcccacaga acaacccaca tccgcaacaa ccttttaaca gcaggctttg aaccaagcat cctcctcctc ccatctataa ggaggcatcc aagccaagaa gagggagagc cgaccgcctt cttcgatcca tatcttccgg cacctcctcc tcacagggta tgtgcccttc tgtagtacgg gcgttgatgt taggaaaggg gatttgggat agaggggttc ttgatgttgc ggttttcaat cgtctggaga gctctatgga gattttgtga gtaccttttg tttgaggtaa aataaaagta cggttgtttg gtcctcgatt ctatcctttg tttattccct attgaacaaa atgagattga atgattgatt cttaagcctg acagtagtcc ccatcacgaa attcatggaa cctgttcttc cgatttgctt tagtcccaga ctttctggtt cagttcaatg aattgattgc gctgtagttc agttaatagg taatacccct tttctgatct ccatttttaa ttatatgaaa attatttttt ttattagctc tcaccccttc tgtcctcaat tttgttttca aattcacatc cctgtagaag tttctttttg gttattcctt agctgtaatc gggatagtta tactgcttgt tggtgtagct tgccactttc accagcaaag tttgtacaaa aaagcaggct taaacaatga caagggcttc ccctcaagcc gaacatctct tcctcgcggt tgggatacca ttgaagagaa attgtggtaa cctctcgttt ctcaccacaa cccttcagat gcagagcttt ggtggaagtg cttcctccac ctccagcgac cagcccccat ctgagaagaa gcagaggctc ccatctgcat gcatcaaaag tgccaatccg gaaataccac attgggctaa gtacataccc aactctccta tccatggctt gagattcggt gagaagaagt <210> 56 <211> 20 <212> PRT
<213> Seqüência artificial <220>
ccctaactaa gctgataact aataaaaaag tcattattgc ccataattgt aaagagagag tttaaacata ggacatgtct attatttatc catgtgtgag gcctatttaa acttttaata acgaactatt caatctccca aaaaacgatg cggccaggag attcctcccc accaaggaca tcgagttctt ggttgttctt gatctgtatc atgttatcgg aatgaaatgg aatcagagca ctggtagtga aataatccaa tccaaaattt acagttataa attttttttc tacaaataat atagtttagt tgaactgtag attattctga gattatctat gactgcttga tcttatgatt ttcatttaaa acctagaaga actacgtccg tgcttgacac ctcctcctct actataagaa ctccctcacc acaaccgctt accgtgaagc cttccattac gaac
caatataggg agaactatgc agtcgctaca ttagaatata catcaaactc atttttttta taattatata tactccatcc ttttttcgat tgcacctcct tacatttagg atatctaaaa taggtttttc tattgggcac atctaacgga agaggaggag ccttttcccc cgcgactagc ggtcgatctc ggatttattg tgtgatgatt ttcggtttga tttagggtac ccggtgattt tgcttctcga ctttgaagac cgcagctggc tcctcaggaa ccaaatatct gcttttatag caggagaaga cataagcagt gctgaaagtc gcattatcct ttacagaaag catttccttt tcaactaggg gaaaccaacc gtgtagcatc ggtaacggtg tcaaggccat gggaagctct tccctttgtc catgagggat tttcagtgct ttccggaggc
aacgtgtgct aagaaaaact ctagtttcgt cgttcacatc ttcttgaata aaaaaataga attttatagt caatttttat tagatgcaag caatacacgt tagcaatatc tacaaaaaat acatacaaaa acaggcaaca ggacagcaag aggcaaagaa tctctatata agaagccgag ttccctcctc ttctaggttg cctgttcttg ttagtagtat ggaatcttgc tgcttggtgt tttgacgaag ggtcccgttg ttgtttagat caggggattc taaaaagtca cgttatccta acttatccga attcatttgg tggcatgaac cttgtatcta aaatttatga gtgcagttct atatcacaag atgacggctt tgcaacacca aaatgcggcc gttagcctca tcttcttcct gtcaaacctc gagatccaac gctgccaaaa cacaacatga
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 2794 <223> motivo 1 <220>
<221> VARIANTE <222> (1)..(1)
<223> /substituir="Gly" /substituir="Asp" <220>
<221> VARIANTE <222> (2)..(2)
<223> /substituir="Arg" /substituir="His" <220>
<221> VARIANTE <222> (3)..(3)
<223> /substituir="Leu" <220>
<221> VARIANTE <222> (4)..(4)
<223> /substituir="Gly" /substituir="Tyr" <220>
<221> VARIANTE <222> (5)..(5)
<223> /substituir="Tyr" /substituir="Cys" <220>
<221> VARIANTE
<222> (7)..(7)
<223> /substituir="Arg"
<220>
<221> VARIANTE
<222> (9)..(9)
<223> /substituir="Ser" /substituir="Asn" /substituir="Thr" <220>
<221> VARIANTE
<222> (10) . . (10)
<223> /substituir="Ile" /substituir="Tyr" <220>
<221> VARIANTE
<222> (11)..(11)
<223> /substituir="Arg" <220>
<221> VARIANTE
<222> (12)..(12)
<223> /substituir="Ala" /substituir="Asp" /substituir="Gln" /substituir="Asn"
/substituir="Ser"
<22 0>
<221> VARIANTE
<222> (14)..(14)
<223> /substituir="Val" /substituir="Leu" <220>
<221> VARIANTE
<222> (16)..(16)
<223> /substituir="Ala" /substituir="Ser" <220>
<221> VARIANTE
<222> (18)..(18)
<223> /substituir="Asn" /substituir="Gly" <22 0>
<221> VARIANTE
<222> (19)..(19)
<223> /substituir="Ile"
<4 00> 56
Glu Gln Ile Cys His Val Gln Cys Gly Phe Cys Thr Thr Ile Leu Leu 10 15 Val Ser Val Pro 20
<210> 57
<211> 10
<212> PRT
<213> Seqüência artificial <220>
<223> motivo 2 <22 0>
<221> VARIANTE
<222> (1)..(1)
<223> /substituir="Ala" /substituir="Thr <220>
<221> VARIANTE
<222> (3)..(3)
<223> /substituir="Ala" /substituir="Pro <220>
<221> VARIANTE
<222> (5)..(5)
<223> /substituir="Gln" /substituir="Lys <220>
<221> VARIANTE
<222> (8)..(8)
<223> /substituir="Cys" <22 0>
<2 21> VARIANTE
<222> (10)..(10)
<223> /substituir="Gly" /substituir="Ser
<4 00> 57
Val Val Thr Val Arg Cys Gly His Cys Thr
10
<210> 58
<211> 5
<212> PRT
<213> Seqüência artificial <220>
<223> motivo 4 <22 0>
<221> VARIANTE
<222> (1)..(1)
<223> /substituir="Asp" /substituir="Glu'
<4 00> 58
Lys Thr Val Thr Val
1 5
<210> 59
<211> 14
<212> PRT
<213> Seqüência artificial <220>
<223> motivo 5 <220>
<221> VARIANTE
<222> (1)..(1)
<223> /substituir="Arg" <220>
<221> VARIANTE
<222> (5)..(5)
<223> /substituir="Arg"
<220>
<221> VARIANTE
<222> (6)..(6)
<223> /substituir=nLys"
<220> <221> <222> <223> <220> <221> <222> <223> <4 00>
VARIANTE (7) . . (7)
/substituir="His'
VARIANTE (9) . . (9)
/substituir="Thr" /substituir="Val" 59
/substituir="Leu' Lys Pro Pro Glu Lys Arg Gln Arg Ala Pro Ser Ala Tyr Asn
1
<210> <211> <212> <213> <400>
10
60
1130 DNA
Oryza sativa 60
catgcggcta atgtagatgc tcactgcgct agtagtaagg
tatacaaagc tgtaatactc gtatcagcaa gagagaggca
caggattaga aaaacgggac gacaaatagt aatggaaaaa
catggcaata taaatggaga aatcacaaga ggaacagaat
gtactcgtac gtaaaaaaaa gaggcgcatt catgtgtgga
gatttgaaac cactcaaatc caccactgca aaccttcaaa
tagaaagcac aggtaagaag' cacaacgccc tcgctctcca
gcacctcgcg gatcggtgac gtggcctcgc cccccaaaaa acaccccggg cccacccacc tgtcacgttg gcacatgttg
caaaatatca acgcggcgcg gcccaaaatt tccaaaatcc
gccgctcttc cacccaggtc cctctcgtaa tccataatgg
tgtacgtggg cgggttaccc tgggggtgtg ggtggatgac
cggccccgcg cgtcatcgcg gggcggggtg tagcgggtgc gaaaattcaa attaggaggt ggggggcggg gcccttggag
tgcccctgac ttggcttggc tcctcttctt cttatccctt
ttctctcctc tcctcttctc ttctcttctc tggtggtgtg
ctccttcctc ctctcctttc ccctcctctc ttcccccctc
gactctcccc aggtgaggtg agaccagtct ttttgctcga
gcctcgcgcg gatctgaccg cttccctcgg ccttctcgca
tactccagta cacaagttgt caaaaaaaaa ccgggcaata cagcgtgcag cgaggccatg ccctcccacc tatcccgcgg gttatggttc cgcccaagcc cgtgtgtacc gggtgggccc gaaaaggagg aataagcgga gtcctcgcaa ggtgtgtccc tcacaagaga ttcgacgcgc ggattcagcc
cattatggaa agcagtagca caaggaaaca cgctgcgaaa cagaagcagg gtttgaagca caatcgcgac cgtgaagctg ccggccgcac cctggcgcgt ctcggctggt ggaggaggtc cgatcggtac atcgcagata ccccgcttcc tgtctcccct gagagcgcca ctttcacgcc
60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1130

Claims (27)

1. Método para melhorar características relacionadas ao rendimento em plantas, caracterizado pelo fato de que compreende modular expressão em uma planta de um ácido nucleico codificando uma proteína relacionada a CRC, em que a seqüência de dita proteína relacionada a CRC compreende um domínio YABBY, tendo pelo menos um dos seguintes motivos: motivo 1 (SEQ ID NO: 56), motivo 2 (SEQ ID NO: 57), motivo 5 (SEQ ID NO: 59), motivo 6 (SEQ ID NO: 50), motivo 7 (SEQ ID NO: 51).
2. Método de acordo com a reivindicação 1, caracterizado pelo fato de que dito ácido nucleico codificando um polipeptídeo associado a CRC é representado por qualquer uma das SEQ ID NOs de ácido nucleico dadas em Tabela A ou uma porção desta, ou uma seqüência capaz de hibridizar com qualquer uma das SEQ ID NOs de ácido nucleico dadas em Tabela A.
3. Método de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que dita seqüência de ácido nucleico codifica um ortólogo ou parálogo de qualquer uma das SEQ ID NOs dadas em Tabela A.
4. Método de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que dita expressão modulada é efetuada por qualquer um ou mais de identificação por ativação de T-DNA, TILLING, mutagênese sítio dirigida, mutagênese sítio dirigida, evolução dirigida, evolução dirigida ou recombinação homóloga.
5. Método de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que dita expressão modulada é efetuada introduzindo e expressando em uma planta um ácido nucleico codificando uma proteína relacionada a CRC, e em que a seqüência de dita proteína relacionada a CRC compreende um domínio YABBY, tendo pelo menos um dos seguintes motivos: motivo 1 (SEQ ID NO: 56), motivo 2 (SEQ ID NO: 57), motivo 5 (SEQ ID NO: 59), motivo 6 (SEQ ID NO: 50), motivo 7 (SEQ ID NO: 51).
6. Método de acordo com qualquer uma das reivindicações 1 a 5, caracterizado pelo fato de que ditas características relacionadas ao rendimento melhoradas são obtidas em condições sem estresse.
7. Método de acordo com qualquer uma das reivindicações 1 a 5, caracterizado pelo fato de que ditas características relacionadas ao rendimento melhoradas são obtidas em condições de estresse abiótico, preferivelmente em condições de estresse por seca.
8. Método de acordo com qualquer uma das reivindicações 1 a 7, caracterizado pelo fato de que dita característica relacionada ao rendimento melhorada é rendimento aumentado de sementes.
9. Método de acordo com qualquer uma das reivindicações 5 a 8, caracterizado pelo fato de que dito ácido nucleico é operacionalmente ligado a um promotor constitutivo, preferivelmente a um promotor GOS2 ou um promotor HMGP.
10. Método de acordo com qualquer uma das reivindicações 1 a 9, caracterizado pelo fato de que dito ácido nucleico codificando uma proteína relacionada a CRC é de origem vegetal, preferivelmente de uma planta dicotiledônea, ainda preferivelmente da família Brassicaceae, mais preferivelmente do gênero Arabidopsis, mais preferivelmente de Arabidopsis thaliana.
11. Planta ou parte da mesma, caracterizada pelo fato de que inclui sementes obteníveis por um método como definido em qualquer uma das reivindicações 1 a 10, em que dita planta ou parte da mesma compreende um ácido nucleico recombinante codificando uma proteína relacionada a CRC.
12. Construção, caracterizada pelo fato de compreender: (a) ácido nucleico codificando uma proteína relacionada a CRC, em que a seqüência de aminoácidos de dita proteína relacionada a CRC compreende um domínio YABBY, tendo pelo menos um dos seguintes motivos: motivo 1 (SEQ ID NO: 56), motivo 2 (SEQ ID NO: 57), motivo 5 (SEQ ID NO: 59), motivo 6 (SEQ ID NO: 50), motivo 7 (SEQ ID NO: 51); (b) uma ou mais seqüências de controle capazes de dirigir expressão da seqüência de ácido nucleico de (a); e opcionalmente (c) uma seqüência de término de transcrição.
13. Construção de acordo com a reivindicação 12, caracterizada pelo fato de que dita uma ou mais seqüências de controle é pelo menos um promotor constitutivo, preferivelmente um promotor GOS2 ou um promotor HMGP.
14. Uso de uma construção como definida na reivindicação 12 ou 13, caracterizado pelo fato de ser para produzir plantas tendo características relacionadas ao rendimento melhoradas, particularmente rendimento aumentado de sementes, em relação a plantas de controle.
15. Uso de uma construção como definida na reivindicação 12 ou 13, caracterizado pelo fato de ser para produzir plantas tendo tolerância aumentada a estresse por seca.
16. Planta, parte de planta ou célula de planta, caracterizada pelo fato de ser transformada com uma construção como definida na reivindicação 12 ou 13.
17. Método para o rendimento de uma planta transgênica tendo características relacionadas ao rendimento melhoradas em relação às plantas de controle, caracterizado pelo fato de compreender: (i) introduzir e expressar em uma planta um ácido nucleico codificando uma proteína relacionada a CRC, em que a seqüência de aminoácidos de dita proteína relacionada a CRC compreende um domínio YABBY, tendo pelo menos um dos seguintes motivos: motivo 1 (SEQ ID NO: 56), motivo 2 (SEQ ID NO: 57), motivo 5 (SEQ ID NO: 59), motivo 6 (SEQ ID NO: 50), motivo 7 (SEQ ID NO: 51); e (ii) cultivar a célula de planta sob condições promovendo crescimento e desenvolvimento da planta.
18. Planta transgênica, caracterizada pelo fato de que tem rendimento aumentado em relação às plantas de controle adequadas, dito rendimento aumentado resultando de expressão aumentada de um ácido nucleico codificando uma proteína relacionada a CRC, em que a seqüência de aminoácidos de dita proteína relacionada a CRC compreende um domínio YABBY, tendo pelo menos um dos seguintes motivos: motivo 1 (SEQ ID NO: 56), motivo 2 (SEQ ID NO: 57), motivo 5 (SEQ ID NO: 59), motivo 6 (SEQ ID NO: 50), motivo 7 (SEQ ID NO: 51); ou uma célula de planta derivada de dita planta transgênica.
19. Planta transgênica de acordo com a reivindicação 11, 16 ou 18, caracterizada pelo fato de que dita planta é uma planta de cultivo ou uma monocotiledônea ou um cereal, tal como arroz, milho, trigo, cevada, milheto, centeio, sorgo e aveia; ou uma célula de planta derivada de dita planta transgênica.
20. Partes colhíveis de uma planta como definida em qualquer uma das reivindicações 11, 16, 18 ou 19, caracterizadas pelo fato de que ditas partes colhíveis são preferivelmente sementes.
21. Produtos, caracterizados pelo fato de serem derivados de uma planta como definida na reivindicação 19 e/ou de partes colhíveis de uma planta como definida na reivindicação 20.
22. Uso de um ácido nucleico codificando uma proteína relacionada a CRC, caracterizado pelo fato de ser para melhorar características relacionadas ao rendimento em plantas, em que a seqüência de aminoácidos de dita proteína relacionada a CRC um domínio YABBY, tendo pelo menos um dos seguintes motivos: motivo 1 (SEQ ID NO: 56), motivo 2 (SEQ ID NO: 57), motivo 5 (SEQ ID NO: 59), motivo 6 (SEQ ID NO: 50), motivo 7 (SEQ ID NO: 51).
23. Uso de acordo com a reivindicação 22, caracterizado pelo fato de que dita característica relacionada ao rendimento melhorada é rendimento aumentado de sementes em relação a plantas de controle.
24. Uso de um ácido nucleico codificando um polipeptídeo relacionado a CRC, caracterizado pelo fato de ser em um método para aumentar tolerância a estresse por seca em plantas em relação a plantas de controle.
25. Uso de acordo com a reivindicação 23, caracterizado pelo fato de que dita tolerância aumentada a estresse por seca resulta em rendimento aumentado de sementes.
26. Uso de um ácido nucleico representado por SEQ ID NO: 55, caracterizado pelo fato de ser para aumentar tolerância a estresse abiótico em plantas, em relação a plantas de controle.
27. Uso de acordo com a reivindicação 26, caracterizado pelo fato de que dita tolerância a estresse abiótico resulta em rendimento aumentado de sementes.
BRPI0718898-6A 2006-11-16 2007-11-16 Método para melhorar características relacionadas ao rendimento em plantas, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico BRPI0718898A2 (pt)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
EP06124181.6 2006-11-16
EP06124181 2006-11-16
US86661106P 2006-11-21 2006-11-21
US60/866611 2006-11-21
EP07116518 2007-09-14
EP07116518.7 2007-09-14
US97584807P 2007-09-28 2007-09-28
US60/975848 2007-09-28
PCT/EP2007/062443 WO2008059048A1 (en) 2006-11-16 2007-11-16 Plants having enhanced yield-related traits and a method for making the same using consensus sequences from the yabby protein family

Publications (1)

Publication Number Publication Date
BRPI0718898A2 true BRPI0718898A2 (pt) 2013-12-10

Family

ID=40261567

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0718898-6A BRPI0718898A2 (pt) 2006-11-16 2007-11-16 Método para melhorar características relacionadas ao rendimento em plantas, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico

Country Status (2)

Country Link
BR (1) BRPI0718898A2 (pt)
CL (1) CL2007003290A1 (pt)

Also Published As

Publication number Publication date
CL2007003290A1 (es) 2008-07-04

Similar Documents

Publication Publication Date Title
EP2193203B1 (en) Plants having increased yield-related traits and a method for making the same
US8461413B2 (en) Plants having enhanced yield-related traits and a method for making the same
EP2570426B1 (en) Plants having enhanced yield-related traits and a method for making the same
AU2008281821B2 (en) Plants having enhanced yield-related traits and a method for making the same
AU2009209600B2 (en) Plants having increased yield-related traits and a method for making the same
WO2009056566A2 (en) Plants having enhanced yield-related traits and a method for making the same
MX2011002675A (es) Plantas que tienen rasgos mejorados relacionados con el rendimiento y un metodo para obtenerlas.
WO2010000794A1 (en) Plants having enhanced yield-related traits and a method for making the same by overexpressing a polynucleotide encoding a tfl1-like protein
MX2013003411A (es) Plantas que tienen mejores rasgos relacinados con el rendimiento y un metodo para producirlas.
BRPI0718977A2 (pt) Método para aumentar rendimento de sementes em plantas em relação às plantas de controle, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica tendo redimento aumentado de sementes em relação às plantas de controle, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico
WO2010020555A1 (en) Plants having enhanced yield-related traits and a method for making the same
BRPI0924537A2 (pt) Método para aumentar as características relacionadas ao rendimento em plantas, plantas ou parte das mesmas, ou células de planta, construto, uso de um construto e de uma sequência de ácido nucleico, método para a produção de plantas transgênicas, partes colhíveis, e, produtos
US20100031389A1 (en) Plants Having Enhanced Yield-Related Traits And A Method For Making The Same Using Consensus Sequences From The Yabby Protein Family
MX2013009997A (es) Plantas que tienen rasgos relacionados con rendimiento mejorado y metodos para producir los mismos.
US8704043B2 (en) Plants having increased yield-related traits and a method for making the same
ES2544249T3 (es) Plantas que tienen rasgos relacionados con un rendimiento de semilla mejorado y un procedimiento de producción de las mismas
MX2012009370A (es) Plantas que tienen mejores rasgos relacionados con el rendimiento y un metodo para producirlas.
MX2012009524A (es) Plantas que tienen mejores rasgos relacionados con el rendimiento y un metodo para producirlas.
MX2012009522A (es) Plantas que tienen mejores rasgos relacionados con el rendimiento y un metodo para producirlas.
BRPI0718898A2 (pt) Método para melhorar características relacionadas ao rendimento em plantas, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE A 9A ANUIDADE.

B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]

Free format text: EM VIRTUDE DO ARQUIVAMENTO PUBLICADO NA RPI 2386 DE 27-09-2016 E CONSIDERANDO AUSENCIA DE MANIFESTACAO DENTRO DOS PRAZOS LEGAIS, INFORMO QUE CABE SER MANTIDO O ARQUIVAMENTO DO PEDIDO DE PATENTE, CONFORME O DISPOSTO NO ARTIGO 12, DA RESOLUCAO 113/2013.