BRPI0714723A2 - mÉtodos para aumentar o rendimento de semente de plantas e o rendimento da planta, para melhorar vÁrios traÇos e para intensificar traÇos relacionados co o rendimento em plantas, para modificar o teor de compostos de armazenagem em sementes, e para a produÇço de uma planta transgÊnica, construÇço, partes colhÍveis, produtos, usos de um Ácido nucleico/gene de az ou variante dos mesmos ou uso de um polipeptÍdeo de az ou um homàlogo do mesmo, de uma construÇço, de uma seqÜÊncia de Ácido nucleico de syt ou uso de um polipeptÍdeo de syt, de uma seqÜÊncia de Ácido nucleico e de um Ácido nucleico, planta, parte de planta ou cÉlula vegetal, seqÜÊncia de Ácido nucleico isolada, planta, partes e cÉlulas de tais plantas - Google Patents

mÉtodos para aumentar o rendimento de semente de plantas e o rendimento da planta, para melhorar vÁrios traÇos e para intensificar traÇos relacionados co o rendimento em plantas, para modificar o teor de compostos de armazenagem em sementes, e para a produÇço de uma planta transgÊnica, construÇço, partes colhÍveis, produtos, usos de um Ácido nucleico/gene de az ou variante dos mesmos ou uso de um polipeptÍdeo de az ou um homàlogo do mesmo, de uma construÇço, de uma seqÜÊncia de Ácido nucleico de syt ou uso de um polipeptÍdeo de syt, de uma seqÜÊncia de Ácido nucleico e de um Ácido nucleico, planta, parte de planta ou cÉlula vegetal, seqÜÊncia de Ácido nucleico isolada, planta, partes e cÉlulas de tais plantas Download PDF

Info

Publication number
BRPI0714723A2
BRPI0714723A2 BRPI0714723-6A BRPI0714723A BRPI0714723A2 BR PI0714723 A2 BRPI0714723 A2 BR PI0714723A2 BR PI0714723 A BRPI0714723 A BR PI0714723A BR PI0714723 A2 BRPI0714723 A2 BR PI0714723A2
Authority
BR
Brazil
Prior art keywords
plant
nucleic acid
acid sequence
polypeptide
plants
Prior art date
Application number
BRPI0714723-6A
Other languages
English (en)
Inventor
Valerie Frankard
Vladimir Mironov
Christophe Reuzeau
Ana Isabel Sanz Molinero
Original Assignee
Cropdesign Nv
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cropdesign Nv filed Critical Cropdesign Nv
Priority claimed from PCT/EP2007/058043 external-priority patent/WO2008015263A2/en
Publication of BRPI0714723A2 publication Critical patent/BRPI0714723A2/pt

Links

Landscapes

  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

MÉTODOS PARA AUMENTAR O RENDIMENTO DE SEMENTE DE PLANTAS E O RENDIMENTO DA PLANTA, PARA MELHORAR VÁRIOS TRAÇOS E PARA INTENSIFICAR TRAÇOS RELACIONADOS COM O RENDIMENTO EM PLANTAS, PARA MODIFICAR O TEOR DE COMPOSTOS DE ARMAZENAGEM EM SEMENTES, E PARA A PRODUÇçO DE UMA PLANTA TRANSGÊNICA, CONSTRUÇçO, PARTES COLHÍVEIS, PRODUTOS,USOS DE UM ÁCIDO NUCLEICO/GENE DE AZ OU VARIANTE DOS MESMOS OU USO DE UM POLIPEPTÍDEO DE AZ OU UM HOMàLOGO DO MESMO, DE UMA CONSTRUÇçO, DE UMA SEQUENCIA DE ÁCIDO NUCLEICO DE SYT OU USO DE UM POLIPEPTÍDEO DE SYT, DE UMA SEQUENCIA DE ÁCIDO NUCLEICO E DE UM ÁCIDO NUCLEICO, PLANTA, PARTE DE PLANTA OU CÉLULA VEGETAL, SEQUENCIA DE ÁCIDO NUCLEICO ISOLADA, PLANTA, PARTES E CELULAS DE TAIS PLANTAS. A presente invenção diz respeito no geral ao campo da biologia molecular e diz respeito a um método para intensificar várias características economicamente importantes em plantas. Mais especificamente, a presente invenção diz respeito a um método para melhorar traços relacionados com o rendimento, tais como rendimento intensificado e/ou crescimento intensificado ou teor modificado de compostos de armazenagem em plantas pela modulação da expressão em uma planta de umácido nucleico que codifica um polipeptídeo de GRP (Proteína Relacionada com o GRP). A presente invenção também diz respeito a plantas tendo expressão modulada de um ácido nucleico que codifica um polipeptídeo de GRP, plantas estas que têm características melhoradas em relação às plantas de controle. A invenção também fornece ácidos nucleicos que codificam GRP até aqui desconhecidos e construções que compreendem o mesmo, úteis na realização dos métodos da invenção.

Description

"MÉTODOS PARA AUMENTAR O RENDIMENTO DE SEMENTE DE PLANTAS E O RENDIMENTO DA PLANTA, PARA MELHORAR VÁRIOS TRAÇOS E PARA INTENSIFICAR TRAÇOS RELACIONADOS COM O RENDIMENTO EM PLANTAS, PARA MODIFICAR O TEOR DE COMPOSTOS DE ARMAZENAGEM EM SEMENTES, E PARA A PRODUÇÃO DE UMA PLANTA TRANSGÊNICA, CONSTRUÇÃO, PARTES COLHÍVEIS, PRODUTOS,USOS DE UM ÁCIDO NUCLEICO/GENE DE AZ OU VARIANTE DOS MESMOS OU USO DE UM POLIPEPTÍDEO DE AZ OU UM HOMÓLOGO DO MESMO, DE UMA CONSTRUÇÃO, DE UMA SEQÜÊNCIA DE ÁCIDO NUCLEICO DE SYT OU USO DE UM POLIPEPTÍDEO DE SYT, DE UMA SEQÜÊNCIA DE ÁCIDO NUCLEICO E DE UM ÁCIDO NUCLEICO, PLANTA, PARTE DE PLANTA OU CÉLULA VEGETAL, SEQÜÊNCIA DE ÁCIDO NUCLEICO ISOLADA, PLANTA, PARTES E CÉLULAS DE TAIS PLANTAS"
A presente invenção diz respeito no geral ao campo da biologia molecular e diz respeito a um método para melhorar várias planta características pela modulação da expressão em uma planta de um ácido nucleico que codifica uma GRP (Proteína Relacionada com o Crescimento). A presente invenção também diz respeito a plantas tendo expressão modulada de um ácido nucleico que codifica um polipeptídeo de GRP, plantas estas que têm características melhoradas em relação às plantas do tipo selvagem correspondentes ou outras plantas de controle. A invenção também fornece construções úteis nos métodos da invenção.
A população mundial sempre crescente e o fornecimento tornando-se menor de terras aráveis disponíveis para agricultura estimulam pesquisas voltadas para o aumento da eficiência da agricultura. Meios convencionais para as melhorias de safra e horticultura utilizam técnicas de procriação seletivas para identificar plantas tendo características desejáveis. Entretanto, tais técnicas de procriação seletivo têm diversas desvantagens, a saber que estas técnicas são tipicamente trabalhosas e resultam em plantas que freqüentemente contém componentes genéticos heterogêneos que nem sempre podem resultar no traço desejável que é passado das plantas precursoras. Avanços na biologia molecular têm permitido que a humanidade modifique o germoplasma de animais e plantas. O engendramento genético de plantas acarreta necessariamente a isolação e manipulação de material genético (tipicamente na forma de DNA ou RNA) e a introdução subsequente deste material genético em uma planta. Tal tecnologia tem a capacidade de gerar safras ou plantas tendo vários traços econômicos, agronômicos ou horticulturais melhorados.
Um traço de interesse econômico particular é o rendimento aumentado. O rendimento é normalmente definido como o produto mensurável de valor econômico de uma safra. Isto pode ser definido em termos de quantidade e/ou qualidade. O rendimento é diretamente dependente de diversos fatores, por exemplo, do número e tamanho dos órgãos, arquitetura da planta (por exemplo, o número de ramos), produção de semente, senescência de folha e mais. O desenvolvimento de raiz, captação de nutriente, tolerância ao estresse e vigor inicial também podem ser fatores importantes na determinação do rendimento. A optimização dos fatores acima mencionados pode portanto contribuir para aumentar o rendimento de safra.
O rendimento de semente é um traço particularmente importante, visto que as sementes de muitas plantas são importantes para a nutrição humana e animal. As safras tais como milho, arroz, trigo, canola e soja são responsáveis por mais da metade da ingestão calórica humana total, seja através do consumo direto das próprias sementes ou através do consumo de produtos de carne acrescidos nas sementes processadas. Elas também são uma fonte de açúcares, óleos e muitos tipos de metabólitos usados em processos industriais.As sementes contém um embrião (a fonte de novos brotos e raízes) e um endosperma (a fonte de nutrientes para o crescimento de embrião durante a germinação e durante crescimento inicial de mudas). O desenvolvimento de uma semente envolve muitos genes e requer a transferência de metabólitos das raízes, folhas e hastes nas raízes em crescimento. O endosperma, em particular, assimila os precursores metabólicos de carboidratos, óleos e proteínas e sintetizá-los em macromoléculas de armazenagem para encher os grãos.
Um outro traço importante para muitas safras é o vigor inicial. Melhorar o vigor inicial é um objetivo importante de programas de procriação do arroz modernos nos cultivares de arroz tanto temperados quanto tropicais. As raízes longas são importantes para a ancoragem no solo apropriadas em arroz semeado em água. Onde o arroz é semeado diretamente nos campos alagados e onde as plantas devam emergir rapidamente da água, brotos mais longos são associados com vigor. Onde a semeadura em sulco é praticada, mesocotiledôneas e coleóptilos mais longos são importantes para a boa emergência da muda. A capacidade para engendrar vigor inicial nas plantas pode ser de enorme importância na agricultura. Por exemplo, o vigor inicial deficiente tem sido uma limitação para a introdução de híbridos de milho {Zea mays L.) com base no germoplasma Corn Belt no Atlântico europeu.
Um outro traço importante é aquele de tolerância ao estresse abiótico melhorada. Estresse abiótico é uma causa primária de perda de safra no mundo todo, reduzindo os rendimentos médios para a maioria das plantas de safra principais em mais do que 50% (Wang et al., Plant (2003) 218: 1-14). Os estresses abióticos podem ser causados pela seca, salinidade, extremos de temperatura, toxicidade química e estresse oxidativo. A capacidade para melhorar a tolerância da planta ao estresse abiótico seria de enorme vantagem econômica para os fazendeiros do mundo todo e permitiria o cultivo de safras durante as condições adversas e em territórios onde o cultivo de safras de outro modo podem ser possíveis.
O rendimento de safra portanto pode ser aumentado pela otimização de um dos fatores mencionados acima.
Dependendo do uso final, a modificação de certos traços de rendimento podem ser favorecidos em relação a outros. Por exemplo para aplicações tais como forragem ou produção de madeira ou recurso de bio- combustível, um aumento nas partes vegetativas de uma planta pode ser desejável e para aplicações tais como produção de farinha, amido ou óleo, um aumento nos parâmetros de semente pode ser particularmente desejável. Mesmo entre os parâmetros de semente, alguns podem ser favorecidos em relação a outros, dependendo da aplicação. Vários mecanismos podem contribuir para aumentar o rendimento de semente, seja o que está na forma de tamanho de semente aumentado ou número de semente aumentado.
Um método para aumentar o rendimento (rendimento e/ou biomassa de semente) em plantas pode ser através da modificação dos mecanismos de crescimento inerentes de uma planta, tal como o ciclo celular ou vários caminhos de sinalização envolvidos no crescimento da planta ou em mecanismos de defesa.
Foi agora descoberto que várias características podem ser melhoradas em plantas pela modulação da expressão em uma planta de um ácido nucleico que codifica um polipeptídeo de GRP em uma planta. O polipeptídeo de GRP pode ser um dos seguintes: um polipeptídeo de Anquirina - Dedo de zinco (AZ), um polipeptídeo SYT; um polipeptídeo cloroplástico da frutose-1,6-bisfosfatase (cpFBPase); uma quinase indutível pequena (SIK); um fator de transcrição de homeodomínio Classe ΙΙ-zíper de leucina (HD Zip); e um polipeptídeo SYB1. As características melhoradas compreendem traços relacionados com rendimento, tais como rendimento realçado e/ou crescimento realçado ou teor modificado de compostos de armazenagem. Fundamentos Anquirina - Dedo de zinco A biomassa vegetal é produzida para safras de forragem como alfafa, milho de silagem e feno. Muitos substitutos para produção foram usados em safras de grão. Mais importante entre estas são as estimativas de tamanho de planta. O tamanho de planta pode ser medido de muitos modos dependendo das espécies e do estágio de desenvolvimento, mas incluem o peso seco de planta total, peso seco acima do solo, peso fresco acima do solo, área de folha, volume de haste, altura da planta, diâmetro da roseta, comprimento da folha, comprimento da raiz, massa da raiz, número de brotos e número de folha. Muitas espécies mantém uma razão conservativa entre o tamanho de partes diferentes da planta em um dado estágio de desenvolvimento. Estas relações alométricas são usadas para extrapolar de uma destas medidas de tamanho para uma outra (por exemplo, Tittonell et al 2005 Agric Ecosys & Environ 105: 213). O tamanho da planta em um estágio de desenvolvimento inicial tipicamente correlacionar-se-á com o tamanho da planta mais tarde no desenvolvimento. Uma planta maior com uma área de folha maior pode tipicamente absorver mais luz e dióxido de carbono do que uma planta menor e portanto provavelmente ganhará um peso maior durante o mesmo período (Fasoula & Tollenaar 2005 Maydica 50: 39). Isto é além da continuação potencial da vantagem micro-ambiental ou genética que a planta teve para alcançar o tamanho maior inicialmente. Existe um componente genético forte para o tamanho da planta e taxa de crescimento (por exemplo, ter Steege et al 2005 Plant Physiology 139: 1078) e assim para uma faixa de genótipos diversos o tamanho da planta sob uma condição ambiental é provável estar correlacionado com o tamanho sob uma outra (Hittalmani et al 2003 Theoretical Applied Genetics 107: 679). Deste modo um ambiente padrão é usado como um substituto para os ambientes diversos e dinâmicos encontrados em locais e tempos diferentes pelas safras no campo.
O índice de colheita, a razão de rendimento de semente para o peso seco acima do solo, é relativamente estável sob muitas condições ambientais e assim uma correlação robusta entre o tamanho da planta e o rendimento de grão pode ser freqüentemente obtido (por exemplo, Rebetzke et al 2002 Crop Science 42: 739). Estes processos são intrinsecamente ligados porque a maioria da biomassa de grão é dependente da produtividade fotossintética corrente ou armazenada pelas folhas e haste da planta (Gardener et al 1985 Physiology of Crop Plants. Iowa State University Press, pp 68-73). Portanto, selecionar quanto ao tamanho da planta, mesmo em estágios iniciais de desenvolvimento, tem sido usado como um indicador para o rendimento potencial futuro (por exemplo, Tittonell et al 2005 Agric Ecosys & Environ 105: 213). Quando do teste quanto ao impacto de diferenças genéticas sobre a tolerância ao estresse, a capacidade para padronizar as propriedades de solo, temperatura, água e disponibilidade de nutriente e intensidade de luz é uma vantagem intrínseca de ambientes de estufa ou câmara de crescimento de planta comparada ao campo. Entretanto, limitações artificial no rendimento devido à polinização deficiente devido à ausência de ventos ou insetos ou espaço insuficiente para a raiz madura ou crescimento da copa, pode restringir o uso destes ambientes controlados para testar diferenças de rendimento. Portanto, as medições de tamanho da planta em desenvolvimento inicial, sob condições padronizadas em uma câmara de crescimento ou estufa, são práticas padrão para fornecer indicação de vantagens de rendimento genético potenciais.
A transcrição é realizada pelas RNA polimerases. Estas polimerases são usualmente associadas com outras proteínas (fatores de transcrição) que determinam a especificidade do processo de transcrição. Os fatores de transcrição ligam-se aos elementos reguladores em eis do gene e também podem mediar a ligação de outras proteínas reguladoras. Stegmaier et al. propuseram uma classificação de fatores de transcrição com base nos seus domínios de ligação de DNA. 5 superclasses foram discriminadas, com base na presença de: 1) domínios básicos, 2) domínios da coordenação do zinco, 3) domínios de hélice-volta-hélice, 4) domínios de armação beta com contatos de ranhura menor e 5) outros domínios (Stegmaier et al., Genome informatics 15, 276-286, 2004). O grupo de fatores de transcrição que compreendem os domínios da coordenação do zinco é bastante variado e pode ser classificado ainda de acordo com os seus resíduos de cisteína e histidina conservados, incluindo os domínios WRKY, domínios de grupos de zinco C6, DM e GCM.
Além dos motivos de ligação de DNA, os fatores de transcrição também podem compreender os motivos de interação de proteína- proteína. Um tal motivo é o motivo da anquirina. Este está presente em famílias muito diversas de proteínas, usualmente como uma repetição de 2 até acima de 20 unidades. Cada unidade contém duas hélices antiparalelas e um grampo de cabelo beta.
Embora muitas proteínas vegetais com domínios de dedo de zinco sejam bem caracterizadas, pouco é conhecido a cerca de proteínas vegetais que compreendem o motivo de dedo de zinco C3H1. PEI1, um fator de transcrição que segundo notícias desempenha um papel no desenvolvimento de embrião, tem um motivo de dedo de zinco que se parece com o motivo C3H1 mas carece de um motivo de anquirina (Li e Thomas, Plant Célula 10, 383-398, 1998). A WO 02/44389 descreve AtSIZ, um fator de transcrição isolado de Arabidopsis. A expressão de AtSIZ sob o controle do promotor CaMV35S foi descoberto promover a transcrição de genes induzidos por estresse e plantas com expressão aumentada de AtSIZ segundo notícias tiveram uma taxa de sobrevivência mais alta sob o estresse salino do que as plantas de controle, mas nenhuma análise foi fornecida com respeito ao rendimento de semente. Foi postulado que AtSIZ pôde ser usado para aumentar a resistência em plantas ao estresse osmótico. SYT
Os estresses abióticos tais como o estresse da seca, estresse da salinidade, estresse ao calor e estresse ao frio ou uma combinação de um ou mais destes, são fatores limitantes principais de crescimento e produtividade da planta (Boyer (1982) Science 218: 443-448). Estes estresses têm como importante tema comum para o crescimento da planta a disponibilidade de água. Visto que o alto teor de sal em alguns solos resulta em menos água disponível para a captação pela célula, o seu efeito é similar àquele observado sob as condições de seca. Adicionalmente, sob temperaturas congelantes, as células vegetais perdem água como um resultado da formação de gelo que começa a partir do apoplasto e retira água do simplasto (McKersie e Leshem (1994) Stress and stress coping in cultivated plants, Kluwer Academic Publishers). Durante o estresse ao calor, a abertura dos estornas é afetada para ajustar o esfriamento pela evapotranspiração, afetando por meio disso o teor de água da planta. Habitualmente, um mecanismo de resposta molecular da planta para cada uma destas condições de estresse é similar.
As plantas são expostas durante o seu ciclo de vida inteiro às condições de teor de água ambiental reduzido. A maioria das plantas evoluíram estratégias para proteger a si mesmas contra estas condições. Entretanto, se a gravidade e duração das condições de estresse são muito grandes, os efeitos sobre o desenvolvimento, crescimento e rendimento da planta da maioria das plantas de safra são profundas. A exposição contínua à disponibilidade de água ambiental reduzida causa alterações maiores no metabolismo da planta. Estas mudanças maiores no metabolismo por fim leva à morte da célula e consequentemente a perdas de rendimento. As perdas de safra e as perdas de rendimento de safra de safras importantes tais como arroz, milho (milho) e trigo causadas por estes estresses representam um fator econômico e político significante e contribuem para as faltas de alimento em muitas partes do mundo.
Um outro exemplo de estresse ambiental abiótico é a disponibilidade reduzida de um ou mais nutrientes que necessitam ser assimiladas pelas plantas para crescimento e desenvolvimento. Por causa da forte influência da eficiência de utilização da nutrição sobre o rendimento da planta e qualidade de produto, uma quantidade enorme de fertilizantes é vertida nos campos para otimizar o crescimento e qualidade da planta. A produtividade das plantas é limitada por três nutrientes primários: fósforo, potássio e nitrogênio, que são usualmente os elementos limitantes de taxa no crescimento da planta. O elemento nutricional principal requerido para o crescimento da planta é o nitrogênio (N). Este é um constituinte de numerosos compostos importantes encontrados em células vivas, incluindo aminoácidos, proteínas (enzimas), ácidos nucleicos e clorofila. 1,5% a 2% de matéria seca vegetal é nitrogênio e aproximadamente 16% da proteína vegetal total. Assim, a disponibilidade de nitrogênio é um fator limitante principal no crescimento e produção da planta de cultivo (Frink et ai. (1999) Proc Natl Acad Sci USA 96(4): 1175-1180) e tem um impacto importante sobre o acúmulo de proteína e composição do aminoácido. Portanto, de maior interesse são as plantas de safra com um rendimento aumentado quando cultivadas sob condições limitantes de nitrogênio.
A biomassa vegetal é produzida para safras forrageiras como alfafa, milho de silagem e feno. Muitos substitutos para produzir foram usados em safras de grão. Mais importante entre estes são as estimativas de tamanho da planta. O tamanho da planta pode ser medido em muitos modos dependendo da espécie e estágio de desenvolvimento, mas incluem peso seco de planta total, peso seco acima do solo, peso fresco acima do solo, área de folha, volume de haste, altura da planta, diâmetro da roseta, comprimento da folha, comprimento da raiz, massa da raiz, número de brotos e número de folha. Muitas espécies mantém uma razão conservativa entre o tamanho de partes diferentes da planta a um dado estágio de desenvolvimento. Estas relações aloméricas são usadas para extrapolar a partir de uma destas medidas de tamanho para uma outra (por exemplo, Tittonell et al. (2005) Agric Ecosys & Environ 105: 213). O tamanho da planta em um estágio de desenvolvimento inicial tipicamente correlacionar-se-á com o tamanho da planta mais tarde no desenvolvimento. Uma planta maior com uma área de folha maior pode tipicamente absorver mais luz e dióxido de carbono do que uma planta menor e portanto provavelmente ganhará um peso maior durante o mesmo período (Fasoula & Tollenaar (2005) Maydica 50: 39). Isto está além da continuação potencial da vantagem micro-ambiental ou genética que a planta teve para alcançar o tamanho grande inicialmente. Existe um componente genético forte para o tamanho da planta e taxa de crescimento (por exemplo, ter Steege et al. (2005) Plant Physiology 139: 1078) e assim para uma faixa de genótipos diversos de tamanho de planta sob uma condição ambiental é provável correlacionar-se com o tamanho sob um outro (Hittalmani et al. (2003) Theoretical Applied Genetics 107: 679). Deste modo um ambiente padrão é usado como um substituto para os ambientes diversos e dinâmicos encontrados em localizações e tempos diferentes pelas safras no campo.
Desenvolver plantas tolerantes ao estresse é uma estratégia que tem o potencial para resolver ou mediar pelo menos alguns aspectos de perda de rendimento (McKersie e Leshem (1994) Stress and stress coping in cultivated plants, Kluwer Academic Publishers). Entretanto, as estratégias de procriação tradicionais para desenvolver novas linhagens de plantas que exibem resistência (tolerância) a estes tipos de estresses são relativamente lentas e requerem linhagens resistentes específicas para procriação com a linhagem desejada. Os recursos de germoplasma limitados para tolerância ao estresse e incompatibilidade em procriações entre espécies de planta distantemente relacionadas representam problemas significantes encontrados na procriação convencional. Além disso, tais técnicas de procriação seletivo são tipicamente trabalhosas e resultam em plantas que freqüentemente contém componentes genéticos heterogêneos que nem sempre podem resultar no traço desejável que é passado das plantas precursoras. Avanços na biologia molecular têm possibilitado a humanidade modificar o germoplasma de animais e plantas. O engendramento genético de plantas acarreta a isolação e manipulação de material genético (tipicamente na forma de DNA ou RNA) e a introdução subsequente deste material genético em uma planta. Tal tecnologia tem a capacidade para liberar safras ou plantas tendo vários traços econômicos, agronômicos ou horticulturais melhorados.
SYT é um co-ativador transcricional que, em plantas, forma um complexo funcional com ativadores de transcrição da família de GRF (fator regulador de crescimento) de proteínas (Kim HJ, Kende H (2004) Proc Nat Acad Sc 101: 13374-9). SYT é chamado de GIF para Fator interventor de GRF neste documento e AN3 para angustifolia3 em Horiguchi et al. (2005) Plant J 43: 68-78. Os ativadores de transcrição de GRF compartilham domínios estruturais (na região de terminal N) com as proteínas SWI/SNF dos complexos de remodelagem de cromatina em levedura (van der Knaap E et al., (2000) Plant Phys 122: 695-704). Co-ativadores transcricionais destes complexos são propostos estarem envolvidos no recrutamento de complexos SWI/SNF para realçar e promover regiões para efetuar a remodelagem da cromatina local (revisada Naar AM et al., (2001) Annu Rev Biochem 70: 475- 501). A alteração na estrutura da cromatina local modula a ativação transcricional. Mais precisamente, SYT é proposto interagir com o complexo de SWI/SNF vegetal para afetar a ativação transcricional de gene(s) alvo de GRF (Kim HJ, Kende H (2004) Proc Nat Acad Sc 101: 13374-9).
SYT pertence a uma família de gene de três membros na Arabidopsis. O polipeptídeo SYT compartilha homologia com o SYT humano. O polipeptídeo de SYT humano foi mostrado ser um co-ativador transcricional (Thaete et al. (1999) Hum Molec Genet 8: 585-591). Três domínios caracterizam o polipeptídeo de SYT de mamífero:
(i) o domínio de SNH de terminal N (homologia de SYT de terminal N), conservado em mamíferos, plantas, nematóides e peixe; (ii) o domínio rico em QPGY de terminal C, composto predominantemente de glicina, prolina, glutamina e tirosina, que ocorrem em intervalos variáveis;
(iii) um domínio rico em metionina (rico em Met) localizado entre os dois domínios anteriores.
Em polipeptídeos SYT vegetais, o domínio SNH é bem conservado. O domínio de terminal C é rico em glicina e glutamina, mas não em prolina ou tirosina. O mesmo foi portanto chamado de domínio rico em QG ao contrário do domínio QPGY de mamíferos. Como com SYT de mamífero, um domínio rico em Met pode ser identificado no terminal N do domínio QG. O domínio rico em QG pode ser considerado ser substancialmente o terminal C remanescentes do polipeptídeo (menos o domínio SHN); o domínio rico em Met está tipicamente compreendido dentro da primeira metade do rico em QG (do terminal N para o terminal C). Um segundo domínio rico em Met pode preceder o domínio SNH em polipeptídeos de planta SYT (ver a Fig 1).
Um mutante de perda de função de SYT e plantas transgênicas com expressão reduzida de SYT foram relatados desenvolver folhas e pétalas pequenas e estreitas, que têm menos células (Kim HJ, Kende H (2004) Proc NatAcad Sc 101: 13374-9).
A super expressão de AN3 em Arabidopsis thaliana resultou em plantas com folhas que foram 20 a 30% maiores do que aquelas do tipo selvagem (Horiguchi et ai. (2005) Plant J 43: 68-78).
No pedido de patente japonês 2004-350553, um método para controlar o tamanho de folhas na direção horizontal é descrito, controlando-se a expressão do gene AN3. cpFBPase
O índice de colheita, a razão de rendimento de semente para peso seco acima do solo, é relativamente estável sob muitas condições ambientais e assim uma correlação robusta entre o tamanho da planta e rendimento de grão pode ser freqüentemente obtida (por exemplo, Rebetzke et al 2002 Crop Science 42: 739). Estes processos são intrinsecamente ligados porque a maioria da biomassa de grão é dependente da corrente ou produtividade fotossintética armazenada pelas folhas e haste da planta (Gardener et al 1985 Physiology of Crop Plants. Iowa State University Press, pp 68-73). Portanto, selecionar quanto ao tamanho da planta, mesmo em estágios iniciais de desenvolvimento, tem sido usado como um indicador para o rendimento potencial futuro (por exemplo, Tittonell et al 2005 Agric Ecosys & Environ 105: 213). Quando do teste quanto ao impacto de diferenças genéticas na tolerância ao estresse, a capacidade para padronizar as propriedades de solo, temperatura, água e disponibilidade de nutriente e intensidade de luz é uma vantagem intrínseca de ambientes de estufa ou câmaras de crescimento de planta comparadas com o campo. Entretanto, limitações artificiais no rendimento devido a polinização deficiente devido à ausência de vento ou insetos ou espaço insuficiente para a raiz madura ou crescimento de copa, pode restringir o uso destes ambientes controlados para testar diferenças de rendimento. Portanto, as medições de tamanho da planta no desenvolvimento inicial, sob condições padronizadas em uma câmara de crescimento ou estufas, são práticas padronizadas para fornecer indicação de vantagens de rendimento genético potencial.
O metabolismo de carbono fotossintético em plantas superiores é um processo essencial para o crescimento da planta e o rendimento de safra. Carboidratos são produzidos em plantas superiores pela fixação do CO2 atmosférico por intermédio do caminho da pentose fosfato redutivo (Calvin). Este processo ocorre no cloroplasto e nos triosefosfatos recém sintetizados pode ser mantido no compartimento estrômico para a síntese de amido ou pode ser exportado para o citossol para a formação de sacarose. Durante a fotossíntese, o carboidrato recém sintetizado é canalizado para uma ou outra forma dependendo da necessidade da planta e das condições ambientais.
O ciclo de Calvin é um caminho complexo consistindo de três fases de treze reações catalisadas por onze enzimas. Uma das enzimas mais importantes é a frutose-1,6-bisfosfatase cloroplástica (cpFBPase), que catalisa a conversão irreversível da frutose-1,6- bisfosfato para frutose-6-fosfato e Pi (P inorgânico). O nível de polipeptídeo cpFBPase no cloroplasto é muito baixo comparado com aqueles das outras enzimas do ciclo de Calvin.
A atividade cpFBPase é regulada pelo potencial de redox por intermédio do sistema de ferredoxina/tiorredoxina, que modula a atividade de enzima em resposta às condições de luz/escuro e mudanças dependentes da luz no pH e níveis de Mg2+ (Chiadmi et ai. (1999) EMBO 18(23): 6809- 6815). Mais especificamente, o polipeptídeo de cpFBPase é ativo na luz e inativo no escuro, que ocorre por uma interação da redução-oxidação mediada pela tiorredoxina entre grupos SH da molécula de enzima e também
por intermédio de uma elevação induzida pela luz no pH e concentração de
2+
Mg no estroma do cloroplasto (Buchanan (1980) Annu Rev Plant Physiol 31: 341-374; Jacquot (1984) Bot Acta 103: 323-334).
Os polipeptídeos de cpFBPase de plantas superiores e algas realizam a mesma etapa enzimática, mas diferem um pouco na regulagem da atividade enzimática. Mais especificamente, os polipeptídeos de cpFBPase de algas apresentam uma exigência estrita para a redução ser ativa, mas são menos estritas na especificidade redutora, isto é, eles podem ser ativados pelas tiorredoxinas plastídicas diferentes (Huppe e Buchanan (1989) Z Naturforsch 44(5-6): 487-94).
Em células fotossintéticas (autotróficas) além do polipeptídeo de cpFBPase, existe um segundo polipeptídeo de FBPase (isoforma) localizado no citossol (cyFBPase) e envolvido na síntese de sacarose e gliconeogênese. O polipeptídeo de cyFBPase apresenta propriedades reguladoras muito diferentes quando comparadas com o polipeptídeo de cpFBPase: este é inibido pelo substrato em excesso, demonstra uma inibição alostérica pelo AMP e frutose-2,6-bisfosfoato e apresenta um pH neutro ótimo. O polipeptídeo de cyFBPase é encontrado em sistemas heterotróficos (tais como células de animal). Uma diferença importante entre os polipeptídeos de cpFBPase e os polipeptídeos de cyFBPase é a presença no primeiro de uma inserção de aminoácido que carrega pelo menos dois resíduos de cisteína conservados que são os alvos da regulagem de tiorredoxina.
As plantas de batata transgênica que expressam uma seqüência
de ácido nucleico de cpFBPase da batata sob o controle de um promotor específico de tubérculo foram relatadas (Thorbjornsen et al. (2002) Plant 214: 616-624). Os autores observaram que os tubérculos transgênicos não diferem dos tubérculos do tipo selvagem com respeito ao teor de amido ou aos níveis de açúcares neutros e hexoses fosforiladas.
Dois genes que codificam cyFBPase a partir da cianobactéria Synechococcus (FBPase/SBPase e FBPasell) foram operavelmente ligados a uma seqüência codificadora de peptídeo de trânsito rbcS de tomate para o alvejamento subcelular cloroplástico das proteínas quiméricas (Miyagawa et al (2001) Nature Biotech 19: 965-969; Tamoi et al (2006) Célula vegetal Physiol 47(3): 380-390). As atividades de polipeptídeos FBPase/SBPase e FBPasell não foram encontradas como sendo reguladas pelas condições de redox por intermédio do sistema de ferredoxina/tiorredoxina, visto que eles carecem dos resíduos de cisteína conservados. O promotor rbcS de tomate foi usado para controlar a expressão de ambos os genes quiméricos. As plantas de tabaco transgênicas transformadas com a construção quimérica foram relatadas crescer significantemente mais rápido e mais abundante do que as plantas do tipo selvagem sob condições atmosféricas. SIK Os criadores de planta estão freqüentemente interessados em melhorar aspectos específicos de rendimento dependendo da safra ou planta em questão e a parte desta planta ou safra que é de valor econômico. Por exemplo, para certas safras ou para certos usos finais, uma criador de planta pode olhar especificamente para melhorias na biomassa vegetal (peso) de uma ou mais partes de uma planta, que podem incluir as partes acima do solo (colhíveis) e/ou partes abaixo do solo (colhíveis). Isto é particularmente relevante onde as partes acima do solo ou as partes abaixo do solo de uma planta são para o consumo. Para muitas safras, particularmente cereais, é uma melhora no rendimento de semente que é altamente desejável. O rendimento de semente aumentado pode manifestar-se por si só de muitos modos, com cada aspecto individual de rendimento de semente sendo de importância variável para um criador de planta dependendo da safra ou planta em questão e seu uso final. Por exemplo, o rendimento de semente pode ser manifestado como ou resultado de a) um aumento na biomassa de semente (peso de semente total) que pode ser em uma base de semente individual e/ou por planta e/ou por metro quadrado; b) número aumentado de flores por planta; c) número aumentado de sementes (cheias); d) taxa de enchimento de semente aumentada (que é tipicamente expressada como a razão entre o número de sementes cheias dividido pelo número total de sementes; e) índice de colheita aumentado, que é tipicamente expressado como uma razão do rendimento de partes colhíveis, tais como sementes, dividido pela biomassa total; e f) peso de mil sementes aumentado (TKW), que é tipicamente extrapolado do número de sementes cheias contadas e seu peso total.
Um aumento no rendimento de semente também pode ser manifestado como um aumento no tamanho da semente e/ou volume de semente. Além disso, um aumento no rendimento de semente também pode manifestar-se por si mesmo como um aumento na área da semente e/ou comprimento da semente e/ou largura da semente e/ou perímetro da semente. O rendimento aumentado também pode resultar em arquitetura modificada ou pode ocorrer por causa da arquitetura modificada.
Tomando o milho como um exemplo, um aumento de rendimento pode ser manifestado como um ou mais dos seguintes: aumento no número de plantas por metro quadrado, um aumento no número de espigas por planta, um aumento no número de carreiras, número de grãos por carreira, peso do grão, peso de mil grãos, comprimento/diâmetro da espiga, aumento na taxa de enchimento da semente (que é o número de sementes cheias dividido pelo número total de sementes e multiplicado por 100), entre outras. Tomando-se arroz como um exemplo, um aumento de rendimento pode manifestar-se por si só como um aumento em um ou mais dos seguintes: número de plantas por metro quadrado, número de panículas por planta, número de espiguetas por panícula, número de flores (flósculos) por panícula (que é expressado como uma razão do número de sementes cheias em relação ao número de panículas primárias), aumento na taxa de enchimento de semente (que é o número de sementes cheias dividido pelo número total de sementes e multiplicado por 100), aumento no peso de mil grãos, entre outros.
Deve ser de enorme vantagem para um criador de planta ser capaz de selecionar e escolher os aspectos de rendimento de semente a serem alterados. Seria altamente desejável ser capaz de apanhar da prateleira, por assim dizer, um gene adequado para alterar um aspecto ou componente particulares, de rendimento de semente. Por exemplo um aumento na taxa de enchimento, combinado com peso de mil grãos aumentado seria altamente desejável para uma safra tal como a de milho. Para arroz e trigo uma combinação de taxa de enchimento aumentada, índice de colheita e peso de mil grãos aumentados seria altamente desejável.
O Pedido de Patente Internacional Publicado, WO 02/074801, no nome de Genomine Inc., descreve uma proteína AtSIK de Arabidopsis thaliana e um gene que codifica a dita proteína. É mencionado que as plantas podem ser feitas resistentes ao estresse osmótico pela inibição da expressão de AtSIK e que como uma conseqüência a produtividade de uma planta pode ser aumentada. O que não é mencionado entretanto é que aspectos de rendimento podem ser modificados pela inibição da expressão de AtSIK. HDZip
O estudo e manipulação genética de plantas tem uma longa história que começou mesmo antes dos estudos famosos de Gregor Mendel. No aperfeiçoamento desta ciência, os cientistas realizaram a modificação de traços particulares em plantas que variam de tubérculos de batata tendo teor de amido aumentado até plantas de semente oleaginosa tais como canola e girassol tendo teor de ácido graxo aumentado ou alterado. Com o consumo e uso aumentado de óleos vegetais, a modificação do teor de óleo de semente e níveis de óleo de semente tem se tornado crescentemente muito difundido (por exemplo, Tõpfer et al., 1995, Science 268: 681-686). A manipulação dos caminhos biossintéticos em plantas transgênicas fornece um número de oportunidades para os biologistas moleculares e bioquímicos vegetais para afetar o metabolismo vegetal dando origem à produção de produtos específicos de valor mais alto. A produção ou composição do óleo de semente têm sido alteradas em numerosas plantas de semente oleaginosa tradicionais tais como soja (Patente U.S. N- 5,955.650), canola (Patente U.S. N2 5,955.650), girassol (Patente U.S. N- 6.084.164), semente de colza (Tõpfer et al., 1995, Science 268: 681-686) e plantas de sementes oleaginosas não tradicionais tais como o tabaco (Cahoon et al., 1992, Proc. Natl. Acad. Sei. USA 89: 11184-11188).
Os óleos de semente vegetal compreendem lipídeos tanto neutros quanto polares (Ver a Tabela 1). Os lipídeos neutros contêm primariamente triacilglicerol, que é o lipídeo de armazenagem principal que se acumula em corpos oleosos em sementes. Os lipídeos polares são principalmente encontrados nas várias membranas das células de semente, por exemplo, as membranas microssômicas, plastídicas e mitocondriais e as membranas celulares. Os lipídeos neutros e polares contém diversos ácidos graxos comuns (Ver a Tabela 2) e uma faixa de ácidos graxos menos comuns. A composição de ácido graxo de lipídeos de membrana é altamente regulada e apenas um número seleto de ácidos graxos são encontrados em lipídeos de membrana. Por outro lado, um grande número de ácidos graxos não usuais podem ser incorporados nos lipídeos de armazenagem neutros em sementes de muitas espécies vegetais (Van de Loo F. J. et al., 1993, Unusual Fatty Acids in Lipid Metabolism in Plants pp. 91-126, editor TS Moore Jr. CRC Press; Millar et al., 2000, Trends Plant Sei. 5: 95-101).
Tabela 1: Classes de lipídeo vegetal
Lipídeos Neutros Triacilglicerol (TAG) DiaciIglicerol (DAG) Monoacilglicerol (MAG) Lipídeos Polares Monogalactosildiacilglicerol (MGDG) Digalactosildiacilglicerol (DGDG) Fosfatidilglicerol (PG) Fosfatidilcolina (PC) Fosfatidiletanolamina (PE) Fosfatidilinositol (PI) Fosfatidilserina (PS) Sulfoquinovosildiacilglicerol
Tabela 2: Ácidos graxos vegetais comuns
16:0 Acido palmítico 16:1 Aeido palmitoleico 16:3 Aeido hiragônico 18:0 Acido esteárico 18:1 Aeido oleico 18:2 Acido linoleieo 18:3 Aeido linolênico γ-18:3 Aeido gama-linoleico* 20:0 Aeido araquídico 20:1 Ácido eicosenóico 22:6 Acido docosaexanóico (DHA)* 20:2 Acido eicosadienóico 20:4 Acido araquidônico (AA)* 20:5 Acido eicosapentaenóico (EPA)* 22:1 Acido erúcico
Na Tabela 2, os ácidos graxos indicados com um asterisco não ocorrem normalmente em óleos de semente vegetal, mas a sua produção em óleo de semente vegetal transgênico é de importância na biotecnologia vegetal.
Os sítios primários da biossíntese de ácido graxo em plantas são os plastídeos. A biossíntese de ácido graxo começa com a conversão de acetil-CoA ao malonil-CoA pela acetil-CoA carboxilase (ACCase). A porção malonila é depois transferida a uma proteína carregadora de acila (ACP) pela malonil-CoA:ACP transacilase. A enzima beta-cetoacil-ACP-sintase III (KAS III) catalisa a reação de condensação inicial da biossíntese de ácido graxo, em que depois da descarboxilação de malonil-ACP, o carbânion resultante é transferido para acetil-CoA por um ataque nucleofílico do carbono da carbonila, resultando na formação de 3-cetobutiril-ACP. O ciclo de reação é completado por uma redução, uma desidratação e mais uma vez uma redução produzindo ácido butírico. Este ciclo de reação é repetido (com KAS I ou KAS II catalisando a reação de condensação) até que o grupo acila atinja um comprimento de cadeia usualmente de 16 a 18 átomos de carbono. Estes acil- ACPs podem ser dessaturados pela estearoil-ACP dessaturase, usados como substratos para as aciltransferases plastídicas na formação de lipídeos através do qual foi aludido como o caminho procariótico ou exportado para o citossol depois da clivagem de ACP através da ação das tioesterases. No citossol eles entram no grupo acil-CoA e podem ser usados para a síntese de lipídeos através do qual foi aludido como o caminho eucariótico no retículo endoplasmático.
A síntese de lipídeo através dos caminhos tanto procarióticos quanto eucarióticos ocorrem através da acilação sucessiva de glicerol-3- fosfato, catalisado pelas glicerol-3-fosfato aciltransferases (GPAT) e ácido lisofosfatídico aciltransferase (LPAAT) (Browse et al., 1986, Biochemical J. 235: 25-31; Ohlrogge & Browse, 1995,5 Plant Célula 7: 957-970). O ácido fosfatídico resultante (PA) é o precursor para outros lipídeos de membrana polar tal como monogalactosildiacilglicerol (MGD), digalactosildiacilglicerol (DGD), fosfatidilglicerol (PG) e sulfoquinovosildiacilglicerol (SQD) no plastídeo e fosfatidilcolina (PC), fosfatidiletanolamina (PE), fosfatidilinositol (PI) e fosfatidilserina (PS) no retículo endoplasmático. Os lipídeos polares também são os sítios de outra modificação da cadeia de acila tal como dessaturação, acetilenação e hidroxilação. No retículo endoplasmático, PA também é o intermediário na biossíntese de triacilglicerol (TAG), o componente principal de lipídeos neutros e por este motivo de óleo de semente. Além disso, caminhos alternativos para a biossíntese de TAGS pode existir (isto é, a transacilação através da ação de fosfatidilcolina:diacilglicerol aciltransferase) (Voelker, 1996, The Genetic Engineering ed.: Setlow 1 8: 111-113; Shanklin & Cahoon, 1998, Annu. Rev. Plant Physiol. Planta Mol. Biol. 49: 611-641; Frentzen, 1998, Lipides 100: 161-166; Millar et ai., 2000, Trends Plant Sei. 5: 95-101). A reação reversa, a ruptura de triacilglicerol a diacilglicerol e ácidos graxos é catalisada pelas lipases. Uma tal ruptura pode ser observada próximo ao final do desenvolvimento da semente resultando em uma certa redução np óleo de semente. (Buchanan et al., 2000).
Os lipídeos de armazenagem em sementes são sintetizados a partir de precursores derivados de carboidrato. As plantas têm um caminho glicolítico completo no citosol (Plaxton, 1996, Annu. Rev. Plant Physiol. Plant Mol. Biol. 47: 185-214) e foi mostrado que um caminho completo também existe nos plastídeos de colza (Kang & Rawsthorne, 1994, Plant J. 6: 795-805). Sacarose é a fonte primária de carbono e energia, transportado das folhas nas sementes em desenvolvimento. Durante a fase de armazenagem de sementes, a sacarose é convertida no citossol para fornecer os precursores metabólicos glicose-6-fosfato e piruvato. Estes são transportados nos plastídeos e convertidos em acetil-CoA que serve como o precursor primário para a síntese de ácidos graxos. Acetil-CoA nos plastídeos é o precursor central para a biossíntese de lipídeo. Acetil-CoA pode ser formada nos plastídeos pelas reações diferentes e a contribuição exata de cada reação ainda está sendo debatida (Ohlrogge & Browse, 1995, Plant Célula 7: 957-970). É aceito, entretanto, que uma parte grande da acetil-CoA é derivada de glicose- 6-fosfato e piruvato que são importados do citoplasma nos plastídeos. A sacarose é produzida nos órgãos fonte (folhas ou em qualquer lugar que a fotossíntese ocorra) e é transportada para as sementes em desenvolvimento, também chamada de órgãos escoadouros. Nas sementes em desenvolvimento, a sacarose é o precursor para todos os compostos de armazenagem, isto é, amido, lipídeos e parcialmente as proteínas de armazenagem de semente. Portanto, está claro que o metabolismo de carboidrato no qual a sacarose desempenha um papel central é muito importante para o acúmulo de compostos de armazenagem de semente.
Embora os teores de lipídeo e ácido graxo de óleo de semente
possam ser modificados pelos métodos tradicionais de procriação de planta, o
advento da tecnologia de DNA recombinante tem possibilitado a manipulação
mais fácil do teor de óleo de semente de uma planta e em alguns casos, tem
possibilitado a alteração de óleos de semente em modos que não seriam
realizados apenas pela procriação (Ver, por exemplo, Tõpfer et al., 1995,
Science 268: 681-686). Por exemplo, a introdução de uma seqüência de ácido • 12· ·
nucleico da Δ -hidroxilase no tabaco transgênico resultou na formação de um novo ácido graxo, o ácido ricinoleico, no óleo da semente do tabaco (Van de Loo et al., 1995, Proc. Natl. Acad. Sci USA 92: 6743-6747). As plantas de tabaco também foram engendradas para produzir níveis baixos de ácido petrosselínico pela introdução e expressão de uma acil-ACP desaturase de coentro (Cahoon et al., 1992, Proc. Natl. Acad. Sci USA 89: 11184-11188).
A modificação do teor de óleo de semente em plantas tem ramificações médicas, nutricionais e econômicas significantes. Com respeito às ramificações médicas, os ácidos graxos de cadeia longa (Cl8 e mais longas) encontrados em muitos óleos de semente foram ligados às reduções em hipercolesterolemia e outros distúrbios clínicos relacionados com a doença cardíaca coronária (Brenner, 1976, Adv. Exp. Med. Biol. 83: 85-101). Portanto, o consumo de uma planta tendo níveis aumentados destes tipos de ácidos graxos pode reduzir o risco de doença cardíaca. Níveis realçados de teor de óleo de semente também são úteis em aumentar a produção em larga escala de óleos de semente e deste modo reduzir os custos destes óleos.
Como mencionado mais no início, diversos ácidos nucleicos
de desaturase tais como o ácido nucleico de A6-desaturase, ácido nucleico de
12 ·
Δ -desaturase e ácido nucleico de acil-ACP desaturase foram clonados e demonstrados codificar enzimas requeridas para a síntese de ácido graxo em várias espécies vegetais. As seqüências de ácido nucleico de oleosina das espécies tais como Brássica, soja, cenoura, pinheiro e Arabidopsis thaliana também foram clonadas e determinadas codificar proteínas associadas com a membrana de monocamada de fosfolipídeo de corpos oleosos nestas plantas.
Foi agora descoberto que as seqüências de ácido nucleico que codificam fatores de transcrição do homeodomínio de Classe ΙΙ-zíper de leucina (HD-Zip) são úteis na modificação do teor de compostos de armazenagem em sementes.
Os fatores de transcrição são usualmente definidos como proteínas que mostram a ligação de DNA específica de seqüência e que são capazes de ativar e/ou reprimir a transcrição. O genoma de Arabidopsis codifica pelo menos 1533 reguladores transcricionais, que são responsáveis por -5,9% deste número total estimado de genes. Cerca de 45% destes fatores de transcrição são relatados serem de famílias específicas para as plantas (Riechmann et al., 2000 (Science Vol. 290, 2105-2109)). Um exemplo de uma tal família específica de planta de fatores de transcrição é a família de fatores de transcrição HD-Zip.
Os genes de homeobox são fatores de transcrição presentes em todos os eucariotas e constituem uma família de gene de pelo menos 89 membros em Arabidopsis thaliana. Estes são caracterizados pela presença de um homeodomínio, que usualmente consiste de 60 resíduos de aminoácido conservados que formam uma estrutura de hélice-alça-hélice-volta-hélice que liga DNA. Este sítio de ligação de DNA é usualmente pseudopalindrômico. Os genes de homeobox desempenham papéis cruciais e diversos em muitos aspectos de desenvolvimento, incluindo o desenvolvimento inicial de embriões de animal, a especificação de tipos de célula em levedura e o início e manutenção do meristema apical de broto em plantas florescentes (Sakakibara et al. Mol. Biol. Evol. 18(4): 491-502, 2001).
Numerosos genes de homeobox de angiosperma foram isolados e classificados em sete grupos distintos com base nas suas similaridades de aminoácido. Estas incluem os grupos KNOX, BELL, HD- PHD-dedo, HATl, HAT2, GL2 e ATHB8. Os genes nos últimos quatro grupos também codificam um motivo de zíper de leucina adjacente ao terminal C do homeodomínio e coletivamente formam a família de gene do homeodomínio-zíper de leucina (HD-Zip). Aso et al., Mol. Biol. Evol. 16(4): 544-552, 1999. dos pelo menos 89 membros que compreendem a família de gene de homeobox na Arabidopsis thaliana, pelo menos 47 compreendem tanto um homeodomínio quanto um zíper de leucina. Embora a combinação de um homeodomínio e um motivo de zíper de leucina seja único para as plantas, o mesmo também tem sido encontrado em musgo além de plantas vasculares (Sakakibara et al. (2001) Mol Biol Evol 18(4): 491-502).
As proteínas do homeodomínio zíper de leucina (HD-Zip) constituem uma família de fatores de transcrição caracterizados pela presença de um domínio de ligação de DNA (HD) e um motivo de zíper de leucina (Zip) adjacente. O zíper de leucina, adjacente à extremidade do terminal C do homeodomínio, consiste de diversas repetições de septeto (pelo menos quatro) em que um leucina (ocasionalmente uma valina ou uma isoleucina) tipicamente aparece a cada sete aminoácido. O zíper de leucina é importante para a dimerização de proteína. Esta dimerização é um pré requisito para a ligação de DNA (Sessa et al. (1993) EMBO J 12(9): 3507-3517) e podem proceder entre duas proteínas HD-Zip idênticas (homodímero) ou entre duas proteínas HD-Zip diferentes (heterodímero).
O grupo de genes de homeobox de angiosperma dos grupos HATl, HAT2, GL2 e ATHB8 foram renomeados nas subfamílias HD-Zip I a IV. A combinação de um homeodomínio e um motivo de zíper de leucina é único para as plantas superiores, sugerindo que os genes HD-Zip podem estar envolvidos na regulagem de processos desenvolvimentais específicos para plantas. Aso et al., Mol. Biol. Evol. 16(4): 544-552, 1999. As funções dos genes HD-Zip são diversos entre as subfamílias diferentes. Os genes HD-Zip I e II são prováveis de estarem envolvidos nas redes de transdução de ABA ou auxina induzidas por sinal de luz, desidratação. Estas redes de transdução de sinal estão relacionadas com a regulagem do crescimento geral de plantas. A superexpressão de mRNA de HD-Zip I ou II de sentido ou anti-sentido usualmente altera a taxa de crescimento e desenvolvimento. A maioria dos membros da subfamília de HD-Zip III desempenha papéis na diferenciação de célula no esteia. Os genes HD-Zip IV são relacionados com a diferenciação da camada de célula mais externa. Sakakibara et al. Mol. Biol. Evol. 18(4): 491-502, 2001.
As proteínas HD-Zip diferentes mostraram ativar ou reprimir a
transcrição. Em Arabidopsis, a HD-Zip de classe I ATHB1, 5, 6 e 16 foram mostrados atuar como ativadores transcricionais em ensaios de expressão transitória nas folhas de Arabidopsis usando um gene repórter, luciferase (Henriksson et al. (2005) Plant Phys 139: 509-518). Duas proteínas de HDZip de classe I do arroz, Oshox4 e Oshox5, atuaram como ativadores nos ensaios de expressão transitória nas culturas de suspensão de célula de arroz usando um outro gene repórter (glicuronidase; Meijer et al. (2000) Mol Gen Genet 263: 12-21). Ao contrário, duas proteínas de HD-Zip classe II do arroz, Oshoxl e Oshox3, atuaram como repressores transcricionais nos mesmos experimentos (Meijer et ai. (1997) Plant J 11: 263-276; Meijer et al. (2000) supra).
O gene HD-Zip de Classe II de Arabidopsis thaliana, HAT4, também conhecido como ATHB-2, tem sido relacionadas atuar como um regulador de respostas de evitação de sombra (Morelli e Ruberti TIPS Vol. 7 N2 9, Setembro 2002). SYB 1
Ran é uma GTPase de sinalização pequena (a proteína de ligação de GTP) em células de animal, que está envolvida no transporte nucleocitoplasmático. O transporte nucleocitoplasmático tem sido estudado principalmente em sistemas de animal. Diversas proteínas que ligam Ran são conhecidas, entre elas RanBP2, também conhecida como Nup358. RanBP2 é postulada associar no lado citoplasmático com proteínas do Complexo de Poro Nuclear e putativamente funciona como uma SUMO E3 ligase, embora a sua estrutura não seja de uma E3 ligase típica. SUMOs (modificadores relacionados com a ubiquitina pequena) são proteínas eucarióticas que são covalentemente ligadas a outras proteínas, regulando deste modo vários processos celulares. Em associação com Ubc9 (que atua uma proteína conjugadora E2), RanBP2 rotula substratos ligados aos receptores de importação nuclear com SUMO-1, em um modo similar como a ubiquitinação de proteínas. O substrato SUMOilado é depois importado através do poro nuclear no núcleo. Os exemplos de proteínas importadas na SUMOilação incluem NFXl-pl5, um acompanhante na exportação de mRNA e a histona desacetilase HDAC-4. A modificação SUMO e por este motivo RanBP2, também é implicado desempenhar um papel na expressão de gene, no ciclo celular (durante a ruptura do envelope nuclear) e na formação de estruturas subcelulares tais como corpos de leucemia promielocítica.
A maioria dos estudos foram realizados em sistemas de animal modelo e pouco é conhecido a cerca das proteínas e processos correspondentes em plantas. As proteínas relacionadas com RanBP2, identificado em Arabidopsis, compartilham os domínios de dedo de zinco mas são de outro modo diferentes em estrutura. Sumário
Surpreendentemente, foi agora descoberto que modular a expressão de um ácido nucleico que codifica um polipeptídeo de GRP dá plantas tendo características melhoradas em relação às plantas de controle.
Em um aspecto da presente invenção, foi agora descoberto que modular a expressão em uma planta de um ácido nucleico que codifica o polipeptídeo AZ de Arabidopsis (AtAZ) ou um homólogo deste dá plantas tendo rendimento aumentado em relação às plantas de controle. De acordo com uma forma de realização da presente invenção, é fornecido um método para aumentar o rendimento da planta, que compreende modular a expressão em uma planta de um ácido nucleico que codifica o polipeptídeo de AZ ou um homólogo deste. Vantajosamente, o desempenho dos métodos de acordo com a presente invenção resulta em plantas tendo rendimento aumentado, particularmente rendimento de semente, em relação às plantas do tipo selvagem correspondentes. A presente invenção também fornece seqüências de ácido nucleico e construções úteis na realização de tais métodos.
Em um outro aspecto da presente invenção, foi agora descoberto que modular a expressão em uma planta de uma seqüência de ácido nucleico que codifica um polipeptídeo de SYT dá plantas tendo rendimento aumentado sob estresse abiótico em relação às plantas de controle. Portanto, a invenção também fornece um método para aumentar o rendimento da planta sob estresse abiótico em relação às plantas de controle, compreendendo modular a expressão em uma planta de uma seqüência de ácido nucleico que codifica um polipeptídeo de SYT. A presente invenção também fornece seqüências de ácido nucleico e construções úteis na realização de tais métodos. Ainda em um outro aspecto da presente invenção, foi agora descoberto que aumentar a expressão em partes acima do solo de uma planta de uma seqüência de ácido nucleico que codifica um polipeptídeo frutose-1,6- bisfosfatase cloroplástica (cpFBPase) aumenta o rendimento da planta em relação às plantas de controle. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar o rendimento da planta em relação às plantas de controle, que compreende aumentar a expressão em partes acima do solo de uma planta de uma seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase. A presente invenção também fornece seqüências de ácido nucleico e construções úteis na realização de tais métodos.
Já em um outro aspecto da presente invenção, foi agora descoberto que modular a expressão em uma planta de um ácido nucleico de SIK e/ou um polipeptídeo de SIK dá plantas tendo vários traços melhorados relacionados com o rendimento em relação às plantas de controle, em que a superexpressão de um ácido nucleico que codifica SIK em uma planta dá número de flores aumentado por planta em relação às plantas de controle e em que a redução ou eliminação substanciais de um ácido nucleico de SIK dá o peso de mil grãos aumentado, índice de colheita aumentado e taxa de enchimento aumentado em relação às plantas do tipo selvagem correspondentes. A presente invenção também fornece seqüências de ácido nucleico e construções úteis na realização de tais métodos.
Em um outro aspecto da presente invenção, foi agora descoberto que ácidos nucleicos que codificam fatores de transcrição HD-Zip de Classe II são úteis na modificação do teor dos compostos de armazenagem em sementes. A presente invenção portanto fornece um método para modificar o teor de compostos de armazenagem em sementes em relação às plantas de controle pela modulação da expressão em uma planta de um ácido nucleico que codifica um fator de transcrição de HD-Zip de Classe II. A presente invenção também fornece seqüências de ácido nucleico e construções úteis na realização de tais métodos. A invenção fornece ainda sementes tendo um teor modificado de compostos de armazenagem em relação às plantas de controle, sementes estas que têm expressão modulada de um ácido nucleico que codifica um fator de transcrição de HD-Zip de Classe II. A presente invenção fornece um método para modificar o teor de compostos de armazenagem em sementes em relação às plantas de controle, que compreende modular a expressão em uma planta de um ácido nucleico que codifica um fator de transcrição de HD-Zip de Classe II.
Em um outro aspecto da presente invenção, foi agora descoberto que modular a expressão em uma planta de um ácido nucleico que codifica um polipeptídeo de SYBl dá plantas tendo traços realçados relacionados com o rendimento em relação às plantas de controle. Este aumento de rendimento foi surpreendentemente observado quando as plantas foram cultivadas sob condições sem estresse (condições não estressantes). A presente invenção portanto também fornece um método para realçar traços relacionados com o rendimento em plantas em relação às plantas de controle, compreendendo modular a expressão em uma planta de um ácido nucleico que codifica um polipeptídeo de SYB1. A presente invenção também fornece seqüências de ácido nucleico e construções úteis na realização de tais métodos. Definições
PolipeptídeofsVProteínaCs)
Os termos "polipeptídeo" e "proteína" são aqui usados intercambiavelmente e referem-se aos aminoácidos em uma forma polimérica de qualquer comprimento, ligados entre si pelas ligações peptídicas. Polinucleotídeo(syÁcido(s) nucleicofsVSequênciaCs) de Ácido Nucleico/ sequência(s) de Nucleotídeo
Os termos "polinucleotídeo(s)", "sequência(s) de ácido nucleico", "sequência(s) de nucleotídeo", "ácido(s) nucleico(s)", "molécula de ácido nucleico" são aqui usados intercambiavelmente e referem-se aos nucleotídeos, ribonucleotídeos ou desoxirribo-nucleotídeos ou uma combinação de ambos, em uma forma não ramificada polimérica de qualquer comprimento.
Planta(s) de controle
A escolha de plantas de controle adequadas é uma parte de rotina de um projeto experimental e pode incluir plantas do tipo selvagem correspondentes ou plantas correspondentes sem o gene de interesse. A planta de controle é tipicamente da mesma espécie de planta ou ainda da mesma variedade como a planta a ser avaliada. A planta de controle também pode ser um nulizigoto da planta a ser avaliada. Nulizigotos são indivíduos que perdem o transgene pela segregação. Uma "planta de controle" como aqui usado refere-se não apenas às plantas inteiras, mas também às partes de plantas, incluindo sementes e partes de semente. Homólogo(s)
"Homólogos" de uma proteína abrangem peptídeos, oligopeptídeos, polipeptídeos, proteínas e enzimas tendo substituições, deleções e/ou inserções de aminoácido em relação à proteína não modificada em questão e tendo atividade biológica e funcional similares como a proteína não modificada a partir da qual os mesmos são derivados.
Uma deleção refere-se à remoção de um ou mais aminoácidos de uma proteína.
Uma inserção refere-se a um ou mais resíduos de aminoácido que são introduzidos em um sítio pré determinado em uma proteína. As inserções podem compreender as fusões de terminal N e/ou terminal C assim como inserções intra-sequência de aminoácidos únicos ou múltiplos. No geral, as inserções dentro da seqüência de aminoácido será menor do que as fusões de terminal N ou C, da ordem de cerca de 1 a 10 resíduos. Os exemplos de proteínas ou peptídeos de fusão de terminal N ou C incluem o domínio de ligação ou domínio de ativação de um ativador transcricional como usado no sistema de levedura de híbrido duplo, proteínas de revestimento de fago, rótulo de (histidina)-6, rótulo de glutationa S- transferase, proteína A, proteína de ligação de maltose, diidrofoliato redutase, epítopo de Rótulo'100, epítopo c-myc, epítopo FLAG®, IacZ, CMP (peptídeo de ligação de calmodulina), epítopo HA, epítopo de proteína C e epítopo
vsv.
Uma substituição refere-se à substituição de aminoácidos da proteína com outros aminoácidos tendo propriedades similares (tais como hidrofobicidade, hidrofilicidade, antigenicidade, propensão para formar ou romper estruturas α-helicoidais ou estruturas de folha β similares). As substituições de aminoácido são tipicamente de resíduos únicos, mas podem ser agrupadas dependendo das restrições funcionais colocadas no polipeptídeo; as inserções usualmente serão da ordem de cerca de 1 a 10 resíduos de aminoácido. As substituições de aminoácido são preferivelmente substituições de aminoácido conservativas. As tabelas de substituição conservativas são bem conhecidas na técnica (ver por exemplo Creighton (1984) Proteins. W. H. Freeman and Company (Eds) e Tabela 3 abaixo).
Tabela 3: Exemplos de substituições de aminoácido conservadas
Resíduo Substituições Conservativas Resíduo Substituições Conservativas Ala Ser Leu lie; Val Arg Lys Lys Arg; Gln Asn Gln; His Met Leu; Ile Asp Glu Phe Met; Leu; Tyr Gln Asn Ser Thr; Gly Cys Ser Thr Ser; Val Glu Asp Trp Tyr Gly Pro Tyr Trp; Phe His Asn; Gln Val lie; Leu Ile Leu, Val
As substituições, deleções e/ou inserções de aminoácido
podem ser facilmente feitas usando técnicas sintéticas de peptídeo bem conhecidas na técnica, tais como síntese de peptídeo de fase sólida e outros ou pela manipulação de DNA recombinante. Os métodos para a manipulação de seqüências de DNA para produzir variantes de substituição, inserção ou deleção de uma proteína são bem conhecidos na técnica. Por exemplo, as técnicas para fabricar mutações de substituição em sítios pré determinados no DNA são bem conhecidos por aqueles habilitados na técnica e incluem mutagênese Ml3, mutagênese in vitro T7-Gen (USB, Cleveland, OH), Mutagênese Direcionada ao Sítio QuickChange (Stratagene, San Diego, CA), mutagênese direcionada ao sítio mediada pela PCR ou outros protocolos de mutagênese direcionada ao sítio. Derivados
"Derivados" incluem peptídeos, oligopeptídeos, polipeptídeos
que podem, comparados com a seqüência de aminoácido da forma que ocorre naturalmente da proteína, tal como a proteína de interesse, compreender substituições de aminoácidos com resíduos de aminoácido que não ocorrem naturalmente ou adições de resíduos de aminoácido que não ocorrem naturalmente. "Derivados" de uma proteína também abrangem peptídeos, oligopeptídeos, polipeptídeos que compreendem resíduos de aminoácido que ocorrem naturalmente alterados (glicosilados, acilados, prenilados, fosforilados, miristoilados, sulfatados, etc.) ou não naturalmente alterados comparados com a seqüência de aminoácido de uma forma que ocorre naturalmente do polipeptídeo. Um derivado também podem compreender um ou mais substituintes ou adições que não de aminoácido comparado com a seqüência de aminoácido a partir da qual o mesmo é derivado, por exemplo uma molécula repórter ou outro ligando, covalentemente ou não covalentemente ligado à seqüência de aminoácido, tal como uma molécula repórter que é ligada para facilitar a sua detecção e resíduos de aminoácido que não ocorrem naturalmente em relação à seqüência de aminoácido de uma proteína que ocorre naturalmente. Além disso, "derivados" também incluem fusões da forma que ocorre naturalmente da proteína com peptídeos alvejadores tais como FLAG, HIS6 ou tiorredoxina (para uma revisão de peptídeos alvejadores, ver Terpe, Appl. Microbiol. Biotechnol. 60, 523-533, 2003).
Ortólogo(s)/Parálogo(s)
Ortólogos e parálogos abrangem conceitos evolucionários usados para descrever as relações ancestrais de genes. Parálogos são genes dentro da mesma espécie que originou através da duplicação de um gene ancestral; ortólogos são genes de organismos diferentes que originou através da evolução de novas espécies e também são derivados de um gene ancestral comum. Domínio
O termo "domínio" refere-se a um conjunto de aminoácidos conservados em posições específicas junto um alinhamento de seqüências de proteínas evolucionariamente relacionadas. Embora os aminoácidos em outras posições possam variar entre homólogos, os aminoácidos que são altamente conservados em posições específicas indicam aminoácidos que são provavelmente essenciais na estrutura, estabilidade ou função de uma proteína. Identificados pelo seu alto grau de conservação em seqüências alinhadas de uma família de homólogos de proteína, eles podem ser usados como identificadores para determinar se algum polipeptídeo em questão pertence a uma família de polipeptídeo anteriormente identificada. Motivo/S equência de Consenso/Assinatura
Os termos "motivo" ou "seqüência de consenso" ou "assinatura" referem-se a uma região conservada curta na seqüência de proteínas evolucionariamente relacionadas. Os motivos são de modo freqüente partes altamente conservadas de domínios, mas também podem incluir apenas parte do domínio ou estar localizado fora de domínio conservado (se todos dos aminoácidos do motivo caem fora de um domínio definido). Hibridizacão O termo "hibridização" como aqui definido é um processo em que seqüências de nucleotídeo complementares substancialmente homólogas recozem-se entre si. O processo de hibridização pode ocorrer totalmente em solução, isto é, ambos os ácidos nucleicos complementares estão em solução. O processo de hibridização pode também ocorrer com um dos ácidos nucleicos complementares imobilizados a uma matriz tal como pérolas magnéticas, pérolas de Sefarose ou qualquer outra resina. O processo de hibridização pode além disso ocorrer com um dos ácidos nucleicos complementares imobilizado a um suporte sólido tal como uma membrana de nitro-celulose ou náilon ou imobilizado por exemplo, pela fotolitografia, por exemplo, a um suporte de vidro silicoso (o último conhecido como arranjos ou microarranjos de ácido nucleico ou como lascas de ácido nucleico). De modo a permitir que a hibridização ocorra, as moléculas de ácido nucleico são no geral térmica ou quimicamente desnaturadas para fundir um filamento duplo em dois filamentos simples e/ou para remover grampos de cabelo ou outras estruturas secundárias de ácidos nucleicos de filamento simples.
O termo "severidade" refere-se às condições sob as quais uma hibridização ocorre. A severidade de hibridização é influenciada por condições tais como temperatura, concentração salina, força iônica e composição do tampão de hibridização. No geral, condições de baixa severidade são selecionadas para serem de cerca de 3 O0C mais baixas do que o ponto de fusão térmica (Tm) para a seqüência específica em uma força iônica definida e pH. As condições de severidade média são quando a temperatura está 20°C abaixo da Tm e condições de severidade alta são quando a temperatura está IO0C abaixo da Tm. As condições de hibridização de severidade alta são tipicamente usadas para isolar seqüências hibridizadoras que têm alta similaridade de seqüência com a seqüência de ácido nucleico alvo. Entretanto, os ácidos nucleicos podem divergir em seqüência e ainda codificar um polipeptídeo substancialmente idêntico, devido à degenerescência do código genético. Portanto as condições de hibridização de severidade média algumas vezes podem ser necessárias para identificar tais moléculas de ácido nucleico.
A Tm é a temperatura sob força iônica e pH definidos, em que 50% da seqüência alvo hibridiza a uma sonda perfeitamente emparelhada. A Tm, é dependente das condições da solução e da composição base e comprimento da sonda. Por exemplo, seqüências mais longas hibridizam especificamente em temperaturas mais altas. A taxa máxima de hibridização é obtida de cerca de 16°C até 32°C abaixo da Tm. A presença de cátions monovalentes na solução de hibridização reduz a repulsão eletrostática entre os dois filamentos de ácido nucleico promovendo deste modo a formação de híbrido; este efeito é visível para concentrações de sódio de até 0,4 M (para concentrações mais altas, este efeito pode ser ignorado). A formamida reduz a temperatura de fusão de duplexes de DNA-DNA e DNA-RNA em 0,6 a 0,7°C para cada porcentagem de formamida e a adição de 50% de formamida permite que a hibridização seja realizada de 30 a 45°C, entretanto a taxa de hibridização será diminuída. Os desemparelhamentos de par de base reduzem a taxa de hibridização e a estabilidade térmica dos duplexes. Em média e para sondas maiores, a Tm diminui em cerca de 1°C por% de desemparelhamento de base. A Tm pode ser calculada usando as seguintes equações, dependendo dos tipos de híbridos:
1) Híbridos de DNA-DNA (Meinkoth e Wahl, Anal. Biochem., 138: 267-284, 1984):
Tm= 81,5°C + 16,6 χ logio[Na+]a + 0,41 x%[G/Cb] - 500 χ [Lc]"1 - 0,61
x% de formamida
2) Híbridos de DNA-RNA ou RNA-RNA:
Tm = 79,8 + 18,5 (logio[Na+]a) + 0,58 (%G/Cb) + 11,8 (%G/Cb)2 - 820/Lc
3) Híbridos de oligo-DNA ou oligo-RNAd:
Para < 20 nucleotídeos: Tm= 2 (In) Para 20 a 35 nucleotídeos: Tm- 22 + 1,46 (In)
a ou para outro cátion monovalente, mas apenas preciso na faixa de 0,01 a 0,4 M.
apenas preciso para% GC na faixa de 30% a 75%. cL = comprimento do duplex em pares de base.
d oligo, oligonucleotídeo; ln> = comprimento efetivo do iniciador = 2x(n2 de G/C)+( n2 de A/T).
A ligação não específica pode ser controlada usando qualquer um de várias técnicas conhecidas tais como, por exemplo, bloqueio da membrana com soluções contendo proteína, adições de RNA, DNA e SDS heterólogos ao tampão de hibridização e tratamento com Rnase. Para as sondas não homólogas, uma série de hibridizações pode ser realizada variando-se um de (i) diminuir progressivamente a temperatura de recozimento (por exemplo de 68°C para 42°C) ou (ii) diminuir progressivamente a concentração de formamida (por exemplo de 50% para 0%). O técnico habilitado está ciente de vários parâmetros que podem ser alterados durante a hibridização e que manterá ou mudará as condições de severidade.
Além das condições de hibridização, a especificidade de hibridização tipicamente também depende da função das lavagens pós hibridização. Para remover o fundo que resulta da hibridização não específica, amostras são lavadas com soluções salinas diluídas. Fatores críticos de tais lavagens incluem a força iônica e a temperatura da solução de lavagem final: quanto mais baixa a concentração salina e quanto mais alta a temperatura de lavagem, mais alta a severidade da lavagem. As condições de lavagem são tipicamente realizadas na ou abaixo da severidade de hibridização. Uma hibridização positiva dá um sinal que é pelo menos duas vezes daquele do fundo. No geral, as condições de severidade adequadas para os ensaios de hibridização de ácido nucleico ou procedimentos de detecção de amplificação de gene são como apresentadas acima. As condições mais ou menos severas também podem ser selecionadas. O técnico habilitado está ciente de vários parâmetros que podem ser alterados durante a lavagem e que manterá ou mudará as condições de severidade.
Por exemplo, as condições de hibridização típicas de severidade alta para híbridos de DNA mais longos do que 50 nucleotídeos abrangem hibridização a 65°C em 1 χ SSC ou a 42°C em 1 χ SSC e 50% de formamida, seguido pela lavagem a 65°C em 0,3 χ SSC. Os exemplos de condições de hibridização de severidade média para híbridos de DNA mais longos do que 50 nucleotídeos abrangem hibridização a 50°C em 4x SSC ou a 40°C em 6x SSC e 50% de formamida, seguido pela lavagem a 50°C em 2x SSC. O comprimento do híbrido é o comprimento previsto para o ácido nucleico hibridizante. Quando ácidos nucleicos de seqüência conhecida são hibridizados, o comprimento do híbrido pode ser determinado pelo alinhamento das seqüências e identificação das regiões conservadas aqui descritas. 1 χ SSC é 0,15 M de NaCl e 15 mM de citrato de sódio; a solução de hibridização e soluções de lavagem podem adicionalmente incluir 5x reagente de Denhardt, 0,5 a 1,0% de SDS, 100 μg/ml de DNA de esperma de salmão desnaturado, fragmentado, 0,5% de pirofosfato de sódio.
Para os propósitos de definir o nível de severidade, referência pode ser feita a Sambrook et al. (2001) Molecular Cloning: a laboratory manual, 3a Edição, Cold Spring Harbor Laboratory Press, CSH, Nova Iorque ou a Current Protocols in Molecular Biology, John Wiley & Sons, Ν. Y. (1989 e atualizações anuais). Variante de Junção
O termo "variante de junção" como aqui usado abrange variantes de uma seqüência de ácido nucleico em que íntrons e/ou exons selecionados foram excisados, substituídos, deslocados ou adicionados ou em que introns foram encurtados ou alongados. Tais variantes serão aquelas em que a atividade biológica da proteína é substancialmente retida; isto pode ser obtido retendo-se seletivamente segmentos funcionais da proteína. Tais variantes de junção podem ser encontradas na natureza ou podem ser feitas pelo homem. Os métodos para prognosticar e isolar tais variantes de junção são bem conhecidos na técnica (ver por exemplo Foissac e Schiex (2005) BMC Bioinformatics 6: 25). Variante Alélica
Alelos ou variantes alélicas são formas alternativas de um gene dado, localizada na mesma posição cromossômica. As variantes alélicas abrangem Polimorfismos de Nucleotídeo Único (SNPs), assim como Polimorfismos de Inserção Pequena/Deleção (INDELs). O tamanho de INDELs é usualmente menor do que 100 pares de base. SNPs e INDELs formam o conjunto maior de variantes de seqüência em que as cepas polimórficas ocorrem naturalmente da maioria dos organismos. Embaralhamento de Gene/Evolução Direta
O embaralhamento de gene ou evolução direta consistem de iterações de embaralhamento de DNA seguido pela triagem apropriada e/ou seleção para gerar variantes de ácidos nucleicos ou porções destas que codificam proteínas tendo uma atividade biológica modificada (Castle et ai., (2004) Science 304 (5674): 1151-4; Patentes US 5.811.238 e 6,395.547). Elemento Regulador/Sequência de Controle/Promotor
Os termos "elemento regulador", "seqüência de controle" e "promotor" são todos usados aqui intercambiavelmente e devem ser considerados em um contexto amplo para se referir às seqüências de ácido nucleico reguladoras capazes de efetuar a expressão das seqüências às quais elas são ligadas. O termo "promotor" tipicamente refere-se a uma seqüência de ácido nucleico de controle localizada a montante do início transcricional de um gene e que é envolvido no reconhecimento e ligação da RNA polimerase e outras proteínas, direcionando deste modo a transcrição de um ácido nucleico operavelmente ligado. Abrangido pelos termos anteriormente mencionados são seqüências transcricionais reguladoras derivadas de um gene genômico eucariótico clássico (incluindo a caixa TATA que é requerida para o início de transcrição precisa, com ou sem uma seqüência de caixa CCAAT) e elementos reguladores adicionais (isto é, seqüências ativadoras, realçadoras e silenciadoras a montante) que alteram a expressão de gene em resposta ao estímulo desenvolvimental e/ou externo ou em uma maneira específica de tecido. Também incluído dentro do termo está uma seqüência reguladora transcricional de um gene procariótico clássico, em cujo caso o mesmo pode incluir uma seqüência de caixa -35 e/ou seqüências reguladoras transcricionais de caixa -10. O termo "elemento regulador" também abrange uma molécula de fusão sintética ou derivado que confere, ativa ou realça a expressão de uma molécula de ácido nucleico em uma célula, tecido ou órgão.
Um "promotor vegetal" compreende elementos reguladores, que medeiam a expressão de um segmento de seqüência codificadora em células vegetais. Consequentemente, um promotor vegetal não precisa ser de origem vegetal, mas pode originar de vírus ou micro-organismos, por exemplo de vírus que atacam células vegetais. O "promotor vegetal" também pode originar-se de uma célula vegetal, por exemplo, da planta que é transformada com a seqüência de ácido nucleico a ser expressada no processo inventivo e aqui descrito. Isto também se aplica a outros sinais reguladores de "planta", tais como terminadores de "planta". Os promotores a montante das seqüências de nucleotídeo úteis nos métodos da presente invenção podem ser modificados por uma ou mais substituição(ões), inserção(ões) e/ou deleção(ões) de nucleotídeo sem interferir com a funcionalidade ou atividade dos promotores, da matriz de leitura aberta (ORF) ou da região reguladora 3' tal como terminadores ou outras regiões reguladoras 3' que são localizadas fora da ORF. E além disso possível que a atividade dos promotores é aumentado pela modificação da sua seqüência ou que eles são substituídos completamente por promotores mais ativos, mesmo promotores de organismos heterólogos. Para a expressão em plantas, a molécula de ácido nucleico, como descrito acima, deve ser ligada operavelmente a ou compreender um promotor adequado que expressa o gene no ponto certo no tempo e com o padrão de expressão espacial requerido.
Para a identificação de promotores funcionalmente equivalentes, a força do promotor e/ou padrão de expressão de um promotor candidato podem ser analisados por exemplo ligando-se operavelmente o promotor a um gene repórter e ensaiando o nível e padrão de expressão do gene repórter em vários tecidos da planta. Os genes repórteres bem conhecidos adequados incluem por exemplo beta-glicuronidase ou beta- galactosidase. A atividade de promotor é ensaiada medindo-se a atividade enzimática da beta-glicuronidase ou beta-galactosidase. A força do promotor e/ou padrão de expressão podem ser depois comparados com aquele de um promotor de referência (tal como aquele usado nos métodos da presente invenção). Alternativamente, a força do promotor pode ser ensaiada quantificando-se os níveis de mRNA ou comparando-se os níveis de mRNA do ácido nucleico usado nos métodos da presente invenção, com níveis de mRNA de genes de manutenção tais como 18S rRNA, usando métodos conhecidos na técnica, tais como Northern blotting com análise densitométrica de autorradiogramas, a PCR em tempo real quantitativa ou RT-PCR (Heid et al., 1996 Genome Methods 6: 986-994). No geral por "promotor fraco" é intencionado um promotor que direcione a expressão de uma seqüência codificadora em um nível baixo. Por "nível baixo" é intencionado em níveis de cerca de 1/10.000 transcritos a cerca de 1/100.000 transcritos, a cerca de 1/500.0000 transcritos por célula. Ao contrário, um "promotor forte" direciona a expressão de uma seqüência codificadora em nível alto ou em cerca de 1/10 transcritos a cerca de 1/100 transcritos a cerca de 1/1000 transcritos por célula. Operavelmente ligada
O termo "operavelmente ligada" como aqui usado refere-se a uma ligação funcional entre a seqüência promotora e o gene de interesse, tal que a seqüência promotora seja capaz de iniciar a transcrição do gene de interesse.
Promotor constitutivo
Um "promotor constitutivo" refere-se a um promotor que é transcricionalmente ativo durante a maior parte, mas não necessariamente todas, das fases de crescimento e desenvolvimento e sob a maior parte das condições ambientais, em pelo menos uma célula, tecido ou órgão. A Tabela 4a abaixo dá exemplos de promotores constitutivos.
Tabela 4a: Exemplos de promotores constitutivos
Fonte de gene Referência Actina McElroy et al, Vegetal Cell5 2: 163-171, 1990 HMGP WO 2004/070039 CAMV 35S Odell et al, Nature, 313: 810-812, 1985 CaMV 19S Nilsson et al, Physiol. Plant. 100: 456-462, 1997 GOS2 de Pater et al, Plant J Nov; 2(6): 837-44, 1992, WO 2004/065596 Ubiquitina Christensen et al, Plant Mol. Biol. 18: 675-689, 1992 CiclofIlina do arroz Buchholz et al, Plant Mol Biol. 25(5): 837-43, 1994 H3 histona do Milho Lepetit et al, Mol. Gen. Genet. 231: 276-285, 1992 H3 histona da Alfafa Wu et al. Plant Mol. Biol. 11: 641 -649, 1988 Actina 2 Anet al, Plant J. 10(1); 107-121, 1996 34S FMV Sanger et al., Plant. Mol. Biol., 14, 1990: 433-443 Subunidade pequena Rubiseo US 4,962.028 OCS Leisner (1988) Proe Natl Acad Sei USA 85(5): 2553 SADl Jain et al., Crop Science, 39 (6), 1999: 1696 SAD2 Jain et al., Crop Science, 39 (6), 1999: 1696 nos Shaw et al. (1984) Nucleic Acids Res. 12(20): 7831-7846 V-ATPase WO 01/14572 Super promotor WO 95/14098 Proteínas de caixa G WO 94/12015
Promotor ubíquo
Um promotor ubíquo é ativo em substancialmente todos os tecidos ou células de um organismo. Promotor desenvolvimentalmente regulado
Um promotor desenvolvimentalmente regulado é ativo durante certos estágios de desenvolvimento ou em partes da planta que sofrem mudanças desenvolvimentais. Promotor indutível
Um promotor indutível tem início de transcrição induzido ou aumentado em resposta a um estímulo químico (para uma revisão ver Gatz 1997, Annu. Rev. Plant Physiol. Plant Mol. Biol., 48: 89-108), ambiental ou físico ou pode ser "indutível por estresse", isto é, ativado quando uma planta é exposta a várias condições de estresse ou um "indutível por patógeno" isto é, ativado quando uma planta é exposta à exposição a vários patógenos. Promotor Específico de Órgão/Específico de Tecido
Um promotor específico de órgão ou específico de tecido é um que é capaz de preferencialmente iniciar a transcrição em certos órgãos ou tecidos, tais como as folhas, raízes, tecido de semente, etc. Por exemplo, um "promotor específico de raiz" é um promotor que é transcricionalmente ativo de modo predominante em raízes de planta, substancialmente para a exclusão de quaisquer outras partes de uma planta, embora permita ainda qualquer expressão avariada nestas outras partes de planta. Promotores capazes de iniciar a transcrição em certas células apenas são aqui aludidas como "específico de célula".
Um promotor específico de semente é transcricionalmente ativo de modo predominante em tecido de semente, mas não de modo necessariamente exclusivo em tecido de semente (em casos de expressão avariada). O promotor específico de semente pode ser ativo durante o desenvolvimento da semente e/ou durante a germinação. O promotor específico de semente pode ser específico de endosperma/aleurona/ embrião. Os exemplos de promotores específicos de semente são mostrados nas Tabelas 4b a 4e abaixo. Outros exemplos de promotores específicos de semente são dados em Qing Qu e Takaiwa (Plant Biotechnol. J. 2, 113-125, 2004), divulgação esta que é aqui incorporada por referência como se completamente apresentada.
Tabela 4b: Exemplos de promotores específicos de semente
Fonte de Gene Referência genes específicos de semente Simon et al., Plant Mol. Biol. 5: 191, 1985; Scofield et al., J. Biol. Chem. 262: 12202, 1987. Baszczynski et al., Plant Mol. Biol. 14: 633, 1990. Albumina de castanha do Pará Pearson et al., Plant Mol. Biol. 18: 235-245, 1992. legumina Ellis et al., Plant Mol. Biol. 10: 203-214, 1988. glutelina (arroz) Takaiwa et al., Mol. Gen. Genet. 208: 15-22, 1986; Takaiwa et al., FEBS Letts. 221: 43-47,1987. zeina Matzke et al Plant Mol Biol, 14(3): 323-32 1990 napA Stalberg et al, Plant 199: 515-519, 1996. glutenina-1 LMW e HMW do trigo Mol Gen Genet 216: 81-90, 1989; NAR 17: 461- 2,1989 SPA do trigo Albani et al, Plant Cell, 9: 171-184, 1997 α, β, γ-gliadinas do trigo EMBO J. 3: 1409-15, 1984 promotor Itrl da cevada Diaz et al. (1995) Mol Gen Genet 248(5): 592-8 B1, C, D, hordeína da cevada Theor Appl Gen 98: 1253-62, 1999; Planta J 4: 343-55, 1993; Mol Gen Genet 250: 750-60,1996 DOF da cevada Mena et al, The Plant Journal, 116(1): 53-62, 1998 blz2 EP99106056.7 Promotor sintético Vicente-Carbajosa et al., Plant J. 13: 629-640, 1998. prolamina NRP33 do arroz Wu et al, Célula vegetal Physiology 39(8) 885- 889, 1998 α-globulina Glb-I do arroz Wu et al, Célula vegetal Physiology 39(8) 885- 889, 1998 OSHl do arroz Sato et al, Proc. Natl. Acad. Sei. USA, 93: 8117- 8122, 1996 α-globulina REB/OHP-1 do arroz Nakase et al. Plant Mol. Biol. 33: 513-522, 1997 ADP-glicose pirofosforilase do arroz Trans Res 6: 157-68, 1997 Família de gene ESR do milho PlantaJ 12:235-46, 1997 α-cafirina do sorgo DeRose et al., Planta Mol. Biol 32: 1029-35, 1996 KNOX Postma-Haarsma et al, Plant Mol. Biol. 39: 257- 71, 1999 Oleosina do arroz Wu et al, J. Biochem. 123: 386, 1998 Oleosina do girassol Cummins et al., Plant Mol. Biol. 19: 873-876, 1992 PROO117, proteína ribossômica 40S do arroz putativa WO 2004/070039 PROO136, alanina aminotransferase do arroz não publicado PROO147, inibitor de tripsina ITRl (cevada) não publicado PR00151, arroz WSIl 8 WO 2004/070039 PROOl75, arroz RAB21 WO 2004/070039 PR0005 WO 2004/070039 PR00095 WO 2004/070039 α-amilase (Amy32b) Lanahan et al, Célula vegetal 4: 203-211, 1992; Skriver et al, Proc Natl Acad Sci USA 88: 7266-7270, 1991 Gene equivalente a catepsina β Cejudo et al, Plant Mol Biol 20: 849-856, 1992 Ltp2 da Cevada Kalla et al., Planta J. 6: 849-60, 1994 Chi26 Leah et al., Planta J. 4: 579-89, 1994 B-Peru do Milho Selinger et al., Genéticas 149;1125-38,1998
Tabela 4c: Exemplos de promotores específicos de endosperma
Fonte de Gene Referência glutelina (arroz) Takaiwa et al. (1986) Mol Gen Genet 208: 15-22; Takaiwa et al. (1987) FEBS Letts. 221: 43-47 zeína Matzke et al., (1990) Plant Mol Biol 14(3): 323-32 glutenina-1 de LMW e HMW do trigo Colot et al. (1989) Mol Gen Genet 216: 81-90, Anderson et al. (1989) NAR 17: 461-2 SPA do trigo Albani et al. (1997) Plant Cell 9: 171-184 Gliadinas do trigo Rafalski et al. (1984) EMBO 3: 1409-15 Promotor Itrl da cevada Diaz et al. (1995) Mol Gen Genet 248(5): 592-8 Hordeína BI, C, D, da cevada Cho et al. (1999) Theor Appl Genet 98: 1253-62; Muller et al. (1993) Plant J 4: 343-55; Sorenson et al. (1996) Mol Gen Genet 250: 750-60 DOF da cevada Mena et al, (1998) Plant J 116(1): 53-62 blz2 Onate et al. (1999) J Biol Chem 274(14): 9175-82 Promotor sintético Vicente-Carbajosa et al. (1998) Plant J 13: 629-640 Prolamina NRP33 do arroz Wu et al, (1998) Plant Cell Physiol 39(8) 885-889 globulina Glb-I do arroz Wu et al. (1998) Plant Cell Physiol 39(8) 885-889 globulina REB/OHP-1 do arroz Nakase et al. (1997) Plant Molec Biol 33: 513-522 ADP-glicose Pirofosforilase do arroz Russell et al. (1997) Trans Res 6: 157-68 Família do gene ESR do milho Opsahl-Ferstad et al. (1997) Plant J 12: 235-46 Cafirina do sorgo DeRose et al. (1996) Plant Mol Biol 32: 1029-35 Tabela 4d: Exemplos de promotores específicos de embrião: Fonte de Gene Referência OSHl do Arroz Sato et al, Proc. Natl. Acad. Sei. USA, 93: 8117- 8122,1996 KNOX Postma-Haarsma et al, Plant Mol. Biol. 39: 257-71, 1999 PROOl 51 WO 2004/070039 PROO175 WO 2004/070039 PR0005 WO 2004/070039 PR00095 WO 2004/070039 Tabela 4e: Exemplos de promotores específicos de aleurona: Fonte de Gene Referência α-amilase (Amy32b) Lanahan et al, Plant Cell 4: 203-211, 1992; Skriver et al, Proc Natl Acad Sci USA 88: 7266-7270, 1991 gene equivalente à catepsina β Cejudo et al, Plant Mol Biol 20: 849-856, 1992 Ltp2 da Cevada Kalla et al., Plant J. 6: 849-60, 1994 Chi26 Leah et al., Plant J. 4: 579-89, 1994 B-Peru do Milho Selinger et al., Genetics 149; 1125-38, 1998
Um promotor específico de tecido verde como aqui definido é um promotor que é transcricionalmente ativo de modo predominante em tecido verde, substancialmente para a exclusão de quaisquer outras partes de uma planta, embora ainda permita qualquer expressão avariada nestas outras partes de planta.
Um outro exemplo de um promotor específico de tecido é um promotor específico de meristema, que é transcricionalmente ativo de modo predominante em tecido meristemático, substancialmente para a exclusão de quaisquer outras partes de uma planta, embora ainda permita qualquer expressão avariada nestas outras partes de planta. Terminador
O termo "terminador" abrange uma seqüência de controle que é uma seqüência de DNA no final de uma unidade transcricional que sinaliza o processamento 3' e poliadenilação de um transcrito primário e terminação de transcrição. O terminador pode ser derivado do gene natural, de uma variedade de outros genes vegetais ou de T-DNA. O terminador a ser adicionado pode ser derivado, por exemplo, dos genes da nopalina sintase ou octopina sintase ou alternativamente de um outro gene vegetal ou menos preferivelmente de qualquer outro gene eucariótico. Modulação O termo "modulação" significa em relação à expressão ou expressão de gene, um processo em que o nível de expressão é trocado pela dita expressão de gene em comparação com a planta de controle, o nível de expressão pode ser aumentado ou diminuído. A expressão não modulada, original pode ser de qualquer tipo de expressão de um RNA estrutural (rRNA, tRNA) ou mRNA com a tradução subsequente. O termo "modular a atividade" deve significar qualquer mudança da expressão das seqüências de ácido nucleico da invenção ou proteínas codificadas, que leve ao rendimento aumentado e/ou crescimento aumentado das plantas. Expressão
O termo "expressão" ou "expressão de gene" significa a transcrição de um gene específico ou genes específicos ou construção genética específica. O termo "expressão" ou "expressão de gene" em particular significa a transcrição de um gene ou genes ou construção genética em RNA estrutural (rRNA, tRNA) ou mRNA com ou sem tradução subsequente do último em uma proteína. O processo inclui a transcrição de DNA e o processamento do produto de mRNA resultante. Expressão Aumentada/Super Expressão
Os termos "expressão aumentada" ou "superexpressão" como aqui usados significam qualquer forma de expressão que é adicional ao nível de expressão do tipo selvagem original.
Os métodos para aumentar a expressão de genes ou produtos de gene são bem documentados na técnica e incluem, por exemplo, superexpressão direcionada pelos promotores apropriados, o uso de realçadores de transcrição ou realçadores de tradução. Os ácidos nucleicos isolados que servem como elementos promotores ou realçadores podem ser introduzidos em uma posição apropriada (tipicamente a montante) de uma forma não heteróloga de um polinucleotídeo de modo a super regular a expressão de um ácido nucleico que codifica o polipeptídeo de interesse. Por exemplo, promotores endógenos podem ser alterados in vivo pela mutação, deleção, e/ou substituição (ver, Kmiec, US 5.565,350; Zarling et al., W09322443) ou promotores isolados podem ser introduzidos em uma célula vegetal na orientação e distância apropriada de um gene da presente invenção de modo a controlar a expressão do gene.
Se a expressão de polipeptídeo é desejada, é no geral desejável incluir uma região de poliadenilação na extremidade 3' de uma região codificadora de polinucleotídeo. A região de poliadenilação pode ser derivada do gene natural, de uma variedade de outros genes vegetais ou de T-DNA. A seqüência da extremidade 3' a ser adicionada pode ser derivada, por exemplo, dos genes da nopalina sintase ou octopina sintase ou alternativamente de um outro gene vegetal ou menos preferivelmente de qualquer outro gene eucariótico.
Uma seqüência de intron também pode ser adicionada à região não traduzida 5' (UTR) ou à seqüência codificadora da seqüência codificadora parcial para aumentar a quantidade da messagem madura que acumula no citossol. A inclusão de um intron passível de união na unidade de transcrição nas construções de expressão tanto vegetal quanto animal tem sido mostrado aumentar a expressão de gene aos níveis tanto de mRNA quanto de proteína até 1000 vezes (Buchman e Berg (1988) Mol. Cell Biol. 8: 4395- 4405; Callis et al. (1987) Genes Dev 1: 1183-1200). Tal realce de intron de expressão de gene é tipicamente maior quando colocado próximo da extremidade 5' da unidade de transcrição. O uso dos introns do milho Adhl-5 intron 1, 2 e 6, o intron Bronze-1 são conhecidos na técnica. Para informação geral ver: The Maize Handbook, Capítulo 116, Freeling e Walbot, Eds., Springer, N.Y. (1994). Gene Endógeno
Referência aqui a um gene "endógeno" não apenas refere-se ao gene em questão como encontrado em uma planta na sua forma natural (isto é, sem que haja qualquer intervenção humana), mas também refere-se àquele mesmo gene (ou um ácido nucleico/gene substancialmente homólogo) em uma forma isolada subseqüentemente (re)introduzida em uma planta (um transgene). Por exemplo, uma planta transgênica contendo um tal transgene pode encontrar uma redução substancial da expressão de transgene e/ou redução substancial da expressão do gene endógeno. O gene isolado pode ser isolado de um organismo ou pode ser feito pelo homem, por exemplo pela síntese química. Expressão Diminuída
Referência aqui à "expressão diminuída" ou "redução ou eliminação substanciais" de expressão é considerada significar uma diminuição na expressão de gene endógena e/ou níveis de polipeptídeo e/ou atividade de polipeptídeo em relação às plantas de controle. A redução ou eliminação substanciais está em ordem crescente de preferência pelo menos 10%, 20%, 30%, 40% ou 50%, 60%, 70%, 80%, 85%, 90% ou 95%, 96%, 97%, 98%, 99% ou mais reduzida comparada com aquela de plantas de controle.
Para a redução ou eliminação substanciais da expressão de um gene endógeno em uma planta, um comprimento suficiente de nucleotídeos substancialmente contíguos de uma seqüência de ácido nucleico é requerido. De modo a realizar o silenciamento de gene, isto pode ser tão pouco quanto 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10 ou menos nucleotídeos, alternativamente isto pode ser tanto quanto o gene inteiro (incluindo a 5' e/ou 3' UTR, em parte ou no todo). O trecho de nucleotídeos substancialmente contíguo pode ser derivado do ácido nucleico que codifica a proteína de interesse (gene alvo) ou de qualquer ácido nucleico capaz de codificar um ortólogo, parálogo ou homólogo da proteína de interesse. Preferivelmente, o trecho de nucleotídeos substancialmente contíguos é capaz de formar ligações de hidrogênio com o gene alvo (filamento de sentido ou anti-sentido), mais preferivelmente, o trecho de nucleotídeos substancialmente contíguos tem, em ordem crescente de preferência, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 100% de identidade de seqüência ao gene alvo (filamento de sentido ou anti-sentido). Uma seqüência de ácido nucleico que codifica um polipeptídeo (funcional) não é uma exigência para os vários métodos aqui debatidos para a redução ou eliminação substanciais da expressão de um gene endógeno.
Esta redução ou eliminação substanciais de expressão pode ser obtida usando ferramentas e técnicas de rotina. Um método preferido para a redução ou eliminação substanciais da expressão de gene endógeno é pela introdução e expressão em uma planta de uma construção genética em que o ácido nucleico (neste caso um trecho de nucleotídeos substancialmente contíguos derivados do gene de interesse ou de qualquer ácido nucleico capaz de codificar um ortólogo, parálogo ou homólogo de qualquer uma das proteínas de interesse) é clonado como uma repetição invertida (em parte ou completamente), separado por um espaçador (DNA não codificador).
Em um tal método preferido, a expressão do gene endógeno é reduzido ou substancialmente eliminado através do silenciamento mediado por RNA usando uma repetição invertida de um ácido nucleico ou uma parte deste (neste caso um trecho de nucleotídeos substancialmente contíguos derivados do gene de interesse ou de qualquer ácido nucleico capaz de codificar um ortólogo, parálogo ou homólogo da proteína de interesse), preferivelmente capaz de formar uma estrutura de grampo de cabelo. A repetição invertida é clonada em um vetor de expressão que compreende as seqüências de controle. Uma seqüência de ácido nucleico de DNA não codificador (um espaçador, por exemplo um fragmento da região de ligação de matriz (MAR), um intron, um poliligador, etc.) está localizado entre os dois ácidos nucleicos invertidos que forma a repetição invertida. Depois da transcrição da repetição invertida, um RNA quimérico com uma estrutura auto-complementar é formada (parcial ou completa). Esta estrutura de RNA de filamento duplo é aludida como o RNA grampo de cabelo (hpRNA). O hpRNA é processado pela planta em siRNAs que são incorporados em um complexo de silenciamento induzido pelo RNA (RISC). O RISC cliva ainda os transcritos de mRNA, reduzindo substancialmente deste modo o número de transcritos de mRNA a serem traduzidos em polipeptídeos. Para mais detalhes gerais ver por exemplo, Grierson et al. (1998) WO 98/53083; Waterhouse et al. (1999) WO 99/53050).
O desempenho dos métodos da invenção não contam com a introdução e expressão em uma planta de uma construção genética na qual o ácido nucleico é clonado como uma repetição invertida, mas qualquer um ou mais de diversos métodos de "silenciamento de gene" bem conhecido podem ser usados para se obter os mesmos efeitos.
Um tal método para a redução da expressão de gene endógeno é o silenciamento mediado por RNA da expressão de gene (infra-regulagem). O silenciamento neste caso é deflagrado em uma planta por uma seqüência de RNA de filamento duplo (dsRNA) que é substancialmente similar ao gene endógeno alvo. Este dsRNA é ainda processado pela planta em cerca de 20 a cerca de 26 nucleotídeos chamado de RNAs interferentes curtos (siRNAs). Os siRNAs são incorporados em um complexo de silenciamento induzido pelo RNA (RISC) que cliva o transcrito de mRNA do gene alvo endógeno, reduzindo substancialmente deste modo o número de mRNA transcritos a serem traduzidos em um polipeptídeo. Preferivelmente, a seqüência de RNA de filamento duplo corresponde a um gene alvo. Um outro exemplo de um método de silenciamento de RNA
envolve a introdução de seqüências de ácido nucleico ou partes destas (neste caso um trecho de derivados de nucleotídeo substancialmente contíguo do gene de interesse ou de qualquer ácido nucleico capaz de codificar um ortólogo, parálogo ou homólogo da proteína de interesse) em uma orientação de sentido em uma planta. "Orientação de sentido" refere-se a uma seqüência de DNA que é homóloga a um transcrito de mRNA desta. Portanto seria introduzida em uma planta pelo menos uma cópia da seqüência de ácido nucleico. A seqüência de ácido nucleico adicional reduzirá a expressão do gene endógeno, dando origem a um fenômeno conhecido como co-supressão. A redução da expressão de gene será mais pronunciada se diversas cópias adicionais de uma seqüência de ácido nucleico forem introduzidas na planta, visto que existe uma correlação positiva entre níveis de transcrito altos e a deflagração da co-supressão.
Um outro exemplo de um método de silenciamento de RNA envolve o uso de seqüências de ácido nucleico de anti-sentido. Uma seqüência de ácido nucleico de "anti-sentido" compreende uma seqüência de nucleotídeo que é complementar a uma seqüência de ácido nucleico de "sentido" que codifica uma proteína, isto é, complementares ao filamento codificador de uma molécula de cDNA de filamento duplo ou complementar a uma seqüência de mRNA transcrita. A seqüência de ácido nucleico de anti- sentido é preferivelmente complementar ao gene endógeno a ser silenciado. A complementaridade pode estar localizada na "região codificadora" e/ou na "região não codificadora" de um gene. O termo "região codificadora" refere- se a uma região da seqüência de nucleotídeo que compreende códons que são traduzidos em resíduos de aminoácido. O termo "região não codificadora" refere-se às seqüências 5' e 3' que flanqueiam a região codificadora que são transcritas mas não traduzidas em aminoácidos (também aludidas como regiões não traduzidas 5' e 3').
As seqüências de ácido nucleico de anti-sentido podem ser planejadas de acordo com as regras de emparelhamento de base de Watson e Crick. A seqüência de ácido nucleico de anti-sentido pode ser complementar à seqüência de ácido nucleico inteira (neste caso um trecho de nucleotídeo substancialmente contíguos derivados do gene de interesse ou de qualquer ácido nucleico capaz de codificar um ortólogo, parálogo ou homólogo da proteína de interesse), mas também pode ser um oligonucleotídeo que seja de anti-sentido apenas a uma parte da seqüência de ácido nucleico (incluindo a 5' e 3' UTR de mRNA). Por exemplo, a seqüência de oligonucleotídeo de anti- sentido pode ser complementar à região que circunda o sítio de início de tradução de um mRNA transcrito que codifica um polipeptídeo. O comprimento de uma seqüência de oligonucleotídeo de anti-sentido adequada é conhecido na técnica e pode começar de cerca de 50, 45, 40, 35, 30, 25, 20, ou 10 nucleotídeos no comprimento ou menos. Uma seqüência de ácido nucleico de anti-sentido de acordo com a invenção pode ser construída usando a síntese química e reações de ligação enzimática usando métodos conhecido na técnica. Por exemplo, uma seqüência de ácido nucleico de anti-sentido (por exemplo, uma seqüência de oligonucleotídeo de anti-sentido) pode ser quimicamente sintetizado usando nucleotídeos que ocorrem naturalmente ou nucleotídeos variadamente modificados planejados para aumentar a estabilidade biológica das moléculas ou para aumentar a estabilidade física do duplex formado entre as seqüências de ácido nucleico de anti-sentido e sentido, por exemplo, nucleotídeos substituídos com derivados de fosforotioato e acridina podem ser usados. Os exemplos de nucleotídeos modificados que podem ser usados para gerar as seqüências de ácido nucleico de anti-sentido são bem conhecidos na técnica. As modificações de nucleotídeo conhecidas incluem metilação, ciclização e 'encapuzamentos' e substituição de um ou mais dos nucleotídeos que ocorrem naturalmente com um análogo tal como inosina. Outras modificações de nucleotídeos são bem conhecidas na técnica.
A seqüência de ácido nucleico de anti-sentido pode ser produzida biologicamente usando um vetor de expressão no qual uma seqüência de ácido nucleico foi subclonada em uma orientação de anti-sentido (isto é, o RNA transcrito a partir do ácido nucleico inserido será de uma orientação de anti-sentido em relação a um ácido nucleico alvo de interesse). Preferivelmente, a produção de seqüências de ácido nucleico de anti-sentido em plantas ocorre por meio de uma construção de ácido nucleico estavelmente integrada que compreenda um promotor, um oligonucleotídeo de anti-sentido operavelmente ligado e um terminador.
As moléculas de ácido nucleico usadas para silenciamento nos métodos da invenção (sejam introduzidos em uma planta ou gerados in situ) hibridizam com ou se ligam a transcritos de mRNA e/ou DNA genômico que codifica um polipeptídeo para deste modo inibir a expressão da proteína, por exemplo, pela inibição da transcrição e/ou tradução. A hibridização pode ser pela complementaridade de nucleotídeo convencional para formar um duplex estável, ou, por exemplo, no caso de uma seqüência de ácido nucleico de anti- sentido que se liga a duplexes de DNA, através de interações específicas na ranhura principal da hélice dupla. As seqüências de ácido nucleico de anti- sentido podem ser introduzidas em uma planta pela transformação ou injeção direta em um sítio de tecido específico. Alternativamente, as seqüências de ácido nucleico de anti-sentido podem ser modificadas para alvejar células selecionadas e depois sistemicamente administradas. Por exemplo, para a administração sistêmica, as seqüências de ácido nucleico de anti-sentido podem ser modificadas tal que elas especificamente se liguem aos receptores ou antígenos expressados em uma superfície de célula selecionada, por exemplo, ligando-se a seqüência de ácido nucleico de anti-sentido aos peptídeos ou anticorpos que se ligam aos receptores ou antígenos de superfície celular. As seqüências de ácido nucleico de anti-sentido também podem ser liberadas às células usando os vetores aqui descritos.
De acordo com um outro aspecto, a seqüência de ácido nucleico de anti-sentido é uma seqüência de ácido nucleico a-anomérica. Uma seqüência de ácido nucleico α-anomérica forma híbridos de filamento duplo específicos com o RNA complementar em que, ao contrário das unidades b usuais, os filamentos correm paralelos entre si (Gaultier et al. (1987) Nucl Ac Res 15: 6625-6641). A seqüência de ácido nucleico de anti- sentido também pode compreender um 2'-o-metilribonucleotídeo (Inoue et al.
(1987) Nucl Ac Res 15, 6131-6148) ou um análogo de RNA-DNA quimérico (Inoue et al. (1987) FEBS Lett. 215, 327-330).
A redução ou eliminação substanciais da expressão de gene endógeno também podem ser realizadas usando ribozimas. As ribozimas são moléculas de RNA catalíticas com atividade de ribonuclease que são capazes de clivar uma seqüência de ácido nucleico de filamento único, tal como um mRNA, ao qual eles têm uma região complementar. Assim, as ribozimas (por exemplo, ribozimas cabeça de martelo (descritas em Haselhoff e Gerlach
(1988) Nature 334, 585-591) podem ser usadas para clivar cataliticamente transcritos de mRNA que codificam um polipeptídeo, reduzindo substancialmente deste modo o número de transcritos de mRNA a serem
traduzidos em um polipeptídeo. Uma ribozima tendo especificidade para uma seqüência de ácido nucleico pode ser planejada (ver por exemplo: Cech et al. Patente U.S. N- 4,987.071; e Cech et al. Patente U.S. N° 5.116.742). Alternativamente, transcritos de mRNA que correspondem a uma seqüência de ácido nucleico podem ser usados para selecionar um RNA catalítico tendo uma atividade de ribonuclease específica de um grupo de moléculas de RNA (Bartel e Szostak (1993) Science 261, 1411-1418). O uso de ribozimas para o silenciamento de gene em plantas é conhecido na técnica (por exemplo, Atkins et al. (1994) WO 94/00012; Lenne et al. (1995) WO 95/03404; Lutziger et al. (2000) WO 00/00619; Prinsen et al. (1997) WO 97/13865 e Scott et al. (1997) WO 97/38116).
O silenciamento de gene também pode ser obtido pela mutagênese de inserção (por exemplo, inserção de T-DNA ou inserção de transposon) ou pelas estratégias como descrito, entre outros, por Angell e Baulcombe ((1999) Plant J 20(3): 357-62), (Amplicon VIGS WO 98/36083) ou Baulcombe (WO 99/15682).
O silenciamento de gene também pode ocorrer se houver uma mutação em um gene endógeno e/ou uma mutação em um gene/ácido nucleico isolados subseqüentemente introduzidos em uma planta. A redução ou eliminação substanciais pode ser causada por um polipeptídeo não funcional. Por exemplo, o polipeptídeo pode ligar-se a várias proteínas influenciadoras; uma ou mais mutações e/ou truncagens podem fornecer portanto um polipeptídeo que ainda seja capaz de ligar proteínas influenciadoras (tais como proteínas receptoras) mas que não podem exibir a sua função normal (tal como ligando de sinalização).
Um outro método para silenciar gene é pelo alvejamento de seqüências de ácido nucleico complementares à região reguladora do gene (por exemplo, o promotor e/ou realçadores) para formar estruturas helicoidais triplas que impedem a transcrição do gene em células alvo. Ver Helene, C., Anticancer Drug Res. 6, 569-84, 1991; Helene et ai., Ann. Ν. Y. Acad. Sei. 660, 27-36 1992; e Maher, L. J. Bioassays 14, 807-15, 1992.
Outros métodos, tais como o uso de anticorpos direcionados a um polipeptídeo endógeno para inibir a sua função ou interferência em planta no caminho da sinalização em que um polipeptídeo esteja envolvido, será bem conhecido pelo técnico habilitado. Em particular, pode ser considerado que as moléculas feitas pelo homem possam ser úteis para a inibição da função biológica de um polipeptídeo alvo ou para interferir com o caminho da sinalização em que o polipeptídeo alvo esteja envolvido.
Alternativamente, um programa de triagem pode ser ajustado para identificar em uma população de planta variantes naturais de um gene, variantes estas que codificam polipeptídeos com atividade reduzida. Tais variantes naturais também podem ser usadas por exemplo, para realizar a recombinação homóloga.
MicroRNAs (miRNAs) artificiais e/ou naturais podem ser usados para silenciar a expressão de gene e/ou tradução de mRNA. Os miRNAs endógenos são de RNAs pequenos de filamento simples tipicamente de 19 a 24 nucleotídeos de comprimento. Eles funcionam primariamente para regular a expressão de gene e/ou a tradução do mRNA. A maior parte dos microRNAs (miRNAs) vegetais tem complementaridade perfeita ou quase perfeita com as suas seqüências alvo. Entretanto, existem alvos naturais com até cinco desemparelhamentos. Estes são processados a partir de RNAs não codificadores mais longos com estruturas dobradas para trás características pelas RNases específicas de filamento duplo da família Dicer. No processamento, estes são incorporados no complexo de silenciamento induzido pelo RNA (RISC) pela ligação ao seu componente principal, uma proteína Argonaute. MiRNAs servem como os componentes de especificidade de RISC, visto que estes formam par de base com os ácidos nucleicos alvo, principalmente mRNAs, no citoplasma. Os eventos reguladores subsequentes incluem a clivagem do mRNA alvo e a destruição e/ou inibição traducional. Os efeitos da superexpressão de miRNA são assim freqüentemente refletidos nos níveis diminuídos de mRNA de genes alvos.
Os microRNAs (amiRNAs) artificiais, que têm tipicamente 21 nucleotídeos no comprimento, podem ser geneticamente engendrados especificamente para regular negativamente a expressão de gene de genes simples ou múltiplos de interesse. Os determinantes da seleção de microRNA vegetal alvo são bem conhecidos na técnica. Os parâmetros empíricos para o reconhecimento de alvo foram definidos e podem ser usados para ajudar no planejamento de amiRNAs específicos, (Schwab et ai, Dev. Cell 8, 517-527, 2005). As ferramentas convenientes para o planejamento e geração de amiRNAs e seus precursores também estão disponíveis ao público (Schwab et ai., Plant Cell 18, 1121-1133, 2006).
Para o desempenho ótimo, as técnicas de silenciamento de gene usadas para reduzir a expressão em uma planta de um gene endógeno requer o uso de seqüências de ácido nucleico de plantas monocotiledôneas para a transformação de planta monocotiledôneas e de plantas dicotiledôneas para a transformação de plantas dicotiledôneas. Preferivelmente, uma seqüência de ácido nucleico de qualquer espécie de planta dada é introduzida nesta mesma espécie. Por exemplo, uma seqüência de ácido nucleico do arroz é transformada em uma planta do arroz. Entretanto, não é uma exigência absoluta que a seqüência de ácido nucleico a ser introduzida origine-se da
r
mesma espécie de planta como a planta em que a mesma será introduzida. E suficiente que haja homologia substancial entre o gene alvo endógeno e o ácido nucleico a ser introduzido.
São descritos acima exemplos de vários métodos para a redução ou eliminação substanciais da expressão em uma planta de um gene endógeno. Uma pessoa habilitada na técnica facilmente será capaz de adaptar os métodos anteriormente mencionados para o silenciamento de modo a obter a redução da expressão de um gene endógeno em uma planta inteira ou em partes desta através do uso, por exemplo, de um promotor apropriado. Marcador selecionável (geneVGene repórter
"Marcador selecionável", "gene marcador selecionável" ou "gene repórter" incluem qualquer gene que confira um fenótipo em uma célula em que o mesmo seja expressado para facilitar a identificação e/ou seleção de células que são transfectadas ou transformadas com uma construção de ácido nucleico da invenção. Estes genes marcadores possibilitam a identificação de uma transferência bem sucedida das moléculas de ácido nucleico por intermédio de uma série de princípios diferentes, os marcadores adequados podem ser selecionados a partir de marcadores que conferem resistência a antibiótico ou herbicida, que introduzem um novo traço metabólico ou que possibilitam a seleção visual. Os exemplos de genes marcadores selecionáveis incluem genes que conferem resistência aos antibióticos (tais como nptll que fosforila neomicina e canamicina ou hpt, que fosforila a higromicina ou genes que conferem resistência, por exemplo, à bleomicina, estreptomicina, tetraciclina, cloranfenicol, ampicilina, gentamicina, geneticina (G418), espectinomicina ou blasticidina), a herbicidas (por exemplo bar que fornece resistência a Basta®; aroA ou gox que fornecem resistência contra glifosato ou os genes que conferem resistência, por exemplo, a imidazolinona, fosfinotricina ou sulfoniluréia) ou genes que fornecem um traço metabólico (tal como manA que permite que as plantas usem a manose como a única fonte de carbono ou a xilose isomerase para a utilização de xilose ou marcadores antinutritivos tais como a resistência à 2- desoxiglicose). A expressão de genes marcadores visuais resulta na formação de cor (por exemplo β-glicuronidase, GUS ou β-galactosidase com seus substratos coloridos, por exemplo X-Gal), luminescência (tal como o sistema da luciferina/luciferase) ou fluorescência (Proteína Fluorescente Verde, GFP e seus derivados). Esta lista representa apenas um número pequeno de marcadores possíveis. O trabalhador habilitado está familiarizado com tais marcadores. Marcadores diferentes são preferidos, dependendo do organismo e do método de seleção.
É conhecido que na integração estável ou transitória de ácidos nucleicos em células vegetais, apenas uma minoria das células absorvem o DNA estranho e, se desejado, o integra no seu genoma, dependendo do vetor de expressão usado e da técnica de transfecção usada. Para identificar e selecionar estes integrantes, um gene que codifica um marcador selecionável (tal como aqueles descritos acima) é usualmente introduzido nas células hospedeiras juntas com o gene de interesse. Estes marcadores por exemplo podem ser usados em mutantes em que estes genes não sejam funcionais, por exemplo, pela deleção pelos métodos convencionais. Além disso, as moléculas de ácido nucleico que codificam um marcador selecionável podem ser introduzidas em uma célula hospedeira no mesmo vetor que compreende a seqüência que codifica os polipeptídeos da invenção ou usados nos métodos da invenção ou ainda em um vetor separado. As células que foram estavelmente transfectadas com o ácido nucleico introduzido podem ser identificadas por exemplo pela seleção (por exemplo, células que integraram o marcador selecionável sobrevivem ao passo que as outras células morrem).
Visto que os genes marcadores, particularmente os genes para a resistência aos antibióticos e herbicidas, não são mais requeridos ou são indesejados na célula hospedeira transgênica uma vez que os ácidos nucleicos foram introduzidos com êxito, o processo de acordo com a invenção para introduzir os ácidos nucleicos vantajosamente utiliza técnicas que possibilitam a remoção ou excisão destes genes marcadores. Um tal método é o que é conhecido como co-transformação. O método da co-transformação utiliza dois vetores simultaneamente para a transformação, um vetor que carrega o ácido nucleico de acordo com a invenção e um segundo que carrega o(s) gene(s) marcador(es). Um grande proporção de transformantes recebe ou, no caso de plantas, compreende (até 40% ou mais dos transformantes), ambos os vetores. No caso de transformação com Agrobacteria, os transformantes usualmente recebem apenas uma parte do vetor, isto é, a seqüência flanqueada pelo T-DNA, que usualmente representa o cassete de expressão. Os genes marcadores podem ser subseqüentemente removidos da planta transformada pela realização de procriações. Em um outro método, genes marcadores integrados em um transposon são usados para a transformação junto com ácido nucleico desejado (conhecido como a tecnologia Ac/Ds). Os transformantes podem ser procriados com uma fonte de transposase ou os transformantes são transformados com uma construção de ácido nucleico que confere a expressão de uma transposase, transitória ou estavelmente. Em alguns casos (aprox. 10%), os transposon saltam do genoma da célula hospedeira uma vez que a transformação tenha ocorrido com êxito e é perdido. Em um outro número de casos, o transposon pula para uma localização diferente. Nestes casos o gene marcador deve ser eliminado realizando-se procriações. Em microbiologia, técnicas foram desenvolvidas que tornam possível ou facilitam, a detecção de tais eventos. Um outro método vantajoso conta com o que é conhecido como sistemas de recombinação; cuja vantagem é que a eliminação pela procriação pode ser dispensada. O sistema melhor conhecido deste tipo é o que é conhecido como o sistema Cre/lox. Crel é uma recombinase que remove as seqüências localizadas entre as seqüências IoxP. Se o gene marcador é integrado entre as seqüências IoxP, o mesmo é removido uma vez que a transformação tenha ocorrido com êxito, pela expressão da recombinase. Outros sistemas de recombinação são os sistemas HIN/HIX, FLP/FRT e REP/STB (Tribble et ai, J. Biol. Chem., 275, 2000: 22255-22267; Velmurugan et ai, J. Cell Biol., 149, 2000: 553-566). Uma integração específica de sítio no genoma vegetal das seqüências de ácido nucleico de acordo com a invenção é possível. Naturalmente, estes métodos também podem ser aplicados aos microorganismos tais como levedura, fungos ou bactérias. Transgênico/Transgene/Recombinante
Para os propósitos da invenção, "transgênico", "transgene" ou "recombinante" significam com respeito, por exemplo, a uma seqüência de ácido nucleico, um cassete de expressão, construção de gene ou um vetor que compreende a seqüência de ácido nucleico ou um organismo transformado com as seqüências de ácido nucleico, cassetes de expressão ou vetores de acordo com a invenção, todas aquelas construções produzidas pelos métodos recombinantes em que
(a) as seqüências de ácido nucleico que codificam proteínas úteis nos métodos da invenção, ou
(b) sequência(s) de controle genético que é/são operavelmente ligada(s) com a seqüência de ácido nucleico de acordo com a invenção, por exemplo um promotor, ou
(c) a) e b) não estão localizadas no seu ambiente genético natural ou foram modificadas pelos métodos recombinantes, sendo possível para a modificação tomar a forma, por exemplo, de uma substituição, adição, deleção, inversão ou inserção de um ou mais resíduos de nucleotídeo. O ambiente genético natural é entendido como significando o local genômico ou cromossômico naturais na planta original ou a presença em uma biblioteca genômica. no caso de uma biblioteca genômica, o ambiente genético natural da seqüência de ácido nucleico é preferivelmente retido, pelo menos em parte. O ambiente flanqueia a seqüência de ácido nucleico pelo menos em um lado e tem um comprimento de seqüência de pelo menos 50 pares de base, preferivelmente pelo menos 500 pares de base, de modo especialmente preferível pelo menos 1000 pares de base, o mais preferivelmente pelo menos 5000 pares de base. Um cassete de expressão que ocorre naturalmente - por exemplo a combinação que ocorre naturalmente do promotor natural das seqüências de ácido nucleico com a seqüência de ácido nucleico correspondente que codifica um polipeptídeo útil nos métodos da presente invenção, como definido acima — torna-se um cassete de expressão transgênico quando este cassete de expressão é modificado pelos métodos não naturais, sintéticos ("artificiais") tais como, por exemplo, tratamento mutagênico. Os métodos adequados são descritos, por exemplo, na US 5.565.350 ou WO 00/15815.
Uma planta transgênica para os propósitos da invenção é assim entendido como significando, como acima, que os ácidos nucleicos usados no método da invenção não estão no seu local natural no genoma da dita planta, sendo possível para os ácidos nucleicos a serem expressados homóloga ou heterologamente. Entretanto, como mencionado, transgênico também significa que, embora os ácidos nucleicos de acordo com a invenção ou usados no método inventivo estejam na sua posição natural no genoma de uma planta, a seqüência foi modificada com respeito à seqüência natural, e/ou que as seqüências reguladoras das seqüências naturais foram modificadas. Transgênico é preferivelmente entendido como significando a expressão dos ácidos nucleicos de acordo com a invenção em um local não natural no genoma, isto é, a expressão homóloga ou, preferivelmente, heteróloga dos ácidos nucleicos ocorre. As planta transgênicas preferidas são aqui mencionadas. Transformação
Os termos "introdução" ou "transformação" como aqui aludidos abrangem a transferência de um polinucleotídeo exógeno em uma célula hospedeira, independente do método usado para a transferência. O tecido vegetal capaz da propagação clonal subsequente, seja pela organogênese ou embriogênese, pode ser transformado com uma construção genética da presente invenção e uma planta inteira regenerada a partir desta. O tecido particular escolhido variará dependendo dos sistemas de propagação clonal disponíveis e melhor adaptados para a espécie particular que é transformada. Os tecidos alvos exemplares incluem discos de folha, pólen, embrião, cotilédones, hipocotilédones, megagametófitos, tecido de calo, tecido meristemático existente (por exemplo, meristema apical, brotos axilares e meristemas de raiz) e tecido de meristema induzido (por exemplo, meristema de cotilédone e meristema de hipocotilédone). O polinucleotídeo pode ser transitória ou estavelmente introduzida em uma célula hospedeira e pode ser mantida não integrada, por exemplo, como um plasmídeo. Alternativamente, pode ser integrado no genoma hospedeiro. A célula vegetal transformada resultante pode ser depois usada para regenerar uma planta transformada em uma maneira conhecida pelas pessoas habilitadas na técnica.
A transferência de genes estranhos no genoma de uma planta é chamada de transformação. A transformação de espécies de planta é agora um técnica razoavelmente de rotina. Vantajosamente, qualquer um de diversos métodos de transformação podem ser usados para introduzir o gene de interesse em uma célula ancestral adequada. Os métodos descritos para a transformação e regeneração de plantas a partir de tecidos vegetais ou células vegetais podem ser utilizados para a transformação transitória ou para a estável. Os métodos de transformação incluem o uso de lipossomas, eletroporação, produtos químicos que aumentam a captação de DNA livre, injeção do DNA diretamente na planta, bombardeamento com pistola de partícula, transformação usando vírus ou pólen e microprojeção. Os métodos podem ser selecionados do método do cálcio/polietileno glicol para protoplastos (Krens, F. A. et al., (1982) Nature 296, 7274; Negrutiu I et al. (1987) Plant Mol Biol 8: 363-373); eletroporação de protoplastos (Shillito R. D. et ai. (1985) Bio/Technol 3, 1099-1102); microinjeção em material vegetal (Crossway A et al., (1986) Mol. Gen Genet 202: 179-185); bombardeamento de partícula revestida com DNA ou RNA (Klein TM et al., (1987) Nature 327: 70) infecção com vírus (não integrativa) e outros. Plantas transgênicas, incluindo plantas de safra transgênicas, são preferivelmente produzidas por intermédio da transformação mediada por Agrobacterium. Um método de transformação vantajoso é a transformação em planta. Para esta finalidade, é possível, por exemplo, permitir que as agrobactérias atuem sobre as sementes da planta ou inocular o meristema da planta com agrobactéria. Tem se mostrado particularmente conveniente de acordo com a invenção possibilitar que uma suspensão de agrobactérias transformadas atuem na planta intacta ou pelo menos na flor primordial. A planta é subseqüentemente cultivada até que as sementes da planta tratada sejam obtidas (Clough e Bent, Plant J. (1998) 16, 735-743). Métodos para a transformação mediada por Agrobacterium de arroz incluem métodos bem conhecidos para a transformação de arroz, tais como aquelas descritas em qualquer um dos seguintes: Pedido de patente européia EP 1198985 Al, Aldemita e Hodges (Plant 199: 612-617, 1996); Chan et al. (Plant Mol Biol 22 (3): 491-506, 1993), Hiei et al. (Plant J 6 (2): 271-282, 1994), divulgações estas que são incorporadas aqui por referência como se completamente apresentada. No caso de transformação de milho, o método preferido é como descrito em Ishida et al. (Nat. Biotechnol 14(6): 745-50, 1996) ou Frame et ai. (Plant Physiol 129(1): 13-22, 2002), divulgações estas que são aqui incorporados por referência como se completamente apresentados. Os ditos métodos são descritos ainda por via de exemplo em B. Jenes et al., Techniques for Gene Transfer, em: Transgenic Plants, Vol. 1, Engineering and Utilization, eds. S.D. Kung e R. Wu, Academic Press (1993) 128-143 e em Potrykus Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 (1991) 205-225). Os ácidos nucleicos ou a construção a ser expressada é preferivelmente clonada em um vetor, que é adequado para transformar Agrobacterium tumefaciens, por exemplo pBinl9 (Bevan et al., Nucl. Acids Res. 12 (1984) 8711). Agrobactérias transformadas por um tal vetor pode ser depois usada na maneira conhecida para a transformação de plantas, tais como plantas usadas como um modelo, como Arabidopsis (Arabidopsis thaliana está dentro do escopo da presente invenção não considerada como uma planta de cultivo) ou plantas de safra tais como, por via de exemplo, plantas de tabaco, por exemplo pela imersão de folhas esmagadas ou folhas picadas em uma solução agrobacteriana e depois cultivando-as em meio adequado. A transformação de plantas por meio de Agrobacterium tumefaciens é descrita, por exemplo, por Hõfgen e Willmitzer em Nucl. Acid Res. (1988) 16, 9877 ou é conhecido inter alia de F. F. White, Vectors for Gene Transfer in Higher Plants; em Transgenic Plant, Vol. 1, Engineering and Utilization, eds. S. D. Kung e R. Wu, Academic Press, 1993, pp. 15-38.
Além da transformação de células somáticas, que depois têm que ser regeneradas em plantas intactas, também é possível transformar as células de meristemas vegetais e em particular aquelas células que desenvolvem em gametas. Neste caso, os gametas transformados seguem o desenvolvimento da planta natural, dando origem às plantas transgênicas. Assim, por exemplo, sementes de Arabidopsis são tratadas com agrobactérias e sementes são obtidas das plantas em desenvolvimento das quais uma certa proporção é transformada e assim transgênica [Feldman, KA e Marks MD (1987). Mol Gen Genet 208: 274-289; Feldmann K (1992). Em: C Koncz, N- H Chua e J Shell, eds, Methods in Arabidopsis Research. Word Scientific, Singapura, pp. 274-289]. Os métodos alternativos são fundamentados na remoção repetida das inflorescências e incubação do sítio de excisão no centro da roseta com agrobactérias transformadas, as sementes transformadas deste modo podem ser igualmente obtidas em um ponto mais tarde no tempo (Chang (1994). Plant J. 5: 551-558; Katavic (1994). Mol Gen Genet, 245: 363-370). Entretanto, um método especialmente eficaz é o método da infiltração a vácuo com as suas modificações tais como o método da "imersão floral". No caso de infiltração a vácuo de Arabidopsis, plantas intactas sob pressão reduzida são tratadas com uma suspensão agrobacteriana [Bechthold, N (1993). C R Acad Sci Paris Life Sei, 316: 1194-1199], enquanto que no caso do método de "imersão floral" o tecido floral em desenvolvimento é incubado ligeiramente com uma suspensão agrobacteriana tratada com tensoativo [Clough, SJ e Bent AF (1998) The Plant J. 16, 735-743], uma certa proporção de sementes transgênicas são colhidas em ambos os casos e estas sementes podem ser distinguidas de sementes não transgênicas cultivando-se sob as condições seletivas descritas acima. Além disso a transformação estável de plastídeos é de vantagem porque os plastídeos são herdados maternalmente na maioria das safras reduzindo ou eliminando o risco de fluxo de transgene através do pólen. A transformação do genoma de cloroplasto é no geral obtida por um processo que foi esquematicamente demonstrado em Klaus et al., 2004 [Nature Biotechnology 22 (2), 225-229]. Em resumo as seqüências a serem transformadas são clonadas junto com um gene marcador selecionável entre seqüências flanqueadoras homólogas ao genoma do cloroplasto. Estas seqüências flanqueadoras homólogas direcionam a integração específica de sítio no plastoma. A transformação plastídica foi descrita para muitas espécies de planta diferentes e uma vista geral é dada em Bock (2001) Transgenic plastides in basic research and plant biotechnology. J Mol Biol. 21 de setembro de 2001; 312 (3): 425-38 ou Maliga, P (2003) Progress towards commercialization of plastide transformation technology. Trends Biotechnol. 21, 20-28. Outro progresso biotecnológico foi recentemente relatado na forma de transformantes de plastídeo isentos de marcador, que podem ser produzidos por um gene marcador co-integrado transitório (Klaus et al., 2004, Nature Biotechnology 22(2), 225-229). Rotulação pela ativação de T-DNA
A rotulação pela ativação de T-DNA (Hayashi et al. Science (1992) 1350-1353), envolve a inserção de T-DNA, usualmente contendo um promotor (também pode ser um realçador de tradução ou um intron), na região genômica do gene de interesse ou 10 kb a montante ou a jusante da região codificadora de um gene em um configuração tal que o promotor direcione a expressão do gene alvejado. Tipicamente, a regulagem da expressão do gene alvejado pelo seu promotor natural é rompido e o gene cai sob o controle do promotor recém introduzido. O promotor é tipicamente embutido em um T-DNA. Este T-DNA é aleatoriamente inserido no genoma vegetal, por exemplo, através da infecção por Agrobacterium e leva à expressão modificada de genes próximo ao T-DNA inserido. As plantas transgênicas resultantes mostram fenótipos dominantes devido à expressão modificada de genes próximo ao promotor introduzido. TILLING
O termo "TILLING" é uma abreviação de "Lesões Locais Induzidas Alvejadas Em Genomas" e refere-se a uma tecnologia de mutagênese útil para gerar e/ou identificar ácidos nucleicos que codificam proteínas com expressão e/ou atividade modificadas. TILLING também permite a seleção de plantas que carregam tais variantes mutantes. Estas variantes mutantes podem exibir expressão modificada, em força ou em localização ou na regulagem de tempo (se as mutações afetam o promotor por exemplo), estas variantes mutantes podem exibir atividade mais alta do que aquela exibida pelo gene na sua forma natural. TILLING combina mutagênese de alta densidade com métodos de triagem de alto rendimento. As etapas tipicamente seguidas em TILLING são: (a) mutagênese EMS (Redei GP e Koncz C (1992) Em Methods in Arabidopsis Research, Koncz C, Chua NH, Schell J, eds. Singapura, World Scientific Publishing Co, pp. 16-82; Feldmann et al., (1994) Em Meyerowitz EM, Somerville CR, eds, Arabidopsis. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, pp 137-172; Luzner J e Caspar T (1998) Em J Martinez-Zapater, J Salinas, eds, Methods on Biology Molecular, Vol. 82. Humana Press, Totowa, NJ, pp 91-104); (b) preparação e reunião de DNA de indivíduos; (c) amplificação pela PCR de uma região de interesse; (d) desnaturação e recozimento para possibilitar a formação de heteroduplexes; (e) DHPLC, onde a presença de um heteroduplex em uma reunião é detectada como um pico extra no cromatograma; (f) identificação do indivíduo mutante; e (g) sequenciamento do produto de PCR mutante. Os métodos para TILLING são bem conhecidos na técnica (McCallum et al., (2000) Nat Biotechnol 18: 455-457; revisado por Stemple (2004) Nat Rev Genet 5(2): 145-50). Recombinação homóloga
A recombinação homóloga permite a introdução em um genoma de um ácido nucleico selecionado em uma posição selecionada definida. A recombinação homóloga é uma tecnologia padrão usada rotineiramente nas ciências biológicas para organismos inferiores tais como levedura ou o musgo Physcomitrella. Métodos para realizar a recombinação homóloga em plantas foram descritos não apenas para as plantas modelo (Offringa et al. (1990) EMBO J 9(10): 3077-84) mas também para plantas de safra, por exemplo arroz (Terada et al. (2002) Nat Biotech 20(10): 1030-4; lida e Terada (2004) Curr Opin Biotech 15(2): 132-8). Rendimento
O termo "rendimento" no geral significa um produto mensurável de valor econômico, tipicamente relacionado com uma safra especificada, a uma área e a um período de tempo. Partes de planta individuais que diretamente contribuem com o rendimento com base no seu número, tamanho e/ou peso ou o rendimento real é o rendimento por metro quadrado para uma safra e ano, que é determinado dividindo-se a produção total (inclui tanto a produção colhida quanto a estimada) por metro quadrado plantado. O termo "rendimento" de uma planta pode dizer respeito à biomassa vegetativa (raiz e/ou biomassa de broto), aos órgãos reprodutivos e/ou aos propágulos (tais como sementes) desta planta. Vigor inicial
"Vigor inicial" refere-se ao crescimento bem equilibrado saudável ativo especialmente durante os estágios iniciais de crescimento da planta e pode resultar da aptidão da planta aumentada devido, por exemplo, às plantas serem melhor adaptadas ao seu ambiente (isto é, a optimização do uso do recurso de energia e divisão entre broto e raiz). As plantas tendo vigor inicial também mostram sobrevivência de muda aumentado e um melhor estabelecimento da safra, que freqüentemente resulta em campos altamente uniformes (com a safra crescendo de maneira uniforme, isto é, com a maioria das plantas atingindo os vários estágios de desenvolvimento substancialmente ao mesmo tempo) e freqüentemente rendimento melhor e mais alto. Portanto, o vigor inicial pode ser determinado medindo-se vários fatores, tais como peso de mil grãos, germinação porcentual, emergência porcentual, crescimento de muda, altura da muda, comprimento da raiz, biomassa de raiz e broto e muitos mais. Aumento/Melhora/Realce
Os termos "aumento", "melhora" ou "realce" são intercambiáveis e devem significar no sentido do pedido pelo menos um rendimento e/ou crescimento de 3%, 4%, 5%, 6%, 7%, 8%, 9% ou 10%, preferivelmente pelo menos 15% ou 20%, mais preferivelmente 25%, 30%, 35% ou 40% mais em comparação com as plantas de controle como aqui definido.
Rendimento de semente
Rendimento de semente aumentado pode manifestar-se por si só como um ou mais dos seguintes: a) um aumento na biomassa de semente (peso de semente total) que pode estar em uma base de semente individual e/ou por planta e/ou por metro quadrado; b) número de flores aumentado por planta; c) número aumentado de sementes (cheias); d) taxa de enchimento de semente aumentada (que é expressado como a razão entre o número de sementes cheias dividido pelo número total de sementes); e) índice de colheita aumentado, que é expressado como uma razão do rendimento de partes colhíveis, tais como sementes, dividido pela biomassa total; e f) peso de mil grãos aumentado (TKW), que é extrapolado do número de sementes cheias contado e seu peso total. Um TKW aumentado pode resultar de um tamanho de semente e/ou peso de semente aumentados e também pode resultar de um aumento no tamanho do embrião e/ou endosperma.
Um aumento no rendimento de semente também pode ser manifestado como um aumento no tamanho da semente e/ou volume da semente. Além disso, um aumento no rendimento de semente também pode manifestar-se por si só como um aumento na área da semente e/ou comprimento da semente e/ou largura da semente e/ou perímetro da semente. Rendimento aumentado também pode resultar na arquitetura modificada ou pode ocorrer por causa da arquitetura modificada. índice de Verdor
O "índice de verdor" como aqui usado é calculado a partir de imagens digitais de plantas. Para cada pixel pertencente à planta objeto na imagem, a razão do valor verde versus o valor vermelho (no modelo RGB para a cor codificadora) é calculado. O índice de verdor é expressado como a porcentagem de pixéis para a qual a razão de verde para vermelho excede um limiar dado. Sob condições de crescimento normal, sob condições de crescimento em estresse salino e sob condições de crescimento na disponibilidade de nutriente reduzida, o índice de verdor de plantas é medido na última formação de imagem antes do florescimento. Ao contrário, sob condições de crescimento em estresse pela seca, o índice de verdor de plantas é medido na primeira formação de imagem depois da seca. Planta
O termo "planta" como aqui usado abrange plantas inteiras,
ancestrais e progênie das plantas e partes de planta, incluindo sementes, brotos, hastes, folhas, raízes (incluindo tubérculos), flores e tecidos e órgãos, em que cada um dos anteriormente mencionados compreendem o gene/ácido nucleico de interesse. O termo "planta" também abrange células vegetais, culturas em suspensão, tecido de calo, embriões, regiões meristemáticas, gametófítos, esporófitos, pólen e microesporos, mais uma vez em que cada um dos anteriormente mencionados compreendem o gene/ácido nucleico de interesse.
As plantas que são particularmente úteis nos métodos da invenção incluem todas as plantas que pertencem à superfamília Viridiplantae, em particular plantas monocotiledôneas e dicotiledôneas incluindo forragem ou legumes forrageiros, plantas ornamentais, safras alimentícias, árvores ou arbustos selecionados da lista que compreende Acer spp., Actinidia spp., Abelmoschus spp., Agave sisalana, Agropiron spp., Agrostis stolonifera, Allium spp., Amaranthus spp., Ammophila arenaria, Ananas comosus, Annona spp., Apium graveolens, Araehis spp, Artoearpus spp., Asparagus officinalis, Avena spp. (por exemplo, Avena sativa, Avena fatua, Avena byzantina, Avena fatua var. sativa, Avena hybrida), Averrhoa carambola, Bambusa sp., Benincasa hispida, Bertholletia exeelsea, Beta vulgaris, Brassica spp. (por exemplo, Brassica napus, Brassica rapa ssp. [canola, colza, nabo]), Cadaba farinosa, Camellia sinensis, Canna indica, Cannabis sativa, Encapuzamentosicum spp., Carex elata, Cariea papaya, Carissa maeroearpa, Carya spp., Carthamus tinetorius, Castanea spp., Ceiba pentandra, Ciehorium endivia, Cinnamomum spp., Citrullus lanatus, Citrus spp., Cocos spp., Coffea spp., Colocasia eseulenta, Cola spp., Corchorus sp., Coriandrum sativum, Corilus spp., Crataegus spp., Crocus sativus, Cueurbita spp., Cucumis spp., Cynara spp., Daucus carota, Desmodium spp., Dimocarpus longan, Dioscorea spp., Diospiros spp., Echinochloa spp., Elaeis (por exemplo, Elaeis guineensis, Elaeis oleifera), Eleusine coracana, Erianthus sp., Eriobotrya japonica, Eucalyptus sp., Eugenia uniflora, Fagopirum spp., Fagus spp., Festuca arundinacea, Ficus carica, FortuneIla spp., Fragaria spp., Ginkgo biloba, Glicina spp. (por exemplo, Glieina max, Soja hispida ou Soja max), Gossypium hirsutum, Helianthus spp. (por exemplo, Helianthus annuus), Hemerocallis fulva, Hibiscus spp., Hordeum spp. (por exemplo, Hordeum vulgare), Ipomoea batatas, Juglans spp., Lactuca sativa, Lathyrus spp., Lens eulinaris, Linum usitatissimum, Litchi chinensis, Lotus spp., Luffa acutangula, Lupinus spp., Luzula silvatica, Lycopersicon spp. (por exemplo, Lycopersicon esculentum, Lycopersicon lycopersicum, Lycopersicon piriformé), Macrotiloma spp., Malus spp., Malpighia emarginata, Mammea americana, Mangifera indica, Manihot spp., Manilkara zapota, Medicago sativa, Melilotus spp., Mentha spp., Miscanthus sinensis, Momordica spp., Morus nigra, Musa spp., Nicotiana spp., Olea spp., Opuntia spp., Ornithopus spp., Oryza spp. (por exemplo, Oryza sativa, Oryza latifolià), Panicum miliaceum, Panicum virgatum, Passiflora edulis, Pastinaca sativa, Pennisetum sp., Persea spp., Petroselinum crispum, Phalaris arundinacea, Faseolus spp., Phleum pratense, Phoenix spp., Phragmites australis, Physalis spp., Pinus spp., Pistacia vera, Pisum spp., Poa spp., Populus spp., Prosopis spp., Prunus spp., Psidium spp., Punica granatum, Pirus communis, Quercus spp., Raphanus sativus, Rheum rhabarbarum, Ribes spp., Ricinus communis, Rubus spp., Saeeharum spp., Salix sp., Sambueus spp., Seeale eereale, Sesamum spp., Sinapis sp., Solanum spp. (por exemplo, Solanum tuberosum, Solanum integrifolium ou Solanum lyeopersicum), Sorgo bieolor, Spinaeia spp., Syzygium spp., Tagetes spp., Tamarindus indica, Theobroma cacao, Trifolium spp., Triticosecale rimpaui, Triticum spp. (por exemplo, Triticum aestivum, Tritieum durum, Tritieum turgidum, Tritieum hybernum, Tritieum maeha, Tritieum sativum ou Tritieum vulgare), Tropaeolum minus, Tropaeolum majus, Vaeeinium spp., Vicia spp., Vigna spp., Viola odorata, Vitis spp., Zea mays, Zizania palustris, Ziziphus spp., entre outras. Descrição Detalhada da Invenção
Descrição Detalhada para a Anquirina — Polipeptídeo de dedo de zinco
Surpreendentemente, foi agora verificado que modular a expressão em uma planta de um ácido nucleico que codifica o polipeptídeo AZ de Arabidopsis (AtAZ) ou um homólogo deste dá plantas tendo rendimento aumentado em relação às plantas de controle. De acordo com uma forma de realização da presente invenção, é fornecido um método para aumentar o rendimento da planta, que compreende modular a expressão em uma planta de um ácido nucleico que codifica o polipeptídeo AZ ou um homólogo deste. Vantajosamente, o desempenho dos métodos de acordo com a presente invenção resulta em plantas tendo rendimento aumentado, particularmente rendimento de semente, em relação às plantas do tipo selvagem correspondentes.
Uma "referência", "planta de referência", "controle", "planta de controle", "tipo selvagem" ou "planta tipo selvagem" são em particular uma célula, um tecido, um órgão, uma planta ou um parte desta, que não foram produzidos de acordo com o método da invenção. Consequentemente, os termos "tipo selvagem", "controle" ou "referência" são permutável e podem ser uma célula ou uma parte da planta tal como uma organela ou tecido ou uma planta, que não foram modificados ou tratados de acordo com o método aqui descrito de acordo com a invenção. Consequentemente, a célula ou uma parte da planta tal como uma organela ou uma planta usada como tipo selvagem, controle ou referência correspondem à célula, planta ou parte desta tanto quanto possível e não obstante está em qualquer outra propriedade no resultado do processo da invenção tão idêntico à matéria objeto da invenção quanto possível. Assim, o tipo selvagem, controle ou referência são tratados de maneira idêntica ou tão idêntica quanto possível, dizendo que apenas as condições ou propriedades seriam diferentes que não influenciariam a qualidade da propriedade testada. Isto significa em outras palavras que o tipo selvagem denota (1) uma planta, que carrega a forma inalterada ou não modulada de um gene ou alelo ou (2) o material de partida/planta a partir dos quais as plantas produzidas pelo processo ou método da invenção são derivadas.
Preferivelmente, qualquer comparação entre as plantas do tipo selvagem e as plantas produzidas pelo método da invenção são realizadas sob condições análogas. O termo "condições análogas" significa que todas as condições tais como, por exemplo, condições de cultura ou crescimento, condições de ensaio (tais como composição de tampão, temperatura, substratos, cepa de patógeno, concentrações e outros) são mantidas idênticas entre os experimentos a serem comparados.
A "referência", "controle" ou "tipo selvagem" são preferivelmente um objeto, por exemplo, uma organela, uma célula, um tecido, uma planta, que não foram modulados, modificados ou tratados de acordo com o processo da invenção aqui descrito e é em qualquer outra propriedade tão similar à matéria objeto da invenção quanto possível. A referência, controle ou tipo selvagem está no seu genoma, transcritoma, proteoma ou metaboloma tão similar quanto possível ao objeto da presente invenção. Preferivelmente, os termos organela, célula, tecido ou planta de "referência" "controle" ou "tipo selvagem", dizem respeito a uma organela, célula, tecido ou planta, que são quase geneticamente idênticos à organela, célula, tecido ou planta, da presente invenção ou uma parte desta preferivelmente 95%, mais preferido são 98%, ainda mais preferido são 99,00%, em particular 99,10%, 99,30%, 99,50%, 99,70%, 99,90%, 99,99%, 99,999% ou mais. O mais preferivelmente a "referência", "controle" ou "tipo selvagem" são um objeto, por exemplo, uma organela, uma célula, um tecido, uma planta, que é geneticamente idêntica à planta, célula organela usada de acordo com o método da invenção exceto que as moléculas de ácido nucleico ou o produto de gene codificado por elas são trocadas, moduladas ou modificadas de acordo com o método inventivo.
Os termos "expressão" ou "expressão de gene" são como aqui definidos, preferivelmente os mesmos resultam no aparecimento de um traço fenotípico como uma conseqüência da transcrição de um gene específico ou genes específicos.
O aumento que se refere à atividade do polipeptídeo eqüivale em uma célula, um tecido, uma organela, um órgão ou um organismo ou uma parte desta preferivelmente a pelo menos 5%, preferivelmente a pelo menos 10% ou pelo menos 15%, de modo especialmente preferível a pelo menos 20%, 25%, 30% ou mais, de modo muito especialmente preferível é de pelo menos 40%, 50% ou 60%, o mais preferivelmente é de pelo menos 70% ou mais em comparação com o controle, referência ou tipo selvagem.
O termo "rendimento aumentado" como aqui definido é considerado significar um aumento na biomassa (peso) de uma ou mais partes de uma planta, que podem incluir partes acima do solo (colhíveis) e/ou partes abaixo do solo (colhíveis). Em uma forma de realização preferida, o rendimento aumentado é o rendimento de semente aumentado.
Portanto, tais partes colhíveis são preferivelmente sementes e o desempenho dos métodos da invenção resulta em plantas tendo rendimento de semente aumentado em relação ao rendimento de semente de plantas de controle.
Um aumento no rendimento de semente também pode ser manifestado como um aumento no tamanho da semente e/ou volume da semente, que também podem influenciar a composição de sementes (incluindo teor e composição de óleo, proteína e carboidrato total).
Tomando-se o milho como um exemplo, um aumento de rendimento pode ser manifestado como um ou mais dos seguintes: aumento no número de plantas por metro quadrado, um aumento no número de espigas por planta, um aumento no número de carreiras, número de grãos por carreira, peso do grão, peso de mil grãos, comprimento/diâmetro da espiga, aumento na taxa de enchimento da semente (que é o número de sementes cheias dividido pelo número total de sementes e multiplicado por 100), entre outras. Tomando-se arroz como um exemplo, um aumento de rendimento pode ser manifestado por um aumento em um ou mais dos seguintes: número de plantas por metro quadrado, número de panículas por planta, número de espiguetas por panícula, número de flores (flósculos) por panícula (que é expressado como uma razão do número de sementes cheias em relação ao número de panículas primárias), aumento na taxa de enchimento da semente, (que é o número de sementes cheias dividido pelo número total de sementes e multiplicado por 100), aumento no peso de mil grãos, entre outras. Um aumento no rendimento também pode resultar em arquitetura modificada ou pode ocorrer como um resultado da arquitetura modificada. De acordo com uma característica preferida, o desempenho
dos métodos da invenção resulta em plantas tendo rendimento aumentado, particularmente rendimento de semente. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar o rendimento da planta, método este que compreende modular a expressão em uma planta de um ácido nucleico que codifica o polipeptídeo AZ ou um homólogo deste.
Visto que as plantas transgênicas de acordo com a presente invenção têm rendimento aumentado, é provável que estas plantas exibam uma taxa de crescimento aumentada (durante pelo menos parte do seu ciclo de vida), em relação à taxa de crescimento de plantas de controle em um estágio correspondente em seu ciclo de vida. A taxa de crescimento aumentada pode ser específica a uma ou mais partes de uma planta (incluindo sementes) ou pode ser substancialmente por toda a parte da planta inteira. As plantas tendo uma taxa de crescimento aumentada pode ter um ciclo de vida mais curto. O ciclo de vida de uma planta pode ser considerado significar o tempo necessário para crescer de uma semente madura seca até o estágio onde a planta produziu sementes maduras secas, similares ao material de partida. Este ciclo de vida pode ser influenciado por fatores tais como vigor inicial, taxa de crescimento, índice de verdor, tempo de florescimento e velocidade de maturação de semente. O aumento na taxa de crescimento pode ocorrer em um ou mais estágios no ciclo de vida de uma planta ou durante substancialmente o ciclo de vida inteiro da planta. A taxa de crescimento aumentada durante os estágios iniciais no ciclo de vida de uma planta pode refletir no vigor realçado. O aumento na taxa de crescimento pode alterar o ciclo de colheita de uma planta possibilitando que as plantas sejam semeadas mais tarde e/ou colhidas mais cedo do que de outro modo seria possível (um efeito similar pode ser obtido com tempo de florescimento mais cedo). Se a taxa de crescimento é suficientemente aumentada, a mesma pode possibilitar outra semeadura de sementes da mesma espécie de planta (por exemplo semeadura e colheita de plantas de arroz seguidas pela semeadura e colheita de outras plantas de arroz todas dentro de um período de crescimento convencional). Similarmente, se a taxa de crescimento é suficientemente aumentada, a mesma pode possibilitar a semeadura adicional de sementes de espécies de plantas diferentes (por exemplo o plantio e colheita de plantas de milho seguido, por exemplo, pelo plantio e colheita opcional de feijão de soja, batata ou qualquer outra planta adequada). Os tempos adicionais de colheita do mesmo rizoma no caso de algumas plantas de safra também podem ser possíveis. Alterando o ciclo de colheita de uma planta pode levar a um aumento na produção de biomassa anual por metro quadrado (devido a um aumento no número de vezes (digamos em um ano) que qualquer planta particular pode ser cultivada e colhida). Um aumento na taxa de crescimento também pode possibilitar o cultivo de plantas transgênicas em uma área geográfica mais ampla do que suas contrapartes do tipo selvagem, visto que as limitações territorial para o cultivo de uma safra são freqüentemente determinadas pelas condições ambientais adversas no tempo de plantio (estação inicial) ou no tempo de colheita (estação tardia). Tais condições adversas podem ser evitadas se o ciclo de colheita é encurtado. A taxa de crescimento pode ser determinada pela derivatização de vários parâmetros a partir de curvas de crescimento, tais parâmetros podem ser: T-Mid (o tempo levado pelas plantas para atingir 50% do seu tamanho máximo) e T-90 (tempo levado pelas plantas para atingir 90% do seu tamanho máximo), entre outras.
De acordo com uma característica preferida da presente invenção, o desempenho dos métodos da invenção dá plantas tendo uma taxa de crescimento aumentada ou rendimento aumentado em comparação com plantas de controle. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar o rendimento e/ou taxa de crescimento em plantas, método este que compreende modular a expressão em uma planta de um ácido nucleico que codifica o polipeptídeo AZ ou um homólogo deste. Um aumento no rendimento e/ou taxa de crescimento ocorre se
a planta estiver sob condições não estressantes ou se a planta for exposta a vários estresses comparado com as plantas de controle. As plantas tipicamente respondem à exposição ao estresse pelo crescimento de modo mais lento. Em condições de estresse severo, a planta pode mesmo interromper o seu crescimento completamente. O estresse brando por outro lado é aqui definido como sendo qualquer estresse ao qual uma planta é exposta que não resulta na planta cessando de crescer completamente sem a capacidade para retomar o crescimento. O estresse brando no sentido da invenção leva a uma redução no crescimento das plantas estressadas de menos do que 40%, 35% ou 30%, preferivelmente menor do que 25%, 20% ou 15%, mais preferivelmente menor do que 14%, 13%, 12%, 11% ou 10% ou menos em comparação com a planta de controle sob condições não estressantes. Devido aos avanços nas práticas agrícolas (irrigação, fertilização, tratamentos com pesticida) os estresses severos não são freqüentemente encontrados em plantas de safra cultivadas. Como uma conseqüência, o crescimento comprometido induzido pelo estresse brando é freqüentemente uma característica indesejável para a agricultura. Os estresses brandos são os estresses biótico e/ou abiótico (ambiental) de todos os dias aos quais uma planta é exposta. Os estresses abióticos podem ser devido à seca ou água em excesso, estresse anaeróbico, estresse salino, toxicidade química, estresse oxidativo e temperaturas quentes, frias ou congelantes. O estresse abiótico pode ser um estresse osmótico causado por um estresse de água (particularmente devido à seca), estresse salino, estresse oxidativo ou um estresse iônico. Os estresses bióticos são tipicamente aqueles estresses causados pelos patógenos, tais como bactérias, vírus, fungos e insetos.
Em particular, os métodos da presente invenção podem ser realizados sob condições não estressantes ou sob condições de seca branda para dar plantas tendo rendimento aumentado em relação às plantas de controle. Como relatado em Wang et ai. (Plant (2003) 218: 1-14), o estresse abiótico leva a um série de mudanças morfológicas, fisiológicas, bioquímicas e moleculares que afetam adversamente o crescimento e produtividade da planta. Seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidos como estando interconectadas e podem induzir o crescimento e o dano celular através de mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133: 1755-1767) descreve um grau particularmente alto de "conversa cruzada" entre o estresse pela seca e o estresse de salinidade alta. Por exemplo, seca e/ou salinização são manifestadas primariamente como estresse osmótico, resultando no rompimento da homeostase e distribuição de íon na célula. O estresse oxidativo, que freqüentemente acompanha temperatura alta ou baixa, salinidade ou estresse pela seca, podem causar a desnaturação de proteínas funcionais e estruturais. Como uma conseqüência, estes diversos estresses ambientais freqüentemente ativam caminhos de sinalização de célula similares e respostas celulares, tais como a produção de proteínas de estresse, supra-regulagem de anti-oxidantes, acúmulo de solutos compatíveis e parada de crescimento. O termo condições "não estressantes" como aqui usado são aquelas condições ambientais que não impõem estresse, tais como os estresses descritos acima, em plantas. As condições não estressantes possibilitam crescimento ótimo de plantas. As pessoas habilitadas na técnica estão cientes das condições de solo e condições climáticas normais para uma dada localização.
O desempenho dos métodos da invenção dá em plantas cultivadas sob condições não estressantes ou sob condições de seca branda rendimento aumentado em relação às plantas de controle cultivadas sob condições comparáveis. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar o rendimento em plantas cultivadas sob condições não estressantes ou sob condições de seca branda, método este que compreende aumentar a expressão em uma planta de um ácido nucleico que codifica um polipeptídeo de AZ.
Em uma forma de realização preferida da invenção, o aumento no rendimento e/ou taxa de crescimento ocorre de acordo com os métodos da presente invenção sob condições não estressantes.
O desempenho dos métodos da invenção dá plantas cultivadas sob condições de deficiência de nutriente, particularmente sob condições de deficiência de nitrogênio, rendimento aumentado em relação às plantas de controle cultivadas sob condições comparáveis. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar o rendimento em plantas cultivadas sob condições de deficiência de nutriente, método este que compreende aumentar a expressão em uma planta de um ácido nucleico que codifica um polipeptídeo de AZ. A deficiência de nutriente pode resultar de uma falta de nutrientes tais como nitrogênio, fosfatos e outros compostos contendo fósforo, potássio, cálcio, cádmio, magnésio, manganês, ferro e boro, entre outros.
Os métodos da invenção são vantajosamente aplicáveis a qualquer planta. As características de crescimento supracitadas podem ser vantajosamente modificadas em qualquer planta. As plantas que são particularmente úteis nos métodos da invenção incluem todas as plantas que pertencem à superfamília Viridiplantae, em particular plantas monocotiledôneas e dicotiledôneas incluindo forragem ou legumes forrageiros, plantas ornamentais, safras alimentícias, árvores ou arbustos. De acordo com uma forma de realização preferida da presente invenção, a planta é uma planta de cultivo. Os exemplos de plantas de safra incluem soja, girassol, canola, alfafa, colza, algodão, tomate, batata e tabaco. Mais preferivelmente, a planta é uma planta monocotiledônea. Os exemplos de plantas monocotiledôneas incluem cana de açúcar. Mais preferivelmente a planta é um cereal. Os exemplos de cereais incluem arroz, milho, trigo, cevada, painço, centeio, triticale, sorgo e aveia. Outras plantas vantajosas são selecionadas do grupo que
consiste de Asteraceae tais como os gêneros Helianthus, Tagetes por exemplo, as espécies Helianthus annuus [girassol], Tagetes lúcida, Tagetes erecta ou Tagetes tenuifolia [cravo-de-defunto]; Brassicaceae tais como o gênero Brassiea, por exemplo, as espécies Brassica napus, Brassica rapa ssp. [canola, colza, nabo]; Fabaceae tais como os gêneros Glicina por exemplo, as espécies Glieina max, Soja hispida ou Soja max [soja]; Linaeeae tais como os gêneros Linum por exemplo, as espécies Linum usitatissimum, [linho, linhaça]; Poaeeae tal como os gêneros Hordeum, Seeale, Avena, Sorgo, Oryza, Zea, Tritieum por exemplo, as espécies Hordeum vulgare [cevada], Seeale eereale [centeio], Avena sativa, Avena fatua, Avena byzantina, Avena fatua var. sativa, Avena hybrida [aveia], Sorgo bieolor [sorgo, painço], Oryza sativa, Oryza latifolia [arroz], Zea mays [milho, milho] Tritieum aestivum, Tritieum durum, Tritieum turgidum, Tritieum hybernum, Tritieum maeha, Tritieum sativum ou Tritieum vulgare [trigo, trigo de pão, trigo comum]; Solanaeeae tais como os gêneros Solanum, Lyeopersieon por exemplo, as espécies Solanum tuberosum [batata], Lyeopersieon eseulentum, Lyeopersieon lyeopersieum, Lyeopersieon piriforme, Solanum integrifolium ou Solanum lyeopersieum [tomate]. O termo "polipeptídeo de AtAZ ou um homólogo deste" como
aqui definido refere-se às proteínas que compreendem pelo menos uma repetição de anquirina e pelo menos um domínio C3H1 de dedo de zinco, repetição de anquirina está que está localizada a montante do domínio C3H1. Preferivelmente, a proteína de AZ compreende duas repetições de anquirina e dois domínios C3H1 de dedo de zinco tal como na proteína representada na SEQ ID NO: 2. Também preferivelmente, as duas repartições de anquirina são localizadas próximas entre si. Mais preferivelmente, os Domínios C3H1 de dedo de zinco também estão localizados próximos entre si e Cly terminal das repetições de anquirina. Na SEQ ID NO: 2, as repetições de anquirina estão localizadas nas posições D90 a Rl20 e Dl25 a L157, os dois domínios de dedo de zinco estão localizados nas posições H301 a V327 e Q336 a P359 (Figura 1).
Também preferivelmente, a proteína de AtAZ compreende pelo menos uma das seguintes seqüências de consenso: (P/A)CSRAY(S/T)HDWTEC (motivo 1, SEQ ID NO: 3) HPGENARRRDPR (motivo 2, SEQ ID NO: 4) HG( V/I)FE(C/S) WLHP( A/S )Q Y(R/K)TRLCK (motivo 3, SEQ ID NO: 5) CFFAH (motivo 4, SEQ ID NO: 6)
Preferivelmente o motivo 1 é PCSRAYSHDWTEC, e o motivo 3 é preferivelmente HGVFECWLHPAQYRTRLCK.
Mais preferivelmente, a proteína de AtAZ compreende dois dos motivos mencionados acima, de modo especialmente preferível 3 dos motivos mencionados acima, mais preferivelmente todos os quatro motivos.
A repetição de anquirina (SMART SM00248, Interpro IPR002110), como descrito na base de dados Interpro, é um dos motivos de interação de proteína-proteína mais comuns na natureza. Repetições de anquirina são (usualmente em tandem) módulos repetidos usualmente de cerca de 33 aminoácidos. Estes ocorrem em um grande número de proteínas funcionalmente diversas principalmente de eucariotas. Os poucos exemplos conhecidos de procariotas e vírus podem ser o resultado de transferências de gene horizontais. A repetição foi descoberta em proteínas de função diversa tais como iniciadores transcricionais, reguladores de ciclo celular, citoesqueletal, transportadores de íon e transdutores de sinal. A dobra da anquirina parece ser definida pela sua estrutura ao invés da sua função visto que não existe nenhuma seqüência ou estrutura específicas que sejam universalmente reconhecidas por elas. A dobra conservada da unidade de repetição da anquirina é conhecida de diversas estruturas cristalinas e de solução. Cada dobra de repetição em uma estrutura de hélice-alça-hélice com um região beta de grampo de cabelo/alça projetando das hélices em um ângulo de 90°. As repetições empilham juntas para formar uma estrutura na forma de L.
O domínio de dedo de zinco ZnF_C3Hl (também conhecido como Znf CCCH, SMART SM00356; Interpro IPR000571), como descrito na base de dados da Interpro é considerado estar envolvido na ligação de DNA. Os dedos de zinco existem como tipos diferentes, dependendo das posições dos resíduos de cisteína. As proteínas contendo domínios de dedo de zinco do tipo C-x8-C-x5-C-x3-H (em que χ representa qualquer aminoácido e os dígitos 8, 5 e 3 representam o número de aminoácidos entre os resíduos C ou H conservados) incluem proteínas de dedo de zinco de eucariotas envolvidas no ciclo celular ou regulagem relacionada com a fase de crescimento, por exemplo, TISllB humano (fator de resposta de butirato 1), uma provável proteína reguladora envolvida na regulagem da resposta aos fatores de crescimento e a proteína nuclear indutível pelo fator de crescimento TTP de camundongo, que tem a mesma função. A proteína TTP de camundongo é induzida pelos fatores de crescimento. Uma outra proteína contendo este domínio é a subunidade de 35 kD do fator de união humano U2AF, que desempenha um papel crítico na união dependente tanto constitutiva quanto dependente de realçador pela mediação de interações de proteína-proteína essenciais e interações de proteína-RNA requeridas para a seleção de sítio de união 3'. Foi mostrado que proteínas de dedo de zinco CCCH diferentes interagem com a região 3' não traduzida de vários mRNA. Este tipo de dedo de zinco está muito freqüentemente presente em duas cópias.
A Figura 2 descreve as seqüências de consenso como definidas na base de dados SMART para o domínio de anquirina e o domínio de dedo de zinco; entretanto deve ser mencionado que estas seqüências de consenso poderiam ser polarizadas para seqüências de proteína animal.
Os termos "domínio" e "motivo" são definidos nas seção "definições" aqui. As bases de dados especialistas existem para a identificação de domínios. O domínio C3H1 ou de anquirina em uma proteína de AZ pode ser identificado usando, por exemplo, SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunie et al. (2002) Nueleie Aeids Res 30, 242-244), InterPro (Mulder et al., (2003) Nuel. Acids. Res. 31, 315-318), Prosite (Bucher e Bairoeh (1994), A generalized profile syntax for biomolecular sequences motifs and its funetion in automatic sequence interpretation. (In) ISMB-94; Proeeedings 2nd International Conferenee on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp 53-61, AAAIPress, Menlo Park; Hulo et al., Nuel. Acids. Res. 32: D134-D137, (2004)) ou Pfam (Bateman et al., Nucleie Acids Research 30(1): 276-280 (2002)). Um conjunto de ferramentas para a análise in silico de seqüências de proteína está disponível no servidor ExPASY proteomies (abrigado pelo Swiss Institute of Bioinformatics (Gasteiger et al., ExPASy: the proteomies server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31: 3784-3788 (2003)). A seqüência de proteína AZ foi analisada com a ferramenta SMART (versão 4.1; Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunie et al. (2002) Nucleic Acids Res 30, 242-244) e foi usado para triar o Pfam (Versão 17.0, Março de 2005; Bateman et al. (2004) Nuel. Acids Res. 32, D138-141) e base de dados InterPro (Release 11.0, 26 de Julho de 2005; Mulder et al. (2005) Nuel. Acids. Res. 33, D201-205). Alinhando-se outras seqüências de proteína com a SEQ ID
NO: 2, as seqüências de consenso correspondentes, o domínio C3H1, o domínio da anquirina ou outros motivos de seqüência podem ser facilmente identificados. Deste modo, os polipeptídeos de AZ ou homólogos destes (abrangendo ortólogos e parálogos) podem ser facilmente identificados, usando técnicas de rotina bem conhecidos na técnica, tais como pelo alinhamento de seqüência. Os métodos para o alinhamento de seqüências para comparação são bem conhecidos na técnica, tais métodos incluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o algoritmo de Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar o alinhamento de duas seqüências completas que maximiza o número de emparelhamentos e minimiza o número de intervalos. O algoritmo BLAST (Altschul et ai. (1990) J Mol Biol 215: 403-10) calcula a identidade de seqüência percentual e realiza uma análise estatística da similaridade entre as duas seqüências. O software para realiza a análise BLAST está publicamente disponível através do National Centre for Biotechnology Information. Os homólogos podem ser facilmente identificados usando, por exemplo, o algoritmo de alinhamento de seqüência múltipla ClustalW (versão 1.83), com os parâmetros de alinhamento aos pares de default e um método de contagem em porcentagem. As porcentagens globais de similaridade e identidade também podem ser determinadas usando um dos métodos disponíveis no pacote de software MatGAT (Campanella et al., BMC Bioinformatics. Julho de 2003 10; 4: 29. MatGAT: a application that generates similarity/identity matrices using protein ou DNA sequences.). Correção manual menor pode ser realizada para otimizar o alinhamento entre motivos conservados, como estaria evidente a uma pessoa habilitada na técnica. Além disso, ao invés de usar seqüências de tamanho natural para a identificação de homólogos, domínios específico (tais como o domínio C3H1 ou de anquirina ou um dos motivos definidos acima) também podem ser usados. Os valores de identidade de seqüência, que são indicados abaixo como uma porcentagem foram determinados em relação ao domínio conservado inteiro ou seqüência de ácido nucleico ou aminoácido usando os programas mencionados acima usando os parâmetros default.
Os exemplos de proteínas de AZ ou homólogos destes incluem as seqüências de proteína listadas na Tabela A do Exemplo 1. Deve ser entendido que as seqüências que caem sob a
definição de "polipeptídeo de AZ ou homólogo deste" não devem estar limitados às seqüências de polipeptídeo listadas na Tabela A do Exemplo 1, mas que qualquer polipeptídeo que compreenda pelo menos uma repetição de anquirina e pelo menos um domínio de dedo de zinco C3H1 e preferivelmente também pelo menos uma das seqüências de consenso da SEQ ID NO: 3, 4, 5 ou 6 como definidas acima, pode ser adequado para o uso nos métodos da invenção. Preferivelmente, o polipeptídeo é um polipeptídeo de Arabidopsis thaliana.
Abrangido pelo termo "homólogos" estão as seqüências ortólogas e as seqüências parálogas. Ortólogos e parálogos podem ser encontrados realizando-se uma chamada pesquisa de blast recíproca. Isto pode ser feito por uma primeira BLAST envolvendo realizar o BLAST em uma seqüência dúvida (por exemplo, SEQ ID NO: 1 ou SEQ ID NO: 2) contra qualquer base de dados de seqüência, tal como a base de dados NCBI publicamente disponível. BLASTN ou TBLASTX (usando valores default padrão) podem ser usados quando partindo de uma seqüência de nucleotídeo e BLASTP ou TBLASTN (usando valores default padrão) podem ser usados quando partindo de uma seqüência de proteína. Os resultados BLAST podem ser opcionalmente filtrados. As seqüências de tamanho natural dos resultados filtrados ou resultados não filtrados são depois re-submetidos a BLAST (segundo BLAST) contra seqüências do organismo a partir do qual a seqüência dúvida é derivada (onde a seqüência dúvida é a SEQ ID NO: 1 ou SEQ ID NO: 2, o segundo BLAST portanto seria contra as seqüências de Arabidopsis). Os resultados do primeiro e segundo BLASTs são depois comparados. Um parálogo é identificado se um acerto de alta classificação do segundo BLAST for da mesma espécie como da qual a seqüência dúvida é derivada; um ortólogo é identificado se uma alta classificação não é da mesma espécie como da qual a seqüência dúvida é derivada. Os ortólogos preferidos são ortólogos da SEQ ID NO: 1 ou SEQ ID NO: 2. Os acertos de alta classificação são aqueles tendo um valor E baixo. Quanto mais baixo o valor E, mais significante a contagem (ou em outras palavras mais baixa a chance de que o acerto fosse descoberto aos acaso). A computação do valor E é bem conhecida na técnica. Além dos valores E, as comparações também estão contadas em identidade percentual. A identidade percentual refere-se ao número de nucleotídeos idênticos (ou aminoácidos) entre as duas seqüências de ácido nucleico (ou polipeptídeo) comparadas em um comprimento particular. Preferivelmente a contagem é maior do que 50, mais preferivelmente maior do que 100; e preferivelmente o valor E é menor do que e-5, mais preferivelmente menor do que e-6. No caso de famílias grandes, ClustalW pode ser usado, seguido pela geração de uma árvore de união de vizinhos, para ajudar a visualizar a formação de grupos de genes relacionados e para identificar ortólogos e parálogos. Os exemplos de seqüências ortólogas para a SEQ ID NO: 2 incluem SEQ ID NO: 11, SEQ ID NO: 15 e SEQ ID NO: 17. SEQ ID NO: 19 é um exemplo de um parálogo da SEQ ID NO: 2.
Preferivelmente, as proteínas de AZ úteis nos métodos da presente invenção têm, além de pelo menos uma repetição de anquirina e pelo menos um domínio C3H1, em ordem crescente de preferência, pelo menos 26%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de seqüência com a proteína da SEQ ID NO: 2. A matriz mostrada na figura 3 (Matriz A) mostra similaridades e identidades (em negrito) em relação ao tamanho natural de várias proteínas de AZ. No caso apenas domínios específicos são comparados, a identidade ou similaridade podem ser mais altas entre as proteínas diferentes (Matriz B: comparação de uma seqüência de domínio de dedo de Zn).
Um ensaio pode ser realizado para determinar a atividade de AZ. A atividade de ligação de DNA e as interações de proteína-proteína pode ser facilmente determinada in vitro ou in vivo usando técnicas bem conhecidas no ramo. Os exemplos de ensaios in vitro para a atividade de ligação de DNA incluem: análise de retardação em gel ou ensaios de híbrido único de levedura. Um exemplo de um ensaio in vitro para as interações de proteína-proteína é a análise de híbrido duplo de levedura (Fields e Song (1989) Nature 340: 245-6). Além disso, a expressão da proteína de AZ ou de um homólogo desta em plantas e em particular em arroz, tem o efeito de aumentar o rendimento da planta transgênica quando comparada com as plantas do tipo selvagem correspondentes, em que o rendimento aumentado compreende pelo menos um de: peso de sementes total, número de sementes total e número de sementes cheias.
Um polipeptídeo de AZ ou homólogo deste são codificados por um ácido nucleico/gene de AZ. Portanto o termo "ácido nucleico/gene de AZ" como aqui definido é qualquer ácido nucleico/gene que codifiquem um polipeptídeo de AZ ou um homólogo deste como definido acima. Os exemplos de ácidos nucleicos de AZ incluem mas não são limitados àqueles representados na Tabela A do Exemplo 1. Os ácidos nucleicos/genes de AZ e variantes destes podem ser adequados na prática dos métodos da invenção. Preferivelmente, as variantes de um gene de AZ origina-se de Arabidopsis thaliana. Os ácido nucleicos/genes de AZ variantes incluem porções de um ácido nucleico/gene de AZ, variantes de junção, variantes alélicas e/ou ácidos nucleicos capazes de hibridizar com um ácido nucleico/gene de AZ.
Referência aqui a uma "seqüência de ácido nucleico" é considerada significar uma forma polimérica de um polímero de desoxirribonucleotídeo ou um ribonucleotídeo de qualquer comprimento, de filamento duplo ou único ou análogos destes, que têm a característica essencial de um ribonucleotídeo natural em que o mesmo pode hibridizar com as seqüências de ácido nucleico em uma maneira similar aos polinucleotídeos que ocorrem naturalmente.
O termo porção como aqui definido refere-se a um pedaço de DNA que codifica um polipeptídeo que compreende pelo menos uma repetição de anquirina e pelo menos um domínio de dedo de Zn C3H1. Uma porção pode ser preparada, por exemplo, fabricando-se uma ou mais deleções para um ácido nucleico de AZ. As porções podem ser usadas na forma isolada ou elas podem ser fundidas entre si seqüências codificadoras (ou não codificadoras) de modo a, por exemplo, produzir uma proteína que combine diversas atividades. Quando da fusão de seqüência codificadoras entre si, o polipeptídeo resultante produzido na tradução pode ser maior do que aquele prognosticado para o fragmento de AZ. A porção tem tipicamente pelo menos 500, 700 ou 900 nucleotídeos no comprimento, preferivelmente pelo menos 1100, 1300 ou 1500 nucleotídeos no comprimento, mais preferivelmente pelo menos 1700, 1900 ou 2100 nucleotídeos no comprimento e o mais preferivelmente pelo menos 2300 ou 2400 nucleotídeos no comprimento. Preferivelmente, a porção é uma porção de um ácido nucleico como representado na Tabela A do Exemplo 1. O mais preferivelmente a porção de um ácido nucleico de AZ é como representado pela SEQ ID NO: 1 ou SEQ ID NO: 53.
Os termos "fragmento", "fragmento de uma seqüência" ou "parte de uma seqüência" "porção" ou "porção deste' significa uma seqüência truncada da seqüência original aludida. A seqüência truncada (seqüência de ácido nucleico ou proteína) pode variar amplamente no comprimento; o tamanho mínimo sendo uma seqüência de tamanho suficiente para fornecer uma seqüência com pelo menos uma função e/ou atividade comparável da seqüência original aludida ou hibridizar com a molécula de ácido nucleico da invenção ou usada no processo da invenção sob condições severas, embora o tamanho máximo não seja crítico, em algumas aplicações, o tamanho máximo usualmente não é substancialmente maior do que aquele requerido para fornecer a atividade e/ou função(ões) desejadas da seqüência original. Uma função comparável significa pelo menos 40%, 45% ou 50%, preferivelmente pelo menos 60%, 70%, 80% ou 90% ou mais da função da seqüência original.
Uma outra variante de um ácido nucleico/gene de AZ é um ácido nucleico capaz de hibridizar sob condições de severidade reduzida, preferivelmente sob condições severas, com um ácido nucleico/gene de AZ como mais acima definido ou com uma porção como mais acima definida. A seqüência de hibridização tem tipicamente pelo menos 300 nucleotídeos no comprimento, preferivelmente pelo menos 400 nucleotídeos no comprimento, mais preferivelmente pelo menos 500 nucleotídeos no comprimento e o mais preferivelmente pelo menos 600 nucleotídeos no comprimento.
Preferivelmente, a seqüência hibridizadora é uma que é capaz de hibridizar a um ácido nucleico como representado pela SEQ ID NO: 1, SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42 ou SEQ ID NO: 53 ou a uma porção de qualquer uma das seqüências anteriormente mencionadas, uma porção sendo definida como acima. O mais preferivelmente a seqüência hibridizadora é capaz de hibridizar com a SEQ ID NO: 1, com a SEQ ID NO: 53 ou com porções (ou sondas) destas. Os métodos para planejar sondas são bem conhecidos na técnica. As sondas são no geral menores do que 1000 pares de base, 900 pares de base, 800 pares de base, 700 pares de base, 600 pares de base no comprimento, preferivelmente menores do que 500 pares de base, 400 pares de base, 300 pares de base 200 pares de base ou 100 pares de base no comprimento. Habitualmente, os comprimentos de sonda para as hibridizações de DNA-DNA tais como Southern blotting, variam entre 100 e 500 pares de base, ao passo que a região de hibridização em sondas para as hibridizações de DNA-DNA tais como na amplificação pela PCR no geral são mais curtas do que 50 mas mais longas do que 10 nucleotídeos, preferivelmente elas têm 15, 20, 25, 30, 35, 40, 45 ou 50 pares de base no comprimento.
Também úteis nos métodos da invenção são ácidos nucleicos que codificam homólogos (incluindo ortólogos ou parálogos) da seqüência de aminoácido representada pela SEQ ID NO: 2 ou derivados destas. Uma outra variante de ácido nucleico útil nos métodos da presente invenção é uma variante de junção que codifica um polipeptídeo de AZ como definido acima. As variantes de junção preferidas são variantes de junção do ácido nucleico que codifica um polipeptídeo que compreende pelo menos uma repetição de anquirina e pelo menos um domínio C3H1. Preferivelmente, o polipeptídeo de AZ ou o homólogo desta codificado pela variante de junção tem pelo menos 26%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de seqüência com a SEQ ID NO: 2. Mais preferidas são as variantes de junção representadas pelos ácidos nucleicos representados na Tabela A do Exemplo 1. Por exemplo, SEQ ID NO: 25 e SEQ ID NO: 47 são codificadas pelas variantes de junção do mesmo gene. A mais preferida é a variante de junção representada pela SEQ ID NO: 1 ou SEQ ID NO: 53.
Uma outra variante de ácido nucleico útil nos métodos da presente invenção é uma variante alélica de um ácido nucleico que codifica um polipeptídeo de AZ como definido acima. Preferivelmente, o polipeptídeo codificado pela variante alélica é representado pelas seqüências de polipeptídeo listadas na Tabela A do Exemplo 1. Mais preferivelmente, a variante alélica que codifica o polipeptídeo de AZ é representada pela SEQ ID NO: 1.
Uma outra variante de ácido nucleico útil nos métodos da invenção é uma variante de ácido nucleico obtida pelo embaralhamento de gene. Além disso, a mutagênese direcionada ao sítio pode ser usada para gerar variantes de ácidos nucleicos de AZ. Diversos métodos estão disponíveis para se obter a mutagênese direcionada ao sítio; os mais comuns sendo os métodos com base na PCR (Current Protocols in Molecular Biology. Wiley Eds.).
Portanto, a invenção fornece um método para aumentar o rendimento e/ou a taxa de crescimento de uma planta, que compreende modular a expressão em uma planta de uma variante de um ácido nucleico de AZ selecionada de:
(i) uma porção de um ácido nucleico de AZ;
(ii) um ácido nucleico que hibridiza a um ácido nucleico de
AZ;
(iii) uma variante de junção de um ácido nucleico que codifica
um polipeptídeo de AZ;
(iv) uma variante alélica de um ácido nucleico que codifica um polipeptídeo de AZ; e
(v) uma variante de ácido nucleico que codifica um polipeptídeo de AZ obtido pelo embaralhamento de gene ou mutagênese
direcionada ao sítio.
O ácido nucleico de AZ ou variante deste podem ser derivados de qualquer fonte natural ou artificial. Este ácido nucleico pode ser modificado a partir da sua forma nativa em composição e/ou ambiente genômico através da manipulação humana deliberada. O ácido nucleico é preferivelmente de origem vegetal, mais preferivelmente de uma espécie dicotiledônea, mais preferivelmente da família Brassicaceae, mais preferivelmente de Arabidopsis thaliana. O mais preferivelmente, o ácido nucleico de AZ é da seqüência de Arabidopsis thaliana representada pela SEQ ID NO: Iea seqüência de aminoácido de AZ é como representada pela SEQ ID NO: 2. Alternativamente, o ácido nucleico de AZ representado pela SEQ ID NO: 53 ou a seqüência de aminoácido de AZ como representada pela SEQ ID NO: 47 também podem ser úteis nos métodos da presente invenção.
Qualquer referência aqui a um polipeptídeo de AZ é portanto considerada significar uma proteína de AZ como definida acima. Qualquer ácido nucleico que codifica uma tal proteína de AZ é adequado para o uso nos métodos da invenção.
De acordo com um aspecto preferido da presente invenção, a expressão modulada, preferivelmente aumentada do ácido nucleico de AZ ou variante deste é considerada. Os métodos para aumentar a expressão de genes ou produtos de gene são bem documentadas na técnica. A expressão de uma seqüência de ácido nucleico que codifica um polipeptídeo de AZ pode ser modulada pela introdução de uma modificação genética, que pode ser introduzida, por exemplo, por qualquer um (ou mais) dos seguintes métodos: ativação de T-DNA, TILLING, mutagênese direcionada ao sítio, evolução direta e recombinação homóloga ou pela introdução e expressão em uma planta de um ácido nucleico que codifica um polipeptídeo de AZ ou um homólogo desta. A seguir da introdução da modificação genética, segue uma etapa de selecionar quanto a expressão modificada de um ácido nucleico que codifica um polipeptídeo de AZ ou um homólogo desta, modificação na expressão esta que dá plantas tendo rendimento aumentado. Também métodos para diminuir a expressão de genes ou produtos de gene são conhecidos na técnica.
A ativação de T-DNA é descrita acima. Uma modificação
genética também pode ser introduzida no local de um gene de AZ usando a técnica de TILLING (Lesões Locais Induzidas Alvejadas Em Genomas). O local de um gene como aqui definido é considerado significar uma região genômica, que inclui o gene de interesse e 10 kb à montante ou à jusante da região codificadora. A mutagênese direcionada ao sítio pode ser usada para gerar variantes de ácidos nucleicos de AZ. Diversos métodos são disponíveis para se obter a mutagênese direcionada ao sítio; os mais comuns sendo os métodos com base em PCR (Current Protocols in Molecular Biology. Wiley Eds.). Os efeitos da invenção também podem ser produzidos usando a recombinação homóloga.
Um método preferido para introduzir uma modificação genética é introduzir e expressar em uma planta um ácido nucleico que codifica um polipeptídeo de AZ ou um homólogo deste, como definido acima. 0 ácido nucleico a ser introduzido em uma planta pode ser um ácido nucleico de tamanho natural ou pode ser uma porção ou uma seqüência hibridizadora como mais acima definido.
A invenção além disso fornece construções genéticas e vetores para facilitar a introdução e/ou expressão das seqüências de nucleotídeo úteis nos métodos de acordo com a invenção.
Portanto, é fornecido uma construção de gene que
compreende:
(i) um ácido nucleico de AZ ou variante deste, como definido
acima;
(ii) uma ou mais seqüências de controle operavelmente ligadas à seqüência de ácido nucleico de (i);
As construções úteis nos métodos de acordo com a presente invenção podem ser criadas usando a tecnologia de DNA recombinante bem conhecida pelas pessoas habilitadas na técnica. As construções de gene podem ser inseridas em vetores, que podem ser comercialmente disponíveis, adequadas para transformar em plantas e adequadas para a expressão do gene de interesse nas células transformadas. A invenção portanto fornece o uso de uma construção de gene como definido acima nos métodos da invenção.
As plantas são transformadas com um vetor que compreende a seqüência de interesse (isto é, um ácido nucleico que codifica um polipeptídeo de AZ ou homólogo desta). O técnico habilitado está bem ciente dos elementos genéticos que devem estar presentes no vetor de modo a transformar, selecionar e propagar com êxito células hospedeiras contendo a seqüência de interesse. A seqüência de interesse é operavelmente ligada a uma ou mais seqüências de controle (pelo menos a um promotor). Os termos "elemento regulador", "seqüência de controle" e "promotor" são definidos acima. Vantajosamente, qualquer tipo de promotor pode ser usado para direcionar a expressão da seqüência de ácido nucleico.
Os promotores adequados, que são funcionais em plantas, são no geral conhecidos. Estes podem tomar a forma de promotores constitutivos ou indutíveis. Os promotores adequados podem possibilitar a expressão desenvolvimental e/ou específica de tecido em eucariotas multi-celulares; assim, promotores específicos de folha, raiz, flores, semente, estornas, tubérculos ou fruta podem ser vantajosamente usados em plantas.
Os promotores vegetais diferentes utilizáveis em plantas são promotores tais como, por exemplo, o promotor USP, o LegB4, o DC3 ou o promotor da ubiquitina da salsa.
Um promotor "vegetal" compreende elementos reguladores, que medeiam a expressão de um segmento de seqüência codificadora em células vegetais. Consequentemente, um promotor vegetal não precisa ser de origem vegetal, mas pode originar-se de vírus ou micro-organismos, em particular por exemplo de vírus que atacam células vegetais.
O promotor "vegetal" também pode originar-se de uma célula vegetal, por exemplo, da planta que é transformada com a seqüência de ácido nucleico a ser expressada no processo inventivo e aqui descrito. Isto também se aplica a outros sinais reguladores "vegetais", por exemplo em terminadores "vegetais".
Para a expressão em plantas, a molécula de ácido nucleico, como descrita acima, deve estar ligada operavelmente a ou compreender um promotor adequado que expresse o gene no ponto certo no tempo e em uma maneira específica de célula ou tecido. Os promotores úteis são promotores constitutivos (Benfey et al., EMBO J. 8 (1989) 2195-2202), tais como aqueles que se originam de vírus vegetais, tais como 35S CAMV (Franck et al., Cell 21 (1980) 285-294), 19S CaMV (ver também US 5352605 e WO 84/02913), 34S FMV (Sanger et al., Plant. Mol. Biol., 14, 1990: 433-443), o promotor da ubiquitina da salsa ou promotores vegetais tais como o promotor da subunidade pequena de Rubisco descrito na US 4,962.028 ou os promotores vegetais PRPl [Ward et al, Plant. Mol. Biol. 22 (1993)], SSU, PGEL1, OCS [Leisner (1988) Proc Natl Acad Sci USA 85(5): 2553-2557], lib4, usp, mas [Cornai (1990) Plant Mol Biol 15 (3): 373-381], STLS1, ScBV (Schenk (1999) Plant Mol Biol 39(6): 1221-1230), B33, SADl ou SAD2 (promotores do linho, Jain et al., Crop Science, 39 (6), 1999: 1696-1701) ou nos [Shaw et al. (1984) Nucleic Acids Res. 12(20): 7831-7846]. Outros exemplos de promotores constitutivos vegetais são os promotores da V-ATPase da beterraba açucareira (WO 01/14572). Os exemplos de promotores constitutivos sintéticos são o Super promotor (WO 95/14098) e promotores derivados de caixas G (WO 94/12015). Se apropriado, os promotores quimicamente indutíveis além disso também podem ser usado, comparar a EP-A 388186, EP-A 335528, WO 97/06268. A expressão estável, constitutiva das proteínas de acordo com a invenção em uma planta pode ser vantajosa. Entretanto, a expressão indutível do polipeptídeo da invenção é vantajosa, se, por exemplo, a expressão tardia antes da colheita for de vantagem, visto que a manipulação metabólica pode levar à retardação do crescimento da planta.
A expressão de genes vegetais também pode ser facilitada por intermédio de um promotor quimicamente indutível. Os promotores quimicamente indutíveis são particularmente adequados quando é desejado expressar o gene em uma maneira específica de tempo. Os exemplos de tais promotores são um promotor indutível pelo ácido salicílico (WO 95/19443) e promotor indutível pelo ácido abscíssico (EP 335 528), um promotor indutível pela tetraciclina (Gatz et al. (1992) Plant J. 2, 397-404), um promotor indutível pelo ciclo-hexanol ou etanol (WO 93/21334) ou outros como aqui descritos.
Outros promotores adequados são aqueles que reagem com as
condições de estresse biótico ou abiótico, por exemplo o promotor do gene PRPl induzido por patógeno (Ward et al., Plant. Mol. Biol. 22 (1993) 361- 366), o promotor hsp80 indutível por calor do tomate (US 5.187.267), o promotor da alfa-amilase da batata indutível pelo frio (WO 96/12814) ou o promotor pinll indutível por ferimento (EP-A-O 375 091) ou outros como aqui descritos.
Os promotores preferidos são em particular aqueles que causam a expressão de gene em tecidos e órgãos, em células de semente, tais como células do endosperma e células do embrião em desenvolvimento. Os promotores adequados são o promotor do gene napin da colza (US 5.608.152), o promotor USP de Vicia faba (Baeumlein et al., Mol Gen Genet, 1991, 225 (3): 459-67), o promotor da oleosina de Arabidopsis (WO 98/45461), o promotor da faseolina de Faseolus vulgaris (US 5.504.200), o promotor Bce4 de Brassica (WO 91/13980), o promotor ares de feijão, o promotor DcG3 da cenoura ou o promotor B4 de Legumina (LeB4; Baeumlein et al., 1992, Plant Journal, 2 (2): 233-9) e promotores que realizam a expressão específica de semente em plantas monocotiledôneas tais como milho, cevada, trigo, centeio, arroz e outros. Os promotores específicos de semente vantajosos são o promotor da proteína de ligação da sacarose (WO 00/26388), o promotor da faseolina e o promotor de napin. Os promotores adequados que devem ser considerados são o promotor dos genes Ipt2 ou Iptl da cevada (WO 95/15389 e WO 95/23230) e os promotores descritos na WO 99/16890 (promotores do gene da ordeína da cevada, do gene da glutelina do arroz, do gene da orizina do arroz, do gene da prolamina do arroz, do gene da gliadina do trigo, do gene da glutelina do trigo, do gene da zeína do milho, do gene da glutelina da aveia, do gene da casirina do sorgo e o gene da secalina do centeio). Outros promotores adequados são Amy32b, Amy6-6 e Aleurain [US 5.677.474], Bce4 (colza) [US 5.530.149], glicinina (soja) [EP 571 741], fosfoenolpiruvato carboxilase (soja) [JP 06/62870], ADRl2- 2 (soja) [WO 98/08962], isocitrato liase (colza) [US 5.689.040] ou cc-amilase (cevada) [EP 781 849]. Outros promotores que são disponíveis para a expressão de genes em plantas são promotores específicos de folha tais como aqueles descritos em DE-A 19644478 ou promotores regulados por luz tais como, por exemplo, o promotor petE da ervilha.
Outros promotores vegetais adequados são o promotor FBPase citossólico ou o promotor ST-LSI da batata (Stockhaus et al., EMBO J. 8, 1989, 2445), o promotor da fosforribosilpirofosfato amidotransferase da Glicina max (Acesso no GenBank N- U87999) ou o promotor específico de nodo descrito na EP-A-O 249 676.
De acordo com uma característica preferida da invenção, o ácido nucleico de AZ ou variante deste são operavelmente ligados a um promotor específico de semente. O promotor específico de semente pode ser ativo durante o desenvolvimento e/ou durante a germinação da semente. Os promotores específicos de semente são bem conhecidos na técnica. Preferivelmente, o promotor específico de semente é um promotor específico de embrião/específico de endosperma/específico de aleurona. Mais preferivelmente, o promotor específico de semente direciona a expressão em pelo menos um de: o embrião, o endosperma, a aleurona. Mais preferivelmente, o promotor é um WSI18 ou um promotor funcionalmente equivalente. Mais preferivelmente, a seqüência promotora é como representada pela SEQ ID NO: 9 ou SEQ ID NO: 55. Deve estar claro que a aplicabilidade da presente invenção não é restrita ao ácido nucleico de AZ representado pela SEQ ID NO: 1 ou SEQ ID NO: 53, nem é a aplicabilidade da invenção restrita à expressão de um ácido nucleico de AZ quando direcionado por um promotor específico de semente. Os exemplos de outros promotores específicos de semente (promotores específico de embrião/específico de endosperma/específico de aleurona) que também podem ser usados para direcionar a expressão de um ácido nucleico de AZ são fornecidos acima.
De acordo com uma outra característica preferida da invenção, o ácido nucleico de AZ ou variante deste são operavelmente ligados a um promotor constitutivo. Um promotor constitutivo preferido é um promotor constitutivo que também é expressado de modo substancialmente ubíquo. Mais preferivelmente o promotor é derivado de uma planta, mais preferivelmente de uma planta monocotiledônea. Um exemplo de um tal promotor é o promotor GOS2 do arroz (SEQ ID NO: 54 ou SEQ ID NO: 56).
Deve estar claro que a aplicabilidade da presente invenção não é restrita ao ácido nucleico de AZ representado pela SEQ ID NO: 1, nem é a aplicabilidade da invenção restrita à expressão de um ácido nucleico de AZ quando direcionado por um promotor constitutivo e em particular por um promotor GOS2. Os exemplos de outros promotores constitutivos que também podem ser usados para direcionar a expressão de um ácido nucleico de AZ são mostrados acima.
Opcionalmente, uma ou mais seqüências terminadoras podem ser usadas na construção introduzida em uma planta. Os elementos reguladores adicionais podem incluir realçadores transcricionais assim como traducionais. Aqueles habilitados na técnica estarão cientes de seqüências terminadoras e realçadoras que podem ser adequadas para o uso na realização da invenção. Uma seqüência de intron também pode ser adicionada à região não traduzida 5' (UTR) ou na seqüência codificadora para aumentar a quantidade da mensagem madura que acumula no citossol, como descrito na seção de definições. Outras seqüências de controle (além das seqüências promotoras, realçadoras, silenciadoras, de intron, regiões 3'UTR e/ou 5'UTR) podem ser elementos estabilizadores de proteína e/ou RNA. Tais seqüências seriam conhecidas ou podem ser facilmente obtidas por uma pessoa habilitada na técnica.
As construções genéticas da invenção podem incluir ainda
uma seqüência de origem de replicação que é requerida para a manutenção e/ou replicação em um tipo de célula específico. Um exemplo é quando uma construção genética é requerida ser mantida em uma célula bacteriana como um elemento genético epissômico (por exemplo, molécula de plasmídeo ou cosmídeo). As origens preferidas de replicação incluem, mas não são limitadas à fl-ori e colEl.
Para a detecção da transferência bem sucedida das seqüências de ácido nucleico como usadas nos métodos da invenção e/ou seleção de plantas transgênicas que compreendem estes ácidos nucleicos, é vantajoso usar genes marcadores (ou genes repórteres). Portanto, a construção genética pode opcionalmente compreender um gene marcador selecionável. Os marcadores selecionáveis são descritos em mais detalhes na seção "definições" aqui. Os genes marcadores podem ser removidos ou excisados da célula transgênica uma vez que elas não são mais necessárias. As técnicas para a remoção de marcador são conhecidas na técnica, as técnicas úteis são descritas acima na seção definições.
A presente invenção também abrange plantas, parte de plantas ou células vegetais obteníveis pelos métodos de acordo com a presente invenção. A presente invenção portanto fornece plantas obteníveis pelo método de acordo com a presente invenção, plantas estas que têm introduzida nelas um ácido nucleico de AZ ou variante deste, como definido acima.
A invenção também fornece um método para a produção de plantas transgênicas tendo rendimento aumentado, que compreende a introdução e expressão em uma planta de um ácido nucleico de AZ ou uma variante deste como definido acima.
As plantas hospedeiras para os ácidos nucleicos ou o vetor usado no método de acordo com a invenção, o cassete de expressão ou a construção ou vetor são, em princípio, vantajosamente todas plantas, que são capazes de sintetizar os polipeptídeos usados no método inventivo.
Mais especificamente, a presente invenção fornece um método para a produção de plantas transgênicas tendo rendimento aumentado, método este que compreende:
(i) introduzir e expressar em uma planta ou célula vegetal um ácido nucleico de AZ ou variante deste; e
(ii) cultivar a célula vegetal sob condições que promovam crescimento e desenvolvimento da planta.
O ácido nucleico pode ser introduzido diretamente em uma célula vegetal ou na planta por si só (incluindo introdução em um tecido, órgão ou qualquer outra parte de uma planta). De acordo com uma característica preferida da presente invenção, o ácido nucleico é preferivelmente introduzido em uma planta pela transformação. Os termos "introdução" ou "transformação" são descritos em mais detalhes na seção de definições.
No geral depois da transformação, as células vegetais ou agrupamentos de célula são selecionados quanto a presença de um ou mais marcadores que são codificados pelos genes expressáveis em planta co- transferidos com o gene de interesse, seguindo que o material transformado é regenerado em uma planta inteira.
Como mencionado, Agrobacteria transformada com um vetor de expressão de acordo com a invenção também pode ser usada na maneira conhecida por si para a transformação de plantas tais como plantas usadas como um modelo, como Arabidopsis (.Arabidopsis thaliana está dentro do escopo da presente invenção não considerada como uma planta de cultivo) ou plantas de safra, tais como cereais, milho, aveia, centeio, cevada, trigo, soja, arroz, algodão, beterraba açucareira, canola, girassol, linho, cânhamo, batata, tabaco, tomate, cenoura, pimentões sino, colza, tapioca, mandioca, araruta, tagetes, alfafa, alface e as várias árvores, espécies de noz e videiras, em particular plantas de safra contendo óleo tais como soja, amendoim, planta da mamona, girassol, milho, algodão, linho, colza, coco, dendê, cártamo 0Carthamus tinctorius) ou cacau, por exemplo banhando-se as folhas cicatrizadas ou segmentos de folha em uma solução agrobacteriana e subseqüentemente cultivando-as em meio adequado. As células vegetais geneticamente modificadas podem ser regeneradas por intermédio de todos os métodos com que o técnico habilitado está familiarizado. Os métodos adequados podem ser encontrados nas publicações supra citadas popr S. D. Kung e R. Wu, Potrykus ou Hõfgen e Willmitzer.
No geral depois da transformação, as células vegetais ou agrupamentos de célula são selecionados quanto a presença de um ou mais marcadores que são codificados pelos genes expressáveis em planta co- transferidos com o gene de interesse, seguindo que o transformada material é regenerado em uma planta inteira. Para selecionar plantas transformadas, o material vegetal obtido na transformação é, como uma regra, submetida às condições seletivas de modo que as plantas transformadas possam ser distinguidas das plantas não transformadas. Por exemplo, as sementes obtidas na maneira descrita acima podem ser plantadas e, depois de um período de crescimento inicial, submetidas a uma seleção adequada pela pulverização. Uma outra possibilidade consiste em cultivar as sementes, se apropriado depois da esterilização, em placas de ágar usando um agente de seleção adequado de modo que apenas as sementes transformadas possam crescer em plantas. Alternativamente, as plantas transformadas são tríadas quanto a presença de um marcador selecionável tal como aqueles descritos acima.
A seguir da transferência de DNA e regeneração, as plantas putativamente transformadas podem ser avaliadas, por exemplo, usando a análise de Southern, quanto a presença do gene de interesse, número de cópia e/ou organização genômica. Alternativa ou adicionalmente, os níveis de expressão do DNA recém introduzido podem ser monitorados usando a análise de Northern e/ou Western, ambas as técnicas sendo bem conhecidas pelas pessoas tendo habilidade comum na técnica.
As plantas transformadas geradas podem ser propagadas por uma variedade de meios, tais como pela propagação clonal ou técnicas de procriação clássicas. Por exemplo, uma planta transformada da primeira geração (ou TI) pode ser auto-polinizada e transformantes de segunda geração homozigotos (ou T2) selecionados e as plantas T2 podem depois serem ainda propagadas através das técnicas de procriação clássicas.
Os organismos transformados gerados podem tomar uma variedade de formas. Por exemplo, elas podem ser quimeras de células transformadas e células não transformadas; transformantes clonais (por exemplo, todas as células transformadas para conter o cassete de expressão); enxertos de tecidos transformados e não transformados (por exemplo, em plantas, um rizoma transformado enxertado a uma muda não transformada).
A presente invenção claramente estende-se a qualquer célula vegetal ou planta produzida por qualquer um dos métodos aqui descritos e a todas as partes de planta e seus propágulos. A presente invenção estende-se ainda a abranger a progênie de uma célula primária transformada ou transfectada, tecido, órgão ou planta inteira que foram produzidos popr qualquer um dos métodos anteriormente mencionados, a única exigência sendo que a progênie exiba a(s) mesma(s) característica(s) genotípica(s) e/ou fenotípica(s) como aquela(s) produzida(s) pelo precursor nos métodos de acordo com a invenção. A invenção também inclui células hospedeiras contendo um ácido nucleico de AZ isolado ou variante deste. As células hospedeiras preferidas de acordo com a invenção são célula vegetais. A invenção também estende-se às partes colhíveis de uma planta tais como, mas não limitadas a sementes, folhas, frutas, flores, haste, raízes, rizomas, tubérculos e bulbos. A invenção além disso diz respeito aos produtos diretamente derivados de uma parte colhível de uma tal planta, tal como pelotas ou pós secos, óleo, gordura e ácidos graxos, amido ou proteínas.
A presente invenção também abrange o uso de ácidos nucleicos de AZ ou variantes destes e o uso de polipeptídeos de AZ ou homólogos destes. Um tal uso diz respeito a melhorar as características de crescimento de plantas, em particular na melhora do rendimento, especialmente rendimento de semente. O rendimento de semente aumentado preferivelmente compreende o peso de mil grãos aumentado.
Os ácidos nucleicos que codificam os polipeptídeos de AZ podem encontrar uso em programas de procriação em que um marcador de DNA é identificado que pode ser geneticamente ligado a um gene de AZ. Os ácidos nucleicos/genes podem ser usados para definir um marcador molecular. Este marcador de DNA ou proteína pode ser depois usado em programas de procriação para selecionar plantas tendo rendimento aumentado.
As variantes alélicas de um ácido nucleico/gene de AZ também podem encontrar uso em programas de procriação assistidos por marcador. Tais programas de procriação algumas vezes requerem a introdução de variação alélica pelo tratamento mutagênico das plantas, usando por exemplo mutagênese de EMS; alternativamente, o programa pode começar com uma coleção de variantes alélicas da chamada origem "natural" causada involuntariamente. A identificação de variantes alélicas depois ocorre, por exemplo, pela PCR. Isto é seguido por uma etapa para a seleção de variantes alélicas superiores da seqüência em questão e que dão rendimento aumentado. A seleção é tipicamente realizada monitorando-se o desempenho de crescimento de plantas contendo variantes alélicas diferentes da seqüência em questão, por exemplo, variantes alélicas diferentes de qualquer um dos ácidos nucleicos listados na Tabela A do Exemplo 1. O desempenho de crescimento pode ser monitorado em uma estufa ou no campo. Outras etapas opcionais incluem cruzar plantas, em que a variante alélica superior foi identificada, com uma outra planta. Isto pode ser usado, por exemplo, para fabricar uma combinação de características fenotípicas interessantes. Um ácido nucleico de AZ também pode ser usado como sondas para mapear genética e fisicamente os genes dos quais eles são uma parte e como marcadores para traços ligados a estes genes. Tal informação pode ser útil na procriação de planta de modo a desenvolver linhagens com fenótipos desejados. Tal uso de ácidos nucleicos de AZ ou variantes destes requer apenas uma seqüência de ácido nucleico de pelo menos 15 nucleotídeos no comprimento. Os ácidos nucleicos de AZ ou variantes destes podem ser usados como marcadores de polimorfismo de comprimento de fragmento de restrição (RFLP). Southern blots (Sambrook J, Fritsch EF e Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de DNA genômico de planta digerido com restrição podem ser sondadas com os ácidos nucleicos de AZ. Os padrões de associação resultantes podem ser depois submetidos às análises genéticas usando programas de computador tais como MapMaker (Lander et al. (1987) Genomics 1: 174-181) de modo a construir um mapa genético. Além disso, os ácidos nucleicos podem ser usados para sondar Southern blots contendo DNAs genômicos tratados com endonuclease de restrição de um conjunto de indivíduos representando o precursor e a progênie de um cruzamento genético definido. A segregação dos polimorfismos de DNA é mencionada e usada para calcular a posição do ácido nucleico de AZ no mapa genético anteriormente obtido usando esta população (Botstein etal. (1980) Am. J. Hum. Genet. 32: 314-331).
A produção e uso de sondas derivadas de gene vegetal para o uso no mapeamento genético é descrito em Bernatzky e Tanksley (1986) Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevem o mapeamento genético de clones de cDNA específicos usando a metodologia esboçada acima ou variações destas. Por exemplo, populações de intercruzamento F2, populações de retrocruzamento, populações aleatoriamente acasaladas, linhagens quase isogênicas e outros conjuntos de indivíduos podem ser usados para o mapeamento. Tais metodologias são bem conhecidas por aqueles habilitados na técnica.
As sondas de ácido nucleico também podem ser usadas para o mapeamento físico (i.e., colocação de seqüências nos mapas físicos; ver Hoheisel et al. Em: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346 e referências citadas nesta).
Em uma outra forma de realização, as sondas de ácido nucleico podem ser usadas no mapeamento de hibridização in situ pela fluorescência direta (FISH) (Trask (1991) Trends Genet. 7: 149-154). Embora métodos correntes de mapeamento FISH favoreçam o uso de clones grandes (diversos kb a diversas centenas de kb; ver Laan et al. (1995) Genome Res. 5: 13-20), melhoras na sensibilidade podem possibilitar o desempenho do mapeamento FISH usando sondas mais curtas.
Uma variedade de métodos com base na amplificação de ácido nucleico para o mapeamento genético e físico pode ser realizada usando os ácidos nucleicos. Os exemplos incluem a amplificação específica de alelo (Kazazian (1989) J. Lab. Clin. Med 11: 95-96), polimorfismo de fragmentos amplificados pela PCR (CAPS; Sheffield et al. (1993) Genomics 16: 325- 332), ligação específica de alelo (Landegren et al. (1988) Science 241: 1077- 1080), reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acids Res. 18: 3671), Mapeamento de Híbrido por Radiação (Walter et al. (1997) Nat. Genet. 7: 22-28) e Mapeamento Happy (Dear e Cook (1989) Nucleic Acids Res. 17: 6795-6807). Para estes métodos, a seqüência de um ácido nucleico é usada para planejar e produzir pares de iniciador para o uso na reação de amplificação ou em reações de extensão de iniciador. O planejamento de tais iniciadores é bem conhecida por aqueles habilitados na técnica. Em métodos que utilizam mapeamento genético com base na PCR, pode ser necessário identificar as diferenças da seqüência de DNA entre os precursores da cruz de mapeamento na região que corresponde à seqüência de ácido nucleico presente. Isto, entretanto, no geral não é necessário para os métodos de mapeamento.
Os métodos de acordo com a presente invenção resultam em plantas tendo rendimento aumentado, como descritos mais acima. Estas características de crescimento vantajosas também podem ser combinadas com outros traços economicamente vantajosos, tais como outros traços que realçam o rendimento, tolerância a vários estressees, traços que modificam várias características de arquitetura e/ou características bioquímicas e/ou fisiológicas.
Descrição detalhada para o polipeptídeo de SYT
Surpreendentemente, foi agora descoberto que modular a expressão de uma seqüência de ácido nucleico que codifica um polipeptídeo de SYT aumenta o rendimento e/ou vigor inicial da planta sob estresse abiótico em relação às plantas de controle. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar o rendimento e/ou vigor inicial da planta sob estresse abiótico em relação às plantas de controle, compreendendo modular a expressão em uma planta de uma seqüência de ácido nucleico que codifica um polipeptídeo de SYT.
Referência aqui a "plantas de controle" é considerado significar qualquer planta ou plantas de controle adequadas.
A "referência", "controle" ou "tipo selvagem" são aqui usados intercambiavelmente e é preferivelmente um objeto, por exemplo, uma organela, uma célula, um tecido, uma planta, que seja tão similar à matéria objeto da invenção quanto possível. A referência, controle ou tipo selvagem está no seu genoma, transcritoma, proteoma ou metaboloma tão similar quanto possível ao objeto da presente invenção. Preferivelmente, os termos organela, célula, tecido ou planta de "referência" "controle" ou "tipo selvagem", dizem respeito a uma organela, célula, tecido ou planta, que são quase geneticamente idênticos à organela, célula, tecido ou planta, da presente invenção ou a uma parte destes, tendo em ordem crescente de preferência 95%, 98%, 99,00%, 99,10%, 99,30%, 99,50%, 99,70%, 99,90%, 99,99%, 99,999% ou mais de identidade genética à organela, célula, tecido ou planta, da presente invenção. Mais preferivelmente a "referência", "controle" ou "tipo selvagem" é preferivelmente um objeto, por exemplo, uma organela, uma célula, um tecido, uma planta, que são geneticamente idênticos à planta, tecido, célula, organela usados de acordo com o método da invenção exceto que as seqüências de ácido nucleico ou o produto de gene em questão é trocado, modulado ou modificado de acordo com o método inventivo.
Preferivelmente, qualquer comparação entre as plantas de controle e as plantas produzidas pelo método da invenção é realizada sob condições análogas. O termo "condições análogas" significa que todas as condições tais como condições de cultura ou crescimento, condições de ensaio (tais como composição de tampão, temperatura, substratos, cepa de patógeno, concentrações e outras) são mantidas idênticas entre os experimentos a serem comparados.
Qualquer referência a seguir a uma "proteína útil nos métodos da invenção" é considerada significar um polipeptídeo de SYT como aqui definido. Qualquer referência a seguir a um "ácido nucleico útil nos métodos da invenção" é considerado significar um ácido nucleico capaz de codificar um tal polipeptídeo de SYT. O ácido nucleico a ser introduzido em uma planta (e portanto útil na realização dos métodos da invenção) é qualquer ácido nucleico que codifica o tipo de proteína que será agora descrita, a seguir também denominada de "ácido nucleico SYT" ou "gene SYT".
O termo "seqüência" diz respeito aos polinucleotídeos, ácidos nucleicos, moléculas de ácido nucleico, peptídeos, polipeptídeos e proteínas, dependendo do contexto em que o termo "seqüência" é usado. Uma "seqüência codificadora" é uma seqüência de ácido nucleico, que é transcrita em mRNA e/ou traduzida em um polipeptídeo quando colocado sob o controle de seqüências reguladoras apropriadas. Os limites da seqüência codificadora são determinados por um códon de início de tradução no terminal 5' e um códon de parada de tradução no terminal 3'. Uma seqüência codificadora pode incluir, mas não é limitada a mRNA, cDNA, seqüências de ácido nucleico recombinantes ou DNA genômico, embora introns também possam estar presentes sob certas circunstâncias. Os termos "expressão" ou "expressão de gene" são como definidos acima. O termo "modulação" é definido acima e significa em relação à expressão ou expressão de gene, um aumento na expressão.
O termo "polipeptídeo de SYT" como aqui definido refere-se a um polipeptídeo que compreende do terminal N para o terminal C: (i) um domínio SNH tendo em ordem crescente de preferência pelo menos 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% de identidade de seqüência ao domínio SNH da SEQ ID NO: 58; e (ii) um domínio rico em Met; e (iii) um domínio rico em QG. Preferivelmente, o domínio SNH compreende os resíduos mostrados em preto na figura 6. Ainda preferivelmente, o domínio SNH é como representado pela SEQ ID NO: 57.
Adicionalmente, o polipeptídeo de SYT pode compreender um ou mais dos seguintes: (a) SEQ ID NO: 146; (b) SEQ ID NO: 147; e (c) um domínio rico em Met no terminal N precedendo o domínio SNH.
Um polipeptídeo de SYT é codificado por uma seqüência de ácido nucleico de SYT. Portanto o termo "seqüência de ácido nucleico de SYT" como aqui definido é qualquer seqüência de ácido nucleico que codifica um polipeptídeo de SYT como definido acima.
Os termos "motivo' e "domínio" são definidos na seção de definições. As bases de dados especialistas existem para a identificação de domínios, por exemplo, SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318), Prosite (Bucher e Bairoch (1994). A generalized profile syntax for biomoleculars sequences motifs and its fiinction in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conferenee on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp 53-61, AAAl Press, Menlo Park; Hulo et al., Nucl. Acids. Res. 32: D134-D137, (2004)) ou Pfam (Bateman et al., Nucleic Aeids Research 30(1): 276-280 (2002)). Um conjunto de ferramentas para a análise in silico de seqüências de proteína é disponível no servidor ExPASy proteomics (Swiss Institute of Bioinformatics (Gasteiger et al., ExPASy: the proteomics server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31: 3784- 3788 (2003)). Os domínios ou motivos também podem ser identificados usando técnicas de rotina, tais como pelo alinhamento de seqüência.
Os polipeptídeos de SYT podem ser facilmente identificados usando técnicas de rotina bem conhecido na técnica, tal como pelo alinhamento de seqüência. Métodos para o alinhamento de seqüências para comparação são bem conhecidos na técnica, tais métodos incluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o algoritmo de Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar o alinhamento de duas seqüências completas que maximiza o número de emparelhamentos e minimiza o número de intervalos. O algoritmo BLAST (Ferramenta de procura de Alinhamento Local Básico; Altschul et al. (1990) J Mol Biol 215: 403-10) calcula a identidade de seqüência percentual (%) e realiza uma análise estatística da similaridade entre as duas seqüências (valor Ε). A identidade percentual refere-se ao número de nucleotídeos idênticos (ou aminoácidos) entre as duas seqüências de ácido nucleico (ou polipeptídeo) comparadas em relação a um comprimento particular. Quanto mais alta a similaridade entre duas seqüências, mais baixo o valor E (ou em outras palavras mais baixa a chance de que o acerto fosse encontrado ao acaso). A computação do valor E é bem conhecida na técnica. O software para realizar a análise BLAST é publicamente disponível através do National Centre for Biotechnology Information. Os polipeptídeos de SYT que compreendem um domínio SNH tendo em ordem crescente de preferência pelo menos 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% de identidade de seqüência ao domínio SNH da SEQ ID NO: 58 podem ser identificados deste modo. Alternativamente, os polipeptídeos de SYT úteis nos métodos da presente invenção têm, em ordem crescente de preferência, pelo menos 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98% ou 99% de identidade de seqüência ao polipeptídeo da SEQ ID NO: 60. Edição manual menor pode ser realizada para otimizar o alinhamento entre motivos conservados, como estaria evidente a uma pessoa habilitada na técnica, em alguns casos, parâmetros de default podem ser ajustados para modificar a severidade da procura. Por exemplo usando BLAST, o limiar de significância estatística (chamado de valor "esperado") para relatar emparelhamentos contra seqüências de base de dados pode ser aumentado para mostrar emparelhamentos menos severos. Deste modo, emparelhamentos curtos quase exatos podem ser identificados. A presença da SEQ ID NO: 146 e da SEQ ID NO: 147 ambas compreendidas nos polipeptídeos de SYT úteis nos métodos da invenção podem ser identificados deste modo.
Além disso, a presença de um domínio rico em Met ou um domínio rico em QG também podem ser facilmente identificados. Como mostrado na figura 7, o domínio rico em Met e o domínio rico em QG seguem o domínio SNH. O domínio rico em QG pode ser considerado ser substancialmente o resto do terminal C do polipeptídeo (menos o domínio SHN); o domínio rico em Met é tipicamente compreendido dentro da primeira metade do rico em QG (do terminal N para o terminal C). A composição de aminoácido primária (em%) para determinar se um domínio de polipeptídeo é rico em aminoácidos específicos pode ser calculada usando programas de software do servidor ExPASy (Gasteiger E et ai. (2003) ExPASy: the proteomics server for in-depth protein knowledge and analysis. Nucleic Acids Res 31: 3784-3788), em particular a ferramenta ProtParam. A composição do polipeptídeo de interesse pode ser depois comparada com a composição de aminoácido média (em%) no banco de dados Swiss-Prot Protein Sequence (Tabela 5). Dentro deste banco de dados, o teor de Met (M) médio é de 2,37%, o teor de Gln (Q) médio é de 3,93% e o teor de Gly (G) médio é de 6,93% (Tabela 5). Como aqui definido, um domínio rico em Met ou um domínio rico em QG tem teor de Met (em%) ou um teor de Gln e Gly (em%) acima da composição de aminoácido média (em%) no banco de dados da Swiss-Prot Protein Sequence. Por exemplo na SEQ ID NO: 60, o domínio rico em Met no terminal N que precede o domínio SNH (das posições de aminoácido de 1 a 24) tem teor de Met de 20,8% e um domínio rico em QG (das posições de aminoácido de 71 a 200) tem um teor de Gln (Q) de 18,6% e um teor de Gly (G) de 21,4%. Preferivelmente, o domínio Met como aqui definido tem um teor de Met (em%) que é de pelo menos 1.25, 1,5, 1,75, 2,0, 2,25, 2,5, 2,75, 3,0, 3,25, 3,5, 3,75, 4,0, 4,25, 4,5, 4,75, 5,0, 5,25, 5,0, 5,75, 6,0, 6,25, 6,5, 6,75, 7,0, 7,25, 7,5, 7,75, 8,0, 8,25, 8,5, 8,75, 9,0, 9,25, 9,5, 9,75, 10 ou mais como a composição de aminoácido média (em%) do dito tipo de seqüências de proteína, que são incluídas no banco de dados Swiss- Prot Protein Sequence. Preferivelmente, o domínio rico em QG como aqui definido tem um teor de Gln (Q) e/ou um teor de Gly (G) que é de pelo menos 1,25, 1,5, 1,75, 2,0, 2,25, 2,5, 2,75, 3,0, 3,25, 3,5, 3,75, 4,0, 4,25, 4,5, 4,75, 5,0, 5,25, 5,0, 5,75, 6,0, 6,25, 6,5, 6,75, 7,0, 7,25, 7,5, 7,75, 8,0, 8,25, 8,5, 8,75, 9,0, 9,25, 9,5, 9,75, 10 ou mais tanto quanto a composição de aminoácido média (em%) do dito tipo de seqüências de proteína, que são incluídas no banco de dados Swiss-Prot Protein Sequence. Tabela 5: Composição de Aminoácido Média (%) de Proteínas no banco de dados SWISS PROT Protein Sequence (Julho 2004):
Resíduo % Resíduo % A = Ala 7,80 M = Met 2,37 C = Cys 1,57 N = Asn 4,22 D = Asp 5,30 P = Pro 4,85 E = Glu 6,59 Q = Gln 3,93 F = Phe 4,02 R = Arg 5,29 G = Gly 6,93 S = Ser 6,89 H = His 2,27 T = Thr 5,46 I = Ile 5,91 V = Val 6,69 K = Lys 5,93 W = Trp 1,16 L = Leu 9,62 Y = Tyr 3,09
Os exemplos de polipeptídeo de SYT incluem (codificado pela seqüência de polinucleotídeo número de acesso em parênteses; ver também a Tabela 6 e mencionado no protocolo de seqüência): Arabidopsis thaliana ArathS YTl (AY102639.1) SEQ ID NO: 60, Arabidopsis thaliana Arath_SYT2 (AY 102640.1) SEQ ID NO: 62, Arabidopsis thaliana Arath_SYT3 (AY102641.1) SEQ ID NO: 64, Aspergillus officinalis Aspof SYT (CV287542) SEQ ID NO: 66, Brassica napus Brana_SYT (CD823592) SEQ ID NO: 68, Citrus sinensis Citsi SYT (CB290588) SEQ ID NO: 70 Gossypium arboreum Gosar SYT (BM359324) SEQ ID NO: 72, Medieago truneulata MedtrSYT (CA858507.1) SEQ ID NO: 74, Oryza sativa Orysa SYTl (AK058575) SEQ ID NO: 76, Oryza sativa Orysa_SYT2 (AK105366) SEQ ID NO: 78, Oryza sativa Orysa_SYT3 (BP185008) SEQ ID NO: 80, Solanum tuberosum Soltu SYT (BG590990) SEQ ID NO: 82, Zea mays Zeama SYTl (BG874129.1, CA409022.1) SEQ ID NO: 84, Zea mays Zeama_SYT2 (AY106697) SEQ ID NO: 86, Homo sapiens Homsa SYT (CAG46900) SEQ ID NO: 88, Allium cepa AlIce_SYT2 (CF437485) SEQ ID NO: 90, Aquilegia formosa χ Aquilegia pubescens Aqufo_SYTl (DT758802) SEQ ID NO: 92, Brachypodium distaehyon Bradi_SYT3 (DV480064) SEQ ID NO: 94, Brassica napus Brana_SYT2 (CN732814) SEQ ID NO: 96, Citrus sinensis Citsi_SYT2 (CV717501) SEQ ID NO: 98, Euphorbia esula Eupes_SYT2 (DV144834) SEQ ID NO: 100, Glicina max Glima_SYT2 (BQ612648) SEQ ID NO: 102, Glicina soja Gliso_SYT2 (CA799921) SEQ ID NO: 104, Gossypium hirsutum GoshiSYTl (DT558852) SEQ ID NO: 106, Gossypium hirsutum Goshi_SYT2 (DT563805) SEQ ID NO: 108, Hordeum vulgare Horvu_SYT2 (CA032350) SEQ ID NO: 110, Laetuea serriola Lacse_SYT2 (DWl 10765) SEQ ID NO: 112, Lycopersicon eseulentum Lyces_SYTl (AW934450, BP893155) SEQ ID NO: 114, Malus domestica Maldo_SYT2 (CV084230, DR997566) SEQ ID NO: 116, Medieago truneulata MedtrSYT2 (CA858743, B1310799, AL382135) SEQ ID NO: 118, Panieum virgatum Panvi_SYT3 (DN152517) SEQ ID NO: 120, Pieea sitehensis Picsi_SYTl (DR484100, DR478464) SEQ ID NO: 122, Pinus taeda Pinta SYTl (DT625916) SEQ ID NO: 124, Populus tremula Poptr SYTl (DT476906) SEQ ID NO: 126, Saeeharum officinarum Sacof SYTl (CA078249, CA078630, CA082679, CA234526, CA239244, CA083312) SEQ ID NO: 128, Saeeharum offieinarum. Sacof_SYT2 (CAI 10367) SEQ ID NO: 130, Saeeharum offieinarum Sacof SYT3 (CAI61933, CA265085) SEQ ID NO: 132, Solanum tuberosum Soltu_SYTl (CK265597) SEQ ID NO: 134, Sorgo bieolor Sorbi_SYT3 (CX611128) SEQ ID NO: 136, Tritieum aestivum Triae_SYT2 (CD901951) SEQ ID NO: 138, Tritieum aestivum Triae_SYT3 (BJ246754, BJ252709) SEQ ID NO: 140, Vitis vinifera Vitvi_SYTl (DV219834) SEQ ID NO: 142, Zea mays Zeama_SYT3 (00468901) SEQ ID NO: 144, Brassiea napus Brana SYT SEQ ID NO: 151, Glieina max Glima SYT SEQ ID NO: 153.
Tabela 6: Exemplos de seqüências de ácido nucleico que codificam polipeptídeos de SYT
Nome Número de acesso de nucleotídeo NCBI Seqüência de Ácido Nucleico SEQ ID NO Polipeptideo Traduzido SEQ ID NO Fonte Arath SYTl AY 102639.1 59 60 Arabidopsis thaliana Arath SYT2 AY 102640.1 61 62 Arabidopsis thaliana Arath SYT3 AY102641.1 63 64 Arabidopsis thaliana Aspof SYTl CV287542 65 66 Aspergillus officinalis Brana SYTl CD823592 67 68 Brassica napus Citsi SYTl CB290588 69 70 Citrus sinensis Gosar SYTl BM359324 71 72 Gossypium arboreum Medtr SYTl CA858507.1 73 74 Medicago trunculata Orysa SYTl AK058575 75 76 Oryza sativa Orysa SYT2 AK105366 77 78 Oryza sativa Orysa SYT3 B P185008 79 80 Oryza sativa Soltu SYT2 BG590990 81 82 Solanum tuberosum ZeamaS YTl BG874129.1 CA409022.1* 83 84 Zea mays Zeama SYT2 AY106697 85 86 Zea mays Homsa SYT CR542103 87 88 Homo sapiens AIIce SYT2 CF437485 89 90 Allium cepa AqufoS YTl DT758802.1 91 92 Aquilegia formosa χ Aquilegia pubescens Brad i_SYT3 DV480064.1 93 94 Brachypodium distachyon Brana SYT2 CN732814 95 96 Brassica napa Citsi SYT2 CV717501 97 98 Citrus sinensis Eupes SYT2 DV144834 99 100 Euphorbia esula Glima SYT2 BQ612648 101 102 Glieina max Gliso SYT2 CA799921 103 104 Glieina soja Goshi SYTl DT558852 105 106 Gossypium hirsutum Goshi SYT2 DT563805 107 108 Gossypium hirsutum Horvu SYT2 CA032350 109 110 Hordeum vulgare Lacse SYT2 DWl 10765 111 112 Laetuea serriola LycesS YTl AW934450.1 BP893155.1* 113 114 Lyeopersieon eseulentum Maldo_SYT2 CV084230 DR997566* 115 116 Malus domestica Medtr_SYT2 CA858743 BI310799.1 AL382135.1* 117 118 Medicago trunculata Panvi SYT3 DN152517 119 120 Panicum virgatum PicsiS YTl DR484100 DR478464.1 121 122 Picea sitchensis Pinta SYTl DT625916 123 124 Pinus taeda Poptr SYTl DT476906 125 126 Populus tremula SaeofS YTl CA078249.1 CA078630 CA082679 CA234526 CA239244 CA083312* 127 128 Saccharum officinarum Saeof SYT2 CAl 10367 129 130 Saccharum officinarum Sacof_SYT3 CAl 61933.1 CA265085* 131 132 Saccharum officinarum Soltu SYTl CK265597 133 134 Solanum tuberosum Sorbi SYT3 CX611128 135 136 Sorgo bicolor Triae SYT2 CD901951 137 138 Triticum aestivum Triae_SYT3 BJ246754 BJ252709* 139 140 Triticum aestivum Vitvi SYTl DV219834 141 142 Vitis vinifera Zeama SYT3 30468901 143 144 Zea mays Brana SYT NA 150 151 Brassica napus Glima SYT NA 152 153 Glicina max
* Compilado dos acessos citados
NA: não disponíveis (patenteado)
Os exemplos de ácidos nucleicos que codificam polipeptídeos de SYT são dados na Tabela 6 acima. Tais ácidos nucleicos são úteis na realização dos métodos da invenção. As seqüências de aminoácido dados na Tabela 6 acima são seqüências de exemplo de ortólogos e parálogos do polipeptídeo de SYT representado pela SEQ ID NO: 58, os termos "ortólogos" e "parálogos" sendo como aqui definidos. Outros ortólogos e parálogos podem ser facilmente identificados pela realização de uma chamada de busca de blast recíproca. Tipicamente, isto envolve um primeiro BLAST envolvendo submeter a BLAST uma seqüência dúvida (por exemplo usando qualquer uma das seqüências listadas na Tabela 6 acima) contra qualquer base de dados de seqüência, tal como a base de dados da NCBI publicamente disponível. BLASTN ou TBLASTX (usando valores default padrão) são no geral usadas quando partindo de uma seqüência de nucleotídeo e BLASTP ou TBLASTN (usando valores default padrão) quando partindo de uma seqüência de proteína. Os resultados de BLAST podem ser opcionalmente filtrados. As seqüências de tamanho natural de cada um dos resultados filtrados ou resultados não filtrados são depois novamente submetidos a BLAST (segundo BLAST) contra seqüências do organismo a partir do qual a seqüência dúvida é derivado (onde a seqüência dúvida é a SEQ ID NO: 59 ou SEQ ID NO: 60, o segundo BLAST portanto seria contra seqüências de Arabidopsis). Os resultados do primeiro e segundo BLASTs são depois comparados. Um parálogo é identificado se um acerto de alta classificação do primeiro blast é da mesma espécie como da qual a seqüência dúvida é derivada, um BLAST de volta depois idealmente resulta na seqüência dúvida entre os acertos mais altos; um ortólogo é identificado se um acerto de alta classificação no primeiro BLAST não é da mesma espécie como da qual a seqüência dúvida é derivada e preferivelmente resulta no BLAST de volta na seqüência dúvida estando entre os acertos mais altos.
Os acertos de alta classificação são aqueles tendo um valor E baixo. Quanto mais baixo o valor E, mais significante a contagem (ou em outras palavras mais baixa a chance de que o acerto fosse encontrado ao acaso). A computação dos valores E é bem conhecida na técnica, além dos valores E, as comparações também são contadas pela identidade percentual. A identidade percentual refere-se ao número de nucleotídeos idênticos (ou aminoácidos) entre as duas seqüências de ácido nucleico (ou polipeptídeo) comparadas em um comprimento particular. No caso de famílias grandes, ClustalW pode ser usado, seguido por uma árvore de união de vizinhos, para ajudar a visualizar a formação de grupo de genes relacionadas e para identificar ortólogos e parálogos.
Deve ser entendido que as seqüências que caem sob a definição de um "polipeptídeo de SYT" não devem ser limitados aos polipeptídeos dados na Tabela 6 (e mencionados no protocolo de seqüência), mas que qualquer polipeptídeo que compreende do terminal N para o terminal C: (i) um domínio SNH tendo pelo menos 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% de identidade de seqüência ao domínio SNH da SEQ ID NO: 58; e (ii) um domínio rico em Met; e (iii) um domínio rico em QG pode ser adequado na realização dos métodos da invenção. Preferivelmente, o domínio SNH compreende os resíduos mostrados em preto na figura 6. Adicionalmente, o polipeptídeo de SYT pode compreender um ou mais dos seguintes: (a) SEQ ID NO: 146; (b) SEQ ID NO: 147; e (c) um domínio rico em Met no terminal N que precede o domínio SNH. O mais preferivelmente, o polipeptídeo de SYT é como representado pela SEQ ID NO: 60, SEQ ID NO: 151 ou SEQ ID NO: 153.
Um polipeptídeo de SYT tipicamente interage com polipeptídeos GRF (fator regulador de crescimento) em sistemas de híbrido duplo de levedura, os ensaios de interação de híbrido duplo de levedura são bem conhecido na técnica (ver Field et al., (1989) Nature 340 (6230): 245- 246). Por exemplo, o polipeptídeo de SYT como representado pela SEQ ID NO: 4 é capaz de influenciar com AtGRF5 e com AtGRF9.
Em uma outra forma de realização a invenção fornece uma seqüência de ácido nucleico isolada que compreende uma seqüência de ácido nucleico selecionada do grupo que consiste de:
(a) uma seqüência de ácido nucleico isolada como representada na SEQ ID NO: 150 e SEQ ID NO: 152;
(b) uma seqüência de ácido nucleico isolada que codifica o polipeptídeo como representada na SEQ ID NO: 151 e SEQ ID NO: 153;
(c) uma seqüência de ácido nucleico isolada cuja seqüência pode ser deduzida de um polipeptídeo como representado na SEQ ID NO: 151 e SEQ ID NO: 153 como um resultado da degenerescência do código genético;
(d) uma seqüência de ácido nucleico isolada que codifica um polipeptídeo que tem pelo menos 70% de identidade com o polipeptídeo codificado pela seqüência de ácido nucleico de (a) a (c);
(e) uma seqüência de ácido nucleico isolada que codifica um homólogo, derivado ou fragmento ativo do polipeptídeo como representado na SEQ ID NO: 151 e SEQ ID NO: 153, homólogo, derivado ou fragmento estes que são de origem vegetal e compreende vantajosamente de terminal N para o terminal C:
(i) um domínio SNH tendo em ordem crescente de preferência pelo menos 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% de identidade de seqüência com o domínio SNH da SEQ ID NO: 58;
(ii) um domínio rico em Met; (iii) um domínio rico em QG;
(f) uma seqüência de ácido nucleico isolada capaz de hibridizar com um ácido nucleico de (a) a (c) acima ou seu complemento, em que a seqüência hibridizadora ou o complemento deste codifica a proteína vegetal de (a) a (e);
por meio do qual a expressão da seqüência de ácido nucleico modificada aumenta o rendimento e/ou vigor inicial em plantas sob estresse abiótico comparado com as plantas de controle.
As seqüências de ácido nucleico que codificam polipeptídeos de SYT como dados na Tabela 6 ou ortólogos ou parálogos de qualquer uma das SEQ ID NOs anteriormente mencionadas não precisam ser seqüências de ácido nucleico de tamanho natural, visto que o desempenho dos métodos da invenção não contam com o uso de seqüências de ácido nucleico de tamanho natural.
As variantes de ácido nucleico SYT também podem ser
adequadas na prática dos métodos da invenção. As seqüências de ácido nucleico de SYT variantes tipicamente são aquelas tendo a mesma função como uma seqüência de ácido nucleico de SYT que ocorre naturalmente, que pode ser a mesma função biológica ou a função de aumentar o rendimento e/ou vigor inicial quando a expressão da seqüência de ácido nucleico é modulada em uma planta sob estresse abiótico em relação às plantas de controle. Tais variantes incluem porções de uma seqüência de ácido nucleico de SYT, variantes de junção de uma seqüência de ácido nucleico de SYT, variantes alélicas de uma seqüência de ácido nucleico de SYT, variantes de uma seqüência de ácido nucleico de SYT obtidas pelo embaralhamento de gene e/ou seqüências de ácido nucleico capazes de hibridizar com uma seqüência de ácido nucleico de SYT como definida abaixo. Preferivelmente, a variante de ácido nucleico é uma variante de uma seqüência de ácido nucleico como representada pela SEQ ID NO: 59, SEQ ID NO: 150 ou SEQ ID NO: 152. Os termos seqüência hibridizadora, variante de junção, variante alélica e embaralhamento de gene são como aqui descritos.
Ácidos nucleicos que codificam os polipeptídeos de SYT não precisam ser ácidos nucleicos de tamanho natural, visto que o desempenho dos métodos da invenção não contam com o uso de seqüências de ácido nucleico de tamanho natural. De acordo com a presente invenção, é fornecido um método para realçar o rendimento e/ou vigor inicial em plantas sob estresse abiótico, que compreende introduzir e expressar em uma planta uma porção de qualquer uma das seqüências de ácido nucleico dadas na Tabela 6 ou uma porção de um ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer um das seqüências de aminoácido dadas na Tabela 6.
O termo porção como aqui usado refere-se a um pedaço de DNA que codifica um polipeptídeo que compreende do terminal N para o terminal C: (i) um domínio SNH tendo em ordem crescente de preferência pelo menos 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% de identidade de seqüência com o domínio SNH da SEQ ID NO: 58 e (ii) um domínio rico em Met; e (iii) um domínio rico em QG. Uma porção pode ser preparada, por exemplo, fabricando-se uma ou mais deleções para uma seqüência de ácido nucleico de SYT. As porções podem ser usadas em formas isoladas ou elas podem ser fundidas a outras seqüências codificadoras (ou não codificadoras) de modo a, por exemplo, produzir um polipeptídeo que combine diversas atividades. Quando fundido a outras seqüências codificadoras, o polipeptídeo resultante produzido na tradução pode ser maior do que aquele prognosticado para o fragmento de SYT. Preferivelmente, a porção é uma porção de uma seqüência de ácido nucleico como representada por qualquer uma dada na Tabela 6 ou ortólogos ou parálogos de qualquer uma das SEQ ID NOs anteriormente mencionadas. Mais preferivelmente a porção é uma porção de uma seqüência de ácido nucleico como representado pela SEQ ID NO: 59, SEQ ID NO: 150 ou SEQ ID NO: 152.
Uma outra variante de uma seqüência de ácido nucleico de SYT é uma seqüência de ácido nucleico capaz de hibridizar sob condições de severidade reduzida, preferivelmente sob condições severas, com uma seqüência de ácido nucleico de SYT como mais acima definido, seqüência hibridizadora esta que codifica um polipeptídeo de SYT ou uma porção como definido acima.
De acordo com a presente invenção, é fornecido um método para realçar o rendimento e/ou vigor inicial em plantas sob estresse abiótico, que compreende introduzir e expressar em uma planta um ácido nucleico capaz de hibridizar a qualquer um dos ácidos nucleicos dados na Tabela 6 ou que compreende introduzir e expressar em uma planta um ácido nucleico capaz de hibridizar a um ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de ácido nucleico dadas na Tabela 6.
As seqüências hibridizadoras úteis nos métodos da invenção codificam um polipeptídeo de SYT que compreende do terminal N para o terminal C: (i) um domínio SNH tendo em ordem crescente de preferência pelo menos 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% de identidade de seqüência ao domínio de SNH da SEQ ID NO: 58 e (ii) um domínio rico em Met; e (iii) um domínio rico em QG. Preferivelmente, a seqüência hibridizadora é uma que é capaz de hibridizar a uma seqüência de ácido nucleico como dada na Tabela 6 ou ortólogos ou parálogos de qualquer uma das SEQ ID NOs anteriormente mencionadas ou a uma porção de qualquer uma das seqüências anteriormente mencionadas como definido acima. Mais preferivelmente a seqüência de hibridização é uma que é capaz de hibridizar a uma seqüência de ácido nucleico é como representada pela SEQ ID NO: 59, SEQ ID NO: 150, SEQ ID NO: 152 ou a porções (ou sondas) destas. Métodos para planejar sondas são bem conhecidos na técnica, as sondas são no geral menores do que 1000 pares de base no comprimento, preferivelmente menores do que 500 pares de base no comprimento. Habitualmente, os comprimentos de sonda para as hibridizações de DNA- DNA tais como Southern blotting, variam entre 100 e 500 pares de base, ao passo que a região de hibridização em sondas para as hibridizações de DNA- DNA tais como na amplificação pela PCR no geral são mais curtas do que 50 mas mais longas do que 10 nucleotídeos. A seqüência hibridizadora é tipicamente de pelo menos 100, 125, 150, 175, 200 ou 225 nucleotídeos no comprimento, preferivelmente pelo menos 250, 275, 300, 325, 350, 375, 400, 425, 450 ou 475 nucleotídeos no comprimento, mais preferivelmente no mínimo 500, 525, 550, 575, 600, 625, 650, 675, 700 ou 725 nucleotídeos no comprimento ou tão longos quanto um cDNA de SYT de tamanho natural.
Uma outra variante de ácido nucleico útil nos métodos da invenção é uma variante de junção que codifica um polipeptídeo de SYT como definido acima. As variantes de junção preferidas são variantes de junção das seqüências de ácido nucleico de SYT como dadas na Tabela 6 ou ortólogos ou parálogos de qualquer uma das SEQ ID Nos anteriormente mencionadas. Mais preferida é uma variante de junção de uma seqüência de ácido nucleico de SYT como representada pela SEQ ID NO: 59, SEQ ID NO: 150 ou SEQ ID NO: 152.
De acordo com a presente invenção, é fornecido um método para realçar o rendimento e/ou vigor inicial em plantas sob estresse abiótico, que compreende introduzir e expressar em uma planta uma variante de junção de qualquer uma das seqüências de ácido nucleico dadas na Tabela 6 ou uma variante de junção de um ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na Tabela 6.
Uma outra variante de ácido nucleico útil na realização dos métodos da invenção é uma variante alélica de um ácido nucleico que codifica um polipeptídeo de SYT como definido acima. Variantes alélicas existem na natureza e abrangido dentro dos métodos da presente invenção está o uso destes alelos naturais. As variantes alélicas preferidas são variantes alélicas das seqüências de ácido nucleico de SYT como dadas na Tabela 6 ou ortólogos ou parálogos de qualquer uma das SEQ ID Nos anteriormente mencionadas. Mais preferido é uma variante de junção de uma seqüência de ácido nucleico de SYT como representada pela SEQ ID NO: 59.
De acordo com a presente invenção, é fornecido um método para realçar o rendimento e/ou vigor inicial em plantas sob estresse abiótico, que compreende introduzir e expressar em uma planta uma variante alélica de qualquer um dos ácidos nucleicos dados na Tabela 6 ou que compreende introduzir e expressar em uma planta uma variante alélica de um ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na Tabela 6.
Uma outra variante de ácido nucleico útil nos métodos da invenção é uma variante de ácido nucleico que codifica um polipeptídeo de SYT obtido pelo embaralhamento de gene (ou evolução direta).
Uma outra variante de ácido nucleico útil nos métodos da invenção é uma variante de ácido nucleico que codifica um polipeptídeo de SYT obtido pela mutagênese direcionada ao sítio. A mutagênese direcionada ao sítio pode ser usada para gerar variantes de seqüências de ácido nucleico de SYT. Diversos métodos são disponíveis para se obter a mutagênese direcionada ao sítio, o mais comum sendo métodos com base em PCR (Current Protocols in Molecular Biology. Wiley Eds).
De acordo com a presente invenção, é fornecido um método para realçar o rendimento e/ou vigor inicial em plantas sob estresse abiótico, que compreende introduzir e expressar em uma planta uma variante de qualquer uma das seqüências de ácido nucleico dadas na Tabela 6 ou que compreende introduzir e expressar em uma planta uma variante de um ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na Tabela 6, ácido nucleico variante este que é obtido pelo embaralhamento de gene ou mutagênese direcionada ao sítio.
As seguintes variantes de ácido nucleico de SYT são exemplos de variantes adequadas na prática dos métodos da invenção:
(i) uma porção de uma seqüência de ácido nucleico de SYT;
(ii) uma seqüência de ácido nucleico capaz de hibridizar com uma seqüência de ácido nucleico de SYT;
(iii) uma variante de junção de uma seqüência de ácido nucleico de SYT;
(iv) uma variante alélica de uma seqüência de ácido nucleico
de SYT;
(v) uma seqüência de ácido nucleico de SYT obtida pelo
embaralhamento de gene;
(vi) uma seqüência de ácido nucleico de SYT obtida pela mutagênese direcionada ao sítio.
Também úteis nos métodos da invenção são ácidos nucleicos que codificam homólogos de polipeptídeos de SYT como dadas na Tabela 6 ou ortólogos ou parálogos de qualquer uma das SEQ ID NOs anteriormente mencionadas.
Também úteis nos métodos da invenção são ácidos nucleicos que codificam derivados de qualquer uma das seqüências de ácido nucleico de SYT como dadas na Tabela 6 ou ortólogos ou parálogos de qualquer uma das SEQ ID Nos anteriormente mencionadas. Derivados de ortólogos ou parálogos de qualquer uma das SEQ ID NOs anteriormente mencionado são outros exemplos que podem ser adequados para o uso nos métodos da invenção. As seqüências de ácido nucleico de SYT podem ser derivadas de qualquer fonte artificial ou fonte natural, tais como plantas, algas, fungos ou animais. A seqüência de ácido nucleico pode ser modificada a partir da sua forma nativa em composição e/ou ambiente genômico através da manipulação humana deliberada. Preferivelmente a seqüência de ácido nucleico que codifica um polipeptídeo de SYT é de origem vegetal. A seqüência de ácido nucleico pode ser isolado de uma espécies dicotiledônea, preferivelmente da família Brassicaceae, mais preferivelmente da Arabidopsis thaliana ou Brassica napus. Alternativamente, a seqüência de ácido nucleico pode ser isolada da família Fabaceae, preferivelmente da Glicina max. Mais preferivelmente, a seqüência de ácido nucleico de SYT isolada de:
(a) Arabidopsis thaliana é como representada pela SEQ ID NO: 59 e o polipeptídeo de SYT como representado pela SEQ ID NO: 60;
(b) Brassica napus é como representada pela SEQ ID NO: 150 e o polipeptídeo de SYT como representado pela SEQ ID NO: 151;
(c) Glieina max é como representada pela SEQ ID NO: 152 e o polipeptídeo de SYT como representado pela SEQ ID NO: 153.
Os termos "rendimento", "rendimento de semente" e "vigor inicial" são definidos acima. Os termos "aumentado", "melhorado", "realçado", "amplificado", "prolongado" ou "elevado" são intercambiáveis e são definidos acima. Tomando-se o milho como um exemplo, um aumento de rendimento pode ser manifestado como um ou mais dos seguintes: aumento no número de plantas por metro quadrado, um aumento no número de espigas por planta, um aumento no número de carreiras, número de grãos por carreira, peso do grão, peso de mil grãos, comprimento/diâmetro da espiga, aumento na taxa de enchimento da semente (que é o número de sementes cheias dividido pelo número total de sementes e multiplicado por 100), entre outras. Tomando-se arroz como um exemplo, um aumento de rendimento pode ser manifestado por um aumento em um ou mais dos seguintes: número de plantas por metro quadrado, número de panículas por planta, número de espiguetas por panícula, número de flores (flósculos) por panícula (que é expressado como uma razão do número de sementes cheias em relação ao número de panículas primárias), aumento na taxa de enchimento da semente (que é o número de sementes cheias dividido pelo número total de sementes e multiplicado por 100), aumento no peso de mil grãos, entre outros.
Um aumento no rendimento também pode resultar em arquitetura modificada ou pode ocorrer como um resultado da arquitetura modificada.
De acordo com uma característica preferida, o desempenho dos métodos da invenção resulta em plantas tendo biomassa aumentada, rendimento de semente aumentado e/ou vigor inicial sob estresse abiótico em relação às plantas de controle. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar a biomassa, rendimento de semente e/ou vigor inicial em uma planta sob estresse abiótico em relação às plantas de controle, método este que compreende modular a expressão em uma planta de uma seqüência de ácido nucleico que codifica um polipeptídeo de SYT. Preferivelmente, por aumentar a biomassa é aqui considerado significar a parte acima do solo (ou biomassa folhosa) durante o desenvolvimento da planta e na maturidade. Preferivelmente, pelo rendimento de semente aumentado é aqui considerado significar qualquer um dos seguintes: rendimento de semente total, número de sementes cheias, taxa de enchimento de semente, TKW e índice de colheita.
Visto que as plantas transgênicas de acordo com a presente invenção têm rendimento aumentado sob estresse abiótico, é provável que estas plantas exibam uma taxa de crescimento aumentada sob estresse abiótico (durante pelo menos parte do seu ciclo de vida, por exemplo no estágio de muda para vigor inicial), em relação às taxas de crescimento de plantas de controle em um estágio correspondente em seu ciclo de vida. A taxa de crescimento aumentada pode ser específica a uma ou mais partes de uma planta (incluindo sementes) ou pode ser por toda a parte da planta substancialmente inteira. O aumento na taxa de crescimento pode ocorrer em um ou mais estágios no ciclo de vida de uma planta ou durante substancialmente o ciclo de vida inteiro da planta. A taxa de crescimento aumentada durante os estágios iniciais no ciclo de vida de uma planta pode refletir vigor realçado. O aumento na taxa de crescimento pode alterar o ciclo de colheita de uma planta possibilitando que as plantas sejam semeadas mais tarde e/ou colhidas mais cedo do que de outro modo seria possível. Se a taxa de crescimento é suficientemente aumentada, a mesma pode possibilitar a semeadura adicional de sementes da mesma espécie de planta (por exemplo semeadura e colheita de plantas de arroz seguidas pela semeadura e colheita de mais plantas de arroz todas dentro de um período de crescimento convencional). Similarmente, se a taxa de crescimento é suficientemente aumentada, a mesma pode possibilitar a semeadura adicional de sementes de espécies de plantas diferentes (por exemplo o plantio e colheita de plantas de milho seguido, por exemplo, pelo plantio e colheita opcional de soja, batata ou qualquer outra planta adequada). Os tempos adicionais de colheita do mesmo rizoma no caso de algumas plantas de safra também podem ser possíveis. Alterar o ciclo de colheita de uma planta pode levar a um aumento na produção de biomassa anual por metro quadrado (devido a um aumento no número de vezes (digamos em um ano) que qualquer planta particular pode ser cultivada e colhida). Um aumento na taxa de crescimento também pode possibilitar o cultivo de plantas transgênicas em uma área geográfica mais ampla do que as suas contrapartes do tipo selvagem, visto que as limitações territoriais para o cultivo de uma safra são freqüentemente determinadas pelas condições ambientais adversas no tempo de plantio (estação inicial) ou no tempo de colheita (estação tardia). Tais condições adversas podem ser evitadas se o ciclo de colheita for encurtado. A taxa de crescimento pode ser determinada pela derivatização de vários parâmetros a partir de curvas de crescimento, tais parâmetros podem ser: T-Mid (o tempo levado pelas plantas para atingir 50% do seu tamanho máximo) e T-90 (tempo levado pelas plantas para atingir 90% do seu tamanho máximo), entre outras. A taxa de crescimento de plantas é medida sob estresse abiótico tal como estresse salino; estresse de água (seca ou água em excesso); o estresse da disponibilidade de nutriente reduzida; estresses de temperatura causadas pelas temperaturas quentes ou frias/congelantes atípicas; estresse oxidativo; estresse metálico; estresse por toxicidade química; ou combinações destes. O desempenho dos métodos da invenção dá plantas tendo uma
taxa de crescimento aumentada sob estresse abiótico em relação às plantas de controle. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar a taxa de crescimento em plantas sob estresse abiótico em relação às plantas de controle, método este que compreende modular a expressão em uma planta de uma seqüência de ácido nucleico que codifica um polipeptídeo de SYT.
Plantas tipicamente respondem à exposição ao estresse pelo crescimento mais lento. Em condições de estresse severo, a planta pode mesmo interromper crescimento completamente. O estresse brando no sentido da invenção leva a uma redução no crescimento das plantas estressadas de menos do que 40%, 35% ou 30%, preferivelmente menor do que 25%, 20% ou 15%, mais preferivelmente menor do que 14%, 13%, 12%, 11% ou 10% ou menos em comparação com a planta de controle sob condições não estressantes. Devido aos avanços nas práticas agrícolas (irrigação, fertilização, tratamentos com pesticida) estresses severos não são freqüentemente encontrados em plantas de safra cultivadas. Como uma conseqüência, o crescimento comprometido induzido pelo estresse brando é freqüentemente uma característica indesejável para agricultura. Os estresses brandos são os estresses típicos aos quais uma planta pode ser exposta. Estes estresses podem ser os estresses bióticos e/ou abióticos (ambientais) diários aos quais uma planta é exposta. Os estresses bióticos são tipicamente aqueles estresses causados pelos patógenos, tais como bactérias, vírus, fungos, nematóides e insetos. Os estresses abióticos ou ambientais típicos compreendem qualquer um ou mais de: estresse salino, estresse da água (seca ou água em excesso), o estresse da disponibilidade de nutriente reduzida, estresses de temperatura causados pelas temperaturas quentes ou frias/congelantes atípicas, estresse oxidativo, estresse metálico ou estresse pela toxicidade química. O desempenho dos métodos de acordo com a presente
invenção resulta em plantas tendo rendimento aumentado e/ou vigor inicial sob estresse abiótico em relação às plantas de controle. Como relatadas em Wang et ai., (Plant (2003) 218: 1-14), estresse abiótico leva a uma série de mudanças morfológicas, fisiológicas, bioquímicas e moleculares que adversamente afetam o crescimento e produtividade da planta. Seca, salinidade, temperaturas extremas e estresse oxidativo são freqüentemente interconectadas e podem induzir o crescimento e dano celular através de mecanismos similares. Por exemplo, seca e/ou salinização são manifestadas primariamente como estresse osmótico, resultando no rompimento da homeostase e distribuição iônica na célula. Estresse oxidativo, que freqüentemente acompanha a temperatura alta ou baixa, salinidade ou estresse pela seca, podem causar desnaturação de proteínas funcionais e estruturais. A disponibilidade de nutriente reduzida, em particular disponibilidade de nitrogênio reduzida, é um fator limitante principal para o crescimento da planta, por exemplo através da disponibilidade reduzida de aminoácidos para a síntese de proteína. Como uma conseqüência, estes diversos estresses ambientais freqüentemente ativam caminhos de sinalização de célula similares e respostas celulares, tais como a produção de proteínas de estresse, super-regulagem de anti-oxidantes, acúmulo de solutos compatíveis e parada no crescimento.
Visto que diversos estresses ambientais ativam caminhos similares, a exemplificação da presente invenção com estresse salino não deve ser encarada como uma limitação ao estresse salino, mas mais como uma triagem para indicar o envolvimento de polipeptídeos de SYT nos estresses abióticos no geral. Uma revisão em TRENDS in Plant Science (Jian-Kang Zhu, Vol. 6, No. 2, Fev. 2001) confirma que as plantas transgênicas realizam melhor sob estresse salino freqüentemente também realizam melhor sob outros estresses incluindo frio, congelamento, calor e seca. Um grau particularmente alto de "conversa cruzada" está relacionado entre estresse pela seca e estresse de salinidade alta (Rabbani et ai, Plant Physiology, Dezembro de 2003, Vol. 133, pp. 1755-1767). Portanto, estaria evidente que um polipeptídeo de SYT (como aqui definido), junto com a sua utilidade no aumento do rendimento e/ou vigor inicial em plantas sob estresse salino, também encontraria uso no aumento do rendimento e/ou vigor inicial da planta sob vários outros estresses abióticos.
O termo "estresse abiótico" como aqui definido é considerado significar qualquer um ou mais de: estresse salino, estresse pela água (seca ou água em excesso), o estresse da disponibilidade de nutriente reduzida, estresses de temperatura causados pelas temperaturas quentes ou frias/congelantes atípicas, estresse oxidativo, estresse de metal ou estresse pela toxicidade química. O termo estresse salino não é restrito ao sal comum (NaCl), mas pode ser qualquer um ou mais de: NaCl, KCl, LiCl, MgCl2, CaCl2, entre outros.
O desempenho dos métodos da invenção dá plantas tendo
rendimento aumentado e/ou vigor inicial sob estresse abiótico em relação às plantas de controle. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar o rendimento e/ou vigor inicial da planta sob estresse abiótico em relação às plantas de controle, método este que compreende modular a expressão em uma planta de uma seqüência de ácido nucleico que codifica um polipeptídeo de SYT. Por estresse abiótico é considerado significar qualquer um ou mais de: estresse salino, estresse pela água (seca ou água em excesso), o estresse da disponibilidade de nutriente reduzida, estresses de temperatura causados pelas temperaturas quentes ou frias/congelantes atípicas, estresse oxidativo, estresse de metal ou estresse pela toxicidade química.
Os métodos da invenção são vantajosamente aplicáveis a qualquer planta. Plantas que são particularmente úteis nos métodos da invenção incluem todas as plantas que pertencem à superfamília Viridiplantae, em particular plantas monocotiledôneas e dicotiledôneas incluindo forragem ou legumes forrageiros, plantas ornamentais, safras alimentícias, árvores ou arbustos. De acordo com uma forma de realização preferida da presente invenção, a planta é uma planta de cultivo. Exemplos de plantas de safra incluem soja, girassol, canola, alfafa, colza, algodão, tomate, batata e tabaco. Mais preferivelmente, a planta é uma planta monocotiledônea. Os exemplos de plantas monocotiledôneas incluem cana de açúcar. Mais preferivelmente a planta é um cereal. Os exemplos de cereais incluem arroz, milho, trigo, cevada, painço, centeio, triticale, sorgo e aveia.
Um método preferido para introduzir uma modificação genética é introduzir e expressar em uma planta uma seqüência de ácido nucleico que codifica um polipeptídeo de SYT. Um polipeptídeo de SYT é definido como um polipeptídeo que compreende do terminal N para o terminal C: (i) um domínio SNH tendo em ordem crescente de preferência pelo menos 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% de identidade de seqüência com o domínio SNH da SEQ ID NO: 58; e (ii) um domínio rico em Met; e (iii) um domínio rico em QG. Preferivelmente, o domínio SNH compreende os resíduos mostrados em preto na figura 6. Mais preferivelmente, o domínio SNH é representado pela SEQ ID NO: 57.
De acordo com um aspecto preferido da presente invenção, a expressão modulada de uma seqüência de ácido nucleico de SYT é a expressão aumentada. O aumento na expressão pode levar aos níveis de mRNA ou polipeptídeo de SYT elevados, que eqüivaleria à atividade do polipeptídeo de SYT elevada; ou a atividade também pode ser elevada quando não existir nenhuma mudança nos níveis de polipeptídeo ou mesmo quando hpuver uma redução nos níveis de polipeptídeo. Isto pode ocorrer quando as propriedades intrínsecas do polipeptídeo de SYT são alteradas, por exemplo, fabricando-se versões mutantes que são mais ativas que o polipeptídeo do tipo selvagem. Métodos para aumentar ou reduzir a expressão de genes ou produtos de gene são conhecidos na técnica.
A invenção também fornece construções genéticas e vetores para facilitar a introdução e/ou expressão das seqüências de nucleotídeo úteis nos métodos de acordo com a invenção.
Portanto, é fornecida uma construção genética que
compreende:
(i) Uma seqüência de ácido nucleico que codifica um polipeptídeo de SYT, como definido acima ou uma seqüência de ácido
nucleico como representada pela SEQ ID NO: 150 ou SEQ ID NO: 152;
(ii) Uma ou mais seqüências de controle capazes de direcionar a expressão da seqüência de ácido nucleico de (i); e opcionalmente
(iii) Uma seqüência de terminação de transcrição.
Uma construção preferida é uma onde a seqüência de controle é um promotor derivado de uma planta, preferivelmente de uma planta monocotiledônea se uma monocotiledônea deva ser transformada.
As construções úteis nos métodos de acordo com a presente invenção podem ser construídas usando a tecnologia de DNA recombinante bem conhecida pelas pessoas habilitadas na técnica. As construções genéticas podem ser inseridas em vetores, que podem ser comercialmente disponíveis, adequadas para transformar em plantas e adequadas para a expressão do gene de interesse nas células transformadas. A invenção portanto fornece o uso de uma construção genética como definida acima nos métodos da invenção.
As plantas são transformadas com um vetor que compreende a
seqüência de interesse (isto é, uma seqüência de ácido nucleico que codifica um polipeptídeo de SYT). A seqüência de interesse é operavelmente ligada a uma ou mais seqüências de controle (pelo menos a um promotor).
Vantajosamente, qualquer tipo de promotor pode ser usado para direcionar a expressão da seqüência de ácido nucleico.
Os promotores úteis são promotores constitutivos (Benfey et al., EMBO J. 8 (1989) 2195-2202), tais como aqueles que se originam de vírus vegetais, tais como 35S CAMV (Franck et al., Cell 21 (1980) 285-294), 19S CaMV (ver também US 5352605 e WO 84/02913), 34S FMV (Sanger et al., Plant. Mol. Biol., 14, 1990: 433-443), o promotor da ubiquitina da salsa ou promotores vegetais tais como o promotor da subunidade pequena de Rubisco descrito na US 4.962.028 ou os promotores vegetais PRPl [Ward et al., Plant. Mol. Biol. 22 (1993)], SSU, PGEL1, OCS [Leisner (1988) Proc Natl Acad Sci USA 85(5): 2553-2557], lib4, usp, mas [Cornai (1990) Plant Mol Biol 15 (3): 373-381], STLS1, ScBV (Schenk (1999) Plant Mol Biol 39(6): 1221-1230), B33, SADl ou SAD2 (promotores do linho, Jain et al., Crop Science, 39 (6), 1999: 1696-1701) ou nos [Shaw et al. (1984) Nucleic Acids Res. 12(20): 7831-7846]. Outros exemplos de promotores constitutivos vegetais são os promotores da V-ATPase da beterraba açucareira (WO 01/14572). Os exemplos de promotores constitutivos sintéticos são o Super promotor (WO 95/14098) e promotores derivados de caixas G (WO 94/12015). Se apropriado, promotores indutíveis químicos além disso também podem ser usados, comparar a EP-A 388186, EP-A 335528, WO 97/06268. A expressão estável, constitutiva dos polipeptídeos de acordo com a invenção em uma planta pode ser vantajosa. Entretanto, a expressão indutível do polipeptídeo da invenção é vantajosa, se uma expressão tardia antes da colheita for de vantagem, visto que a manipulação metabólica pode levar ao retardo no crescimento da planta.
A expressão de genes vegetais também pode ser facilitada por intermédio de um promotor indutível químico (para uma revisão, ver Gatz 1997, Annu. Rev. Plant Physiol. Plant Mol. Biol., 48: 89-108). Os promotores quimicamente indutíveis são particularmente adequados quando é desejado expressar o gene em uma maneira específica de tempo. Os exemplos de tais promotores são um promotor indutível pelo ácido salicílico (WO 95/19443) e promotor indutível pelo ácido abscíssico (EP 335 528), um promotor indutível pela tetraciclina (Gatz et al. (1992) Plant J. 2, 397-404), um promotor indutível pelo ciclo-hexanol ou etanol (WO 93/21334) ou outros como aqui descritos.
Outros promotores adequados são aqueles que reagem ao estresse biótico ou abiótico, por exemplo o promotor de gene PRPl induzido por patógeno (Ward et al., Plant. Mol. Biol. 22 (1993) 361-366), o promotor de hsp80 do tomate induzido pelo calor (US 5.187.267), o promotor da alfa- amilase da batata indutível pelo frio (WO 96/12814) ou o promotor de pinll indutível por ferimento (EP-A-O 375 091) ou outros como aqui descritos.
Os promotores preferidos são em particular aqueles que causam a expressão de gene em tecidos e órgãos, em células de semente, tais como células do endosperma e células do embrião em desenvolvimento. Os promotores adequados são o promotor do gene napin da colza (US 5.608.152), o promotor USP de Vicia faba (Baeumlein et al., Mol Gen Genet, 1991, 225 (3): 459-67), o promotor da oleosina de Arabidopsis (WO 98/45461), o promotor da faseolina de Faseolus vulgaris (US 5.504.200), o promotor Bce4 de Brassica (WO 91/13980), o promotor ares de feijão, o promotor DcG3 da cenoura ou o promotor B4 de Legumina (LeB4; Baeumlein et ai, 1992, Plant Journal, 2 (2): 233-9) e promotores que realizam a expressão específica de semente em plantas monocotiledôneas tais como milho, cevada, trigo, centeio, arroz e outros. Os promotores específicos de semente vantajosos são o promotor da proteína de ligação da sacarose (WO 00/26388), o promotor da faseolina e o promotor de napin. Os promotores adequados que devem ser considerados são o promotor dos genes Ipt2 ou Iptl da cevada (WO 95/15389 e WO 95/23230) e os promotores descritos na WO 99/16890 (promotores do gene da ordeína da cevada, do gene da glutelina do arroz, do gene da orizina do arroz, do gene da prolamina do arroz, do gene da gliadina do trigo, do gene da glutelina do trigo, do gene da zeína do milho, do gene da glutelina da aveia, do gene da casirina do sorgo e o gene da secalina do centeio). Outros promotores adequados são Amy32b, Amy6-6 e Aleurain [US 5.677.474], Bce4 (colza) [US 5.530.149], glicinina (soja) [EP 571 741], fosfoenolpiruvato carboxilase (soja) [JP 06/62870], ADRl2- 2 (soja) [WO 98/08962], isocitrato liase (colza) [US 5.689.040] ou oc-amilase (cevada) [EP 781 849]. Outros promotores que são disponíveis para a expressão de genes em plantas são promotores específicos de folha tais como aqueles descritos em DE-A 19644478 ou promotores regulados por luz tais como, por exemplo, o promotor petE da ervilha. Outros promotores vegetais adequados são o promotor FBPase
citossólico ou o promotor ST-LSI da batata (Stockhaus et ai, EMBO J. 8, 1989, 2445), o promotor da fosforribosilpirofosfato amidotransferase da Glicina max (Acesso no GenBank N- U87999) ou o promotor específico de nodo descrito na EP-A-O 249 676. Em uma forma de realização, a seqüência de ácido nucleico de
SYT é operavelmente ligada a um promotor constitutivo. Um promotor constitutivo é transcricionalmente ativo durante a maior parte, mas não necessariamente todas, as fases do seu crescimento e desenvolvimento e é expressado de modo substancialmente ubíquo. Preferivelmente o promotor é derivado de uma planta, mais preferivelmente o promotor é de uma planta monocotiledônea se uma planta monocotiledônea seja transformada. Mais preferivelmente, o promotor constitutivo é um promotor GOS2 que é representado por uma seqüência de ácido nucleico substancialmente similar à SEQ ID NO: 145 ou SEQ ID NO: 56. O mais preferivelmente o promotor GOS2 é como representado pela SEQ ID NO: 56 ou SEQ ID NO: 145. Deve estar claro que a aplicabilidade da presente invenção não é restrita à seqüência de ácido nucleico SYT representada pela SEQ ID NO: 59, nem é a aplicabilidade da invenção restrita à expressão de uma seqüência de ácido nucleico de SYT quando direcionada por um promotor GOS2. Os exemplos de outros promotores constitutivos que também podem ser usados para direcionar a expressão de uma seqüência de ácido nucleico de SYT são mostrados na seção de definição.
Opcionalmente, uma ou mais seqüências terminadoras podem ser usadas na construção introduzida em uma planta. Os elementos reguladores adicionais podem incluir realçadores transcricionais assim como traducionais. Aqueles habilitados na técnica estarão cientes de seqüências terminadoras e realçadoras que podem ser adequadas para o uso na realização da invenção. Uma seqüência de intron também pode ser adicionada à região não traduzida 5' (UTR) ou na seqüência codificadora para aumentar a quantidade da mensagem madura que acumula no citossol, como descrito na seção de definição. Outras seqüências de controle (além do promotor, realçador, silenciador, seqüências de intron, regiões 3'UTR e/ou 5'UTR) podem ser proteína e/ou elementos estabilizadores de RNA. Tais seqüências podem ser conhecidas ou podem ser facilmente obtidas por uma pessoa habilitada na técnica.
As construções genéticas da invenção podem incluir ainda uma seqüência de origem de replicação que é requerida para a manutenção e/ou replicação em um tipo de célula específico. Um exemplo é quando uma construção genética é requerida ser mantida em uma célula bacteriana como um elemento genético epissômico (por exemplo, molécula de plasmídeo ou cosmídeo). As origens preferidas de replicação incluem, mas não são limitadas ao fl-ori e colEl.
Para a detecção da transferência bem sucedida das seqüências de ácido nucleico como usadas nos métodos da invenção e/ou seleção de plantas transgênicas que compreendem estes ácidos nucleicos, é vantajoso usar genes marcadores (ou genes repórteres). Portanto, a construção genética pode opcionalmente compreender um gene marcador selecionável. Os marcadores selecionáveis são descritos em mais detalhes na seção "definições" aqui. Os genes marcadores podem ser removidos ou excisados da célula transgênica uma vez que elas não são mais necessárias. As técnicas para a remoção de marcador são conhecidas no ramo, as técnicas úteis são descritas acima na seção de definição.
A presente invenção também abrange plantas obteníveis pelos métodos de acordo com a presente invenção. A presente invenção portanto fornece plantas, parte de plantas e células vegetais obteníveis pelo métodos de acordo com a presente invenção, plantas estas que têm introduzida uma seqüência de ácido nucleico de SYT e plantas, partes de planta e células vegetais estas que são preferivelmente de um planta de cultivo, mais preferivelmente de uma planta monocotiledônea.
A invenção também fornece um método para a produção de plantas transgênicas tendo rendimento aumentado e/ou vigor inicial sob estresse abiótico, que compreende a introdução e expressão em uma planta de uma seqüência de ácido nucleico de SYT.
Mais especificamente, a presente invenção fornece um método para a produção de plantas transgênicas, preferivelmente plantas monocotiledôneas, tendo rendimento aumentado e/ou vigor inicial sob estresse abiótico, método este que compreende: (i) introduzir e expressar em uma planta ou célula vegetal uma seqüência de ácido nucleico que codifica um polipeptídeo de SYT; e
(ii) cultivar a célula vegetal sob condições que promovam o crescimento e desenvolvimento da planta.
O ácido nucleico de (i) pode ser qualquer um dos ácidos nucleicos capazes de codificar um polipeptídeo de SYT, como definido acima ou uma seqüência de ácido nucleico como representada pela SEQ ID NO: 150 ou SEQ ID NO: 152.
As gerações subsequentes das plantas obtidas a partir da etapa de cultivo (ii) podem ser propagadas por uma variedade de meios, tais como pela propagação clonal ou técnicas de cruzamento clássicas. Por exemplo, uma planta da primeira geração (ou TI) transformada pode ser auto- polinizada para dar transformantes de segunda geração (ou T2) homozigotos e as plantas T2 propagadas ainda através das técnicas de procriação clássicas.
A seqüência de ácido nucleico pode ser introduzida diretamente em uma célula vegetal ou na planta por si só (incluindo a introdução em um tecido, órgão ou qualquer outra parte de uma planta). De acordo com uma característica preferida da presente invenção, a seqüência de ácido nucleico é introduzida em uma planta pela transformação.
No geral depois da transformação, as células vegetais ou agrupamentos de célula são selecionados quanto a presença de um ou mais marcadores que são codificados pelos genes expressáveis em planta co- transferidos com o gene de interesse, seguindo que o material transformado é regenerado em um planta inteira. Para selecionar plantas transformadas, o material vegetal obtido na transformação é, como uma regra, submetidos às condições selecionáveis de modo que as plantas transformadas pudessem ser distinguidas das plantas não transformadas. Por exemplo, as sementes obtidas na maneira descrita acima podem ser plantadas e, depois de um período de crescimento inicial, submetidas a uma seleção adequada pela pulverização. Uma outra possibilidade consiste no cultivo das sementes, se apropriado depois da esterilização, em placas de ágar usando um agente de seleção adequado de modo que apenas as sementes transformadas possam crescer em plantas. Alternativamente, as plantas transformadas são triadas quanto a presença de um marcador selecionável tal como aqueles descritos acima.
A seguir da transferência do DNA e regeneração, as plantas putativamente transformadas também podem ser avaliadas, por exemplo, usando análise de Southern, quanto a presença do gene de interesse, número de cópia e/ou organização genômica. Alternativa ou adicionalmente, os níveis de expressão do DNA recém introduzido pode ser monitorado usando a análise de Northern e/ou Western, ambas as técnicas sendo bem conhecidas pelas pessoas tendo habilidade comum na técnica.
As plantas transformadas geradas podem ser propagadas por uma variedade de meios, tais como pela propagação clonal ou técnicas de procriação clássicas. Por exemplo, uma planta transformada de primeira geração (ou TI) pode ser auto-polinizada para dar transformantes homozigotos da segunda geração (ou T2) e as plantas T2 propagadas ainda através de técnicas de procriação clássicas.
Os organismos transformados gerados podem tomar uma variedade de formas. Por exemplo, eles podem ser quimeras de células transformadas e células não transformadas; transformantes clonais (por exemplo, todas as células transformadas contendo o cassete de expressão); enxertos de tecidos transformado e não transformado (por exemplo, em plantas, um rizoma transformado enxertado a uma muda não transformada).
A presente invenção claramente estende-se a qualquer célula vegetal ou planta produzida por qualquer um dos métodos aqui descritos e a todas as partes de planta e propágulos destes. A presente invenção estende-se ainda para abranger a progênie de uma célula primária transformada ou transfectada, tecido, órgão ou planta inteira que foi produzida por qualquer um dos métodos anteriormente mencionados, a única exigência sendo que a progênie exibe a(s) mesma(s) característica(s) genotípica(s) e/ou fenotípica(s) como aquela(s) produzida(s) pelo precursor nos métodos de acordo com a invenção. A invenção também inclui células hospedeiras contendo uma seqüência de ácido nucleico de SYT isolada. As células hospedeiras preferidas de acordo com a invenção são células vegetais. A invenção também estende-se às partes colhíveis de uma planta tais como, mas não limitadas às sementes, folhas, frutas, flores, culturas de haste, raízes, rizomas, tubérculos e bulbos. A invenção além disso diz respeito a produtos derivados, preferivelmente diretamente derivados, de uma parte colhível de uma tal planta, tal como pelotas secas ou pós, farinha, óleo, gordura e ácidos graxos, amido ou proteínas.
De acordo com uma característica preferida da invenção, a expressão modulada é a expressão aumentada. Métodos para aumentar a expressão de ácidos nucleicos ou genes ou produtos de gene, são bem documentados na técnica e os exemplos são fornecidos na seção de definição.
Alternativamente, a expressão de uma seqüência de ácido nucleico que codifica um polipeptídeo de SYT pode ser modulada pela introdução de uma modificação genética, por exemplo, por qualquer uma (ou mais) das seguintes técnicas: ativação de T-DNA, TILLING, recombinação homóloga ou pela introdução e expressão em uma planta de uma seqüência de ácido nucleico que codifica um polipeptídeo de SYT. A seguir da introdução da modificação genética, segue uma etapa de selecionar quanto a expressão modulada de uma seqüência de ácido nucleico que codifica um polipeptídeo de SYT, expressão modulada esta que dá plantas tendo rendimento aumentado e/ou vigor inicial sob estresse abiótico.
Uma tal técnica é a ativação de rotulação de T-DNA. O promotor a ser introduzido pode ser qualquer promotor capaz de direcionar a expressão de um gene no organismo desejado, neste caso uma planta. Por exemplo, promotor constitutivo, preferido de tecido, preferido de tipo de célula e indutível são todos adequados para o uso na ativação de T-DNA. Os efeitos da invenção também podem ser reproduzidos usando a técnica de TILLING (Lesões Locais Induzidas Alvejadas em Genomas). Os efeitos da invenção também podem ser reproduzidos usando recombinação homóloga.
A presente invenção também abrange o uso de seqüências de ácido nucleico de e o uso de polipeptídeos de SYT e o uso de uma construção como definida acima no aumento do rendimento e/ou vigor inicial da planta sob estresse abiótico.
As seqüências de ácido nucleico de SYT ou polipeptídeos de
SYT podem encontrar uso em programas de procriação em que um marcador de DNA é identificado que pode ser geneticamente ligado a um SYT. As seqüências de ácido nucleico de SYT ou polipeptídeos de SYT podem ser usados para definir um marcador molecular. Este marcador de DNA ou polipeptídeo pode ser depois usado em programas de procriação para selecionar plantas tendo rendimento aumentado. O gene de SYT, por exemplo, pode ser uma seqüência de ácido nucleico como representada por qualquer uma das seqüências de ácido nucleico de SYT como dadas na Tabela 6 ou ortólogos ou parálogos de qualquer umas das SEQ ID NOs anteriormente mencionadas.
As variantes alélicas de uma seqüência de ácido nucleico de SYT também podem encontrar uso em programas de procriação assistidos popr marcador. Tais programas de procriação algumas vezes requerem a introdução de variação alélica pelo tratamento mutagênico das plantas, usando por exemplo a mutagênese de EMS; alternativamente, o programa pode começar com uma coleção de variantes alélicas da chamada origem "natural" causada involuntariamente. A identificação de variantes alélicas depois ocorre, por exemplo, pela PCR. Isto é seguido por uma etapa para a seleção de variantes alélicas superiores da seqüência em questão e que dá rendimento aumentado. A seleção é tipicamente realizada pelo monitoramento do desempenho de crescimento de plantas contendo variantes alélicas diferentes da seqüência em questão, por exemplo, variantes alélicas diferentes de qualquer uma das seqüências de ácido nucleico de SYT como dadas na Tabela 6 ou ortólogos ou parálogos de qualquer uma das SEQ ID Nos anteriormente mencionadas. O desempenho do crescimento pode ser monitorado em uma estufa ou no campo. Outras etapas opcionais incluem cruzar plantas, em que a variante alélica superior foi identificada, com uma outra planta. Isto pode ser usado, por exemplo, para fabricar uma combinação de características fenotípicas interessantes.
As seqüências de ácido nucleico de SYT também podem ser usadas como sondas para mapear genética e fisicamente os genes que são uma parte de e como marcadores para traços ligados a estes genes. Tal informação pode ser útil na procriação de planta de modo a desenvolver linhagens com fenótipos desejados. Tal uso de seqüências de ácido nucleico de SYT requer apenas uma seqüência de ácido nucleico de pelo menos 15 nucleotídeos no comprimento. As seqüências de ácido nucleico de SYT podem ser usadas como marcadores de polimorfismo de comprimento de fragmento de restrição (RFLP). Southern blots (Sambrook J, Fritsch EF e Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de DNA genômico de planta digerida com restrição podem ser sondadas com as seqüências de ácido nucleico de SYT. Os padrões de faixa resultantes podem ser depois submetidos à análise genética usando programas de computador tais como MapMaker (Lander et al. (1987) Genomics 1: 174-181) de modo a construir um mapa genético. Além disso, as seqüências de ácido nucleico podem ser usadas para sondar Southern blots contendo DNAs genômicos tratados com endonuclease de restrição a partir de um conjunto de indivíduos que representam precursor e progênie de um cruzamento genético definido. A segregação dos polimorfismos de DNA é mencionada e usada para calcular a posição da seqüência de ácido nucleico de SYT no mapa genético previamente obtido usando esta população (Botstein et al. (1980) Am. J. Hum. Genet. 32: 314-331).
A produção e uso de sondas derivadas de gene vegetal para o uso no mapeamento genético é descrito em Bematzky e Tanksley (1986) Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevem o mapeamento genético de clones de cDNA específicos usando a metodologia esboçada acima ou variações destas. Por exemplo, populações de intercruzamento F2, populações retrocruzadas, populações aleatoriamente acasaladas, linhagens quase isogênicas e outros conjuntos de indivíduos podem ser usados para mapear. Tais metodologias são bem conhecidas por aqueles habilitados na técnica.
As sondas de ácido nucleico também podem ser usadas para o mapeamento físico (isto é, colocação de seqüências nos mapas físicos; ver Hoheisel et al. Em: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346 e referências aí citadas).
Em uma outra forma de realização, as sondas de ácido nucleico podem ser usadas no mapeamento da hibridização in situ pela fluorescência direta (FISH) (Trask (1991) Trends Genet. 7: 149-154). Embora métodos correntes de mapeamento FISH favoreçam o uso de clones grandes (diversos kb a diversas centenas de kb; ver Laan et ai. (1995) Genome Res. 5: 13-20), melhoras na sensibilidade podem possibilitar o desempenho do mapeamento de FISH usando sondas mais curtas.
Uma variedade de métodos com base na amplificação de ácido nucleico para o mapeamento genético e físico podem ser realizados usando as seqüências de ácido nucleico. Os exemplos incluem a amplificação específicas de alelo (Kazazian (1989) J. Lab. Clin. Med 11: 95-96), polimorfismos de fragmentos amplificados pela PCR (CAPS; Sheffield et al. (1993) Genomics 16: 325-332), ligação específica de alelo (Landegren et al. (1988) Science 241: 1077-1080), reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acids Res. 18: 3671), Mapeamento de Híbrido por Radiação (Walter et al. (1997) Nat. Genet. 7: 22-28) e Mapeamento Happy (Dear e Cook (1989) Nucleic Acids Res. 17: 6795-6807). Para estes métodos, a seqüência de ácido nucleico é usada para planejar e produzir pares de iniciador para o uso na reação de amplificação ou nas reações de extensão de iniciador. O planejamento de tais iniciadores é bem conhecido por aqueles habilitados na técnica. Em métodos que utilizam mapeamento genético com base na PCR, pode ser necessário identificar As diferenças de seqüência de DNA entre os precursores do cruzamento de mapeamento na região que corresponde à seqüência de ácido nucleico presente. Isto, entretanto, no geral não é necessário para mapear métodos.
Os métodos de acordo com a presente invenção resulta em plantas tendo rendimento aumentado sob estresse abiótico, como descrito mais acima. Estes traços que realçam o rendimento também podem ser combinados com outros traços economicamente vantajosos, tais como outros traços que realçam o rendimento, tolerância aos vários estresses, traços que modificam várias características de arquitetura e/ou características bioquímicas e/ou fisiológicas.
Descrição detalhada para o polipeptídeo de cpFBPase
Surpreendentemente, foi agora descoberto que aumentar a expressão em partes acima do solo de uma planta de uma seqüência de ácido nucleico que codifica um polipeptídeo de frutose-l,6-bisfosfatase (cpFBPase) cloroplástico aumenta o rendimento da planta em relação às plantas de controle. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar o rendimento da planta em relação às plantas de controle, que compreende aumentar a expressão em partes acima do solo de uma planta de uma seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase. Referência aqui a "plantas de controle" é considerado significar qualquer planta ou plantas de controle adequadas. A "referência", "controle" ou "tipo selvagem" são aqui usados intercambiavelmente e é preferivelmente um objeto, por exemplo, uma organela, uma célula, um tecido, uma planta, que é tão similar à matéria objeto da invenção quanto possível. A referência, controle ou tipo selvagem está no seu genoma, transcritoma, proteoma ou metaboloma tão similar quanto possível ao objeto da presente invenção. Preferivelmente, o termo organela, célula, tecido ou planta de "referência" "controle" ou "tipo selvagem", diz respeito a uma organela, célula, tecido ou planta, que é quase geneticamente idêntica à organela, célula, tecido ou planta, da presente invenção ou uma parte desta, preferivelmente 95%, 98%, 99,00%, 99,10%, 99,30%, 99,50%, 99,70%, 99,90%, 99,99%, 99,999% ou mais idênticos. O mais preferivelmente a "referência", "controle" ou "tipo selvagem" é preferivelmente um objeto, por exemplo, uma organela, uma célula, um tecido, uma planta, que é geneticamente idêntico à planta, tecido, célula, organela usado de acordo com o método da invenção exceto que as seqüências de ácido nucleico ou o produto de gene codificado por elas são trocados, modulados ou modificados de acordo com o método inventivo.
A menos que de outro modo especificado, os termos "polinucleotídeos", "ácido nucleico" e "molécula de ácido nucleico", são intercambiáveis no presente contexto. A menos que de outro modo especificado, os termos "peptídeo", "polipeptídeo" e "proteína" são intercambiáveis no presente contexto. O termo "seqüência" pode dizer respeito a polinucleotídeos, ácidos nucleicos, moléculas de ácido nucleico, peptídeos, polipeptídeos e proteínas, dependendo do contexto em que o termo "seqüência" é usado. Os termos "gene(s)", "polinucleotídeo", "seqüência de ácido nucleico", "seqüência de nucleotídeo" ou "molécula(s) de ácido nucleico" como aqui usados referem-se a uma forma polimérica de nucleotídeos de qualquer comprimento, ribonucleotídeos ou desoxirribonucleotídeos. Os termos referem-se apenas à estrutura primária da molécula.
Assim, os termos "seqüência de ácido nucleico", "gene(s)", "polinucleotídeo", "seqüência de nucleotídeo" ou "molécula(s) de ácido nucleico" como aqui usados incluem DNA e RNA de filamento duplo e único. Eles também incluem tipos conhecidos de modificações, por exemplo, metilação, "encapuzamentos", substituições de um ou mais dos nucleotídeos que ocorrem naturalmente com um análogo. Preferivelmente, a seqüência de DNA ou RNA da invenção compreende uma seqüência codificadora que codifica o polipeptídeo aqui definido.
Uma "seqüência codificadora" é uma seqüência de ácido nucleico, que é transcrita em mRNA e/ou traduzida em um polipeptídeo quando colocado sob o controle de seqüências reguladoras apropriadas. Os limites da seqüência codificadora são determinados por um códon de partida de tradução no terminal 5' e um códon de parada de tradução no terminal 3'. Uma seqüência codificadora pode incluir, mas não é limitado a mRNA, cDNA, seqüências de ácido nucleico recombinantes ou DNA genômico, embora introns também possam estar presentes sob certas circunstâncias.
O termo "polipeptídeo da frutose-1,6-bisfosfatase (cpFBPase) cloroplástica" como aqui definido refere-se a um polipeptídeo que funciona no cloroplasto e que compreende: (i) pelo menos um domínio FBPase; e (ii) pelo menos uma inserção reguladora de redox.
Um exemplo de um polipeptídeo de cpFBPase como definido acima como funcionamento no cloroplasto e que compreende: (i) pelo menos um domínio de FBPase; e (ii) pelo menos uma inserção reguladora de redox é como representado na SEQ ID NO: 155. Outros de tais exemplos são representados por qualquer uma da SEQ ID NO: 157, SEQ ID NO: 159, SEQ ID NO: 161, SEQ ID NO: 163, SEQ ID NO: 165, SEQ ID NO: 167, SEQ ID NO: 169, SEQ ID NO: 171, SEQ ID NO: 173, SEQ ID NO: 175, SEQ ID NO: 177, SEQ ID NO: 179, SEQ ID NO: 181, SEQ ID NO: 183, SEQ ID NO: 185, SEQ ID NO: 187, SEQ ID NO: 189, SEQ ID NO: 191, SEQ ID NO: 193, SEQ ID NO: 195 e SEQ ID NO: 197 ou ortólogos ou parálogos de qualquer uma das SEQ ID NOs anteriormente mencionadas. A invenção é ilustrada pelas plantas transformantes com a seqüência de Chiamydomonas reinhardthii representado pela SEQ ID NO: 154, que codifica o polipeptídeo da SEQ ID NO: 155. SEQ ID NO: 157 (codificado pela SEQ ID NO: 156, de Bigelowiella natans), SEQ ID NO: 159 (codificado pela SEQ ID NO: 158, de Aquilegia formosa χ Aquilegia pubescens), SEQ ID NO: 161 (codificado pela SEQ ID NO: 160, de Arabidopsis thaliana), SEQ ID NO: 163 (codificado pela SEQ ID NO: 162, de Brassica napus), SEQ ID NO: 165 (codificado pela SEQ ID NO: 164, de Cyanidioschyzon merolae) SEQ ID NO: 167 (codificado pela SEQ ID NO: 166, de Glieina max), SEQ ID NO: 169 (codificado pela SEQ ID NO: 168, de Lyeopersieon eseulentum), SEQ ID NO: 171 (codificado pela SEQ ID NO: 170, de Medieago truneatula), SEQ ID NO: 173 (codificado pela SEQ ID NO: 172, de Nieotiana tabaeum), SEQ ID NO: 175 (codificado pela SEQ ID NO: 174, de Oryza sativa), SEQ ID NO: 177 (codificado pela SEQ ID NO: 176, de Ostreococcus lueimarinus), SEQ ID NO: 179 (codificado pela SEQ ID NO: 178, de Ostreoeoceus tauri), SEQ ID NO: 181 (codificado pela SEQ ID NO: 180, de Phaeodaetilum trieornutum), SEQ ID NO: 183 (codificado pela SEQ ID NO: 182, de Pisum sativa), SEQ ID NO: 185 (codificado pela SEQ ID NO: 184, de Poneirus trifoliata), SEQ ID NO: 187 (codificado pela SEQ ID NO: 186, de Populus tremuloides), SEQ ID NO: 189 (codificado pela SEQ ID NO: 188, de Solanum tuberosum), SEQ ID NO: 191 (codificado pela SEQ ID NO: 190, de Spinaeia oleraeeà), SEQ ID NO: 193 (codificado pela SEQ ID NO: 192, de Tritieum aestivum), SEQ ID NO: 195 (codificado pela SEQ ID NO: 194, de Zea mays) e SEQ ID NO: 197 (codificado pela SEQ ID NO: 196, de Physieomitrella patens), são ortólogos do polipeptídeo da SEQ ID NO: 155.
Deve ser entendido que as seqüências que caem sob a definição de um "polipeptídeo de cpFBPase" não devem ser limitadas aos polipeptídeos dados na Tabela 7 (e mencionados aqui acima) mas que qualquer polipeptídeo funcionando no cloroplasto e que compreende: (i) pelo menos um domínio de FBPase; e (ii) pelo menos uma inserção reguladora de redox, pode ser adequada na realização dos métodos da invenção. Preferivelmente, o polipeptídeo de cpFBPase é como representado pela SEQ ID NO: 155.
Entretanto, o desempenho da invenção não é restrito a estas seqüências; os métodos da invenção podem ser vantajosamente realizados usando qualquer ácido nucleico que codifica cpFBPase ou polipeptídeo de cpFBPase como aqui definidos.
Os exemplos de ácidos nucleicos que codificam polipeptídeos de cpFBPase são dados na Tabela C do Exemplo 12 aqui. Tais ácidos nucleicos são úteis na realização dos métodos da invenção. As seqüências de aminoácido dadas na Tabela C do Exemplo 12 são exemplos de seqüências de ortólogos e parálogos do polipeptídeo de cpFBPase representado pela SEQ ID NO: 155, os termos "ortólogos" e "parálogos" sendo como aqui definidos. Ortólogos e parálogos podem ser facilmente encontrados realizando-se uma chamada pesquisa de blast recíproca. Isto pode ser feito por um primeiro BLAST envolvendo submeter a BLAST uma seqüência dúvida (por exemplo, SEQ ID NO: 154 ou SEQ ID NO: 155) contra qualquer base de dados de seqüência, tal como a base de dados NCBI publicamente disponível. BLASTN ou TBLASTX (usando valores default padrão) podem ser usados quando partindo de uma seqüência de nucleotídeo e BLASTP ou TBLAS TN (usando valores default padrão) podem ser usados quando partindo de uma seqüência de polipeptídeo. Os resultados de BLAST podem ser opcionalmente filtrados. As seqüências de tamanho natural dos resultados filtrados ou resultados não filtrados são depois submetidos novamente a BLAST (segundo BLAST) contra seqüências do organismo a partir das quais a seqüência dúvida é derivada (onde a seqüência dúvida é a SEQ ID NO: 154 ou SEQ ID NO: 155, o segundo BLAST portanto seria contra seqüências de Chlamydomonas). Os resultados do primeiro e segundo BLASTs são depois comparados. Um parálogo é identificado se um acerto de alta classificação do primeiro BLAST é da mesma espécie como da qual a seqüência dúvida é derivada, um BLAST posterior depois idealmente resulta na seqüência dúvida como o acerto mais alto (além de si mesmo); um ortólogo é identificado se um acerto de alta classificação no primeiro BLAST não é da mesma espécie como a da qual a seqüência dúvida é derivada e preferivelmente resulta no BLAST posterior na seqüência dúvida entre o acerto mais alto. Os acertos de alta classificação são aqueles tendo um valor E baixo. Quanto mais baixo o valor E, mais significante a contagem (ou em outras palavras mais baixa a chance que o acerto fosse encontrado ao acaso). A computação do valor E é bem conhecida na técnica. Além dos valores E, as comparações também estão contadas pela identidade percentual. A identidade percentual refere-se ao número de nucleotídeos idênticos (ou aminoácidos) entre as duas seqüências de ácido nucleico (ou polipeptídeo) comparadas em relação a um comprimento particular. Um exemplo que detalha a identificação de ortólogos e parálogos é dado no Exemplo 12. No caso de famílias grandes, ClustalW pode ser usado, seguido por uma árvore de união de vizinhos, para ajudar a visualizar a formação de grupos de genes relacionados e para identificar ortólogos e parálogos. Preferivelmente, polipeptídeos de CpFBPase úteis nos métodos da invenção estão funcionando no cloroplasto e compreendem: (i) pelo menos um domínio FBPase; e (ii) pelo menos uma inserção reguladora de redox; e (iii) em ordem crescente de preferência, pelo menos 40%, 45%, 50%, 55%, 65%, 70%, 75%, 80%, 85%, 90%, 95% ou 98% de identidade de seqüência com a SEQ ID NO: 155 (cálculos mostrados no Exemplo 14). O alinhamento de seqüências de polipeptídeo múltiplo é usado para encontrar domínios conservados e motivos característicos em famílias de proteína, na determinação de ligação evolucionária e no prognóstico melhorado de estrutura secundária e terciária. Muitos programas são disponíveis a uma pessoa habilitada na técnica para realizar tal análise, por exemplo, aquelas propostas pela caixa de ferramentas Expasy proteomics abrigada pelo Swiss Institute for Bioinformatics.
Os métodos para o alinhamento de seqüências para comparação são bem conhecidos na técnica, tais métodos incluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o algoritmo de Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar o alinhamento global (isto é, que transpõem as seqüências completas) de duas seqüências que maximizam o número de emparelhamentos e minimiza o número de intervalos. O algoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403- 10) calcula a identidade de seqüência percentual e realiza uma análise estatística da similaridade entre as duas seqüências. O software para realizar a análise de BLAST está publicamente disponível através do National Centre for Biotechnology Information (NCBI). Os homólogos podem ser facilmente identificados usando, por exemplo, o algoritmo de alinhamento de seqüência múltipla ClustalW (versão 1.83), com os parâmetros de alinhamento aos pares de default e um método de contagem em porcentagem. As porcentagens globais de similaridade e identidade também podem ser determinadas usando um dos métodos disponíveis no pacote de software MatGAT (Campanella et al., BMC Bioinformatics. 10 de julho de 2003; 4: 29. MatGAT: a application that generates similarity/identity matrices using protein or DNA sequences.). Edição manual menor pode ser realizada para otimizar o alinhamento entre motivos conservados, como estaria evidente a uma pessoa habilitada na técnica. Além disso, ao invés de usar seqüências de tamanho natural para a identificação de homólogos, domínios específicos também podem ser usados. Os valores de identidade de seqüência podem ser determinados em relação à seqüência de ácido nucleico ou aminoácido inteira ou em relação aos domínios selecionados ou motivo(s) conservado(s), usando os programas mencionados acima usando os parâmetros de default.
Os termos "domínio" e "motivo' são descritos na seção de
definição. Bases de dados especiais existem para a identificação de domínios. O domínio FBPase em um polipeptídeo de cpFBPase pode ser identificado usando, por exemplo, SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244;
abrigado pelo EMBL em Heidelberg, Alemanha), InterPro (Mulder et al.,
(2003) Nucl. Acids. Res. 31,315-318; abrigado pelo European Bioinformatics Institute (EBI) no Reino Unido), Prosite (Bucher e Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its funetion in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd
International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp 53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32: D134-D137,
(2004). O servidor ExPASy proteomies é fornecido como um serviço para a comunidade científica (abrigado pelo Swiss Institute of Bioinformatics (SIB)
na Suíça) ou Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280 (2002), abrigado pelo Sanger Institute no Reino Unido). Por exemplo, na base de dados Interpro, o domínio de FBPase compreendido no polipeptídeo de cpFBPase é designado IPROOO146. No Exemplo 15 estão listadas as entradas identificadas em várias bases de dados, relacionadas com um polipeptídeo de
cpFBPase como representado pela SEQ ID NO: 155.
Um motivo importante compreendido dentro do domínio de FBPase é a inserção reguladora de redox, que está presente apenas nos polipeptídeos de cpFBPase e não nos polipeptídeos de cyFBPase. Alinhando- se todos os polipeptídeos de FBPases usando os métodos descritos acima e no Exemplo 13 (e Figura 12), uma inserção de aminoácidos que compreendem pelo menos dois resíduos de cisteína necessários para a formação de ponte de dissulfeto (isto é, regulagem de redox) são identificados. As cisteínas conservadas são nomeados depois da sua posição no polipeptídeo da ervilha maduro (Pisum sativa), isto é, Cysl53, Cysl73 e Cysl78. Cysl53 e Cysl73 usualmente são os dois parceiros envolvidos na formação da ponte de dissulfeto (Chiadmi et ai. (1999) EMBO J 18(23): 6809-6815). Cysl 53 e Cys 173 são separados por uma alça cujo comprimento é de 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24 ou 25 resíduos de aminoácido, preferivelmente de 14, 15, 16, 17, 18 ou 19 resíduos de aminoácido.
A tarefa do prognóstico da localização subcelular da proteína é importante e bem estudada. Conhecer uma localização da proteína ajuda a elucidar a sua função. Os métodos experimentais para a localização de proteína varia de imunolocalização para a rotulação de proteínas usando proteína fluorescente verde (GFP). Tais métodos são precisos embora intensivos em trabalho comparados com os métodos computacionais. Recentemente muito progresso tem sido feito no prognóstico computacional de localização de proteína a partir dos dados de seqüência. Entre algoritmos bem conhecidos a uma pessoa habilitada na técnica estão disponíveis nas ferramentas ExPASy Proteomics abrigadas pelo Swiss Institute for Bioinformatics, por exemplo, PSort, AlvoP, ChloroP, Predotar, LipoP, MITOPROT, PATS, PTS1, SinalP e outras. A identificação da localização subcelular do polipeptídeo da invenção é mostrada no Exemplo 16. Em particular a SEQ ID NO: 155 da presente invenção é designada ao compartimento plastídico (cloroplástico) de células fotossintéticas (autotróficas).
Métodos para alvejar aos plastídeos são bem conhecidos na técnica e incluem o uso de peptídeos de trânsito. A Tabela 7 abaixo mostra exemplos de peptídeos de trânsito que podem ser usados para alvejar qualquer polipeptídeo de FBPase a um plastídeo, polipeptídeo de FBPase este que não é, na sua forma natural, normalmente alvejado a um plastídeo ou polipeptídeo de FBPase este que na sua forma natural é alvejado a um plastídeo em virtude de um peptídeo de trânsito diferente (por exemplo, seu peptídeo de trânsito natural). Por exemplo uma seqüência de ácido nucleico que codifica um cyFBPase também pode ser adequada para o uso nos métodos da invenção contanto que o ácido nucleico seja alvejado a um plastídeo, preferivelmente a um cloroplasto e que compreenda pelo menos uma inserção de redox reguladora.
Tabela 7: Exemplos de seqüências de peptídeo de trânsito úteis no alvejamento de aminoácidos aos plastídeos
Número de Acesso da NCBI Organismo Fonte Função da Proteína Seqüência de Peptídeo de Trânsito P07839 Chlamydomonas Ferredoxina MAMAMRSTFAARVGAKPAVRGARPASR MSCMA AAR23425 Chlamydomonas Rubisco ativase MQVTMKSSAVSGQRVGGARVATRSVRR AQLQV CAA56932 Arabidopsis thaliana Asp amino transferase MASLMLSLGSTSLLPREINKDKLKLGTSA SNPFLKAKSFSRVTMTV AVKPSR CAA31991 Arabidopsis thaliana Proteína carregadora de acila 1 MATQFSASVSLQTSCLATTRISFQKPALIS NHGKTNLSFNLRRSIPSRRLSVSC CAB63798 Arabidopsis thaliana Proteína carregadora de acila 2 MASIAASASISLQARPRQLAIAASQVKSFS NGRRSSLSFNLRQLPTRLTVSCAAKPETV DKVCAVVRKQL CAB63799 Arabidopsis thaliana Proteína carregadora de acila 3 MASIATSASTSLQARPRQLVIGAKQVKSF SYGSRSNLSFNLRQLPTRLTVYCAAKPET VDKVCAVVRKQLSLKE
Os polipeptídeos de cpFBPase como representados pela SEQ ID NO: 155 são enzimas com número da Enzyme Commission (EC; classificação de enzimas pelas reações que elas catalisam) EC 3.1.3.11 para a frutose-bisfosfatase (também chamada de D-frutose-1,6-bisfosfato 1- fosfoidrolase). Os polipeptídeos de cpFBPase catalisam a conversão irreversível da frutose-1,6-bisfosfato para frutose-6-fosfato e Pi. O ensaio funcional pode ser um ensaio quanto a atividade de cpFBPase com base em um ensaio de Pi colorimétrico, como descrito por Huppe e Buchanan (1989) em Naturforsch. 44c: 487-494. Outros métodos para ensaiar a atividade enzimática são descritos por Alscher-Herman (1982) em Plant Physiol 70: 728-734.
Por "funcionando no cloroplasto" é considerado significar aqui que o polipeptídeo de cpFBPase é ativo no cloroplasto, isto é, o polipeptídeo de cpFBPase está realizando a reação enzimática que consiste na hidrolisação da frutose-l,6-bisfosfato em frutose-6-fosfato e Pi, no cloroplasto.
As seqüências de ácido nucleico que codificam polipeptídeos de cpFBpase como dadas na Tabela 7 ou que codificam ortólogos ou parálogos de qualquer uma das SEQ ID NOs anteriormente mencionadas não precisam ser seqüências de ácido nucleico de tamanho natural, visto que o desempenho dos métodos da invenção não contam com o uso de seqüências de ácido nucleico de tamanho natural.
As variantes de ácido nucleico de cpFBPase também podem ser adequadas na prática dos métodos da invenção. As seqüências de ácido nucleico de cpFBPase variantes tipicamente são aquelas tendo a mesma função como uma seqüência de ácido nucleico de cpFBPase que ocorre naturalmente, que pode ter a mesma função biológica ou a função de aumentar o rendimento quando a expressão da seqüência de ácido nucleico é aumentada em partes acima do solo de uma planta em relação à uma planta de controle. Os exemplos de tais variantes de cpFBPase incluem porções de seqüências de ácido nucleico, seqüências de ácido nucleico capazes de hibridizar com cpFBPases, variantes de junção, variantes alélicas que ocorrem naturalmente ou pela manipulação de DNA, uma seqüência de ácido nucleico de cpFBPase obtida pelo embaralhamento de gene ou uma seqüência de ácido nucleico de cpFBPase obtida pela mutagênese direcionada ao sítio.
O termo "porção" como aqui usado refere-se a um pedaço de DNA que codifica um polipeptídeo que funciona no cloroplasto e que compreende: (i) pelo menos um domínio FBPase; e (ii) pelo menos uma inserção reguladora de redox.
Uma porção pode ser preparada, por exemplo, fazendo-se uma ou mais deleções a um ácido nucleico que codifica um polipeptídeo de cpFBPase como definido acima. As porções podem ser usadas na forma isolada ou ela pode ser fundida a outras seqüências codificadoras (ou não codificadoras) de modo a produzir, por exemplo, um polipeptídeo que combine diversas atividades. Em um outro exemplo, a seqüência codificadora de peptídeo de trânsito que ocorrem naturalmente pode ser substituída por uma seqüência codificadora de peptídeo de trânsito de um outro organismo fotossintético ou por um sintético. Se a transformação de cloroplasto é considerada, a seqüência codificadora de peptídeo de trânsito pode ser removida completamente. Quando fundida a outras seqüências codificadoras, o polipeptídeo resultante produzido na tradução pode ser maior do que o prognosticado para a porção de cpFBPase. As porções úteis nos métodos da invenção têm tipicamente pelo menos 900 nucleotídeos no comprimento, preferivelmente pelo menos 1000 nucleotídeos no comprimento, mais preferivelmente pelo menos 1100 nucleotídeos no comprimento e o mais preferivelmente pelo menos 1200 nucleotídeos no comprimento. Preferivelmente, a porção é uma porção de uma seqüência de ácido nucleico como representada por qualquer uma das seqüências de ácido nucleico dadas na Tabela 7 ou seqüências de ácido nucleico que codificam ortólogos ou parálogos de qualquer uma das SEQ ID Nos anteriormente mencionadas. O mais preferivelmente a porção é uma porção de uma seqüência de ácido nucleico como representada pela SEQ ID NO: 154.
De acordo com a presente invenção, é fornecido um método para aumentar o rendimento em plantas, que compreende aumentar a expressão em uma planta de uma porção de qualquer uma das seqüências de ácido nucleico dadas na Tabela C do Exemplo 12 ou de uma porção de um ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na Tabela C do Exemplo 12.
Uma outra variante de ácido nucleico útil nos métodos da invenção, é um ácido nucleico capaz de hibridizar sob condições de severidade reduzida, preferivelmente sob condições severas, com uma seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase como definido acima ou uma com uma porção como definida acima.
De acordo com a presente invenção, é fornecido um método para aumentar o rendimento em plantas, que compreende aumentar a expressão em uma planta de um ácido nucleico capaz de hibridizar a qualquer um dos ácidos nucleicos dados na Tabela C do Exemplo 12 ou que compreende aumentar a expressão em uma planta de um ácido nucleico capaz de hibridizar a um ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma da seqüências de ácido nucleico dadas na Tabela C do Exemplo 12.
As seqüências hibridizadoras úteis nos métodos da invenção,
codificam um polipeptídeo de cpFBPase que funciona no cloroplasto e que compreende: (i) pelo menos um domínio FBPase; e (ii) pelo menos uma inserção reguladora de redox e tendo substancialmente a mesma atividade biológica como o polipeptídeo de cpFBPase como representado pela SEQ ID NO: 155. Os métodos para planejar sondas são bem conhecidos na técnica. A seqüência hibridizadora é tipicamente menor do que 1000 pares de base no comprimento, preferivelmente menor do que 900, 800, 700, 600 ou 500 pares de base no comprimento. Habitualmente, os comprimentos da seqüência hibridizadora para as hibridizações de DNA-DNA tais como Southern blotting variam entre 100 e 500 pares de base, ao passo que para as hibridizações de DNA-DNA tais como na amplificação de PCR no geral mais curtas do que 50 mas mais longas do que 10 nucleotídeos. Preferivelmente, a seqüência hibridizadora é uma que é capaz de hibridizar a qualquer uma das seqüências de ácido nucleico (ou às sondas derivadas destas) como representado pelas seqüências de ácido nucleico dadas na Tabela 7 ou seqüências de ácido nucleico que codificam ortólogos ou parálogos de qualquer uma das SEQ ID NOs anteriormente mencionadas ou a uma porção de qualquer uma das seqüências anteriormente mencionadas, uma porção sendo como definido acima. O mais preferivelmente a seqüência hibridizadora é capaz de hibridizar com a SEQ ID NO: 154 ou com as porções (ou sondas) desta.
Uma outra variante de ácido nucleico útil nos métodos da invenção é uma variante de junção que codifica um polipeptídeo de cpFBPase como definido acima. Tais variantes serão aquelas em que a atividade biológica da proteína é substancialmente retida; isto pode ser obtido retendo- se seletivamente segmentos funcionais da proteína. As variantes de junção preferidas são variantes de junção das seqüências de ácido nucleico de cpFBPase como dadas na Tabela 7 ou seqüências de ácido nucleico que codificam ortólogos ou parálogos de qualquer umas das SEQ ID NOs anteriormente mencionadas. A mais preferida é uma variante de junção de uma seqüência de ácido nucleico de cpFBPase como representada pela SEQ ID NO: 154.
Uma outra variante de ácido nucleico útil na realização dos métodos da invenção é uma variante alélica de uma seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase como definido acima. Variantes alélicas existem na natureza e abrangidas dentro dos métodos da presente invenção está o uso destes alelos naturais. As variantes alélicas preferidas são variantes alélicas das seqüências de ácido nucleico de cpFBPase como dadas na Tabela 7 ou seqüências de ácido nucleico que codificam ortólogos ou parálogos de qualquer uma das SEQ ID NOs anteriormente mencionadas. Mais preferida é uma variante de junção de uma seqüência de ácido nucleico de cpFBPase como representada pela SEQ ID NO: 154. De acordo com a presente invenção, é fornecido um método para aumentar o rendimento em plantas, que compreende aumentar a expressão em uma planta de uma variante de junção de qualquer uma das seqüências de ácido nucleico dadas na Tabela C do Exemplo 12 ou de uma variante de junção de um ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na Tabela C do Exemplo 12.
Uma outra variante de ácido nucleico útil nos métodos da invenção é uma variante de ácido nucleico que codifica um polipeptídeo de cpFBPase obtido pelo embaralhamento de gene (ou evolução direta). Mais preferida é uma variante de ácido nucleico obtida pelo embaralhamento de gene de uma seqüência de ácido nucleico de cpFBPase como representada pela SEQ ID NO: 155.
De acordo com a presente invenção, é fornecido um método para aumentar o rendimento em plantas, que compreende aumentar a expressão em uma planta de uma variante de qualquer uma das seqüências de ácido nucleico dadas na Tabela C do Exemplo 12 ou que compreende aumentar a expressão em uma planta de uma variante de um ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na Tabela C do Exemplo 12, ácido nucleico variante este que é obtido pelo embaralhamento de gene.
Uma outra variante de ácido nucleico útil nos métodos da invenção é uma variante de ácido nucleico que codifica um polipeptídeo de cpFBPase obtido pela mutagênese direcionada ao sítio. A mutagênese direcionada ao sítio pode ser usada para gerar variantes de seqüências de ácido nucleico de cpFBPase. Diversos métodos são disponíveis para se obter a mutagênese direcionada ao sítio, os mais comuns sendo métodos com base em PCR (Current Protocols in Molecular Biology, Wiley Eds). Por exemplo, um mutação que afeta a formação da ponte de dissulfeto é atroca de uma das cisteínas conservadas em serina, tornando deste modo a cpFBPase constitutivamente ativa (Chiadmi et ai (1999) EMBO J 18(23): 6809-6815). Mais preferida é uma variante de ácido nucleico obtida pela mutagênese direcionada ao sítio de uma seqüência de ácido nucleico de cpFBPase como representada pela SEQ ID NO: 154.
As seguintes variantes de ácido nucleico de cpFBPase são exemplos de variantes adequadas na prática dos métodos da invenção:
(i) uma porção de uma seqüência de ácido nucleico de
cpFBPase;
(ii) uma seqüência de ácido nucleico capaz de hibridizar com
uma seqüência de ácido nucleico de cpFBPase;
(iii) uma variante de junção de uma seqüência de ácido nucleico de cpFBPase;
(iv) uma variante alélica de uma seqüência de ácido nucleico
de cpFBPase;
(v) uma seqüência de ácido nucleico de cpFBPase obtida pelo embaralhamento de gene;
(vi) uma seqüência de ácido nucleico de cpFBPase obtida pela mutagênese direcionada ao sítio.
Também úteis nos métodos da invenção são as seqüências de
ácido nucleico que codificam homólogos de polipeptídeos de cpFBPase como dados na Tabela 7 ou que codificam ortólogos ou parálogos de qualquer uma das SEQ ID NOs anteriormente mencionadas.
Também úteis nos métodos da invenção são seqüências de
ácido nucleico que codificam derivados de qualquer um dos polipeptídeos de cpFBPase como dadas na Tabela 7 ou ortólogos ou parálogos de qualquer uma das SEQ ID NOs anteriormente mencionadas. Derivados de polipeptídeos de cpFBPase como representados por qualquer uma dada na Tabela 7 ou ortólogos ou parálogos de qualquer uma das SEQ ID NOs anteriormente mencionadas são outros exemplos que podem ser adequados para o uso nos métodos da invenção.
As seqüências de ácido nucleico que codificam polipeptídeos de cpFBPase podem ser derivado de qualquer fonte artificial ou fonte natural, tal como planta, algas, diatomácea ou animal. A seqüência de ácido nucleico pode ser modificada a partir da sua forma nativa em composição e/ou ambiente genômico através da manipulação humana deliberada. Preferivelmente a seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase origina de uma célula fotossintética (Reino Plantae). Mais preferivelmente a seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase origina-se de uma célula vegetal. Mais preferivelmente, a seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase origina-se de uma célula diatomácea. Mais preferivelmente a seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase origina-se de uma célula de alga (vermelha, marrom ou verde). A seqüência de ácido nucleico pode ser isolada de Chlorophyta ou Charophyta pertencentes às algas verdes ou de plantas de solo, não vasculares ou vasculares. Por exemplo, a seqüência de ácido nucleico que codifica o polipeptídeo de cpFBPase é isolado de Chlamydomonas sp., Chlorella sp., Bigelowiella natans, Cyanidioschyzon merolae, Ostreococcus lueimarinus, Ostreoeoceus tauri, Galderia sulphuraria Physieomitrella patens, Phaeodaetilum trieornutum, Aquilegia formosa χ Aquilegia pubeseen,s Arabidopsis thaliana, Brassiea napus, Glieina max, Lyeopersieon eseulentum, Medieago truneatula, Nieotiana tabaeum, Oryza sativa, Pisum sativa, Poneirus trifoliate, Populus tremuloides, Solanum tuberosum, Spinaeia oleraeea, Tritieum aestivum, Zea mays e mais. Mais preferivelmente a seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase é de Chalmydomonas reinhardtii.
O desempenho dos métodos da invenção dá plantas tendo rendimento realçado. Os termos "rendimento", "aumentado", "melhorado", "realçado", "amplificado", "prolongado", "aumentado" ou "elevado" são intercambiáveis e são definidos acima. A biomassa aumentada pode manifestar-se por si só como biomassa de raiz aumentada. A biomassa de raiz aumentada pode ser devido ao número de raízes aumentado, espessura de raiz aumentada e/ou comprimento da raiz aumentado. O rendimento aumentado pode manifestar-se por si só como um ou mais dos seguintes:
(i) biomassa aumentada (peso) de uma ou mais partes de uma planta, particularmente partes acima do solo (colhíveis), biomassa de raiz aumentada ou biomassa aumentada de qualquer outras partes colhíveis;
(ii) vigor inicial aumentado, aqui definido como a área acima do solo da muda três semanas após a germinação;
(iii) rendimento de semente total aumentado, que inclui um aumento na biomassa de semente (peso de semente) e que pode ser um aumento no peso de semente por planta ou em uma base de semente individual;
(iv) número de panículas aumentado por planta;
(v) número de flores aumentado ("flósculos") por panícula;
(vi) taxa de enchimento de semente aumentada;
(vii) número de sementes (cheias) aumentado;
(viii) tamanho de semente aumentado (comprimento, largura, área, perímetro), que também pode influenciar a composição de sementes;
(ix) volume da semente aumentado, que também pode influenciar a composição de sementes;
(x) índice de colheita aumentado, que é expressado como uma razão do rendimento de partes colhíveis, tais como sementes, em relação à biomassa total; e
(xi) peso de mil grãos aumentado (TKW), que é extrapolado do número de sementes cheias contadas e seu peso total. Um TKW aumentado pode resultar de um tamanho de semente aumentado e/ou peso de semente. Um TKW aumentado pode resultar de um aumento no tamanho do embrião e/ou tamanho do endosperma.
Um aumento no tamanho da semente, volume da semente, área da semente, perímetro da semente, largura da semente e comprimento da semente pode ser devido a um aumento nas partes específicas de uma semente, por exemplo devido a um aumento no tamanho do embrião e/ou endosperma e/ou aleurona e/ou escutelo ou outras partes de uma semente.
Em particular, o rendimento aumentado é o rendimento de semente aumentado e é selecionado de um ou mais dos seguintes: (i) peso de semente aumentado; (ii) número de sementes cheias aumentado; (iii) taxa de enchimento de semente aumentada; e (iv) índice de colheita aumentado.
Tomando-se o milho como um exemplo, um aumento de rendimento pode ser manifestado como um ou mais dos seguintes: aumento no número de plantas por metro quadrado, um aumento no número de espigas por planta, um aumento no número de carreiras, número de grãos por carreira, peso do grão, peso de mil grãos, comprimento/diâmetro da espiga, aumento na taxa de enchimento da semente (que é o número de sementes cheias dividido pelo número total de sementes e multiplicado por 100), entre outras.
Tomando-se arroz como um exemplo, um aumento de rendimento pode ser manifestado por um aumento em um ou mais dos seguintes: número de plantas por metro quadrado, número de panículas por planta, número de espiguetas por panícula, número de flores (flósculos) por panícula (que é expressado como uma razão do número de sementes cheias em relação ao número de panículas primárias), aumento na taxa de enchimento da semente (que é o número de sementes cheias dividido pelo número total de sementes e multiplicado por 100), aumento no peso de mil grãos, entre outros.
Um aumento no rendimento também podem resultar em arquitetura modificada ou pode ocorrer como um resultado de arquitetura modificada.
De acordo com uma característica preferida, o desempenho dos métodos da invenção resulta em plantas tendo rendimento de semente aumentado em relação às plantas de controle. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar o rendimento de semente, método este que compreende aumentar a expressão em partes acima do solo de uma planta de uma seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase.
Visto que as plantas transgênicas de acordo com a presente invenção têm rendimento aumentado, é provável que estas plantas exibam uma taxa de crescimento aumentada (durante pelo menos parte do seu ciclo de vida), em relação à taxa de crescimento de plantas de controle em um estágio correspondente em seu ciclo de vida.
A taxa de crescimento aumentada pode ser específica a uma ou mais partes de uma planta (incluindo sementes) ou pode ser por toda a parte da planta substancialmente inteira. Plantas tendo uma taxa de crescimento aumentada pode ter um ciclo de vida mais curto. O ciclo de vida de uma planta pode ser considerado significar o tempo necessário para crescer de uma semente madura seca até o estágio onde a planta produziu sementes maduras secas, similares ao material de partida. Este ciclo de vida pode ser influenciado por fatores tais como vigor inicial, taxa de crescimento, índice de verdor, tempo de florescimento e velocidade de maturação de semente. O aumento na taxa de crescimento pode ocorrer em um ou mais estágios no ciclo de vida de uma planta ou durante substancialmente o ciclo de vida da planta inteira. A taxa de crescimento aumentada durante os estágios iniciais no ciclo de vida de uma planta pode refletir no vigor realçado. O aumento na taxa de crescimento pode alterar o ciclo de colheita de uma planta possibilitando que as plantas sejam semeadas mais tarde e/ou colhida mais cedo do que de outro modo seria possível (um efeito similar pode ser obtido com o tempo de florescimento mais cedo). Se a taxa de crescimento é suficientemente aumentada, a mesma pode possibilitar a semeadura adicional de sementes da mesma espécie de planta (por exemplo semeadura e colheita de plantas de arroz seguido pela semeadura e colheita de mais plantas de arroz todas dentro de um período de crescimento convencional). Similarmente, se a taxa de crescimento é suficientemente aumentada, a mesma pode possibilitar a semeadura adicional de sementes de espécies de plantas diferentes (por exemplo a semeadura e colheita de plantas de milho seguida, por exemplo, pela semeadura e colheita opcional de soja, batata ou qualquer outra planta adequada). Tempos de colheita adicionais do mesmo rizoma no caso de algumas plantas de safra também podem ser possíveis. Alterar o ciclo de colheita de uma planta pode levar a um aumento na produção de biomassa anual por metro quadrado (devido a um aumento no número de vezes (digamos em um ano) que qualquer planta particular pode ser cultivada e colhida). Um aumento na taxa de crescimento também pode possibilitar o cultivo de plantas transgênicas em uma área geográfica mais ampla do que as suas contrapartes do tipo selvagem, visto que as limitações territoriais para o cultivo de uma safra são freqüentemente determinadas pelas condições ambientais adversas no tempo de plantio (estação inicial) ou no tempo de colheita (estação tardia). Tais condições adversas podem ser evitadas se o ciclo de colheita é encurtado. A taxa de crescimento pode ser determinada pela derivatização de vários parâmetros a partir de curvas de crescimento, tais parâmetros podem ser: T-Mid (o tempo levado para as plantas atingirem 50% do seu tamanho máximo) e T-90 (tempo levado pelas plantas para atingirem 90% do seu tamanho máximo), entre outras.
De acordo com uma característica preferida da presente invenção, o desempenho dos métodos da invenção dá plantas tendo uma taxa de crescimento aumentada em relação às plantas de controle. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar a taxa de crescimento de plantas, método este que compreende modular a expressão, preferivelmente aumentar a expressão, em uma planta de um ácido nucleico que codifica um polipeptídeo de cpFBPase como aqui definido.
Um aumento no rendimento e/ou taxa de crescimento ocorre se a planta estiver sob condições não estressantes ou se a planta for exposta a vários estresses comparada com as plantas de controle. As plantas tipicamente respondem à exposição ao estresse por crescimento mais lento. Em condições de estresse severo, a planta pode mesmo parar completamente o crescimento. O estresse brando por outro lado é aqui definido como sendo qualquer estresse ao qual uma planta é exposta que não resulta na planta cessando de crescer completamente sem a capacidade para retomar o crescimento. O estresse brando no sentido da invenção leva a uma redução no crescimento das plantas estressadas de menos do que 40%, 35% ou 30%, preferivelmente menor do que 25%, 20% ou 15%, mais preferivelmente menor do que 14%, 13%, 12%, 11% ou 10%) ou menos em comparação com a planta de controle sob condições não estressantes. Devido aos avanços nas práticas agrícolas (irrigação, fertilização, tratamentos com pesticida) estresses severos não são freqüentemente encontrados em plantas de safra cultivadas. Como uma conseqüência, o crescimento comprometido induzido pelo estresse brando é freqüentemente uma característica indesejável para a agricultura. Os estresses brandos são os estresses bióticos e/ou abióticos (ambientais) diários aos quais uma planta é exposta. Estresses abióticos podem ser devido à seca ou água em excesso, estresse anaeróbico, estresse salino, toxicidade química, estresse oxidativo e temperaturas quentes, frias ou congelantes. O estresse abiótico pode ser um estresse osmótico causado por um estresse pela água (particularmente devido à seca), estresse salino, estresse oxidativo ou um estresse iônico. Estresses bióticos são tipicamente aqueles estresses causados pelos patógenos, tais como bactérias, vírus, fungos e insetos.
Em particular, os métodos da presente invenção podem ser realizados sob condições não estressantes ou sob condições de seca branda para dar plantas tendo rendimento aumentado em relação às plantas de controle. Como relatado em Wang et al. (Plant (2003) 218: 1-14), o estresse abiótico leva a um série de mudanças morfológicas, fisiológicas, bioquímicas e moleculares que afeta adversamente o crescimento e produtividade da planta. Seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidos como sendo interconectados e podem induzir o crescimento e dano celular através de mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133: 1755-1767) descreve um grau particularmente alto de "conversa cruzada" entre estresse pela seca e estresse de salinidade alta. Por exemplo, seca e/ou salinização são manifestadas primariamente como estresse osmótico, resultando no rompimento de homeostase e distribuição iônica na célula. O estresse oxidativo, que freqüentemente acompanha temperatura alta ou baixa, salinidade ou estresse pela seca, podem causar a desnaturação de proteínas funcionais e estruturais. Como uma conseqüência, estes diversos estresses ambientais freqüentemente ativam caminhos da sinalização de célula e respostas celulares similares, tais como a produção de proteínas de estresse, supra-regulagem de anti-oxidantes, acúmulo de solutos compatíveis e parada de crescimento. O termo condições "não estressantes" como aqui usado são aquelas condições ambientais que possibilitam crescimento ótimo de plantas. As pessoas habilitadas na técnica estão cientes de condições de solo e condições climáticas normais para uma dada localização.
O desempenho dos métodos da invenção dá em plantas cultivadas sob condições não estressantes ou sob condições de seca branda rendimento aumentado em relação às plantas de controle cultivadas sob condições comparáveis. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar o rendimento em plantas cultivadas sob condições não estressantes ou sob condições de seca branda, método este que compreende aumentar a expressão em uma planta de um ácido nucleico que codifica um polipeptídeo de cpFBPase.
O desempenho dos métodos da invenção dá plantas cultivadas sob condições de deficiência de nutriente, particularmente sob condições de deficiência de nitrogênio, rendimento aumentado em relação às plantas de controle cultivadas sob condições comparáveis. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar o rendimento em plantas cultivadas sob condições de deficiência de nutriente, método este que compreende aumentar a expressão em uma planta de um ácido nucleico que codifica um polipeptídeo de cpFBPase. A deficiência de nutriente pode resultar de uma falta de nutrientes tais como nitrogênio, fosfatos e outros compostos contendo fósforo, potássio, cálcio, cádmio, magnésio, manganês, ferro e boro, entre outros.
Preferivelmente o aumento no rendimento e/ou taxa de crescimento ocorre de acordo com o método da invenção sob condições não estressantes ou de estresse abiótico brando ou biótico brando.
O termo "expressão" ou "expressão de gene" significa a transcrição de um gene específico ou genes específicos ou construção genética específica. O termo "expressão" ou "expressão de gene" em particular significa a transcrição de um gene ou genes ou construção genética em RNA (rRNA, tRNA) ou mRNA estruturais com ou sem tradução subsequente do último em uma proteína. O processo inclui a transcrição de DNA e processamento do produto de mRNA resultante.
O termo "aumentar a expressão" é definido acima. O aumento na expressão da seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase em partes acima do solo leva ao rendimento aumentado das plantas em relação às plantas de controle. Preferivelmente, o aumento na expressão do ácido nucleico é 1,25, 1,5, 1,75, 2, 5, 7,5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100 ou mais vezes a expressão do polipeptídeo vegetal endógeno de cpFBPase. O termo "partes acima do solo de planta" é aqui considerado significar parte de plantas excluindo as raízes, pelos de raiz e qualquer outra parte de planta que esteja no solo, isto é, que não esteja diretamente exposto à luz.
Aumentando-se a expressão (em um plastídeo) de uma
seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase, um aumento na quantidade de polipeptídeo de cpFBPase é obtido. Este aumento na quantidade de polipeptídeo de cpFBPase (em um plastídeo) leva a um aumento na atividade de cpFBPase. Alternativamente, a atividade também podem ser aumentada quando não houver nenhuma mudança na quantidade de um polipeptídeo de cpFBPase ou in the quantidade mesmo quando existe uma redução na quantidade de um polipeptídeo de cpFBPase. Isto pode ocorrer quando as propriedades intrínsecas do polipeptídeo são alteradas, por exemplo, fazendo-se versões mutantes que são mais ativas do que o polipeptídeo do tipo selvagem.
A expressão de uma seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase é aumentada em um plastídeo usando técnicas bem conhecido no ramo, tais como alvejando-se um polipeptídeo de cpFBPase ao plastídeo usando seqüências de peptídeo de trânsito ou pela transformação direta de um polipeptídeo de cpFBPase sem seqüências de peptídeo de trânsito, em um plastídeo. A expressão pode ser aumentada em qualquer plastídeo, entretanto, preferido é preferencialmente aumentar a expressão em um cloroplasto.
A expressão de uma seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase pode ser modulada pela introdução de uma modificação genética, por exemplo, por qualquer uma (ou mais) das seguintes técnicas: ativação de T-DNA, TILLING, recombinação homóloga ou pela introdução e expressão em uma planta de uma seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase. A seguir da introdução da modificação genética, segue uma etapa de selecionar quanto a expressão aumentada de uma seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase, expressão aumentada esta que dá plantas tendo rendimento aumentado em relação às plantas de controle.
Uma tal técnica é a ativação de rotulação de T-DNA. O
promotor a ser introduzido pode ser qualquer promotor capaz de direcionar a expressão de um gene no organismo desejado, neste caso uma planta. Por exemplo, promotores constitutivos, de partes acima do solo, partes abaixo do solo, preferidos de tecido, preferidos do tipo de célula e indutíveis são todos adequados para o uso na ativação de T-DNA. Os efeitos da invenção também podem ser reproduzidos usando a técnica de TILLING ou usando a recombinação homóloga.
Um método preferido para introduzir uma modificação genética é introduzir e expressar em partes acima do solo de uma planta uma seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase. A cpFBPase como aqui definida refere-se a um polipeptídeo que funciona no cloroplasto e que compreendem: (i) pelo menos um domínio FBPase; e (ii) pelo menos uma inserção reguladora de redox.
Em uma forma de realização da presente invenção, a expressão de uma seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase é expressão aumentada (em partes acima do solo da planta). O aumento na expressão pode levar ao níveis de mRNA ou polipeptídeo de cpFBPase elevados, que equivaler-se-iam à atividade elevada do polipeptídeo de cpFBPase; ou a atividade também pode ser elevada quando não houver nenhuma mudança nos níveis de polipeptídeo ou mesmo quando houver uma redução nos níveis de polipeptídeo. Isto pode ocorrer quando as propriedades intrínsecas do polipeptídeo de cpFBPase são alterados, por exemplo, fazendo- se versões mutantes que sejam mais ativas que o polipeptídeo do tipo selvagem. Métodos para aumentar a expressão de genes ou produtos de genes são bem documentados na técnica.
A invenção também fornece construções genéticas e vetores para facilitar a introdução e/ou expressão das seqüências de nucleotídeo úteis nos métodos de acordo com a invenção.
Portanto, é fornecido uma construção genética que
compreende:
(i) Uma seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase, como definido acima;
(ii) Uma ou mais seqüências de controle capazes de direcionar a expressão em partes acima do solo de uma planta, da seqüência de ácido nucleico de (i); e opcionalmente
(iii) Uma seqüência de terminação de transcrição;
Uma construção preferida é uma se a seqüência de controle é um promotor derivado de uma planta, preferivelmente de uma planta monocotiledônea se uma monocotiledônea deva ser transformada.
As construções úteis nos métodos de acordo com a presente invenção podem ser construídas usando a tecnologia de DNA recombinante bem conhecida pelas pessoas habilitada na técnica. As construções genéticas podem ser inseridas em vetores, que podem ser comercialmente disponíveis, adequados para transformação em plantas e adequados para a expressão do gene de interesse nas células transformadas. A invenção portanto fornece o uso de uma construção genética como definida acima nos métodos da invenção.
As plantas são transformadas com um vetor que compreende a seqüência de interesse (isto é, uma seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase). A seqüência de interesse é operavelmente ligada a uma ou mais seqüências de controle (pelo menos a um promotor). Os termos "elemento regulador", "seqüência de controle" e "promotor" são todos usados aqui intercambiavelmente e são definidos acima. Vantajosamente, o promotor usado para direcionar a expressão da seqüência de ácido nucleico pode ser um promotor preferido de tecido, isto é um que é capaz de preferencialmente iniciar a transcrição em certos tecidos, tais como as folhas, hastes, tecido de semente etc. Promotores capazes de iniciar a transcrição apenas em certos tecidos são aqui aludidos como "específicos de tecido", similarmente, promotores capazes de iniciar a transcrição apenas em certas células são aqui aludidos como "específicos de célula". Adicional ou alternativamente, o promotor pode ocorrer natural ou sintético. Preferivelmente, o promotor é capaz de direcionar a expressão de um ácido nucleico que codifica um polipeptídeo de cpFBPase em partes acima do solo de uma planta, isto é, em partes expostas à luz para a regulagem de redox de cpFBPase apropriada.
Outros promotores adequados são promotores constitutivos (Benfey et al., EMBO J. 8 (1989) 2195-2202), tais como aqueles que se originam de vírus vegetais, tais como 35S CAMV (Franck et al., Cell 21 (1980) 285-294), 19S CaMV (ver também US 5352605 e WO 84/02913), 34S FMV (Sanger et al., Plant. Mol. Biol., 14, 1990: 433-443), o promotor da ubiquitina da salsa ou promotores vegetais tais como o promotor da subunidade pequena de Rubisco descrito na US 4.962.028 ou os promotores vegetais PRPl [Ward et al., Plant. Mol. Biol. 22 (1993)], SSU, PGEL1, OCS [Leisner (1988) Proc Natl Acad Sci USA 85(5): 2553-2557], lib4, usp, mas [Cornai (1990) Plant Mol Biol 15 (3): 373-381], STLS1, ScBV (Schenk (1999) Plant Mol Biol 39(6): 1221-1230), B33, SADl ou SAD2 (promotores do linho, Jain et al., Crop Science, 39 (6), 1999: 1696-1701) ou nos [Shaw et al. (1984) Nucleic Acids Res. 12(20): 7831-7846]. Outros exemplos de promotores constitutivos vegetais são os promotores da V-ATPase da beterraba açucareira (WO 01/14572). Os exemplos de promotores constitutivos sintéticos são o super promotor (WO 95/14098) e promotores derivados de caixas G (WO 94/12015). Se apropriado, os promotores indutíveis por produtos químicas além disso também podem ser usados, comparar a EP-A 388186, EP-A 335528, W097/06268. Na expressão estável, constitutiva dos polipeptídeos de acordo com a invenção uma planta pode ser vantajosa. Entretanto, a expressão indutível do polipeptídeo da invenção é vantajoso, se uma expressão tardia antes da colheita é de vantagem, como manipulação metabólica pode levar ao retardo do crescimento da planta.
A expressão de gene vegetais também pode ser facilitada por intermédio de um promotor indutível por produto químico. Os exemplos de tais promotores são um promotor indutível pelo ácido salicílico (WO 95/19443) e promotor indutível pelo ácido abscíssico (EP 335 528), um promotor indutível tetraciclina (Gatz et al. (1992) Plant J. 2, 397-404), um promotor indutível por ciclo-hexanol ou etanol (WO 93/21334) ou outros como aqui descritos.
Outros promotores adequados são aqueles que reagem ao estresse biótico ou abiótico, por exemplo o promotor do gene PRP1 induzido por patógeno (Ward et al., Plant. Mol. Biol. 22 (1993) 361-366), o promotor de hsp80 do tomate induzido pelo calor (US 5,187,267), o promotor da alfa- amilase da batata indutível pelo frio (WO 96/12814) ou o promotor de pinll indutível por ferimento (EP-A-0 375 091) ou outros como aqui descritos.
Os promotores preferidos são em particular aqueles que efetuam a expressão em tecidos e órgãos, em células de semente, tais como células do endosperma e células do embrião em desenvolvimento. Promotores adequados são o promotor do gene do napin da colza (US 5.608.152), o promotor USP de Vicia faba (Baeumlein et al., Mol Gen Genet, 1991, 225 (3): 459-67), o promotor da oleosina de Arabidopsis (WO 98/45461), o promotor da faseolina de Faseolus vulgaris (US 5.504.200), o promotor Bce4 da Brassica (WO 91/13980), o promotor ares de feijão, o promotor DcG3 da cenoura ou o promotor B4 de Legumina (LeB4; Baeumlein et al., 1992, Plant Journal, 2 (2): 233-9) e promotores que realizam a expressão específica de semente em plantas monocotiledôneas tais como milho, cevada, trigo, centeio, arroz e outros. Os promotores específico de semente vantajosos são o promotor da proteína de ligação da sacarose (WO 00/26388), o promotor da faseolina e o promotor de napin. Os promotores adequados que devem ser considerados são o promotor do gene Ipt2 ou Iptl da cevada (WO 95/15389 e WO 95/23230) e os promotores descritos na WO 99/16890 (promotores do gene da hordeína da cevada, o gene da glutelina do arroz, o gene orizina do arroz, o gene prolamina do arroz, o gene da gliadina do trigo, o gene da glutelina do trigo, o gene da zeína do milho, o gene da glutelina da aveia, o gene da casirina do sorgo e o gene da secalina do centeio). Outros promotores adequados são Amy32b, Amy 6-6 e Aleurain [US 5.677.474], Bce4 (colza) [US 5.530.149], glicinina (soja) [EP 571 741], fosfoenolpiruvato carboxilase (soja) [JP 06/62870], ADRl2-2 (soja) [WO 98/08962], isocitrato liase (colza) [US 5.689.040] ou ot-amilase (cevada) [EP 781 849]. Outros promotores que são disponíveis para a expressão de
genes em plantas são promotores específicos de folha tais como aqueles descritos em DE-A 19644478 ou promotores regulados por luz tais como, por exemplo, o promotor petE da ervilha.
Em uma forma de realização, a seqüência de ácido nucleico é operavelmente ligada a um promotor constitutivo. Um promotor constitutivo é transcricionalmente ativo durante a maioria, mas não necessariamente todas as fases do seu crescimento e desenvolvimento e é de modo ubíquo substancialmente expressado (incluindo em partes acima do solo de uma planta). Preferivelmente o promotor é derivado de uma planta, mais preferivelmente o promotor é de uma planta monocotiledônea se uma planta monocotiledônea deva ser transformada. Mais preferivelmente, o promotor constitutivo é um promotor GOS2 que é representado por uma seqüência de ácido nucleico substancialmente similar à SEQ ID NO: 208 ou SEQ ID NO: 56. Mais preferivelmente o promotor GOS2 é como representado pela SEQ ID NO: 56 ou SEQ ID NO: 208. Deve estar claro que a aplicabilidade da presente invenção não é restrita à seqüência de ácido nucleico de cpFBPase como representado pela SEQ ID NO: 154, nem é a aplicabilidade da invenção restrita à expressão de uma seqüência de ácido nucleico de cpFBPase quando direcionado por um Promotor GOS2. Os exemplos de outros promotores constitutivos que também podem ser usados para direcionar a expressão de uma seqüência de ácido nucleico de cpFBPase são mostrados acima.
Opcionalmente, uma ou mais seqüências terminadoras podem ser usadas na construção introduzida em uma planta. Os elementos reguladores adicionais podem incluir realçadores transcricionais assim como traducionais. Aqueles habilitados na técnica estarão cientes de seqüências terminadora e realçadoras que podem ser adequadas para o uso na realização da invenção. Uma seqüência de intron também pode ser adicionada à região não traduzida 5' (UTR) ou na seqüência codificadora para aumentar a quantidade da mensagem madura que acumula no citossol, como descrito na seção de definição. Outras seqüências de controle (além do promotor, realçador, silenciador, seqüências de intron, regiões 3'UTR e/ou 5'UTR) podem ser elementos estabilizadores de proteína e/ou RNA. Tais seqüências podem ser conhecidas ou podem ser facilmente obtidas por uma pessoa habilitada na técnica.
As construções genéticas da invenção podem incluir ainda uma seqüência de origem de replicação que é requerida para a manutenção e/ou replicação em um tipo de célula específico. Um exemplo é quando uma construção genética é requerida ser mantida em uma célula bacteriana como um elemento genético epissômico (por exemplo, molécula plasmídica ou cosmídica). As origens preferidas de replicação incluem, mas não são limitadas ao fl-ori e colEl.
Para a detecção da transferência das seqüências de ácido nucleico bem sucedida como usada nos métodos da invenção e/ou seleção de plantas transgênicas que compreendem estes ácidos nucleicos, é vantajoso usar genes marcadores (ou genes repórteres). Portanto, a construção genética pode opcionalmente compreender um gene marcador selecionável. Os marcadores selecionáveis são descritos em mais detalhes na seção "definições" aqui. Os genes marcadores podem ser removidos ou excisados da célula transgênica uma vez que eles não são mais necessários. As técnicas para a remoção de marcador são conhecidas no ramo, as técnicas úteis são descritas acima na seção de definição. Marcadores diferentes são preferidos, dependendo do organismo e do método de seleção. A presente invenção também abrange plantas (incluindo
sementes) obteníveis pelos métodos de acordo com a presente invenção. A presente invenção portanto fornece plantas, parte de plantas e células vegetais obteníveis pelos métodos de acordo com a presente invenção, plantas estas que tiveram introduzida neste ponto uma seqüência de ácido nucleico de cpFBPase e plantas, parte de plantas e células vegetais estas que são preferivelmente de uma planta de cultivo, mais preferivelmente de uma planta monocotiledônea.
A invenção também fornece um método para a produção de plantas transgênicas tendo rendimento aumentado em relação às plantas de controle, que compreende a introdução e expressão em uma planta de uma seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase.
Mais especificamente, a presente invenção fornece um método para a produção de plantas transgênicas, preferivelmente plantas monocotiledôneas, tendo rendimento aumentado em relação às plantas de controle, método este que compreende:
(i) introduzir e expressar em partes acima do solo de uma planta ou célula vegetal uma seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase; e
(ii) cultivar a célula vegetal sob condições que promovam crescimento e desenvolvimento da planta.
O ácido nucleico de (i) pode ser qualquer um dos ácidos nucleicos capazes de codificar um polipeptídeo de cpFBPase como aqui definido.
A seqüência de ácido nucleico pode ser introduzida
diretamente em uma célula vegetal ou na planta por si só (incluindo a introdução em um tecido, órgão ou qualquer outra parte de uma planta). De acordo com uma característica preferida da presente invenção, a seqüência de ácido nucleico é introduzida em uma planta pela transformação.
As células vegetais geneticamente modificadas podem ser
regeneradas por intermédio de todos os métodos com que o técnico habilitado está familiarizado. Os métodos adequados podem ser encontrados nas publicações supra citadas por S. D. Kung e R. Wu, Potrykus ou Hõfgen e Willmitzer.
No geral depois da transformação, as células vegetais ou
agrupamentos de célula são selecionados quanto a presença de um ou mais marcadores que são codificados pelos genes expressáveis em planta co- transferidos com o gene de interesse, seguindo que o material transformado é regenerado em uma planta inteira. Para selecionar plantas transformadas, o
material vegetal obtido na transformação é, como uma regra, submetido às condições selecionativas de modo que as plantas transformadas podem ser distinguidas das plantas não transformadas. Por exemplo, as sementes obtidas na maneira descrita acima pode ser plantada e, depois de um período de crescimento inicial, submetida a uma seleção adequada pela pulverização.
Uma outra possibilidade consiste em cultivar as sementes, se apropriado depois da esterilização, em placas de ágar usando um agente de seleção adequado de modo que apenas as sementes transformadas possam crescer em plantas. Alternativamente, as plantas transformadas são triadas quanto a presença de um marcador selecionável tal como aqueles descritos acima. A seguir da transferência de DNA e regeneração, as plantas putativamente transformadas podem ser avaliadas, por exemplo, usando a análise de Southern, quanto a presença do gene de interesse, número de cópia e/ou organização genômica. Alternativa ou adicionalmente, os níveis de expressão do DNA recém introduzido podem ser monitorados usando as análises de Northern e/ou Western, PCR quantitativa, tais técnicas sendo bem conhecidas pelas pessoas tendo habilidade comum na técnica.
As plantas transformadas geradas podem ser propagadas por uma variedade de meios, tais como pela propagação clonal ou técnicas de procriação clássicas. Por exemplo, uma planta transformada de primeira geração (ou TI) pode ser auto-polinizada para dar transformantes homozigotos da segunda geração (ou T2) e as plantas T2 propagadas ainda através de técnicas de procriação clássicas.
Os organismos transformados gerados podem tomar uma variedade de formas. Por exemplo, eles podem ser quimeras de células transformadas e células não transformadas; transformantes clonais (por exemplo, todas as células transformadas para conter o cassete de expressão); enxertos de tecidos transformados e não transformados (por exemplo, em plantas, um rizoma transformado enxertado a uma muda não transformada). Os métodos da invenção são vantajosamente aplicáveis a
qualquer planta. As plantas que são particularmente úteis nos métodos da invenção incluem todas as plantas que pertencem à superfamília Viridiplantae, em particular plantas monocotiledôneas e dicotiledôneas incluindo forragem ou legumes forrageiros, plantas ornamentais, safras alimentícias, árvores ou arbustos. De acordo com uma forma de realização preferida da presente invenção, a planta é uma planta de cultivo. Os exemplos de planta de cultivos incluem soja, girassol, canola, alfafa, colza, algodão, tomate, batata e tabaco. Mais preferivelmente, a planta é uma planta monocotiledônea. Os exemplos de plantas monocotiledôneas incluem cana de açúcar. Mais preferivelmente a planta é um cereal. Os exemplos de cereais incluem arroz, milho, trigo, cevada, painço, centeio, triticale, sorgo e aveia.
Outras plantas vantajosas são selecionadas do grupo que consiste de Asteraceae tal como os gêneros Helianthus, Tagetes por exemplo, as espécies Helianthus annus [girassol], Tagetes lúcida, Tagetes erecta ou Tagetes tenuifolia [cravo-de-defunto], Brassicaceae tal como os gêneros Brassica, Arabadopsis por exemplo, as espécies Brassica napus, Brassica rapa ssp. [canola, colza, nabo] ou Arabidopsis thaliana·, Fabaeeae tal como os gêneros Glicina por exemplo, as espécies Glieina max, Soja hispida ou Soja max [soja]; Linaceae tal como os gêneros Linum por exemplo, as espécies Linum usitatissimum, [linho, linhaça]; Poaeeae tal como os gêneros Hordeum, Seeale, Avena, Sorgo, Oryza, Zea, Tritieum por exemplo, as espécies Hordeum vulgare [cevada]; Secale eereale [centeio], Avena sativa, Avena fatua, Avena byzantina, Avena fatua var. sativa, Avena hybrida [aveia], Sorgo bicolor [Sorgo, painço], Oryza sativa, Oryza latifolia [arroz], Zea mays [milho, milho] Tritieum aestivum, Tritieum durum, Tritieum turgidum, Tritieum hybernum, Tritieum maeha, Tritieum sativum ou Tritieum vulgare [trigo, trigo de pão, trigo comum]; Solanaeeae tal como os gêneros Solanum, Lycopersicon por exemplo, as espécies Solanum tuberosum [batata], Lycopersicon eseulentum, Lyeopersieon lycopersieum, Lyeopersieon piriforme, Solanum integrifolium ou Solanum lycopersieum [tomate].
A presente invenção claramente estende-se a qualquer célula vegetal ou planta produzida por qualquer um dos métodos aqui descritos e a todas as partes de planta e propágulos desta. A presente invenção estende-se ainda para abranger a progênie de uma célula primária transformada ou transfectada, tecido, órgão ou planta inteira que foram produzidos por qualquer um dos métodos anteriormente mencionados, a única exigência sendo que a progênie exiba a(s) mesma(s) característica(s) genotípica(s) e/ou fenotípica(s) como aquelas produzidas pelo precursor nos métodos de acordo com a invenção. A invenção também inclui células hospedeiras contendo uma seqüência de ácido nucleico de cpFBPase isolada. As células hospedeiras preferidas de acordo com a invenção são células vegetais. A invenção também estende-se às partes colhíveis de uma planta tais como, mas não limitado às sementes, folhas, frutas, flores, culturas de haste, rizomas, tubérculos e bulbos. A invenção além disso diz respeito aos produtos derivados, preferivelmente diretamente derivados, de uma parte colhível de uma tal planta, tal como pelotas ou pós secos, farinha, óleo, gordura e ácidos graxos, amido ou proteínas.
A presente invenção também abrange o uso de seqüências de
ácido nucleico de cpFBPase e o uso de polipeptídeos de cpFBPase e o uso de uma construção como definido acima no aumento do rendimento da planta em relação às plantas de controle. O rendimento aumentado da planta é em particular o rendimento de semente aumentado. Por rendimento de semente aumentado é aqui considerado significar qualquer um dos seguintes: (i) peso de semente aumentado; (ii) número de sementes cheias aumentado; (iii) taxa de enchimento de semente aumentada; e (iv) índice de colheita aumentado.
As seqüências de ácido nucleico de cpFBPase ou polipeptídeos de cpFBPase podem encontrar uso em programas de procriação em que um marcador de DNA é identificado que pode ser geneticamente ligado a um cpFBPase local. As seqüências de ácido nucleico de cpFBPase ou polipeptídeos de cpFBPase podem ser usados para definir um marcador molecular. Este DNA ou marcador de polipeptídeo podem ser depois usados em programas de procriação para selecionar plantas tendo rendimento aumentado. O gene de cpFBPase, por exemplo, pode ser uma seqüência de ácido nucleico como representada por qualquer uma das seqüências de ácido nucleico de cpFBPase como dadas na Tabela 7 ou seqüências de ácido nucleico que codificam ortólogos ou parálogos de qualquer uma das SEQ ID NOs anteriormente mencionadas. Variantes alélicas de uma seqüência de ácido nucleico de cpFBPase também podem encontrar uso em programas de procriação assistidas por marcador. Tais programas de procriação algumas vezes requerem a introdução de variação alélica pelo tratamento mutagênico das plantas, usando por exemplo mutagênese EMS; alternativamente, o programa pode começar com uma coleção de variantes alélicas da chamada origem "natural" causada involuntariamente. A identificação de variantes alélicas depois ocorre, por exemplo, pela PCR. Isto é seguido por uma etapa para seleção de variantes alélicas superiores da seqüência em questão e que dá rendimento aumentado. A seleção é tipicamente realizada monitorando-se o desempenho de crescimento de plantas contendo variantes alélicas diferentes da seqüência em questão, por exemplo, variantes alélicas diferentes de qualquer uma das seqüências de ácido nucleico de cpFBPase como dadas na Tabela 7 ou seqüências de ácido nucleico que codifica ortólogos ou parálogos de qualquer uma das SEQ ID NOs anteriormente mencionadas. O desempenho de crescimento pode ser monitorado em uma estufa ou no campo, outras etapas opcionais incluem cruzar plantas, em que a variante alélica superior foi identificada, com uma outra planta, isto pode ser usado, por exemplo, para fabricar uma combinação de características fenotípicas interessantes.
As seqüências de ácido nucleico de cpFBPase também podem ser usadas como sondas para mapear genética e fisicamente os genes dos quais eles são uma parte e como marcadores para traços ligados a estes genes. Tal informação pode ser útil na procriação de planta de modo a desenvolver linhagens com fenótipos desejados. Tal uso de seqüências de ácido nucleico de cpFBPase requer apenas uma seqüência de ácido nucleico de pelo menos nucleotídeos no comprimento. As seqüências de ácido nucleico de cpFBPase podem ser usadas como marcadores de polimorfismo de comprimento de fragmento de restrição (RFLP). Southern blots (Sambrook J, Fritsch EF e Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de DNA genômieo vegetal digerido com restrição podem ser sondadas com as seqüências de ácido nucleico de cpFBPase. os padrões de faixa resultantes podem ser depois submetidos às análises genéticas usando programas de computador tais como MapMaker (Lander et al. (1987) Genomics 1: 174- 181) de modo a construir um mapa genético. Além disso, as seqüências de ácido nucleico podem ser usadas para sondar Southern blots contendo DNAs genômicos tratados com endonuclease de restrição de um conjunto de indivíduos que representam precursor e progênie de um cruzamento genético definido. A segregação dos polimorfismos de DNA é mencionada e usada para calcular a posição da seqüência de ácido nucleico de cpFBPase no mapa genético anteriormente obtido usando esta população (Botstein et al. (1980) Am. J. Hum. Genet. 32: 314-331).
A produção e uso de sondas derivadas de gene vegetal para o uso no mapeamento genético são descritos em Bematzky e Tanksley (1986) Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevem o mapeamento genético de clones de cDNA específicos usando a metodologia esboçada acima ou variações desta. Por exemplo, populações de intercruzamento F2, populações de retrocruzamento, populações aleatoriamente acasaladas, linhagens quase isogênicas e outros conjuntos de indivíduos podem ser usados para o mapeamento. Tais metodologias são bem conhecidas por aqueles habilitados na técnica.
As sondas de ácido nucleico também podem ser usadas para o mapeamento físico (isto é, colocação de seqüências nos mapas físicos; ver Hoheisel et al. Em: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346 e referências aqui citadas).
Em uma outra forma de realização, as sondas de ácido nucleico podem ser usadas no mapeamento da hibridização in situ pela fluorescência direta (FISH) (Trask (1991) Trends Genet. 7: 149-154). Embora métodos correntes de mapeamento FISH favoreçam o uso de clones grandes (diversos kb a diversas centenas de kb; ver Laan et al. (1995) Genome Res. 5: 13-20), melhorias na sensibilidade podem possibilitar desempenhos de mapeamento FISH usando sondas mais curtas.
Uma variedade de métodos com base na amplificação de ácido
nucleico para o mapeamento genético e físico pode ser realizada usando as seqüências de ácido nucleico. Os exemplos incluem amplificação específica de alelo (Kazazian (1989) J. Lab. Clin. Med 11: 95-96), polimorfismo de fragmentos amplificados pela PCR (CAPS; Sheffield et al. (1993) Genomics 16: 325-332), ligação específica de alelo (Landegren et al. (1988) Science 241: 1077-1080), reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acids Res. 18: 3671), Mapeamento de Híbrido de Radiação (Walter et al. (1997) Nat. Genet. 7: 22-28) e Mapeamento Happy (Dear e Cook (1989) Nucleic Acids Res. 17: 6795-6807). Para estes métodos, a seqüência de ácido nucleico é usada para planejar e produzir pares de iniciador para o uso na reação de amplificação ou nas reações de extensão de iniciador. O planejamento de tais iniciadores é bem conhecido por aqueles habilitados na técnica. Em métodos que utilizam mapeamento genético com base na PCR, pode ser necessário identificar as diferenças de seqüência de DNA entre os precursores dos cruzamentos de mapeamento na região que corresponde à presente seqüência de ácido nucleico. Isto, entretanto, no geral não é necessário para os métodos de mapeamento.
Os métodos de acordo com a presente invenção resultam em plantas tendo rendimento aumentado em relação às plantas de controle, como descrito mais acima. Estes traços que realçam o rendimento também podem ser combinados com outros traços economicamente vantajosos, tais como outros traços que realçam o rendimento, tolerância aos vários estresses, traços que modificam várias características de arquitetura e/ou características bioquímicas e/ou fisiológicas. Descrição detalhada para o polipeptídeo de SIK
Foi agora descoberto que modular a expressão em uma planta de um ácido nucleico de SIK e/ou um polipeptídeo de SIK dá plantas tendo vários traços melhorados relacionados com o rendimento em relação às plantas de controle, em que a superexpressão de um ácido nucleico que codifica SIK em uma planta dá número de flores aumentado por planta em relação às plantas de controle e em que a redução ou eliminação substanciais de um ácido nucleico de SIK dá peso de mil grãos aumentado, índice de colheita aumentado e taxa de enchimento aumentada em relação às plantas do tipo selvagem correspondentes.
Portanto, a invenção fornece um método para melhorar traços relacionados com o rendimento em plantas em relação às plantas de controle, compreendendo modular a expressão em uma planta de um ácido nucleico de SIK e/ou um polipeptídeo de SIK, em que a expressão modulada é a superexpressão de um ácido nucleico que codifica SIK em uma planta resultando em um número de flores aumentado por planta em relação às plantas de controle e em que a expressão modulada é uma redução ou eliminação substanciais de um ácido nucleico de SIK resultando em um peso de mil grãos aumentado (TKW), índice de colheita aumentado (HI) e taxa de enchimento aumentada em relação às plantas do tipo selvagem correspondentes.
O termo "modulação" como aqui definido é considerado significar uma mudança no nível de expressão de gene em comparação com uma planta de controle, no caso onde um ácido nucleico que codifica SIK está sendo usado para aumentar o número de flores por planta, o nível de expressão é aumentado e no caso onde um ácido nucleico de SIK está sendo usado para aumentar TKW, HI ou a taxa de enchimento, o nível de expressão é diminuído, a expressão não modulada original pode ser de qualquer tipo de expressão de um RNA estrutural (rRNA, tRNA) ou mRNA com tradução subsequente.
O termo "expressão" ou "expressão de gene" significa a transcrição de um gene específico ou genes específicos ou construção genética específica. O termo "expressão" ou "expressão de gene" em particular significa a transcrição de um gene ou genes ou construção genética em RNA estrutural (rRNA, tRNA) ou mRNA com ou sem tradução subsequente do último em uma proteína. O processo inclui a transcrição de DNA e o processamento do produto de mRNA resultante.
Os vários traços melhorados relacionados com o rendimento são melhorados em pelo menos 5%, 6%, 7%, 8%, 9% ou 10%, preferivelmente pelo menos 15% ou 20%, mais preferivelmente 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65% ou 70% comparado com as plantas de controle.
A melhora pode ser em um ou mais dos seguintes: número de flores aumentado por planta, taxa de enchimento de semente aumentada (que como aqui definido é a razão entre o número de sementes cheias dividido pelo número total de sementes; índice de colheita aumentado, que como aqui definido é a razão do rendimento de partes colhíveis, tais como sementes, dividido pela biomassa total; e peso de mil grãos aumentado (TKW), que como aqui definido é derivado pela extrapolação do número de sementes cheias contadas e seu peso total. O TKW aumentado pode resultar de um tamanho de semente e/ou peso de semente aumentado e também pode resultar de um aumento no tamanho do embrião e/ou endosperma.
Um aumento no peso de mil grãos, índice de colheita aumentado e taxa de enchimento aumentada ocorre se a planta está sob condições não estressantes ou se a planta é exposta a vários estresses comparada com as plantas de controle. As plantas tipicamente respondem à exposição ao estresse pelo crescimento mais lento. Em condições de estresse severa, a planta pode mesmo parar o crescimento completamente. O estresse brando por outro lado é aqui definido como sendo qualquer estresse ao qual uma planta é exposta que não resulta na planta cessando de crescer completamente sem a capacidade para retomar o crescimento. O estresse brando no sentido da invenção leva a uma redução no crescimento das plantas estressadas de menos do que 40%, 35% ou 30%, preferivelmente menor do que 25%, 20% ou 15%, mais preferivelmente menor do que 14%, 13%, 12%, 11 % ou 10% ou menos em comparação com a planta de controle sob condições não estressantes. Devido aos avanços nas práticas agrícolas (irrigação, fertilização, tratamentos com pesticida) estresses severos não são freqüentemente encontrados em plantas de safra cultivadas. Como uma conseqüência, o crescimento comprometido induzido pelo estresse brando é freqüentemente uma característica indesejável para a agricultura. Os estresses brandos são os estresses bióticos e/ou abióticos (ambientais) diários aos quais uma planta é exposta. Estresse abióticos podem ser devido à seca ou água em excesso, estresse anaeróbico, estresse salino, toxicidade química, estresse oxidativo e temperaturas quentes, frias ou congelantes. O estresse abiótico pode ser um estresse osmótico causado por um estresse pela água (particularmente devido à seca), estresse salino, estresse oxidativo ou um estresse iônico. Estresses bióticos são tipicamente aqueles estresses causados por patógenos, tais como bactérias, vírus, fungos e insetos.
Em particular, os métodos da presente invenção podem ser realizados sob condições não estressantes ou sob condições de seca branda para dar plantas tendo peso de mil grãos aumentado, índice de colheita aumentado e taxa de enchimento aumentada em relação às plantas de controle. Como relatado em Wang et ai. (Plant (2003) 218: 1-14), o estresse abiótico leva a uma série de mudanças morfológicas, fisiológicas, bioquímicas e moleculares que afetam adversamente o crescimento e a produtividade da planta. A seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidos como estando interconectados e podem induzir crescimento e dano celular através de mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133: 1755-1767) descreve um grau particularmente alto de "conversa cruzada" entre estresse pela seca e estresse de salinidade alta. Por exemplo, a seca e/ou a salinização são manifestadas primariamente como estresse osmótico, resultando no rompimento da homeostase e distribuição iônica na célula. O estresse oxidativo, que freqüentemente acompanha as temperaturas altas ou baixas, a salinidade ou estresse pela seca, podem causar a desnaturação de proteínas funcionais e estruturais. Como uma conseqüência, estes diversos estresses ambientais freqüentemente ativam caminhos da sinalização de célula e respostas celulares similares, tais como a produção de proteínas de estresse, super-regulagem de anti-oxidantes, acúmulo de solutos compatíveis e parada de crescimento. O termo condições "não estressantes" como aqui usado são aquelas condições ambientais que possibilitam crescimento ótimo de plantas. As pessoas habilitadas na técnica estão cientes de condições de solo e condições climáticas normais para uma dada localização.
O desempenho dos métodos da invenção dá plantas cultivadas sob condições não estressantes ou sob condições de seca branda peso de mil grãos aumentado, índice de colheita aumentado e taxa de enchimento aumentada em relação às plantas de controle cultivadas sob condições comparáveis. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar o peso de mil grãos, índice de colheita aumentado e taxa de enchimento aumentada em plantas cultivadas sob condições não estressantes ou sob condições de seca branda, método este que compreende aumentar a expressão em uma planta de um ácido nucleico que codifica um polipeptídeo de SIK.
O desempenho dos métodos da invenção dá plantas cultivadas sob condições de deficiência de nutriente, particularmente sob condições de deficiência de nitrogênio, peso de mil grãos aumentado, índice de colheita aumentado e taxa de enchimento aumentada em relação às plantas de controle cultivadas sob condições comparáveis. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar o peso de mil grãos, índice de colheita aumentado e taxa de enchimento aumentada em plantas cultivadas sob condições de deficiência de nutriente, método este que compreende aumentar a expressão em uma planta de um ácido nucleico que codifica um polipeptídeo de SIK. A deficiência de nutriente pode resultar de uma falta de nutrientes tais como nitrogênio, fosfatos e outros compostos contendo fósforo, potássio, cálcio, cádmio, magnésio, manganês, ferro e boro, entre outros.
A presente invenção abrange plantas ou partes destas (incluindo sementes) obteníveis pelos métodos de acordo com a presente invenção. As plantas ou partes destas compreendendo um transgene de ácido nucleico que codifica um polipeptídeo de SIK como definido acima.
De acordo com um aspecto da presente invenção, uma redução ou eliminação substanciais de um ácido nucleico de SIK resulta em um ou mais de um peso de mil grãos aumentado (TKW), índice de colheita aumentado (HI) e taxa de enchimento aumentada em relação às plantas de controle.
Referência aqui a um "ácido nucleico de SIK" é considerado significar uma forma polimérica de um polímero de desoxirribonucleotídeo ou um ribonucleotídeo de qualquer comprimento, de filamento duplo ou único ou análogos destes, que têm a característica essencial de um ribonucleotídeo natural em que podem hibridizar com as seqüências de ácido nucleico de SIK em uma maneira similar aos polinucleotídeos que ocorrem naturalmente.
Referência aqui a "uma redução ou eliminação substanciais de um ácido nucleico ou gene de SIK" e a um gene de SIK "endógeno" é como descrito na seção de definição.
Para a redução ou eliminação substanciais de expressão de um gene SIK endógeno em uma planta, um comprimento suficiente de nucleotídeos substancialmente contíguos de uma seqüência de ácido nucleico de SIK é requerida. O trecho de nucleotídeos substancialmente contíguos pode ser derivado de qualquer ácido nucleico de SIK, preferivelmente um ácido nucleico de SIK representado por qualquer uma das SEQ ID NO 213 a 225 ou qualquer uma das seqüências de ácido nucleico dadas na Tabela 8 ou Tabela 9 abaixo. Uma seqüência de ácido nucleico de SIK que codifica um polipeptídeo (funcional) não é uma exigência para os vários métodos aqui debatidos para a redução ou eliminação substanciais da expressão de um gene SIK endógeno.
Esta redução ou eliminação substanciais podem ser obtidas
usando ferramentas e técnicas de rotina, como descrito acima. Um método preferido para a redução ou eliminação substanciais da expressão de um ácido nucleico de SIK é pela introdução e expressão em uma planta de uma construção genética na qual o ácido nucleico de SIK é clonado como uma repetição invertida (em parte ou completamente), separada por um espaçador (DNA não codificador).
De acordo com um outro aspecto da presente invenção, a superexpressão em uma planta de um ácido nucleico que codifica SIK resulta em um número de flores aumentado por planta em relação às plantas de controle.
Um método preferido para a superexpressão de um ácido nucleico que codifica SIK é pela introdução e expressão em uma planta de um ácido nucleico que codifica um polipeptídeo de SIK como definido abaixo.
Um "ácido nucleico que codifica SIK" codifica um "polipeptídeo de SIK" ou "seqüência de aminoácido de SIK" que como aqui definido é considerado significar um polipeptídeo de acordo com a SEQ ID NO: 210 e ortólogos e parálogos destes como aqui definidos.
O polipeptídeo de SIK representado pela SEQ ID NO: 210 e ortólogos e parálogos destes tipicamente também podem compreender as seguintes características. Região de ligação de ATP
A região de ligação de ATP VSESLTSTSYKASFRDDFTD PKTIEAIVSRL (Motivo 1) ou uma região de ligação de ATP tendo em ordem crescente de preferência pelo menos 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% de identidade ao Motivo I.
Assinatura de sítio ativo da serina treonina quinase
A assinatura de sítio ativo da serina treonina quinase AMYNDFSTSNIQI com resíduo D conservado (Motivo 2) ou uma assinatura de sítio ativo da serina treonina quinase tendo em ordem crescente de preferência pelo menos 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% de identidade ao Motivo II. Domínio rico em serina
Um domínio rico em serina de terminal N. Sítios de miristoilação
Os ortólogos e parálogos podem compreender ainda um ou mais sítios de miristoilação que pode servir para ancorar a proteína à membrana.
Atividade de quinase
Além disso, os ortólogos e parálogos de SIK exibirão atividade de quinase da qual podem ser facilmente determinados usando ferramentas e tecnicas de rotina. Diversos ensaios sao disponiveis (por exemplo Current Protocols in Molecular Biology, Volumes 1 e 2, Ausubel et al. (1994), Current Protocols; ou online tal como http: //www.protocol-online.org).
Em resumo, ο ensaio de quinase no geral envolve (1) levar a proteina de quinase em contato com um polipeptideo de substrato contendo ο sitio alvo a ser fosforilado; (2) possibilitar a fosforilayao do sitio alvo em um tampao de quinase apropriado sob condi9oes apropriadas; (3) separar os produtos fosforilados do substrato nao fosforilado depois de um periodo de reagao adequado. A presenfa ou ausencia de atividade de quinase e determinada pela presen^a ou ausencia de um alvo fosforilado. Alem disso, as medi9oes quantitativas podem ser realizadas.
As proteinas ou extratos de celula de SIK purificados contendo ou enriquecidos na proteina SIK podem ser usados como fonte para a proteina de quinase. Como um substrato, peptideos pequenos sao particularmente bem adaptados. O peptideo deve compreender um ou mais residuos de serina, treonina ou tirosina em um motivo de sitio de fosforila^ao. Uma compila9ao de sitios de fosforilafao pode ser encontrada em Biochimica et Biophysica Acta 1314,191-225, (1996). Alem disso, os substratos de peptideo podem ter vantajosamente uma carga positiva liquida para facilitar a ligagao aos filtros de fosfocelulose, (possibilitando separar os peptideos fosforilados dos nao fosforilados e para detectar os peptideos fosforilados). Se um motivo de sitio de fosforila9ao nao e conhecido, um substrato de tirosina quinase geral pode ser usado. Por exemplo, ο "peptideo relacionado com Src" (RRLIEDAEYAARG) e um substrato para muitas tirosina quinases receptoras e nao receptoras). Para determinar os parametros cineticos para a fosforila9ao do peptideo sintetico, uma faixa de concentrates de peptideo e requerida. Para as reagoes iniciais, uma concentragSo de peptideo de 0,7 a 1,5 mM pode ser usada.
Para cada enzima de quinase, e importante determinar ο tampao, forga ionica e pH ideais para a atividade. Um Tampao de Quinase 5x padrao no geral contem 5 mg/ml de BSA (Albumina Serica Bovina que impede a absor^So da quinase ao tubo de ensaio), 150 mM de Tris-Cl (pH 7,5), 100 mM de MgCl2. Os cations bivalentes sao requeridos para a maioria das tirosina quinases, embora algumas tirosina quinases (por exemplo, quinases receptoras de insulina, IGF-I e PDGF) requerem MnCl2 ao inves de MgCl2 (ou alem disso MgCl2). As concentra^Ses otimas de cations bivalentes devem ser determinadas empiricamente para cada proteina quinase.
Um doador habitualmente usado do grupo fosforila e radio- rotulado [gama-32P]ATP (normalmente a 0,2 mM de concentra?ao final). A
• 32 ‘
quantidade de P incorporada nos peptideos pode ser determinada medindo- se a atividade nas almofadas secas de nitrocelulose em um contador de cintila^ao.
Alternativa ou adicionalmente, a atividade de um ortologo ou paralogo de SIK pode ser ensaiada pela superexpressao em uma planta de um acido nucleico que codifica um polipeptideo de SIK sob ο controle de um promotor constitutivo para checar quanto ao aumento do niimero de flores por planta em rela9ao as plantas de controle e tambem pela redi^ao ou elimina9ao substanciais de um acido nucleico de SIK sob ο controle de um promotor constitutivo para checar quanto a um ou mais de um aumento no peso de mil graos (TKW), indice de colheita (HI) e taxa de enchimento em plantas em rela9ao as plantas de controle.
A inven^ao e ilustrada pela transformayao de plantas com a sequencia de Oryza sativa representada pela SEQ ID NO: 209,que codifica a sequencia de polipeptideo da SEQ ID NO: 210, entretanto ο desempenho da inven9ao nao e restrita a estas sequencias. Os metodos da inven^ao podem ser vantajosamente realizadas usando qualquer acido nucleico que codifica um polipeptideo de SIK como aqui definido, tal como qualquer uma das
sequencias de acido nucleico dadas na Tabela 8 e Tabela 9. Os exemplos de ortologos e paralogos da SEQ ID NO: 210 dadas na Tabela 8 e Tabela 9 foram obtidos do The Institute of Genetic Research (TIGR). A% de identidade dada na Tabela 9 esta em um nivel de nucleotideo. O numero de acesso dado comegando com 'TO’ identifica a sequencia como descoberta atraves de TIGR. No caso de acidos nucleicos parciais, estaria bem dentro das capacidades de uma pessoa habilitada na tecnica para se obter a sequencia de tamanho natural (ou pelo menos um comprimento suficiente de sequencia para realizar os metodos da invengao).
Tabela 8: Os exemplos de ortologos e paralogos de SIK putativos
# TC Fun^ao Putativa 1 Arabidopsis\TC212322 (Q9C9Y3) Proteina hipotetica F17014.23 2 Cevada|TC 134680 (Q8RUD7) Similar a quinase de proteina AtSIK (proteina P0485B12.21) 3 Algodao|TC30779 (Q9C9Y3) Proteina hipotetica F17014.23 4 Uva|TC43027 (Q94CI5) Proteina quinase AtSIK Ljaponicus\TC 17767 (Q94CI5) Proteina quinase AtSIK 6 AlfaceITC 15 801 quinase de proteina AtSIK 7 Milho|TC255367 (Q8RUD7) Similar a quinase de proteina AtSIK (proteina P0485B 12.21) 8 Milho|TC272965 (Q8RUD7) Similar a quinase de proteina AtSDC (proteina P0485B12.21) 9 Medicago\TC96\15 (Q9C9Y3) Proteina hipotetica F1701423 Pimentao|TC5595 (Q94CI5) Quinase de proteina AtSIK 11 Batata|TC 117743 Dominio putativo da quinase de proteina 12 Arroz|TC268277 (Q8RUD7) Similar a quinase de proteina AtSIK (proteina P0485B12.21) 13 S. qfficinarum[TC679T4 (Q8RUD7) Similar a quinase de proteina AtSIK (proteina P0485B12.21) 14 Sorgo|TC103780 (Q8RUD7) Similar a quinase de proteina AtSIK (proteina P0485B12.21) Soja|TC229774 (Q94CI5) Quinase de proteina AtSIK 16 Tomate|TCl 58378 68416.m01018 proteina da familia da quinase de proteina contem ο dominio da quinase de proteina Pfam: PF00069 17 Tomate|TC 166426 68416.m01018 proteina da familia da quinase de proteina contem ο dominio da quinase de proteina Pfam: PF00069 18 Trigo|TC257477 (Q8RUD7) Similar a quinase de proteina AtSIK (proteina) P0485B12.21
Tabela 9: Os exemplos de ortologos e paralogos de SIK putativo.
Sequencia 1 Sequencia 2 %de Identidade Comprimento emparelhado Valor ρ Recip. melhores acertos Cevada|TC 134680 Arabidopsis\TCn2322 63 1030 6,80E-66 Algodao|TC30779 Arabidopsis\TC272322 71 1008 9’40E-103 本 Algodao|TC30779 Cevada|TC 134680 68 971 8,30E-80 * Uva|TC43027 A rabidopsis |TC272322 60 619 4’30E-25 本 Uva|TC43027 Algodao|TC30779 80 245 5,60E-29 * Uva|TC43027 Milho|TC272965 58 483 3,20E-13 * Uva|TC43027 Arroz|TC268277 66 318 3,50E-19 * Uva|TC43027 S. officinarum\TC6191A 63 372 2’40E-17 * Uva|TC43027 Soja 丨 TC229774 77 276 4,60E-30 * Uva|TC43027 Tomate|TC 158378 69 420 9,20E-33 * Uva|TC43027 Tomate|TC 166426 75 241 l,80E-23 Ljaponicus\TC 17761 Arabidopsis\TCn2322 72 659 l,30E-64 Ljaponicus\TC 1776" Cevada|TC 134680 67 659 4,40E-53 本 Ljaponicus\TC 1776) Algodao|TC30779 80 654 9’20E-89 * Alface|TC 15801 Arabidopsis\TC212322 69 529 8’90E-44 Alface|TC 15 801 Algodao|TC30779 77 501 l,20E-58 * Alface|TC 15801 Ljaponicus^CMl (ft 75 412 2,20E-45 * Milho|TC255367 Arabidopsis[rC272322 62 528 5,50E-24 本 Milho|TC255367 Cevada|TC 134680 81 451 l’10E-60 本 Milho|TC255367 Algodao|TC30779 63 738 6,90E-44 * Milho|TC255367 Ljaponicus\TC 17767 66 366 2’20E-24 本 Milho|TC255367 Alface|TC15801 65 455 4’10E-30 本 Milho|TC272965 Cevada|TC 134680 68 623 2,90E-43 Medicago\TC96\lS Arabidopsis\TC272322 67 1245 2,70E-102 本 Medicago\TC96\15 Cevada|TC 134680 65 1069 2,50E-75 木 Medicago\TC96\15 Algodao|TC30779 76 1041 2’20E-125 * Medicago\JC96\lS Ljaponicus\TC 17767 89 666 3,50E-114 Medicago\TC96\15 Alface|TC 15801 73 504 1,00E-51 * Medicago\TC96\15 Milho|TC255367 62 813 3’60E-41 * Pimentao|TC5595 Arabidopsis\TC212322 66 696 6,40E-49 Pimentao|TC5595 Cevada|TC 134680 66 510 2’90E-38 * Pimentao|TC5595 Algodao|TC30779 76 553 l,60E-66 * Pimentao|TC5595 Ljaponicus\TC 17767 75 474 4,50E-53 Pimentao|TC5595 Alface|TC 15801 75 541 3’30E-60 * Pimentao|TC5595 Milho|TC255367 66 462 l,00E-29 * Pimentao|TC5595 Medicago\lC96\15 67 800 l,30E-60 * Batata|TCl 17743 Arabidopsis\TCn2322 64 1082 8,80E-65 * Batata|TC117743 Cevada|TC 134680 66 565 l,30E-39 Batata|TCl 17743 Algodao|TC30779 77 587 l,80E-70 * Batata|TCl 17743 LjaponicusSJQ 17767 75 496 3,60E-54 本 BatataITCl 17743 Alface|TC 15801 77 543 2,30E-65 * Batata|TC 117743 Milho|TC255367 67 444 l,30E-33 * Batata|TCl 17743 Medicago\TC96\15 68 804 4’20E-64 * Batata|TCl 17743 Pimentao|TC5595 82 826 1,60E-121 * Arroz|TC268277 Arabidopsis\TC212322 63 1019 3’10E-66 * Arroz|TC268277 Cevada|TC 134680 78 1371 5’70E-179 * Arroz|TC268277 Algodao|TC30779 64 1436 3’40E-101 Arroz|TC268277 Ljaponicus\TC 17767 70 656 1,90E-61 Arroz|TC268277 Milho|TC255367 81 860 4,50E-121 Arroz|TC268277 Milho|TC272965 74 646 4,00E-68 Arroz|TC268277 Medicago\TC96\15 63 1684 3 ,OOE-104 * Arroz|TC268277 Pimentao|TC5595 65 600 5,50E-40 * Arroz|TC268277 Batata|TCl 17743 65 691 3,80E-45 * S. officinarum\ TC67974 4rabidopsis\TC212322 63 938 l,50E-59 * S. ojficinarum\ TC67974 Cevada|TC 134680 76 1294 2,60E-151 * S. officinarum\ TC67974 A.lgodao|TC30779 66 876 5’10E-70 * S. officinarum] TC67974 Ljaponicus\TC 17767 69 656 4,70E-57 * S. officinarum] TC67974 A.lface|TC 15801 66 390 4,70E-28 * S. officinarum、 TC67974 碰o|TC255367 96 367 2,80E-72 S. officinarum\ TC67974 Milho|TC272965 90 649 2,20E-112 * S. officinarum\TC6191 4 Medicago\TC96\15 64 1140 7,80E-75 本 S. officinarum\ TC67974 Pimentao|TC5595 66 471 l,80E-33 * S. officinarum\ TC67974 Batata|TCl 17743 67 460 l,OOE-35 * S. officinarum\ TC67974 Arroz|TC268277 82 1338 1’20E-194 本 S. officinarum\ TC67974 Sorgo|TC103780 95 1359 8,70E-277 本 S. officinarum\ TC67974 Soja|TC229774 70 750 l’70E-67 * Sorgo|TC 103780 4rabidopsis\TC212322 63 1057 l,40E-65 SorgoITC 103780 Cevada|TC 134680 75 1421 5’ IOE-163 Sorgo|TC 103 780 Algodao|TC30779 64 1333 8,60E-91 本 Sorgo|TC103780 Ljaponicus\TC 17767 69 656 6’40E-57 * Sorgo|TC 103780 AlfaceITC 15801 64 493 3’70E-30 * SorgoITC 103780 Milho|TC255367 92 948 1 JOE-180 * Sorgo|TC 103780 Milho|TC272965 89 651 2’40E-110 Sorgo|TC103780 Medicago\TC96l75 62 1653 5’10E-96 * Sorgo|TC 103 780 Pimentao|TC5595 64 580 2,60E-36 本 SorgoITC 103780 Batata|TCl 17743 65 602 6,50E-39 * Sorgo|TC103780 Arroz|TC268277 80 1852 l’40E-260 * Soja|TC229774 Arabidopsis[TC272322 72 757 l’10E-77 本 Soja|TC229774 Cevada|TC 134680 69 756 5,70E-67 本 Soja|TC229774 AIgodao|TC30779 78 737 3,40E-96 本 Soja 丨 TC229774 Ljaponicus\TC 17767 90 495 4,10E-87 * Soja|TC229774 Alface 丨 TC15801 77 249 l,90E-26 * Soja|TC229774 Milho|TC255367 71 203 2’00E-15 Soja|TC229774 Medicago\TC96\15 87 717 2,10E-118 Soja|TC229774 Pimentao|TC5595 76 308 l,50E-32 * Soja|TC229774 Batota 丨 TCl 17743 76 332 1.80E-35 * Soja|TC229774 krroz|TC268277 71 744 4,20E-74 * Soja|TC229774 SorgoITC 103 780 69 757 l’30E-65 * Tomate|TC158378 Arabidopsis\lC212Z22 71 686 3,10E-64 * Tomate|TC158378 Cevada|TC 134680 65 907 8’80E-63 * Tomate|TC158378 Algodao|TC30779 78 669 2’90E-86 * Tomate|TC158378 Ljaponicus\TC 17767 78 427 l,70E-52 * Tomate|TC158378 Alface 丨 TC15801 81 181 3’90E-21 Tomate|TC158378 Milho|TC272965 60 428 4,80E-14 * Tomate|TC 158378 Medicago\TC96\75 68 908 4,60E-76 * Tomate|TC158378 Pimentao|TC5595 84 243 6,40E-34 Tomate|TC158378 Batata|TCl 17743 96 264 8,90E-50 * Tomate|TC 158378 Arroz|TC268277 66 897 l’70E-64 本 TomateITCl 58378 S. ojficinarum\TC6191A 65 906 2,40E-60 本 Tomate|TC158378 Soja|TC229774 74 700 4’80E-78 本 Tomate|TC 166426 Arabidopsis\TC212322 70 675 l,80E-62 Tomate|TC 166426 Cevada|TC 134680 67 680 l,40E-54 Tomate|TC 166426 Algodao|TC30779 77 679 3,80E-85 Tomate|TC 166426 LjaponicusfTC 17767 77 440 l,30E-50 Tomate|TC 166426 Alface|TC 15801 81 193 6,50E-23 * Tomate|TC 166426 MWc 聊丨 TC96175 73 675 l,30E-69 Tomate|TC 166426 Pimentao|TC5595 95 255 l’10E-46 * Tomate|TC 166426 Batata|TCl 17743 85 276 2,40E-39 Tomate|TC 166426 Arroz|TC268277 67 680 2,70E-55 Tomate|TC 166426 S. officinarum\TC6191A 67 680 4,90E-53 Tomate|TC 166426 Sorgo|TC 103780 67 680 l,60E-53 本 Tomate|TC 166426 Soja|TC229774 73 680 2’30E-72 Trigo|TC257477 Cevada|TC 134680 91 672 7,00E-119 * Trigo|TC257477 Milho|TC272965 69 639 2’80E-49 * Trigo|TC257477 Arroz|TC268277 68 647 4,10E-47 * Trigo|TC257477 S. officinarum\JC6191A 67 648 4,10E-46 * Trigo|TC257477 Sorgo|TC103780 69 648 4’20E-49 * Trigo|TC257477 Tomate|TC 158378 61 441 1’20E-18
Os polipeptideos ortologos e paralogos de SIK podem ser
facilmente encontrados e os acidos nucleicos que codificam tais ortologos e paralogos podem ser iiteis na realiza^ao dos metodos da inven^So.
Os ortologos e paralogos podem ser facilmente encontrados realizando-se uma chamada pesquisa de blast reciproca. Tipicamente isto envolve um primeiro BLAST envolvendo submeter a BLAST uma sequencia diivida (por exemplo, SEQ ID NO: 209 ou SEQ ID NO: 210) contra qualquer base de dados de sequencia, tal como a base de dados NCBI publicamente disponivel que pode ser encontrada em: http: //www.ncbi.nlm.nih.gov. BLASTN ou TBLASTX (usando valores default padrao) sao no geral usados quando partindo de uma sequencia de nucleotideo e BLASTP ou TBLASTN (usando valores default padrao) quando partindo de uma sequencia de proteina. Os resultados de BLAST podem ser opcionalmente filtrados. As sequencias de tamanho natural dos resultados filtrados ou resultados nao filtrados sao depois submetidos novamente a BLAST (segundo BLAST) contra sequencias do organismo a partir das quais a sequencia diivida e derivada (onde a sequencia diivida e a SEQ ID NO: 209 ou SEQ ID NO: 210, ο segundo BLAST portanto seria contra sequencias de Oryza). Os resultados do primeiro e segundo BLASTs sao depois comparados. Um paralogo e identificado se um acerto de alta classificaySo do primeiro blast e da mesma especies como da qual a sequencia duvida e derivada, um BLAST posterior depois idealmente resulta na sequencia diivida estando entre os acertos mais altos; um ortologo e identificado se um acerto de alta classificagao no primeiro BLAST nao e da mesma especies como da qual a sequencia diivida e
derivada e preferivelmente resulta no BLAST posterior na sequencia duvida estando entre os acertos mais altos.
Os acertos de alta classifica?ao sao aqueles tendo um valor E baixo. Quanto mais baixo ο valor E, mais significante a contagem (ou em outras palavras mais baixa a chance de que ο acerto fosse encontrado ao acaso). A computagSo do valor E e bem conhecida na tecnica. alem dos valores E, as compara^oes tambem estao contadas pela identidade percentual. A identidade percentual refere-se ao niimero de nucleotideos identicos (ou aminoacidos) entre as duas sequencias de acido nucleico (ou polipeptideo) comparadas em relagao a um comprimento particular. Preferivelmente a contagem e maior do que 50, mais preferivelmente maior do que 100; e preferivelmente ο valor E e menor do que e-5, mais preferivelmente menor do que e-6. No caso de familias grandes, ClustalW pode ser usado, seguido por uma arvore de uniao de vizinhos, para ajudar a visualizar a forma9ao de grupos de genes relacionados e para identificar ortologos e paralogos. Ortologos e paralogos tambem podem ser identificados usando
ο procedimento de BLAST descrito abaixo. Homologos (ou proteinas homologas, que abrangem ortologos e paralogos) podem ser facilmente identificados usando tecnicas de rotina bem conhecidas no ramo, tais como pelo alinhamento de sequencia. Os metodos para ο alinhamento de sequencias para compara^So sao bem conhecidos na tecnica, tais metodos incluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa ο algoritmo de Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar ο alinhamento de duas sequencias completas que maximiza ο niimero de emparelhamentos e minimiza ο numero de intervalos. O algoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-410) calcula a identidade de sequencia percentual e realiza uma analise estatistica da similaridade entre as duas sequencias. O software para realizar a analise de BLAST esta publicamente disponivel atraves do National Centre for Biotechnology Information. Homologos
podem ser facilmente identificados usando, por exemplo, ο algoritmo de alinhamento de sequencia multipla ClustalW (versao 1.83), com os parametros de alinhamento aos pares de default e um metodo de contagem em porcentagem. As porcentagens globais de similaridade e identidade tambem podem ser determinadas usando um dos metodos disponiveis no pacote de software MatGAT (Campanella et al., BMC Bioinformatics. 4, 29, 2003). Edi9ao manual menor pode ser realizada para otimizar ο alinhamento entre motivos conservados, como estaria evidente a uma pessoa habilitada na tecnica. Alem disso, ao inves de usar sequencias de tamanho natural para a identificagao de homologos, dominios especificos tambem podem ser usados. Os valores de identidade de sequencia, que sao indicados abaixo como uma porcentagem foram determinados em rela?3o a sequencia de acido nucleico ou de aminoacido inteira de SIK usando os programas mencionados acima usando os parametros de default.
Preferivelmente, os polipeptideos de SIK codificados pelos acidos nucleicos que codificam SIK iiteis nos metodos da presente inven^So tem, em ordem crescente de preferencia, pelo menos 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% de identidade com ο polipeptideo da SEQ ID NO: 210.
Alternativamente, a identidade de sequencia entre homologos pode ser determinada usando um dominio especifico. Qualquer dominio dado pode ser identificado e delineado usando as bases de dados e ferramentas para a identificagao de proteina listadas acima, e/ou metodos para ο alinhamento de sequencias para compara9ao. Em alguns casos, parametros de default podem ser ajustados para modificar a severidade da pesquisa. Por exemplo usando BLAST, ο limiar de significancia estatistica (chamado de valor "esperado") para reportar emparelhamentos contra sequencias da base de dados pode ser aumentado para mostrar emparelhamentos menos severos. Deste modo, emparelhamentos curtos quase exatos podem ser identificados.
Os polipeptideos de SIK podem ser identificaveis pela presenpa de uma regiao de liga^ao de ATP, uma assinatura de sitio ativo da serina treonina quinase, um dominio de terminal N rico em serina e um ou mais sitios de miristoilagao. Os termos "dominio" e "motivo" sao definidos acima. Bases de dados especialistas existem para a identifica9ao de dominios, tais como SMART (Schultz et al. (1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic et al (2002) Nucleic Acids Res 30, 242-244), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31,315-318), Prosite (Bucher e Bairoch (1994), A generalized profile syntax for biomoleculars sequences motifs and its function in automatic sequence interpretation. (Em) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R.,Searls D., Eds., pp. 53-61, AAAI Press, Menlo Park; Hulo et al., Nucl. Acids. Res. 32: D134-D137, (2004)) ou Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280 (2002)). Um conjunto de ferramentas para a analise in silico de sequencias de proteina esta disponivel no servidor ExPASY proteomics (abrigado pelo Swiss Institute of Bioinformatics (Gasteiger et al., ExPASy: the proteomics server for in-depth protein knowledge and analyse, Nucleic Acids Res. 31: 3784-3788 (2003)). Entretanto, os varios dominios tambem podem ser facilmente identificados no alinhamento de sequencia de um polipeptideo de SIK putativo com polipeptideos de SIK conhecidos na tecnica.
Tambem iiteis nos metodos da invenpao sao acidos nucleicos que codificam homologos de um polipeptideo de SIK representado pela SEQ ID NO: 210 ou ortologos ou paralogos destes como definido acima.
Tambem iiteis nos metodos da inven9ao sao acidos nucleicos que codificam derivados da SEQ ID NO: 210 ou acidos nucleicos que codificam derivados de ortologos, paralogos ou homologos da SEQ ID NO: 210.
Os acidos nucleicos que codificam polipeptideos de SIK aqui definidos nao precisam ser acidos nucleicos de tamanho natural, visto que ο desempenho dos metodos da invengSo nao contam com ο uso de sequencias de acido nucleico de tamanho natural. Os exemplos de acidos nucleicos adequados para ο uso na realizayao dos metodos da inven9ao incluem as sequencias de acido nucleico dadas na Tabela 8 e Tabela 9, mas nao sao limitados aquelas sequencias. As variantes de acido nucleico tambem podem ser \jteis na pratica dos metodos da invenfao. Os exemplos de tais variantes de acido nucleico incluem porfdes de acidos nucleicos que codificam um polipeptideo de SIK como aqui definido, variantes de jun^ao de acidos nucleicos que codificam um polipeptideo de SIK como aqui definido, variantes alelicas de acidos nucleicos que codificam um polipeptideo de SIK como aqui definidos e variantes de acidos nucleicos que codificam um polipeptideo de SIK como aqui definido que sao obtidos pelo embaralhamento de gene. Os termos porgao, variante de jungSo, variante alelica e embaralhamento de gene sao como aqui descritos.
De acordo com a presente invengao, e fornecido um metodo para aumentar ο niimero de flores por planta em rela^ao as plantas de controle, que compreende introduzir e expressar em uma planta uma por^So de qualquer uma das sequencias de acido nucleico dadas na Tabela 8 ou Tabela 9 ou uma por^ao de um acido nucleico que codiflca um ortologo, paralogo ou homologo de qualquer uma das sequencias de aminoacido dadas na Tabela 8 ou Tabela 9.
Por^Ses iiteis nos metodos da invengao, codificam um polipeptideo tendo substancialmente a mesma atividade biologica como ο polipeptideo de SIK representado por qualquer uma das sequencias de
aminoacido dadas na Tabela 8 ou Tabela 9. Preferivelmente, a por^ao e uma porgao de qualquer um dos acidos nucleicos dados na Tabela 8 ou Tabela 9 ou uma por9ao de qualquer uma das sequencias de acidos nucleicos representadas pela SEQ ID NO: 213 a 225. A por?ao e tipicamente de pelo menos 300 nucleotideos consecutivos no comprimento, preferivelmente pelo menos 400 nucleotideos consecutivos no comprimento, mais preferivelmente pelo menos 500 nucleotideos consecutivos no comprimento, os nucleotideos consecutivos sendo de qualquer uma das sequencias de acido nucleico dadas na Tabela 8 ou Tabela 9 ou qualquer uma das sequencias de acidos nucleicos representadas pela SEQ ID NO: 213 a 225. Mais preferivelmente a por^ao e uma por9ao do acido nucleico da SEQ ID NO: 209. Preferivelmente, a por?ao codifica uma sequencia de aminoacido que compreendem qualquer um ou mais de uma regiao de liga?So de ATP, uma assinatura de sitio ativo da serina treonina quinase, um dominio de terminal N rico em serina, um ou mais sitios de miristoilagao e atividade de quinase. Uma por?So de um acido nucleico que codifica um
polipeptideo de SIK como aqui definido pode ser preparada, por exemplo, fazendo-se uma ou mais delegdes ao acido nucleico. As poises podem ser usadas na forma isolada ou ela pode ser fundida a outras sequencias codificadoras (ou nao codificadoras) de modo a, por exemplo, produzir uma proteina que combine diversas atividades. Quando fundida a outras sequencias codificadoras, ο polipeptideo resultante produzido na tradu^ao pode ser maior do que aquele prognosticado para a por?ao.
Uma outra variante de acido nucleico util nos metodos da inven9ao e um acido nucleico capaz de hibridizar, sob condigdes de severidade reduzida, preferivelmente sob condigSes severas, com um acido nucleico que codifica um polipeptideo de SIK como aqui definido ou com uma por^ao como aqui definida.
As sequencias hibridizadoras uteis nos metodos da invengao,
codificam um polipeptideo tendo substancialmente a mesma atividade biologica como ο polipeptideo de SIK representado por qualquer uma das sequencias de aminoacido dadas na Tabela 8 ou Tabela 9. A sequencia hibridizadora tern tipicamente pelo menos 300 nucleotideos consecutivos no comprimento, preferivelmente pelo menos 400 nucleotideos consecutivos no comprimento, mais preferivelmente pelo menos 500 nucleotideos consecutivos no comprimento, os nucleotideos consecutivos sendo de qualquer uma das sequencias de acido nucleico dadas na Tabela 8 ou Tabela 9. Preferivelmente, a sequencia hibridizadora e uma que e capaz de hibridizar a qualquer um dos acidos nucleicos dados na Tabela 8 ou Tabela 9 ou a uma por9ao de qualquer uma destas sequencias, uma por^ao sendo como definida acima. Mais preferivelmente, a sequencia hibridizadora e capaz de hibridizar a um acido nucleico como representado pela SEQ ID NO: 209 ou a uma por9ao desta. Preferivelmente, a sequencia hibridizadora codifica uma sequencia de aminoacido que compreende qualquer um ou mais de uma regiao de liga9ao de ATP, uma assinatura de sitio ativo da serina treonina quinase, um dominio de terminal N rico em serina, um ou mais sitios de miristoilagao e atividade de quinase.
De acordo com a presente inven9ao, e fornecido um metodo para aumentar ο niimero de flores por planta, que compreende introduzir e expressar em uma planta um acido nucleico capaz de hibridizar a qualquer um dos acidos nucleicos dados na Tabela 8 ou Tabela 9 ou qualquer uma das sequencias de acidos nucleicos representadas pelas SEQ ID NO: 213 a 225 ou que compreende introduzir e expressar em uma planta um acido nucleico capaz de hibridizar a um acido nucleico que codifica um ortologo, paralogo ou homologo de qualquer uma das sequencias de acido nucleico dadas na Tabela 1 ou Tabela 2 ou qualquer uma das sequencias de acidos nucleicos representadas pela SEQ ID NO: 213 a 225.
Uma outra variante de acido nucleico iitil nos metodos da
invengao e uma variante de jun9ao que codifica um polipeptideo de SIK como definido acima, ο termo "variante de jun^ao" sendo como definido acima. De acordo com a presente inver^ao, e fornecido um metodo para aumentar ο numero de flores por planta, que compreende introduzir e expressar em uma planta uma variante de jun9ao de qualquer uma das sequ§ncias de acido nucleico dadas na Tabela 8 ou Tabela 9 ou uma variante de jun9ao de qualquer um dos acidos nucleicos representados pela SEQ ID NO: 213 a 225 ou uma variante de jun^So de um acido nucleico que codifica um ortologo, paralogo ou homologo de qualquer uma das sequencias de aminoacido dadas na Tabela 8 ou Tabela 9 ou qualquer uma das sequencias de acidos nucleicos representadas pela SEQ ID NO: 213 a 225.
As variantes de jungao preferidas sao variantes de jungao de um acido nucleico representado pela SEQ ID NO: 209 ou uma variante de junyao que codifica um ortologo ou paralogo da SEQ ID NO: 210. Preferivelmente, ο aminoacido codificado pela variante de jun9ao compreende qualquer um ou mais de uma regiao de liga9ao de ATP, uma assinatura de sitio ativo da serina treonina quinase, um dominio de terminal N rico em serina, um ou mais sitios de miristoilaySo e atividade de quinase.
Uma outra variante de acido nucleico iitil na realiza9ao dos metodos da ίηνβηςδο e uma variante alelica de um acido nucleico que codifica um polipeptideo de SIK como definido acima.
De acordo com a presente invengao,e fornecido um metodo para aumentar ο numero de flores por planta, que compreende introduzir e expressar em uma planta uma variante alelica de qualquer um dos acidos nucleicos dados na Tabela 8 ou Tabela 9 ou de qualquer uma das sequencias de acido nucleico representadas pelas SEQ ID NO: 213 a 225 ou que compreendem introduzir e expressar em uma planta uma variante alelica de um acido nucleico que codifica um ortologo, paralogo ou homologo de qualquer uma das sequencias de aminoacido dadas na Tabela 8 ou Tabela 9
ou de qualquer uma das sequencias de acidos nucleicos representadas pelas SEQ ID NO: 213 a 225.
Preferivelmente, a variante alelica e uma variante alelica da SEQ ID NO: 209 ou uma variante alelica de um acido nucleico que codifica um ortologo ou paralogo ou homologo da SEQ ID NO: 210. Preferivelmente, ο aminoacido codificado pela variante alelica compreende qualquer um ou mais de uma regiao de Iiga^So de ATP, uma assinatura de sitio ativo da serina treonina quinase, um dominio de terminal N rico em serina, um ou mais sitios de miristoila9ao e atividade de quinase.
Uma outra variante de acido nucleico iitil nos metodos da invenpSo e uma variante de acido nucleico obtida pelo embaralhamento de gene. Embaralhamento de gene ou evolu9ao direta tambem podem ser usados para gerar variantes de acidos nucleicos que codificam polipeptideos de SIK.
De acordo com a presente inver^o, e fornecido um metodo para aumentar ο niimero de flores por planta, que compreende introduzir e expressar em uma planta uma variante de qualquer uma das sequencias de acido nucleico dadas na Tabela 8 ou Tabela 9 ou de qualquer uma das sequencias de acidos nucleicos representadas pelas SEQ ID NO: 213 a 225 ou que compreendem introduzir e expressar em uma planta uma variante de um acido nucleico que codifica um ortologo, paralogo ou homologo de qualquer uma das sequencias de aminoacido dadas na Tabela 8 ou Tabela 9 ou de qualquer uma das sequencias de acidos nucleicos representadas pelas SEQ ID NO: 213 a 225, acido nucleico variante este que e obtido pelo embaralhamento de gene. Preferivelmente, ο acido nucleico variante obtido pelo embaralhamento de gene codifica um aminoacido que compreendem qualquer um ou mais de uma regiao de liga9ao de ATP, uma assinatura de sitio ativo da serina treonina quinase, um dominio de terminal N rico em serina, um ou mais sitios de miristoilagao e atividade de quinase.
Alem disso, variantes de acido nucleico tambem podem ser
obtidas pela mutagenese direcionada ao sitio. Diversos metodos sao disponiveis para se obter mutagenese direcionada ao sitio, os mais comuns sendo metodos com base em PCR (Current Protocols in Molecular Biology. Wiley Eds.
Os acidos nucleicos SIK que codificam polipeptideos equivalente a SIK podem ser derivados de qualquer fonte natural ou artificial. O acido nucleico de SIK pode ser modificado a partir da sua forma nativa em composi9ao e/ou ambiente genomico atraves da manipula^ao humana deliberada. Preferivelmente ο acido nucleico que codifica SIK e de uma planta, mais preferivelmente de uma planta monocotiledonea, mais preferivelmente da familia de Poaceae, mais preferivelmente ο acido nucleico e de Oryza sativa.
Qualquer referencia aqui a um polipeptideo de SIK e portanto considerado significar um polipeptideo de SIK como definido acima. Qualquer acido nucleico de SIK que codifica um tal polipeptideo de SIK e adequado para ο uso na realizagao dos metodos da ίηνεηςαο para aumentar ο numero de flores por planta.
A presente ΐηνεηςδο tambem abrange plantas ou partes destas (incluindo sementes) obteniveis pelo metodos de acordo com a presente inven9ao. As plantas ou partes destas compreendem um transgene de acido nucleico que codifica um polipeptideo de SIK como definido acima.
A ίηνεηςδο tambem fornece constru9oes geneticas e vetores para facilitar a introdi^ao e/ou expressao das sequencias de acido nucleico de SIK iiteis nos metodos de acordo com a ίηνεηςδο, em uma planta.
Portanto, e fornecido uma constru^ao de gene que
compreende:
(i) um acido nucleico de SIK como definido acima ou um acido nucleico que codifica SIK;
(ii) uma ou mais sequencias de controle operavelmente ligadas
ao acido nucleico de SIK de (i). Uma constru9ao preferida no caso de redu9ao ou eliminagao substanciais de um acido nucleico de SIK para dar peso de mil graos aumentado, indice de colheita aumentado e taxa de enchimento aumentada e uma que compreende uma repeti^So invertida de um acido nucleico de SIK, preferivelmente capaz de formar uma estrutura de grampo de cabelo, repeti9ao invertida esta que esta sob ο controle de um promotor constitutivo.
As constru9oes uteis nos metodos de acordo com a presente inven9ao podem ser construidas usando tecnologia de DNA recombinante bem conhecida pelas pessoas habilitada na tecnica. As constru9oes de gene podem ser inseridas em vetores, que podem ser comercialmente disponiveis, adequados para a transformagao em plantas e adequadas para a transcrigao do gene de interesse nas celulas transformadas. A invenySo portanto fornece ο uso de uma constru^So de gene como definida acima nos metodos da invenyao.
As plantas sao transformadas com um vetor que compreende a
sequencia de interesse. O tecnico habilitado esta bem ciente dos elementos geneticos que devem estar presentes no vetor de modo a transformar, selecionar e propagar com exito as celulas hospedeiras contendo a sequencia de interesse. A sequencia de interesse e operavelmente ligada a uma ou mais sequencias de controle (pelo menos a um promotor). Os termos "elemento regulador", "sequencia de controle" e "promotor" sao todos aqui usados intercambiavelmente e sao definidos acima.
Vantajosamente, qualquer tipo de promotor pode ser usado nos metodos da presente invengao. O termo "promotor" refere-se a uma sequencia de acido nucleico de controle localizada a montante do inicio transcricional de um gene e que esta envolvido no reconhecimento e liga^ao da RNA polimerase e outras proteinas, direcionando deste modo a transcriySo de um acido nucleico operavelmente ligado. O promotor pode ser um promotor
constitutivo. Alternativamente, ο promotor pode ser um promotor indutivel. Adicional ou alternativamente, ο promotor pode ser um promotor especifico de tecido. Promotores capazes de iniciar a transcri9ao apenas em certos tecidos sao aqui aludidos como "especificos de tecido", similarmente, promotores capazes de iniciar a transcrigSo apenas em certas celulas sao aqui aludidos como "especificos de celula".
Preferivelmente, a sequencia de acido nucleico e operavelmente ligada a um promotor constitutivo. Preferivelmente ο promotor e derivado de uma planta, mais preferivelmente ο promotor e de uma planta monocotiledonea se uma planta monocotiledonea deva ser transformada. Mais preferivelmente, ο promotor constitutivo e um promotor GOS2 que e representado por uma sequencia de acido nucleico substancialmente similar a SEQ ID NO: 56 ou 226. Mais preferivelmente ο promotor GOS2 e como representado pela SEQ ID NO: 56 ou 226. Deve estar claro que a aplicabilidade da presente ϊηνεηςδο nao e restrita a sequencia de acido nucleico de SIK como representado pela SEQ ID NO: 209, nem e a aplicabilidade da inver^ao restrita a expressao de uma sequencia de acido nucleico de SIK quando direcionada por um promotor GOS2. Os exemplos de outros promotores constitutivos que tambem podem ser usados para direcionar a expressao de uma sequencia de acido nucleico de SIK sao mostrados acima.
Opcionalmente, uma ou mais sequencias terminadoras podem ser usadas na constru9ao introduzida em uma planta. Elementos reguladores adicionais podem incluir real^adores transcricionais assim como traducionais. Aqueles habilitados na tecnica estarao cientes de sequencias terminadoras e real^adoras que podem ser adequadas para ο uso na realiza^ao da invenyao. Uma sequencia de intron tambem pode ser adicionada a regiao nao traduzida 5’ (UTR) ou na sequencia codificadora para aumentar a quantidade da mensagem madura que acumula no citossol, como descrito na se?3o de
defini^ao. Outras sequencias de controle (alem do promotor, real^ador, silenciador, sequencias de intron, regioes 3'UTR e/ou 5'UTR) podem ser elementos estabilizadores de proteina e/ou RNA. Tais sequencias podem ser conhecidas ou podem ser facilmente obtidas por uma pessoa habilitada na tecnica.
As constru9oes geneticas da inven^ao podem incluir ainda
uma sequencia de origem de replicafao que e requerida para a manuten9ao e/ou replicafao em um tipo de celula especifico. Um exemplo e quando uma construgao genetica e requerida ser mantida em uma celula bacteriana como um element。genetico epissomico (por exemplo, molecula de plasmideo ou cosmideo). As origens preferidas de replica^a。incluem, mas nao sao limitadas ao fl-ori e colEl.
Para a detec^ao da transferencia bem sucedida das sequencias de acido nucleico como usadas nos metodos da inven9ao e/ou selegSo de plantas transgenicas que compreendem estes acidos nucleicos, e vantajoso usar genes marcadores (ou genes reporteres). Portanto, a constru9ao genetica pode opcionalmente compreender um gene marcador selecionavel. marcadores selecionaveis sao descritos em mais detalhes na se9ao de "defini9oes" aqui. Os genes marcadores podem ser removidos ou excisados da celula transgenica uma vez que eles nao sao mais necessarios. Tecnicas para a remogao de marcador sao conhecidas na tecnica, as tecnicas iiteis sao descritas acima na se?ao de defmi^So.
A expressao de um acido nucleico de SIK ou polipeptideo de SIK tambem pode ser modulada pela introdu9ao de uma modificayao genetica, dentro do local de um gene SIK. O local de um gene como aqui definido e considerado significar uma regiao genomica, que inclui ο gene de interesse e 10 kb a montante ou a jusante da regiao codiflcadora.
A modificagao genetica pode ser introduzida, por exemplo, por qualquer um (ou mais) dos seguintes metodos: rotulagao de T-DNA,
TILLING e recombina^ao homologa. A seguir da introdu9ao da modifica9ao genetica, segue uma etapa de selecionar quanto a expressao modulada adequada.
Os metodos da invenyao sao vantajosamente aplicaveis a qualquer planta. As plantas que sao particularmente iiteis nos metodos da inven9ao incluem todas as plantas que pertencem a superfamilia Viridiplantae, em particular plantas monocotiledoneas e dicotiledoneas incluindo forragem ou legumes forrageiros, plantas ornamentals, safras alimenticias, arvores ou arbustos. De acordo com uma forma de realiza?So preferida da presente inven^So,a planta e uma planta de cultivo. Os exemplos de planta de cultivos incluem soja, girassol, canola, alfafa, colza, algodao, tomate, batata e tabaco. Mais preferivelmente, a planta e uma planta monocotiledonea. Os exemplos de plantas monocotiledoneas incluem cana de agucar. Mais preferivelmente a planta e um cereal. Os exemplos de cereais incluem arroz, milho, trigo, cevada, paingo, centeio, triticale, sorgo e aveia. Outras plantas vantajosas sao selecionadas do grupo que
consiste de Asteraceae tais como os generos Helianthus, Tagetes por exemplo, as especies Helianthus annus [girassol], Tagetes lucida, Tagetes erecta ou Tagetes tenuifolia [Cravo-de-defunto], Brassicaceae tal como os generos Brassica, Arabadopsis por exemplo, as especies Brassica napus, Brassica rapa ssp. [canola, colza, nabo] ou Arabidopsis thaliana. Fabaceae tal como os generos Glicina por exemplo, as especies Glicina max, Soja hispida ou Soja max [soja]. Linaceae tal como os generos Linum por exemplo, as especies Linum usitatissimum, [linho, linha^a]; Poaceae tal como os generos Hordeum, Secale, Avena, Sorgo, Oryza, Zea, Triticum por exemplo, as especies Hordeum vulgare [cevada]; Secale cereale [centeio], Avena sativa, Avena fatua, Avena byzantina, Avena fatua var. sativa, Avena hybrida [aveia], Sorgo bicolor [Sorgo, pain90], Oryza sativa, Oryza latifolia [arroz], Zea mays [milho, milho] Triticum aestivum, Triticum durum, Triticum
turgidum, Triticum hybernum, Triticum macha, Triticum sativum ou Triticum vulgare [trigo, trigo de pao, trigo comum]; Solanaceae tal como os generos Solanum, Lycopersicon por exemplo, as especies Solanum tuberosum [batata], Lycopersicon esculentum, Lycopersicon lycopersicum, Lycopersicon piriforme, Solanum integrifolium ou Solanum lycopersicum [tomate].
A presente invenpao tambem abrange plantas obteniveis pelos
metodos de acordo com a presente inven^ao. A presente invengSo portanto fornece plantas, parte de plantas ou celulas vegetais destas obteniveis pelo metodo de acordo com a presente invengao, plantas ou partes ou celulas destas que compreendem um transgene de acido nucleico de SIK (que pode codificar um polipeptideo de SIK como definido acima).
A invengao alem disso fornece um metodo para a produ9ao de plantas transgenicas tendo os varios tra^os melhorados relacionados com os rendimentos mencionados acima, que compreende a introdu^ao e expressao em uma planta acido nucleico de SIK como definido. As plantas hospedeiras para os acidos nucleicos ou ο vetor
usado no metodo de acordo com a invengao, ο cassete de expressao ou constru9ao ou vetor sao, em principio, vantajosamente todas as plantas, que sao capazes de sintetizar os polipeptideos usados no metodo inventivo.
Mais especificamente, a presente invei^ao fornece um metodo para a produgao de plantas transgenicas tendo varios tragos melhorados relacionados com ο rendimento em rela^ao as plantas de controle, metodo este que compreende:
(i) introduzir e expressar um acido nucleico de SIK em uma celula vegetal; e
(ii) cultivar a celula vegetal sob condiydes que promovam ο
crescimento e desenvolvimento da planta;
(iii) obter plantas tendo niimero de flores aumentado por
planta.
Tambem e fornecido um metodo para a produ^ao de plantas transgenicas tendo varios traqos melhorados relacionados com ο rendimento em rela9ao as plantas de controle, metodo este que compreende:
(i) introduzir em uma celula vegetal uma construgao para infra-regular a expressao de gene de SIK; e
(ii) cultivar a celula vegetal sob condi9oes que promovam ο crescimento e desenvolvimento da planta;
(iii) obter plantas tendo um ou mais de peso de mil graos aumentado, indice de colheita aumentado e taxa de enchimento aumentada.
O acido nucleico pode ser introduzido diretamente em uma celula vegetal ou na planta por si so (incluindo a introdugao em um tecido, orgao ou qualquer outra parte de uma planta). De acordo com uma caracteristica preferida da presente inven9ao, ο acido nucleico e preferivelmente introduzido em uma planta pela transforma9ao.
Mais preferivelmente a constru9ao para infra-regular a expressao de gene SIK e introduzida na celula vegetal ou planta que compreende uma repeti?ao invertida do acido nucleico de SIK ou uma parte desta.
No geral depois da transformagao, celulas vegetais ou agrupamentos de celula sao selecionados quanto a presen^a de um ou mais marcadores que sao codificados pelos genes expressaveis em planta co- transferida com ο gene de interesse, seguindo que ο material transformado e regenerado em uma planta inteira.
Como mencionado a Agrobacteria transformada com um vetor de expressao de acordo com a invengao tambem pode ser usada na maneira conhecida por si para a transformagao de plantas tais como plantas experimentals como Arabidopsis ou plantas de safra, tais como, por exemplo, cereais, milho, aveia, centeio, cevada, trigo, soja, arroz, algodao, beterraba agucareira, canola, girassol, linho, canhamo, batata, tabaco, tomate, cenoura, pimentdes sino, colza, tapioca, mandioca, araruta, tagetes, alfafa, alface e as varias arvores, especies de nozes e videiras, em particular planta de cultivos contendo oleo tais como soja, amendoim, planta da mamona, girassol, milho, algodao, linho, colza, coco, dende, cartamo {Carthamus tinctorius) ou cacau, por exemplo banhando-se as folhas cicatrizadas ou segmentos de folha em uma solu9ao agrobacteriana e subsequentemente cultivando-as em meio adequado.
As celulas vegetais geneticamente modificadas podem ser regeneradas por intermedio de todos os metodos com que ο tecnico habilitado esta familiarizado. Os metodos adequados podem ser encontrados nas publica9oes supra citadas por S. D. Kung e R. Wu, Potrykus ou Hofgen e Willmitzer.
Para selecionar plantas transformadas, ο material vegetal obtido na transformagao e, como uma regra, submetido as condigdes selecionativas de modo que as plantas transformadas possam ser distinguidas das plantas nao transformadas. Por exemplo, as sementes obtidas na maneira descrita acima podem ser plantadas e, depois de um periodo de crescimento inicial, submetida a um selegao adequada pela pulveriza^ao. Uma outra possibilidade consiste no cultivo das sementes, se apropriado depois da esteriliza9ao, em placas de agar usando um agente de selefao adequado de modo que apenas as sementes transformadas possam crescer em plantas. Alternativamente, as plantas transformadas sao triadas quanto a presenya de um marcador selecionavel tal como aqueles descritos acima.
Apos a transferencia de DNA e regeneragao, as plantas putativamente transformadas podem ser avaliadas, por exemplo, usando a analise de Southern, quanto a presenga do gene de interesse, niimero de copia e/ou organizagao genomica. Alternativa ou adicionalmente, os niveis de expressao podem ser monitorados usando a analise de Northern e/ou Western ou PCR quantitativa, todas as tecnicas sendo bem conhecidas pelas pessoas
tendo habilidade comum no ramo. As plantas transformadas geradas podem ser propagadas por uma variedade de meios, tais como pela propagayao clonal ou tecnicas de procria9ao classicas. Por exemplo, uma planta transformada de primeira geragao (ou Tl) pode ser auto-polinizada para dar transformantes homozigotos da segunda gera9ao (ou T2) e as plantas T2 propagadas ainda atraves de tecnicas de procriagao classicas.
Os organismos transformados gerados podem tomar uma variedade de formas. Por exemplo, eles podem ser quimeras de celulas transformadas e celulas nao transformadas; transformantes clonais (por exemplo, todas as celulas transformadas conter ο cassete de expressao); enxertos de tecidos transformados e nao transformados (por exemplo, em plantas, um rizoma transformado enxertado em uma muda nao transformada).
A presente inven^ao claramente estende-se a qualquer celula vegetal ou planta produzida por qualquer um dos metodos aqui descritos e a todas as partes de plantas e propagulos destas. A presente invengao estende-se ainda para abranger a progenie de uma celula primaria transformada ou transfectada, tecido, orgao ou planta inteira que foi produzida por qualquer um dos metodos anteriormente mencionados, a iinica exigencia sendo que a progenie exiba a(s) mesma(s) caracteristica(s) genotipica(s) e/ou fenotipica(s) como aquela(s) produzida(s) pelo precursor nos metodos de acordo com a inven9ao.
A inven^ao tambem inclui celulas hospedeiras contendo um acido nucleico de SIK isolado como defmido acima. As celulas hospedeiras preferidas de acordo com a ίηνεηςδο sao celulas vegetais. As plantas hospedeiras para os acidos nucleicos ou ο vetor usado no metodo de acordo com a ίηνβηςδο, ο cassete de expressao ou construijao ou vetor sao, em principio, vantajosamente todas as plantas, que sao capazes de sintetizar os polipeptideos usados no metodo inventivo.
A ΐηνεηςδο tambem estende-se as partes colhiveis de uma planta tal como, mas nao limitado a sementes, folhas, frutas, flores, hastes, rizomas, tuberculos e bulbos. A invengao alem disso diz respeito aos produtos derivados, preferivelmente diretamente derivados, de uma parte colhiveis de uma tal planta, tais como pelotas ou pos secos, oleo, gordura e acidos graxos, amido ou proteinas.
A presente inven9ao tambem abrange ο uso de acidos nucleicos de SIK e polipeptideos de SIK na melhora de varios tra^os relacionados com ο rendimento como mencionados acima.
Os acidos nucleicos que codificam os polipeptideos de SIK podem encontrar uso em programas de procria9ao em que um marcador de DNA e identificado que pode ser geneticamente ligado a um gene de SIK. Os acidos nucleicos/genes podem ser usados para definir um marcador molecular. Este marcador de DNA pode ser depois usado em programas de procria?ao para selecionar plantas tendo rendimento aumentado como defmido acima nos metodos da invengSo.
Variantes alelicas de um acido nucleico/gene de SIK tambem podem encontrar uso em programas de procria^ao assistidas por marcador. Tais programas de procria9ao algumas vezes requerem a introdu^ao de varia9ao alelica pelo tratamento mutagenico das plantas, usando por exemplo mutagenese EMS; alternativamente, ο programa pode comegar com uma cole9ao de variantes alelicas da chamada origem "natural" causada involuntariamente. A identifica9ao de variantes alelicas depois ocorre, por exemplo, pela PCR. Isto e seguido por uma etapa para a sele^So de variantes alelicas superiores da sequencia em questao e que da rendimento aumentado. A sele^So e tipicamente realizada monitorando-se ο desempenho de crescimento de plantas contendo variantes alelicas diferentes da sequencia em questao. O desempenho de crescimento pode ser monitorado em um estufa ou no campo. Outras etapas opcionais incluem cruzar plantas em que a variante
alelica superior foi identificada com uma outra planta. Isto pode ser usado, por exemplo, para fabricar uma combinagao de caracteristicas fenotipicas interessantes.
Um acido nucleico de SIK tambem pode ser usado como sondas para mapear genetica e fisicamente os genes que sao uma parte de e como marcadores para tra^os ligados a estes genes. Tal informagao pode ser util na procria^ao de planta de modo a desenvolver linhas com fenotipos desejados. Tal uso de acidos nucleicos de SIK requer apenas uma sequencia de acido nucleico de pelo menos 15 nucleotideos no comprimento. Os acidos nucleicos de SIK podem ser usados como marcadores de polimorfismo de comprimento de fragment。de restri^o (RFLP)· Southern blots (Sambrook J, Fritsch EF e Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de DNA genomico vegetal digerido com restri^So podem ser sondadas com os acidos nucleicos de SIK. Os padr5es de faixa resultantes podem ser depois submetidos as analises geneticas usando programas de computador tais como MapMaker (Lander et al. (1987) Genomics 1: 174-181) de modo a construir um mapa genetico. Alem disso, os acidos nucleicos podem ser usados para sondar Southern blots contendo DNAs genomicos tratados com endonuclease de restri9ao de um conjunto de individuos que representam precursor e progenie de um cruzamento genetico definido. A segrega9ao dos polimorfismos de DNA e mencionada e usada para calcular a posi^ao do acido nucleico de SIK no mapa genetico anteriormente obtido usando esta popula9ao (Botstein et al. (1980) Am. J. Hum. Genet. 32: 314-331).
A produ9ao e uso de sondas derivadas de gene vegetal para ο uso em mapeamento genetico e descrito em Bernatzky e Tanksley (Plant MoL Biol. Reporter 4: 37-41, 1986). Numerosas publica90es descrevem ο mapeamento genetico de clones de cDNA especificos usando a metodologia esbo?ada acima ou varia9oes destas. Por exemplo, popula9oes de intercruzamento F2, popula?5es retrocruzadas, popula9oes acasaladas
aleatoriamente, linhagens quase isogenicas e outros conjuntos de individuos podem ser usados para ο mapeamento. Tais metodologias sao bem conhecidas por aqueles habilitados na tecnica.
As sondas de acido nucleico tambem podem ser usadas para ο mapeamento fisico (isto e, coloca?So das sequencias em mapas fisicos; ver Hoheisel et al. Em: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346 e referencias aqui citadas).
Em uma outra forma de realizaqSo, as sondas de acido nucleico podem ser usadas no mapeamento da hibridizagao in situ pela fluorescencia direta (FISH) (Trask (1991) Trends Genet. 7: 149-154). Embora metodos correntes de mapeamento FISH favore^am ο uso de clones grandes (diversos kb a diversas centenas de kb; ver Laan et al. (1995) Genome Res. 5: 13-20),melhoras na sensibilidade podem possibilitar desempenho de mapeamento de FISH usando sondas mais curtas.
Uma variedade de metodos com base na amplifica?ao de acido nucleico para ο mapeamento genetico e fisico pode ser realizada usando os acidos nucleicos. Os exemplos incluem amplificafao especifica de alelo (Kazazian (1989) J. Lab. Clin. Med 11: 95-96), polimorfismo de fragmentos amplificados pela PCR (CAPS; Sheffield et al. (1993) Genomics 16: 325- 332), ligafao especifica de alelo (Landegren et al. (1988) Science 241: 1077- 1080), rea?5es de extensao de nucleotideo (Sokolov (1990) Nucleic Acids Res. 18: 3671), Mapeamento de Hibrido por Radia9ao (Walter et al. (1997) Nat. Genet. 7: 22-28) e Mapeamento Happy (Dear e Cook (1989) Nucleic Acids Res. 17: 6795-6807). Para estes metodos, a sequencia de um acido nucleico e usada para planejar e produzir pares de iniciador para ο uso na rea9ao de amplifica9ao ou nas reaydes de extensao de iniciador. O planejamento de tais iniciadores e bem conhecido por aqueles habilitados na tecnica. Em metodos que utilizam mapeamento genetico com base na PCR, pode ser necessario identificar as diferen?as de sequencia de DNA entre os precursores da cruz de mapeamento na regiao que corresponde a sequencia de acido nucleico presente. Isto, entretanto, no geral nao e necessario para os metodos de mapeamento.
Os metodos de acordo com a presente invengSo resultam em plantas tendo tragos relacionados com ο rendimento alterados, como descritos mais acima. Estes tra^os tambem podem ser combinados com outros tra^os economicamente vantajosos, tais como outros tragos que realgam ο rendimento, tolerancia a outros estresses abioticos e bioticos, tragos que modificam varias caracteristicas de arquitetura e/ou caracteristicas bioquimicas e/ou fisiologicas. Deserigao detalhada para os fatores de transcri^ao HD-Zip de Classe II
Foi agora descoberto que acidos nucleicos que codificam fatores de transcri9ao HD-Zip de Class II sao \iteis na modificafao do teor de compostos de armazenagem em sementes. A presente ΐηνεηςδο portanto fornece um metodo para modificar ο teor de compostos de armazenagem em sementes em rela^ao as plantas de controle pela modulagao da expressao em uma planta de um acido nucleico que codifica um fator de transcrigao de HD- Zip de Classe II. A presente ίηνεηςδο tambem fornece sequencias de acido nucleico e constru96es uteis na realizagao de tais metodos. A inven^So fornece ainda sementes tendo um teor modificado de compostos de armazenagem em relagao as plantas de controle, sementes estas que tem a expressao modulada de um acido nucleico que codifica um fator de transcrigao de HD-Zip de Classe II.
A presente inven9ao fornece um metodo para modificar ο teor de compostos de armazenagem em sementes em rela?So as plantas de controle, compreendendo modular a expressao em uma planta de um acido nucleico que codifica um fator de transcrigSo de HD-Zip de Classe II.
Um metodo preferido para modular (preferivelmente, aumentar) a expressao de um acido nucleico que codifica um fator de
transcri?ao de HD-Zip de Classe II e pela introdu9ao e expressao em uma planta de um acido nucleico que codifica um fator de transcrigao de HD-Zip de Classe II como sera agora definido.
Um "fator de transcrifao de HD-Zip de Classe II" e considerado significar um polipeptideo que compreende os seguintes: (i) uma caixa de homeodominio; (ii) um ziper de leucina; e (iii) Motivos I, II e III dados abaixo (in qualquer ordem). Motivo I (SEQ ID NO: 279)
RKKLRL ou Motivo I com uma ou mais substituiydes de aminoacido conservativas em qualquer posi?ao, e/ou Motivo I com uma ou duas mudan^as nao conservativas em qualquer posi?ao; e Motivo II (SEQ ID NO: 280)
TKLKQTEVDCEFLRRCCENLTEEN ou Motivo II com uma ou mais substitui9oes de aminoacido conservativas em qualquer posi9ao, e/ou um motivo tendo em ordem crescente de preferencia pelo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% ou mais de identidade de sequencia ao Motivo II; e Motivo III (SEQ ID NO: 281)
TLTMCPSCER ou Motivo III com uma ou mais substitui9oes de aminoacido conservativas em qualquer posi^ao, e/ou Motivo III com uma, duas ou tres mudan9as nao conservativas em qualquer posigao.
Qualquer referencia aqui a um "acido nucleico que codifica um fator de transcri?ao de HD-Zip de Classe II" ou a um "acido nucleico que codifica HD-Zip de Classe II" e considerado significar um acido nucleico que codifica um fator de transcri9ao de HD-Zip de Classe II como definido acima, tais acidos nucleicos sendo uteis na realiza^ao dos metodos da inven^ao.
Como mencionado, um metodo preferido para modular (preferivelmente, aumentar) a expressao de um acido nucleico que codifica um fator de transcr^ao de HD-Zip de Classe II e pela introdu^ao e expressao
em uma planta de um acido nucleico que codifica um fator de transcrigao de HD-Zip de Classe II.
A presente inven^ao e ilustrada pela transforma^ao de plantas com a sequencia de acido nucleico representada pela SEQ ID NO: 229, que codifica a sequencia de polipeptideo da SEQ ID NO: 230.
Entretanto, ο desempenho da invengao nao e restrita a estas
sequencias; os metodos da invengao podem ser vantajosamente realizados usando qualquer fator de transcri9ao de acido nucleico que codifica HD-Zip de Classe II ou fator de transcri^ao de HD-Zip de Classe II como aqui definido.
Por exemplo, acidos nucleicos que codificam ortologos ou
paralogos de uma sequencia de aminoacido representado pela SEQ ID NO: 230 podem ser uteis na realizaijSo dos metodos da ίηνεηςδο. Os exemplos de tais ortologos e paralogos sao fornecidos na Tabela A do Exemplo 1.
Ortologos e paralogos abrangem conceitos evolucionarios usados para descrever as rela9oes ancestrais de genes. Paralogos sao genes dentro da mesma especies que se originaram atraves da duplica?ao de um gene ancestral e ortologos sao genes de organismos diferentes que se originaram atraves da evolu9ao de novas especies.
Ortologos e paralogos podem ser facilmente encontrados realizando-se uma chamada pesquisa de blast reciproca. Tipicamente isto envolve um primeiro BLAST envolvendo submeter a BLAST uma sequencia ddvida (por exemplo, SEQ ID NO: 229 ou SEQ ID NO: 230) contra qualquer base de dados de sequencia, tais como a base de dados NCBI publicamente disponivel que pode ser encontrada em: http: //www.ncbi.nlm.nih.gov. BLASTN ou TBLASTX (usando valores default padrao) sao no geral usados quando partindo de uma sequencia de nucleotideo e BLASTP ou TBLASTN (usando valores default padrao) quando partindo de uma sequencia de proteina. Os resultados de BLAST podem ser opcionalmente filtrados. As
sequencias de tamanho natural dos resultados filtrados ou resultados nao filtrados sao depois submetidas novamente a BLAST (segundo BLAST) contra sequencias do organismo a partir das quais a sequencia diivida e derivada (onde a sequencia diivida e SEQ ID NO: 229 ou SEQ ID NO: 230, ο segundo BLAST portanto seria contra sequencias de Oryza). Os resultados do primeiro e segundo BLASTs sao depois comparados. Um paralogo e identificado se um acerto de alta classificagSo do primeiro blast e da mesmo especie como das quais a sequencia diivida e derivada, um BLAST posterior depois idealmente resulta na sequencia diivida sendo entre os acertos mais altos; um ortologo e identificado se um acerto de alta classifica^ao no primeiro BLAST nao e da mesma especies como das quais a sequencia duvida e derivada e preferivelmente resulta no BLAST posterior na sequencia duvida estando entre ο acerto mais alto. Os acertos de alta classificagao sao aqueles tendo um valor E baixo. Quanto mais baixo ο valor E, mais significante a contagem (ou em outras palavras mais baixa a chance que ο acerto fosse encontrado ao acaso). A computayao do valor E e bem conhecida na tecnica. Alem dos valores E, compara90es tambem estao contadas pela identidade percentual. A identidade percentual refere-se ao numero de nucleotideos identicos (ou aminoacidos) entre as duas sequencias de acido nucleico (ou polipeptideo) comparadas em rela^ao a um comprimento particular. No caso de familias grandes, ClustalW pode ser usado, seguido por uma arvore de uniao de vizinhos, para ajudar a visualizar a formayao de grupos de genes relacionados e para identificar ortologos e paralogos.
Acidos nucleicos que codificam homologos de uma sequencia de aminoacido representada pela SEQ ID NO: 230 ou acidos nucleicos que codificam homologos de qualquer uma das sequencias de aminoacido dadas na Tabela H, tambem podem ser iiteis na realiza9ao dos metodos da inven^ao.
Tambem iiteis nos metodos da invengao sao acidos nucleicos que codificam derivados de qualquer um dos aminoacidos dados na Tabela H
ou derivados de ortologos ou paralogos de qualquer uma das sequencias de aminoacido dadas na Tabela H. "Derivados" incluem peptideos, oligopeptideos, polipeptideos que, comparados com a sequencia de aminoacido da forma que ocorre naturalmente da proteina, tal como aquela apresentada na SEQ ID NO: 230, pode compreender substitui9oes de aminoacidos com residuos de aminoacido que nao ocorrem naturalmente ou adifSes de residuos de aminoacido que nao ocorrem naturalmente.
Homologos (ou proteinas homologas, abrangendo ortologos e paralogos) podem ser facilmente identificados usando tecnicas de rotina bem conhecidas no ramo, tais como pelo alinhamento de sequencia. Metodos para ο alinhamento de sequencias para comparagao sao bem conhecidos na tecnica, tais metodos incluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa ο algoritmo de Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar ο alinhamento of duas sequencias completas que maximizam ο numero de emparelhamentos e minimizam ο niimero de intervalos. O algoritmo BLAST (Altschul et al. (1990) J Mol Biol 215: 403-410) calcula a identidade de sequencia percentual e realiza uma analise estatistica da similaridade entre as duas sequencias. O software para realizar a analise de BLAST esta publicamente disponivel atraves do National Centre for Biotechnology Information. Homologos podem ser facilmente identificados usando, por exemplo, ο algoritmo de alinhamento de sequencia multipla ClustalW (versao 1.83),com os parametros de alinhamento aos pares de default e um metodo de contagem em porcentagem. As porcentagens globais de similaridade e identidade tambem podem ser determinadas usando um dos metodos disponiveis no pacote de software MatGAT (Campanella et al., BMC Bioinformatics. 4,29, 2003). Edi^ao manual menor pode ser realizada para otimizar ο alinhamento entre motivos conservados, como estaria evidente a uma pessoa habilitada na tecnica. Alem disso, ao inves de usar sequencias de tamanho natural para a identificagao de homologos, dominios especificos
tambem podem ser usados. Os valores de identidade de sequencia, que sao indicados abaixo como uma porcentagem foram determinados em relagao a sequencia de acido nucleico ou aminoacido inteira usando ClustalW e parametros de default.
Preferivelmente, os polipeptideos codificados pelos acidos nucleicos iiteis nos metodos da presente inven?ao (tal como qualquer uma das sequencias de polipeptideo dadas na Tabela H) tem, em ordem crescente de preferencia, pelo menos 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% de identidade com ο polipeptideo da SEQ ID NO: 230.
De acordo com a presente invengao, e fornecido um metodo para modificar ο teor de compostos de armazenagem em sementes em relagSo as plantas de controle, compreendendo modular a expressao em uma planta de um acido nucleico que codifica um fator de transcri9ao de HD-Zip de Classe II representado pela SEQ ID NO: 2 ou um ortologo, paralogo ou homologo desta.
Um metodo preferido para modular (preferivelmente, aumentar) a expressao de um acido nucleico que codifica um fator de transcrigao de HD-Zip de Classe II e pela introdu9ao e expressao em uma planta de um acido nucleico que codifica um fator de transcriyao de HD-Zip de Classe II representado pela SEQ ID NO: 230 ou um ortologo, paralogo ou homologo desta.
Os ortologos, paralogos e homologos descritos acima caem sob a definigao de um fator de transcri9ao de HD-Zip de Classe II, isto e signiflcando que os ortologos, paralogos e homologos sao polipeptideos que compreendem os seguintes: (i) uma caixa de homeodominio; (ii) um ziper de leucina; e (iii) Motivos I, II e III aqui descrito.
Os vários domínios e motivos podem ser usados para ajudar a identificar as seqüências úteis nos métodos da invenção. Bases de dados especialistas também existem para a identificação de domínios, por exemplo, SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244, InterPro (Mulder et ai,
(2003) Nucl. Acids. Res. 31, 315-318, Prosite (Bucher e Bairoch (1994), A generalized profile syntax for biomoleculars sequences motifs and its funetion in automatic sequence interpretation. (Em) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et ai, Nucl. Acids. Res. 32: D134-D137,
(2004) ou Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280 (2002). Domínios e motivos também podem ser identificados usando técnicas de rotina, tais como pelo alinhamento de seqüência como aqui descrito.
Os ácidos nucleicos úteis nos métodos da invenção não precisam ser de tamanho natural, visto que o desempenho dos métodos da invenção não contam com o uso de ácidos nucleicos de tamanho natural. Os exemplos incluem porções da seqüência de ácido nucleico representadas pela SEQ ID NO: 229 ou porções de qualquer uma das seqüências de ácido nucleico dadas na Tabela H.
De acordo com a presente invenção, é fornecido um método para modificar o teor de compostos de armazenagem em sementes em relação às plantas de controle, compreendendo modular a expressão em uma planta de uma porção de uma seqüência de ácido nucleico representada pela SEQ ID NO: 229 ou que compreende modular a expressão em uma planta de uma porção de qualquer uma das seqüências de ácido nucleico dadas na Tabela H ou que compreende modular a expressão em uma planta de uma porção de uma seqüência de ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na Tabela H.
Um método preferido para modular (preferivelmente, aumentar) a expressão em uma planta de uma tal porção é pela introdução e expressão em uma planta de uma porção de uma seqüência de ácido nucleico dada na Tabela H ou que compreende introduzir e expressar em uma planta uma porção de uma seqüência de ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de polipeptídeos dadas na Tabela H.
Porções úteis nos métodos da invenção, incluem porções de comprimento suficiente para codificar um polipeptídeo que cai sob a definição de um fator de transcrição de HD-Zip de Classe II, isto é significando que o polipeptídeo compreende os seguintes: (i) uma caixa de homeodomínio; (ii) um zíper de leucina; e (iii) Motivos I, II e III aqui descritos. Além disso, tais porções têm substancialmente a mesma atividade biológica como os fatores de transcrição de HD-Zip de Classe II.
Preferivelmente, a porção tem pelo menos 500 nucleotídeos consecutivos no comprimento, preferivelmente pelo menos 750 nucleotídeos consecutivos no comprimento, mais preferivelmente pelo menos 1.250 nucleotídeos consecutivos no comprimento, os nucleotídeos consecutivos sendo da SEQ ID NO: 229 ou de qualquer uma das seqüências de ácido nucleico dadas na Tabela H ou de qualquer ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma dos seqüências de aminoácido dadas na Tabela H. Mais preferivelmente a porção é uma porção do ácido nucleico da SEQ ID NO: 229.
Um porção como aqui definida pode ser preparada, por exemplo, fazendo-se uma ou mais deleções ao ácido nucleico em questão. As porções podem ser usadas na forma isolada ou elas podem ser fundidas a outras seqüências codificadoras (ou não codificadoras) de modo a, por exemplo, produzir uma proteína que combina diversas atividades. Quando fundida a outras seqüências codificadoras, o polipeptídeo resultante produzido na tradução pode ser maior do que aquele prognosticado para a porção.
Um outro ácido nucleico útil nos métodos da invenção é um ácido nucleico capaz de hibridizar, sob condições de severidade reduzida, preferivelmente sob condições de severidade média, mais preferivelmente sob condições severas, com um ácido nucleico representado pela SEQ ID NO: 229 ou capaz de hibridizar, sob condições de severidade reduzida, preferivelmente sob condições de severidade média, mais preferivelmente sob condições severas, com uma seqüência de ácido nucleico dada na Tabela H ou capaz de hibridizar sob condições de severidade reduzida, preferivelmente sob condições de severidade média, mais preferivelmente sob condições severas com um ácido nucleico que codifica um ortólogo, parálogo ou homólogo de uma seqüência de polipeptídeo dada na Tabela H.
De acordo com a presente invenção, é fornecido um método para modificar o teor de compostos de armazenagem em sementes em relação às plantas de controle, compreendendo modular a expressão em uma planta de um ácido nucleico capaz de hibridizar a um ácido nucleico representado pela SEQ ID NO: 229 ou que compreende modular a expressão em uma planta de um ácido nucleico capaz de hibridizar a uma seqüência de ácido nucleico dada na Tabela H ou que compreende modular a expressão em uma planta de um ácido nucleico capaz de hibridizar a uma seqüência de ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de polipeptídeo dadas na Tabela H. Mais preferivelmente a seqüência hibridizadora é capaz de hibridizar a um ácido nucleico como representado pela SEQ ID NO: 229. A seqüência hibridizadora é preferivelmente capaz de hibridizar sob condições de severidade reduzida, preferivelmente sob condições de severidade média, mais preferivelmente sob condições severas.
Um método preferido para modular (preferivelmente, aumentar) a expressão em uma planta de uma tal seqüência hibridizadora é pela introdução e expressão em uma planta de um ácido nucleico capaz de hibridizar a uma seqüência de ácido nucleico dada na Tabela H ou que compreende introduzir e expressar em uma planta uma seqüência de ácido nucleico capaz de hibridizar a uma seqüência de ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na Tabela H. Mais preferivelmente a seqüência hibridizadora é capaz de hibridizar a um ácido nucleico como representado pela SEQ ID NO: 229. A seqüência hibridizadora é preferivelmente capaz de hibridizar sob condições de severidade reduzida, preferivelmente sob condições de severidade média, mais preferivelmente sob condições severas.
As seqüências hibridizadoras úteis nos métodos da invenção, incluem ácidos nucleicos de comprimento suficiente para codificar um polipeptídeo que cai sob a definição de um fator de transcrição de HD-Zip de Classe II, isto é significando que o polipeptídeo compreende os seguintes: (i) uma caixa de homeodomínio; (ii) um zíper de leucina; e (iii) Motivos I, II e III aqui descritos. Além disso, tais seqüências hibridizadoras têm substancialmente a mesma atividade biológica como os fatores de transcrição de HD-Zip de Classe II.
A seqüência hibridizadora tem tipicamente pelo menos 500 nucleotídeos consecutivos no comprimento, preferivelmente pelo menos 750 nucleotídeos consecutivos no comprimento, mais preferivelmente pelo menos 1,250 nucleotídeos consecutivos no comprimento, os nucleotídeos consecutivos sendo de qualquer ácido nucleico capaz de hibridizar a uma seqüência de ácido nucleico dada na Tabela H ou de qualquer ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na Tabela H. Mais preferivelmente os nucleotídeos consecutivos são de um ácido nucleico capaz de hibridizar a um ácido nucleico representado pela SEQ ID NO: 229 ou a uma porção desta.
Um outro ácido nucleico útil nos métodos da invenção é uma variante de junção da SEQ ID NO: 229 ou uma variante de junção de qualquer uma das seqüências de ácido nucleico dadas na Tabela H ou uma variante de junção de um ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na Tabela H.
De acordo com a presente invenção, é fornecido um método para modificar o teor de compostos de armazenagem em sementes em relação às plantas de controle, compreendendo modular a expressão em uma planta de uma variante de junção de um ácido nucleico representado pela SEQ ID NO: 229 ou que compreende modular a expressão em uma planta de uma variante de junção de seqüência de ácido nucleico dada na Tabela H ou que compreende modular a expressão em uma planta de uma variante de junção de uma seqüência de ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na Tabela H.
Um método preferido para modular (preferivelmente, aumentar) a expressão em uma planta de uma tal variante de junção é pela introdução e expressão em uma planta de uma variante de junção de uma seqüência de ácido nucleico dada na Tabela H ou que compreende introduzir e expressar em uma planta uma variante de junção de uma seqüência de ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na Tabela H.
As variantes de junção úteis nos métodos da invenção, incluem ácidos nucleicos de comprimento suficiente para codificar um polipeptídeo que cai sob a definição de um fator de transcrição de HD-Zip de Classe II, isto é significando que o polipeptídeo compreende os seguintes: (i) uma caixa de homeodomínio; (ii) um zíper de leucina; e (iii) Motivos I, II e III aqui descritos. Além disso, tais variantes de junção têm substancialmente a mesma atividade biológica como os fatores de transcrição de HD-Zip de Classe II.
Um outro ácido nucleico útil na realização dos métodos da invenção é uma variante alélica da SEQ ID NO: 229 ou uma variante alélica de qualquer uma das seqüências de ácido nucleico dadas na Tabela H ou uma variante alélica de um ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na Tabela H.
Variantes alélicas existem na natureza e abrangidas dentro dos métodos da presente invenção está o uso destes alelos naturais.
De acordo com a presente invenção, é fornecido um método para modificar o teor de compostos de armazenagem em sementes em relação às plantas de controle, compreendendo modular a expressão em uma planta de uma variante alélica de um ácido nucleico representado pela SEQ ID NO: 229 ou que compreende modular a expressão em uma planta de uma variante alélica de seqüência de ácido nucleico dada na Tabela H ou que compreende modular a expressão em uma planta de uma variante alélica de uma seqüência de ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na Tabela H.
Um método preferido para modular (preferivelmente, aumentar) a expressão em uma planta de uma tal variante alélica é pela introdução e expressão em uma planta de uma variante alélica de uma seqüência de ácido nucleico dada na Tabela H ou que compreende introduzir e expressar em uma planta uma variante alélica de uma seqüência de ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na Tabela H.
As variantes alélicas úteis nos métodos da invenção, incluem ácidos nucleicos de comprimento suficiente para codificar um polipeptídeo que cai sob a definição de um fator de transcrição de HD-Zip de Classe II, isto é significando que o polipeptídeo compreende os seguintes: (i) uma caixa de homeodomínio; (ii) um zíper de leucina; e (iii) Motivos I, II e III aqui descritos. Além disso, tais variantes alélicas têm substancialmente a mesma atividade biológica como os fatores de transcrição de HD-Zip de Classe II. Um outro ácido nucleico útil nos métodos da invenção é um ácido nucleico obtido pelo embaralhamento de gene. O embaralhamento de gene ou evolução direta também podem ser usados para gerar variantes de qualquer um dos ácidos nucleicos dados na Tabela H ou variantes de ácidos nucleicos que codificam ortólogos, parálogos ou homólogos de qualquer uma das seqüências de aminoácido dadas na Tabela H.
De acordo com a presente invenção, é fornecido um método para modificar o teor de compostos de armazenagem em sementes em relação às plantas de controle, compreendendo modular a expressão em uma planta de uma variante de um ácido nucleico representada pela SEQ ID NO: 229 ou que compreende modular a expressão em uma planta de uma variante de qualquer uma das seqüências de ácido nucleico dadas na Tabela H ou que compreende modular a expressão em uma planta de uma variante de um ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na Tabela H, ácido nucleico variante este que é obtido pelo embaralhamento de gene.
Um método preferido para modular (preferivelmente, aumentar) a expressão em uma planta de uma tal variante obtida pelo embaralhamento de gene é pela introdução e expressão em uma planta de uma variante de qualquer uma das seqüências de ácido nucleico dadas na Tabela H ou que compreende introduzir e expressar em uma planta uma variante de uma seqüência de ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na Tabela H, ácido nucleico variante este que é obtido pelo embaralhamento de gene.
Tais variantes obtidas pelo embaralhamento de gene úteis nos métodos da invenção, incluem ácidos nucleicos de comprimento suficiente para codificar um polipeptídeo que cai sob a definição de um fator de transcrição de HD-Zip de Classe II, isto está significando que o polipeptídeo compreende os seguintes: (i) uma caixa de homeodomínio; (ii) um zíper de leucina; e (iii) Motivos I, II e III aqui descrito.
Além disso, ácidos nucleicos úteis nos métodos da invenção também podem ser obtidos pela mutagênese direcionada ao sítio. Diversos métodos estão disponíveis para se obter a mutagênese direcionada ao sítio, os mais comuns sendo métodos com base em PCR (Current Protocols in Molecular Biology. Wiley Eds.).
Os fatores de transcrição de HD-Zip de Classe II exibem a atividade biológica geral de fatores de transcrição (pelo menos na sua forma nativa) e tipicamente têm atividade de ligação de DNA e um domínio de ativação. Uma pessoa habilitada na técnica pode facilmente determinar a presença de um domínio de ativação e atividade de ligação de DNA usando ferramentas e técnicas de rotina. Sessa et al., 1997 (J Mol Biol 274(3): 303- 309) estudaram as propriedades de ligação de DNA dos domínios ATHB-I e ATHB-2 (= HAT4) HD-Zip (HD-Zip-1 e -2) e descobriram que eles interagem com DNA como homodímeros e reconhecem duas seqüências pseudopalindrômicas de 9 pares de base distintas, CAAT(A/T)ATTG (BS-I) e CAAT(G/C)ATTG (BS-2), respectivamente. A partir de uma análise mutacional do domínio de HD-Zip-2, eles determinaram que os resíduos de aminoácido conservados da hélice 3, Val47 e Asn51 e Arg55 são essenciais para a atividade de ligação de DNA do domínio de HD-Zip-2. Eles também relatam que o reconhecimento preferencial de um par de base G/C na posição central pelo domínio HD-Zip-2 é abolido pela substituição de Arg55 com lisina ou pela substituição de Glu46 e Thr56 com os resíduos correspondentes do domínio HD-Zip-I (alanina e triptofano, respectivamente).
De acordo com uma característica preferida da invenção, a expressão modulada é a expressão aumentada. Métodos para aumentar a expressão de ácidos nucleicos ou genes ou produtos de genes, são bem documentados na técnica.
Um outro método para modular a expressão em uma planta de um ácido nucleico que codifica um fator de transcrição de HD-Zip de Classe II compreende a redução ou eliminação substanciais da expressão em uma planta de um gene endógeno que codifica um fator de transcrição de HD-Zip de Classe II. Referência aqui a "redução ou eliminação substanciais" é considerado significar uma diminuição na expressão de gene endógeno e/ou níveis de polipeptídeo e/ou atividade de polipeptídeo em relação às plantas de controle.
A redução ou eliminação substanciais é em ordem crescente de preferência pelo menos 10%, 20%, 30%, 40% ou 50%, 60%, 70%, 80%, 85%, 90% ou 95%, 96%, 97%, 98%, 99% ou mais reduzida comparada com aquela de plantas de controle. Os métodos para diminuir a expressão são descritos acima na seção "definições".
Para a redução ou eliminação substanciais da expressão de um gene endógeno em uma planta, um comprimento suficiente de nucleotídeos substancialmente contíguos de uma seqüência de ácido nucleico é requerida. De modo a realizar o silenciamento de gene, este pode ser tão pouco quanto 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10 ou menos nucleotídeos, alternativamente isto pode ser tanto quanto o gene inteiro (incluindo a 5' e/ou 3' UTR, em parte ou no todo). O trecho de nucleotídeos substancialmente contíguos pode ser derivado da SEQ ID NO: 229 ou de qualquer uma das seqüências de ácido nucleico dadas na Tabela H ou de qualquer ácido nucleico capaz de codificar um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na Tabela H. Uma seqüência de ácido nucleico que codifica um polipeptídeo (funcional) não é uma exigência para os vários métodos aqui debatidos para a redução ou eliminação substanciais da expressão de um gene endógeno.
Ácidos nucleicos adequado para o uso nos métodos da invenção podem ser derivados de qualquer fonte natural ou artificial. O ácido nucleico pode ser modificado a partir da sua forma nativa na composição e/ou ambiente genômicos através da manipulação humana deliberada. Preferivelmente o ácido nucleico é de uma planta, mais preferivelmente de uma planta dicotiledônea, mais preferivelmente da família Brassicaceae, mais preferivelmente da Arabidopsis thaliana.
Um método preferido para modular (preferivelmente,
aumentar) a expressão de um ácido nucleico que codifica um fator de transcrição de HD-Zip de Classe II é pela introdução e expressão em uma planta de um ácido nucleico que codifica um fator de transcrição de HD-Zip de Classe II; entretanto os efeitos de realizar o método, isto é o teor modificado de compostos de armazenagem de semente, também pode ser obtido usando outras técnicas bem conhecidas. Uma de tal técnica é a ativação de rotulação de T-DNA. Os efeitos da invenção também podem ser reproduzidos usando a técnica de TILLING. Os efeitos da invenção também podem ser reproduzidos usando recombinação homóloga, que permite a introdução em um genoma de um ácido nucleico selecionado em uma posição selecionada definida.
O desempenho dos métodos da invenção dá plantas tendo sementes com um teor modificado de compostos de armazenagem de semente em relação às sementes de plantas de controle. O teor modificado de compostos de armazenagem de semente refere-se a um teor modificado de um ou mais de lipídeos, óleo, ácidos graxos, amido, açúcar e proteínas em relação ao mesmos de plantas de controle. Preferivelmente, a modulação da expressão em uma planta de um ácido nucleico que codifica um fator de transcrição de HD-Zip de Classe II dá plantas com sementes tendo teor de óleo aumentado em relação às sementes de plantas de controle. Em um tal caso, a expressão modulada é tipicamente a superexpressão em uma planta de um ácido nucleico que codifica um fator de transcrição de HD-Zip de Classe II. Preferivelmente, a modulação da expressão em uma planta de um ácido nucleico que codifica um fator de transcrição de HD-Zip de Classe II dá plantas com sementes tendo teor de proteína aumentado em relação às sementes de plantas de controle. Em um tal caso, a expressão modulada é tipicamente a redução ou eliminação substanciais da expressão de um gene endógeno que codifica o fator de transcrição de HD-Zip de Classe II.
A presente invenção também abrange plantas ou partes destas
(particularmente sementes) obteníveis pelos métodos de acordo com a presente invenção. As plantas ou partes destas compreendem um transgene de ácido nucleico (que compreende qualquer uma das seqüências de ácido nucleico descritas acima como sendo úteis nos métodos da invenção). A invenção também fornece construções genéticas e vetores
para facilitar a introdução e/ou expressão em uma planta das seqüências de ácido nucleico descritas acima como sendo úteis nos métodos da invenção.
Mais particularmente, é fornecida uma construção de gene que
compreende:
(i) Um ácido nucleico que codifica um fator de transcrição de
HD-Zip de Classe II como definido acima;
(ii) Uma ou mais seqüências de controle operavelmente ligadas ao ácido nucleico de (i).
As construções úteis nos métodos de acordo com a presente invenção podem ser construídas usando a tecnologia de DNA recombinante bem conhecida pelas pessoas habilitadas na técnica. As construções de gene podem ser inseridas em vetores, que podem ser comercialmente disponíveis, adequadas para transformar em plantas e adequadas para a expressão do gene de interesse nas células transformadas. A invenção portanto fornece o uso de uma construção de gene como definida acima nos métodos da invenção.
As plantas são transformadas com um vetor que compreende a seqüência de interesse. O técnico habilitado está bem ciente dos elementos genéticos que devem estar presentes no vetor de modo a transformar, selecionar e propagar com êxito células hospedeiras contendo a seqüência de interesse. A seqüência de interesse está operavelmente ligada a uma ou mais seqüências de controle (pelo menos a um promotor). Os termos "elemento regulador", "seqüência de controle" e "promotor" são todos aqui usados intercambiavelmente e são definidos acima.
Vantajosamente, qualquer tipo de promotor, se natural ou sintético, pode ser usado para direcionar a expressão da seqüência de ácido nucleico. Ver a seção "Definições" aqui para as definições de vários tipos de promotor.
De acordo com uma característica preferida da invenção, o ácido nucleico de interesse é operavelmente ligado a um promotor constitutivo. Um promotor constitutivo é transcricionalmente ativo durante a maioria mas não necessariamente todas as fases de crescimento e desenvolvimento e é substancialmente expressado de modo ubíquo. O promotor constitutivo é preferivelmente um Promotor GOS2, mais preferivelmente o promotor constitutivo é um Promotor GOS2 do arroz, mais preferivelmente o promotor constitutivo é representado por uma seqüência de ácido nucleico substancialmente similar à SEQ ID NO: 56 ou SEQ ID NO: 282, mais preferivelmente o promotor constitutivo é como representado pela SEQ ID NO: 56 ou SEQ ID NO: 282. Os exemplos de outros promotores constitutivos que também podem ser usados para realizar os métodos da invenção são mostrados acima.
Opcionalmente, uma ou mais seqüências terminadoras podem ser usadas na construção introduzida em uma planta. Elementos reguladores adicionais podem incluir realçadores transcricionais assim como traducionais. Aqueles habilitados na técnica estarão cientes de seqüências terminadoras e realçadoras que podem ser adequadas para o uso na realização da invenção. Uma seqüência de intron também pode ser adicionada à região não traduzida 5' (UTR) ou na seqüência codificadora para aumentar a quantidade da mensagem madura que acumula no citossol, como descrito na seção de definição. Outras seqüências de controle (além do promotor, realçador, silenciador, seqüências de intron, regiões 3'UTR e/ou 5'UTR) podem ser elementos estabilizadores de proteína e/ou RNA. Tais seqüências podem ser conhecidas ou podem ser facilmente obtidas por uma pessoa habilitada na técnica.
As construções genéticas da invenção podem ainda incluir uma seqüência de origem de replicação que é requerida para a manutenção e/ou replicação em um tipo de célula específico. Um exemplo é quando uma construção genética é requerida ser mantida em uma célula bacteriana como um elemento genético epissômico (por exemplo, molécula de plasmídeo ou cosmídeo). As origens preferidas de replicação incluem, mas não são limitadas ao fl-ori e colEl.
Para a detecção da transferência bem sucedida das seqüências de ácido nucleico como usado nos métodos da invenção e/ou seleção de plantas transgênicas que compreendam estes ácidos nucleicos, é vantajoso usar genes marcadores (ou genes repórteres). Portanto, a construção genética pode opcionalmente compreender um gene marcador selecionável. Os marcadores selecionáveis são descritos em mais detalhes na seção "definições" aqui. Os genes marcadores podem ser removidos ou excisados da célula transgênica uma vez que elas não são mais necessárias. As técnicas para a remoção de marcador são conhecidos na técnica, as técnicas úteis são descritas acima na seção de definição.
A invenção também fornece um método para a produção de plantas transgênicas tendo teor modificado de compostos de armazenagem em sementes em relação às plantas de controle, que compreendem a introdução e expressão em uma planta de uma seqüência de ácido nucleico representada pela SEQ ID NO: 229 ou que compreende a introdução e expressão em uma planta de uma seqüência de ácido nucleico dada na Tabela H ou que compreende a introdução e expressão em uma planta de uma seqüência de ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na Tabela H ou que compreende a introdução e expressão em uma planta de qualquer um dos ácidos nucleicos aqui definidos como sendo úteis nos métodos da invenção.
Mais especificamente, a presente invenção fornece um método para a produção de plantas transgênicas tendo teor modificado de compostos de armazenagem em sementes em relação às plantas de controle, método este que compreende:
(i) introduzir e expressar em uma planta, parte de planta ou célula vegetal uma seqüência de ácido nucleico representada pela SEQ ID NO: 229 ou que compreende introduzir e expressar em uma planta uma seqüência de ácido nucleico dada na Tabela H ou que compreende introduzir e expressar em uma planta uma seqüência de ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na Tabela H; e
(ii) cultivar a célula vegetal sob condições que promovam crescimento e desenvolvimento da planta; e
(iii) colheita de sementes da planta de (ii); e opcionalmente
(iv) extração de qualquer um ou mais de lipídeos, óleos, ácidos graxos, amido, açúcar ou proteína das sementes de (iii).
As sementes colhidas podem ser processadas para extrair compostos de armazenagem de semente particulares, tais como lipídeos, óleos, ácidos graxos, amido, açúcar ou proteína. Em particular, as sementes são usadas para a extração de óleo. Os óleos pode ser extraídos das sementes processadas ou não processadas.
O ácido nucleico pode ser introduzido diretamente em uma célula vegetal ou na própria planta (incluindo a introdução em um tecido, órgão ou qualquer outra parte de uma planta). De acordo com uma característica preferida da presente invenção, o ácido nucleico é preferivelmente introduzido em uma planta pela transformação.
O termo "transformação" como aqui aludido é como definido acima. O tecido vegetal capaz de propagação clonal subsequente, seja pela organogênese ou embriogênese, pode ser transformado com uma construção genética da presente invenção e uma planta inteira regenerada desta. O tecido particular escolhido variará dependendo dos sistemas de propagação clonal disponíveis e melhor adaptados para a espécies particular que é transformada. Os tecidos alvo exemplares incluem discos de folha, pólen, embriões, cotilédones, hipocotilédones, megagametófitos, tecido de calo, tecido meristemático existente (por exemplo, meristema apical, brotos axilares e meristemas de raiz) e tecido de meristema induzido (por exemplo, meristema de cotilédone e meristema de hipocotilédone). O polinucleotídeo pode ser transitória ou estavelmente introduzido em uma célula hospedeira e pode ser mantido não integrado, por exemplo, como um plasmídeo. Alternativamente, o mesmo pode ser integrado no genoma hospedeiro. A célula vegetal transformada resultante pode ser depois usada para regenerar uma planta transformada em uma maneira conhecida pelas pessoas habilitadas na técnica.
A transformação de espécies de planta é agora uma técnica completamente de rotina. Vantajosamente, qualquer um de diversos métodos de transformação pode ser usado para introduzir o gene de interesse em uma célula ancestral adequada. Os métodos de transformação incluem o uso de lipossomas, eletroporação, produtos químicos que aumentam a captação do DNA livre, injeção do DNA diretamente na planta, bombardeamento com pistola de partícula, transformação usando vírus ou pólen e microprojeção. Os métodos podem ser selecionados do método do cálcio/polietileno glicol para protoplastos (Krens, F. A. et al. (1982) Nature 296, 72-74; Negrutiu I et al. (1987) Plant Mol Biol 8: 363-373); eletroporação de protoplastos (Shillito R. D. et al. (1985) Bio/Technol 3, 1099-1102); microinjeção em material vegetal (Crossway A et al. (1986) Mol. Gen Genet 202: 179-185); bombardeamento de partícula revestida com DNA ou RNA (Klein TM et al. (1987) Nature 327: 70) infecção com vírus (não integrativa) e outros. As plantas de arroz transgênicas são preferivelmente produzidas por intermédio da transformação mediada por Agrobacterium usando qualquer um dos métodos bem conhecidos para a transformação de arroz, tal como descrito em qualquer um dos seguintes: pedido de patente européia publicado EP 1198985 Al, Aldemita e Hodges (Plant 199: 612-617, 1996); Chan et al. (Plant Mol Biol 22 (3): 491-506, 1993), Hiei et al. (Planta J 6 (2): 271-282, 1994), divulgações estas que são aqui incorporadas por referência como se completamente apresentadas. No caso da transformação de milho, o método preferido é como descrito em Ishida et al. (Nat. Biotechnol 14(6): 745-50, 1996) ou Frame et al. (Planta Physiol 129(1): 13-22, 2002), divulgações estas que são aqui incorporadas por referência como se completamente apresentadas.
As células vegetais geneticamente modificadas podem ser regeneradas por intermédio de todos os métodos com que o técnico habilitado está familiarizado. Os métodos adequados podem ser encontrados nas publicações supra citadas por S. D. Kung e R. Wu, Potrykus ou Hõfgen e Willmitzer.
No geral depois da transformação, as células vegetais ou agrupamentos de célula são selecionados quanto a presença de um ou mais marcadores que são codificados pelos genes expressáveis em planta co- transferidos com o gene de interesse, a seguir do que o material transformado é regenerado em uma planta inteira. Para selecionar plantas transformadas, o material vegetal obtido na transformação é, como uma regra, submetido às condições selecionativas de modo que as plantas transformadas possam ser distinguidas das plantas não transformadas. Por exemplo, as sementes obtidas na maneira descrita acima podem ser plantadas e, depois de um período de crescimento inicial, submetidas a uma seleção adequada pela pulverização. Uma outra possibilidade consiste em cultivar as sementes, se apropriado depois da esterilização, em placas de ágar usando um agente de seleção adequado de modo que apenas as sementes transformada possam crescer em plantas. Alternativamente, as plantas transformadas são tríadas quanto a presença de um marcador selecionável tal como aqueles aqui descritos.
A seguir da transferência de DNA e regeneração, as plantas putativamente transformadas podem ser avaliadas, por exemplo, usando a análise de Southern, quanto a presença do gene de interesse, número de cópia e/ou organização genômica. Alternativa ou adicionalmente, os níveis de expressão do DNA recém introduzido pode ser monitorado usando a análise de Northern e/ou Western ou PCR quantitativa, todas as técnicas sendo bem conhecidas pelas pessoas tendo habilidade comum na técnica.
As plantas transformadas geradas podem ser propagadas por uma variedade de meios, tais como pela propagação clonal ou técnicas de procriação clássicas. Por exemplo, uma planta transformada de primeira geração (ou TI) pode ser auto-polinizada para dar transformantes homozigotos da segunda geração (ou T2) e as plantas T2 propagadas ainda através técnicas de procriação clássicas.
Os organismos transformados gerados podem tomar uma variedade de formas. Por exemplo, eles podem ser quimeras de células transformadas e células não transformadas; transformantes clonais (por exemplo, todas as células transformadas para conter o cassete de expressão); os enxertos de tecidos transformados e não transformados (por exemplo, em plantas, um rizoma transformado enxertado a uma muda não transformada).
A presente invenção claramente estende-se a qualquer célula vegetal ou planta produzida por qualquer um dos métodos aqui descritos e a todas as partes de planta e propágulos desta. A presente invenção estende-se ainda para abranger a progênie de uma primária célula transformada ou transfectada, tecido, órgão ou planta inteira que tenha sido produzida por qualquer um dos métodos anteriormente mencionados, a única exigência sendo que a progênie exiba a(s) mesma(s) característica(s) genotípica(s) e/ou fenotípica(s) como aquela produzida pelo precursor nos métodos de acordo com a invenção.
A invenção também inclui células hospedeiras contendo qualquer um dos ácidos nucleicos descritos acima como sendo úteis nos métodos da invenção. As células hospedeiras preferidas de acordo com a invenção são células vegetais.
Os métodos da invenção são vantajosamente aplicáveis a qualquer planta. As plantas que são particularmente úteis nos métodos da invenção incluem todas as plantas que pertencem à superfamília Viridiplantae, em particular plantas monocotiledôneas e dicotiledôneas incluindo forragem ou legumes forrageiros, plantas ornamentais, safras alimentícias, árvores ou arbustos. De acordo com uma forma de realização preferida da presente invenção, a planta é uma planta de cultivo. Os exemplos de plantas de safra incluem soja, girassol, canola, alfafa, colza, algodão, tomate, batata e tabaco. Mais preferivelmente, a planta é uma planta monocotiledônea. Os exemplos de plantas monocotiledôneas incluem cana de açúcar. Mais preferivelmente a planta é um cereal. Os exemplos de cereais incluem arroz, milho, trigo, cevada, painço, centeio, triticale, sorgo e aveia.
De acordo com uma outra forma de realização preferida da presente invenção, a planta é uma planta de cultivo tipicamente cultivada para a produção de óleo. Os exemplos de tais plantas de safra para a produção de óleo incluem colza, canola, linhaça, soja, girassol, milho, aveia, centeio, cevada, trigo, pimentão, tagetes, algodão, dendê, coco palma, linho, mamona, amendoim, oliva, abacate, gergelim, jatropha.
A invenção também estende-se às partes colhíveis de uma planta, particularmente sementes, mas também folhas, frutas, flores, hastes, rizomas, tubérculos, raízes e bulbos. A invenção além disso diz respeito aos produtos derivados, preferivelmente diretamente derivados, de uma parte colhível de uma tal planta, tal como pelotas ou pós secos, óleo, gordura e ácidos graxos, amido ou proteínas. Um produto particular de interesse derivado de uma parte colhíveis de uma planta é óleo.
A presente invenção também abrange o uso de qualquer um dos ácidos nucleicos aqui mencionados como sendo úteis nos métodos da invenção na modificação do teor de armazenagem de semente em relação às plantas de controle. Particularmente útil é o ácido nucleico representado pela SEQ ID NO: 229 e qualquer uma das seqüências de ácido nucleico dadas na Tabela A e qualquer seqüência de ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de polipeptídeo dadas na Tabela Η. A presente invenção também abrange o uso de uma seqüência de polipeptídeo representada pela SEQ ID NO: 230 e uso de uma seqüência de polipeptídeos dada na Tabela H na modificação do teor de armazenagem de semente em relação às plantas de controle.
Estes ácidos nucleicos ou os polipeptídeos codificados podem encontrar uso em programas de procriação em que um marcador de DNA é identificado que pode ser geneticamente ligado a um gene que codifica o fator de transcrição de HD-Zip de Classe II. Os ácidos nucleicos/genes ou os próprios polipeptídeos podem ser usados para definir um marcador molecular. Este DNA ou marcador de proteína podem ser depois usados em programas de procriação para selecionar plantas tendo teor modificado de compostos de armazenagem de semente.
Variantes alélicas também podem encontrar uso em programas de procriação assistidas por marcador. Tais programas de procriação algumas vezes requerem a introdução de variação alélica pelo tratamento mutagênico das plantas, usando por exemplo a mutagênese de EMS; alternativamente, o programa pode começar com uma coleção de variantes alélicas da chamada origem "natural" causada involuntariamente. A identificação de variantes alélicas depois ocorre, por exemplo, pela PCR. Esta é seguida por uma etapa para seleção de variantes alélicas superiores da seqüência em questão e que dá rendimento aumentado. A seleção é tipicamente realizada monitorando-se o desempenho de crescimento de plantas contendo variantes alélicas diferentes da seqüência em questão. O desempenho de crescimento pode ser monitorado em uma estufa ou no campo. Outras etapas opcionais incluem cruzar plantas em que a variante alélica superior foi identificada com uma outra planta, isto pode ser usado, por exemplo, para fabricar uma combinação de características fenotípicas interessantes.
Os ácidos nucleicos também podem ser usados como sondas para o mapeamento genético e físico dos genes que eles são uma parte e como marcadores para traços ligados a estes genes. Tal informação pode ser útil na procriação de planta de modo a desenvolver linhagens com fenótipos desejados. Tal uso requer apenas uma seqüência de ácido nucleico de pelo menos 15 nucleotídeos no comprimento. Os ácidos nucleicos podem ser usados como marcadores de polimorfismo de comprimento de fragmento de restrição (RFLP). Southern blots (Sambrook J, Fritsch EF e Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de DNA genômico vegetal digerido com restrição pode ser sondadas com os ácidos nucleicos. Os padrões de faixa resultantes podem ser depois submetidos a análises genéticas usando programas de computador tais como MapMaker (Lander et ai. (1987) Genomics 1: 174-181) de modo a construir um mapa genético. Além disso, os ácidos nucleicos podem ser usados para sondar Southern blots contendo DNAs genômicos tratados com endonuclease de restrição de um conjunto de indivíduos que representam precursor e progênie de um cruzamento genético definido. A segregação dos polimorfismos de DNA é mencionada e usada para calcular a posição do ácido nucleico no mapa genético anteriormente obtido usando esta população (Botstein et al. (1980) Am. J. Hum. Genet. 32: 314-331). A produção e uso de sondas derivadas de gene vegetal para o uso no mapeamento genético é descrita em Bematzky e Tanksley (1986) Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevem o mapeamento genético de clones de cDNA específicos usando a metodologia esboçada acima ou variações destas. Por exemplo, populações de intercruzamentos F2, populações de retrocruzamento, populações aleatoriamente acasaladas, linhagens quase isogênicas e outros conjuntos de indivíduos podem ser usados para o mapeamento. Tais metodologias são bem conhecidas por aqueles habilitados na técnica.
As sondas de ácido nucleico também podem ser usadas para o mapeamento físico (isto é, colocação de seqüências nos mapas físicos; ver Hoheisel et al. Em: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346 e referências aí citadas).
Em uma outra forma de realização, as sondas de ácido nucleico podem ser usadas no mapeamento da hibridização in situ pela fluorescência direta (FISH) (Trask (1991) Trends Genet. 7: 149-154). Embora os métodos correntes de mapeamento FISH favoreçam o uso de clones grandes (diversos kb a diversas centenas de kb; ver Laan et al. (1995) Genome Res. 5: 13-20), melhorias na sensibilidade pode possibilitar o desempenho do mapeamento de FISH usando sondas mais curtas.
Uma variedade de métodos com base na amplifícação de ácido nucleico para o mapeamento genético e físico pode ser realizada usando os ácidos nucleicos. Os exemplos incluem amplifícação específica de alelo (Kazazian (1989) J. Lab. Clin. Med 11: 95-96), polimorfismo de fragmentos amplificados pela PCR (CAPS; Sheffield et al. (1993) Genomics 16: 325- 332), ligação específica de alelo (Landegren et al. (1988) Science 241: 1077- 1080), reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acids Res. 18: 3671), Mapeamento de Híbrido por Radiação (Walter et al. (1997) Nat. Genet. 7: 22-28) e Mapeamento Happy (Dear e Cook (1989) Nucleic Acids Res. 17: 6795-6807). Para estes métodos, a seqüência de um ácido nucleico é usado para planejar e produzir pares de iniciador para o uso na reação de amplificação ou nas reações de extensão de iniciador. O planejamento de tais iniciadores é bem conhecido por aqueles habilitados na técnica. Em métodos que utilizam mapeamento genético com base na PCR, pode ser necessário identificar as diferenças de seqüência de DNA entre os precursores da cruz de mapeamento na região que corresponde à seqüência de ácido nucleico presente. Isto, entretanto, no geral não é necessário para os métodos de mapeamento.
Os métodos de acordo com a presente invenção resultam em plantas tendo teor modificado de compostos de armazenagem de semente, como descritos mais acima. Estes traços também podem ser combinados com outros traços economicamente vantajosos, tais como traços que realçam o rendimento, tolerância a outros estresses abióticos e bióticos, traços que modificam várias características de arquitetura e/ou características bioquímicas e/ou fisiológicas. Descrição detalhada para o polipeptídeo de SYBl
Surpreendentemente, foi agora descoberto que modular a expressão em uma planta de um ácido nucleico que codifica um polipeptídeo de SYB1 dá plantas tendo traços relacionados com o rendimento realçados em relação às plantas de controle. Este aumento de rendimento foi surpreendentemente observado quando as plantas foram cultivadas sob condições sem estresse (condições não estressantes). A classe particular de polipeptídeos de SYBl adequados para realçar traços relacionados com o rendimento em plantas é descrita em detalhes abaixo.
A presente invenção fornece um método para realçar traços relacionados com o rendimento em plantas em relação às plantas de controle, compreendendo modular a expressão em uma planta de um ácido nucleico que codifica um polipeptídeo de SYB1. O termo "modulação" significa em relação à expressão ou expressão de gene, um processo em que o nível de expressão é trocado pela dita expressão de gene em comparação com a planta de controle, preferivelmente o nível de expressão é aumentado. A expressão original, não modulada pode ser de qualquer tipo de expressão de um RNA estrutural (rRNA, tRNA) ou mRNA com tradução subsequente.
Qualquer referência a seguir a uma "proteína útil nos métodos da invenção" é considerado significar um polipeptídeo de SYBl como aqui definido. Qualquer referência a seguir a um "ácido nucleico útil nos métodos da invenção" é considerado significar um ácido nucleico capaz de codificar um tal polipeptídeo de SYB1. Os termos "polipeptídeo" e "proteína" são aqui usados intercambiavelmente e referem-se aos aminoácidos em uma forma polimérica de qualquer comprimento. Os termos "polinucleotídeo(s)", "sequência(s) de ácido nucleico", "sequência(s) de nucleotídeo" são aqui usados intercambiavelmente e referem-se aos nucleotídeos, ribonucleotídeos ou desoxirribonucleotídeos ou uma combinação de ambos, em uma forma polimérica de qualquer comprimento.
Um método preferido para modular (preferivelmente, aumentar) a expressão de um ácido nucleico que codifica uma proteína útil nos métodos da invenção é pela introdução e expressão em uma planta de um ácido nucleico que codifica uma proteína útil nos métodos da invenção como definido abaixo.
O ácido nucleico a ser introduzido em uma planta (e portanto útil na realização dos métodos da invenção) é qualquer ácido nucleico que codifica o tipo de proteína que será agora descrito, a seguir também chamado "ácido nucleico de SYB1" ou "gene de SYB1". Um polipeptídeo de "SYB1" como aqui definido refere-se a qualquer seqüência de aminoácido que compreende 3 domínios de dedo de zinco do tipo RanBP (número de acesso SMART: SM00547, número de acesso Interpro: IPROO1876) e opcionalmente um ou mais domínios de baixa complexidade, mas carecendo, quando analisado contra a base de dados SMART, de qualquer outro domínio que não se sobrepõem com os domínios de dedo de zinco ou, se presente, o domínio de baixa complexidade. O domínio tipo Dedo de zinco ZnF RBZ está presente nas proteínas de ligação de Ran (RanBPs) e outras proteínas. Em RanBPs, este domínio se liga a RanGDP. Os domínios de complexidade baixa podem ser identificados usando o algoritmo SEG de Wootton e Federhen (Methods Enzymol. 266 (1996), pp. 554-571). Preferivelmente polipeptídeos de SYB1 na sua forma natural (isto é, como eles ocorrem na natureza) são em ordem crescente de preferência, não mais longos do que 350, 300, 290, 280, 270, 260, 250, 240, 230, 220, 210, 190 ou 180 aminoácidos, mais preferivelmente o comprimento do polipeptídeo de SYBl varia entre 180 e 130 aminoácidos.
Os domínios de dedo de zinco são conhecidos por ligar íons zinco e estão no geral envolvidos nas interações de proteína-DNA ou proteína-proteína. Preferivelmente, os domínios de dedo de zinco na proteína de SYBl começa com um dos seguintes motivos: (G/R/D/N)DW (motivo 1, SEQ ID NO: 344) ou GSW (motivo 2, SEQ ID NO: 345) e tem um primeiro resíduo de cisteína conservado na posição 5 (em que as posições de 1 a 3 são tomadas pelo motivo 1 ou motivo 2), um segundo resíduo de cisteína conservado entre as posições 7 e 10, um terceiro resíduo de cisteína conservado entre as posições 18 e 21 e um quarto resíduo de cisteína conservado entre as posições 21 e 24. Além disso, o domínio de dedo de zinco na proteína SYBl preferivelmente compreende os motivos conservados NF(Q/C/S)(R/K)R (motivo 3, SEQ ID NO: 346) ou N(F/Y)(A/S/P)(N/S/F)R (motivo 4, SEQ ID NO 347).
Opcionalmente, a seqüência localizada entre os domínio de dedo de Zn (digamos começa depois do quarto resíduo de cisteína conservado e termina antes do começo dos motivos 1 ou 2) é enriquecido em resíduos de glicina, o teor de glicina pode ser tão alto quanto 35% ou ainda mais alto (ao passo que o teor de glicina em uma proteína média está em torno de 6,93% (notas da SWISS PROT, liberação 44, Julho de 2004)). Adicional ou alternativamente, o teor de serina nesta seqüência também pode ser aumentado comparado com o teor de serina em uma proteína média (6,89%).
Preferivelmente, a seqüência de polipeptídeo que quando usada na construção de uma árvore filogenética, tal como aquela representada na figura 2b, forma grupos com os grupos de polipeptídeo de SYBl que compreendem a seqüência de aminoácido representada pela SEQ ID NO: 286 ao invés de com qualquer outro grupo.
Os exemplos de polipeptídeos úteis nos métodos da invenção e ácidos nucleicos que codificam o mesmo são como dados abaixo na tabela do Exemplo 40.
Também úteis nos métodos da invenção são homólogos de qualquer uma das seqüências de aminoácido dadas na tabela do Exemplo 40 e derivados de qualquer um dos polipeptídeos dados na tabela do Exemplo 40 ou ortólogos ou parálogos de qualquer uma das SEQ ID NOs anteriormente mencionadas.
A invenção é ilustrada pela transformação de plantas com a seqüência de ácido nucleico de Arabidopsis thaliana representada pela SEQ ID NO: 285, que codifica a seqüência de polipeptídeo da SEQ ID NO: 286, entretanto o desempenho da invenção não é restrito a estas seqüências. Os métodos da invenção podem ser vantajosamente realizadas usando qualquer ácido nucleico que codifica uma proteína útil nos métodos da invenção como aqui definido, incluindo ortólogos e parálogos, tais como qualquer uma das seqüências de ácido nucleico dadas na tabela do Exemplo 40. As seqüências de aminoácido dadas na tabela do Exemplo 40 pode ser considerada ser ortólogos e parálogos do polipeptídeo de SYBl representado pela SEQ ID NO: 286.
Ortólogos e parálogos podem ser facilmente encontrados realizando-se uma chamada pesquisa de blast recíproca. Tipicamente, isto envolve um primeiro BLAST envolvendo submeter a BLAST uma seqüência dúvida (por exemplo usando qualquer uma das seqüências listadas na tabela do Exemplo 40) contra qualquer base de dados de seqüência, tais como a base de dados NCBI publicamente disponível. BLASTN ou TBLASTX (usando valores default padrão) são no geral usados quando partindo de uma seqüência de nucleotídeo e BLASTP ou TBLASTN (usando valores default padrão) quando partindo de uma seqüência de proteína. Os resultados de BLAST podem ser opcionalmente filtrados. As seqüências de tamanho natural dos resultados filtrados ou resultados não filtrados são depois submetidos novamente a BLAST (segundo BLAST) contra seqüências do organismo das quais a seqüência dúvida é derivada (onde a seqüência dúvida é SEQ ID NO: 285 ou SEQ ID NO: 286, o segundo BLAST portanto seria contra seqüências de Arabidopsis thaliana). Os resultados do primeiro e segundo BLASTs são depois comparados. Um parálogo é identificado se um acerto de alta classificação do primeiro blast é da mesma espécie como a partir das quais a seqüência dúvida é derivada, um BLAST posterior depois idealmente resulta na seqüência dúvida como o acerto mais alto; um ortólogo é identificado se um acerto de alta classificação no primeiro BLAST não é da mesma espécie como das quais a seqüência dúvida é derivada e preferivelmente resulta no BLAST posterior na seqüência dúvida estando entre os acertos mais altos.
Os acertos de alta classificação são aqueles tendo um valor E baixo. Quanto mais baixo o valor E, mais significante a contagem (ou em outras palavras mais baixa a chance que o acerto fosse encontrado ao acaso). A computação do valor E é bem conhecido na técnica. Além dos valores E, as comparações também são contadas pela identidade percentual. A identidade percentual refere-se ao número de nucleotídeos (ou aminoácidos) idênticos entre as duas seqüências de ácido nucleico (ou polipeptídeo) comparadas em relação a um comprimento particular. No caso de famílias grandes, ClustalW pode ser usado, seguido por uma árvore de união de vizinhos, para ajudar a visualizar a formação de grupos de genes relacionados e para identificar ortólogos e parálogos.
A tabela do Exemplo 40 dá exemplos de ortólogos e parálogos da proteína SYBl representada pela SEQ ID NO 286. Outros ortólogos e parálogos podem ser facilmente identificados usando o procedimento BLAST descrito acima.
As proteínas da invenção são identificáveis pela presença de três domínios do domínio de dedo de zinco tipo ZnF_RBZ conservados (mostrados na figura 22). Os termos "domínio" e "motivo" ou "assinatura" são definidos na seção "Definições". As bases de dados especialistas também existem para a identificação de domínios, por exemplo, SMART (Schultz et al. (1998) Proc. Natl. Acad. Sei. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244, InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318, Prosite (Bucher e Bairoch (1994), A generalized profile syntax for biomoleculars sequences motifs and its fiinction in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAIPress, Menlo Park; Hulo et al., Nucl. Acids. Res. 32: D134-D137, (2004) ou Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280 (2002). Um conjunto de ferramentas para a análise in silico de seqüências de proteína é disponível no servidor ExPASY proteomies (abrigado pelo Swiss Institute of Bioinformatics (Gasteiger et al., ExPASy: the proteomies server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31: 3784-3788 (2003)).
Os domínios também podem ser identificados usando técnicas de rotina, tais como pelo alinhamento de seqüência. Os métodos para o alinhamento de seqüências para comparação são bem conhecidos na técnica, tais métodos incluem GAP, BESTFIT, BLAST, FASTA e TFASTA. GAP usa o algoritmo de Needleman e Wunsch ((1970) J Mol Biol 48: 443-453) para encontrar o alinhamento global (isto é, que transpõem as seqüências completas) de duas seqüências que maximizam o número de emparelhamentos e minimiza o número de intervalos. O algoritmo BLAST (Altschul et ai. (1990) J Mol Biol 215: 403-10) calcula a identidade de seqüência percentual e realiza uma análise estatística da similaridade entre as duas seqüências. O software para realizar a análise de BLAST está publicamente disponível através do National Centre for Biotechnology Information (NCBI). Homólogos podem ser facilmente identificados usando, por exemplo, o algoritmo de alinhamento de seqüência múltipla ClustalW (versão 1.83), com os parâmetros de alinhamento aos pares de default e um método de contagem em porcentagem. As porcentagens globais de similaridade e identidade também podem ser determinadas usando um dos métodos disponíveis no pacote de software MatGAT (Campanella et al., BMC Bioinformatics. 10 de Jul de 2003; 4: 29. MatGAT: uma aplicação que gera matrizes de similaridade/identidade usando seqüências de proteína ou DNA). Edição manual menor pode ser realizada para otimizar o alinhamento entre motivos conservados, como estaria evidente a uma pessoa habilitada na técnica. Além disso, ao invés de usar seqüências de tamanho natural para a identificação de homólogos, domínios específicos (tais como o domínio de dedo de zinco tipo ZnF_RBZ ou um dos motivos definidos acima) também podem ser usados. Os valores de identidade de seqüência, que são indicados abaixo no Exemplo 42 como uma porcentagem foram determinados em relação à seqüência de ácido nucleico ou aminoácido inteira, e/ou em relação a domínios ou motivo(s) conservado(s) selecionados, usando os programas mencionados acima usando os parâmetros de default.
Além disso, as proteínas de SYBl (pelo menos na sua forma nativa) pode interagir com proteínas ou ácidos nucleicos e tem o efeito de aumentar o rendimento de semente quando expressado de acordo com os métodos da presente invenção. Outros detalhes são fornecidos no Exemplo 45.
Ácidos nucleicos que codificam proteínas úteis nos métodos da invenção não precisam ser ácidos nucleicos de tamanho natural, visto que o desempenho dos métodos da invenção não contam com o uso das seqüências de tamanho natural de ácido nucleico. Os exemplos de ácidos nucleicos adequados para o uso na realização dos métodos da invenção incluem as seqüências de ácido nucleico dadas na tabela do Exemplo 40, mas não são limitados a estas seqüências. Variantes de ácido nucleico também podem ser úteis na prática dos métodos da invenção. Os exemplos de tais variantes de ácido nucleico incluem porções de ácidos nucleicos que codificam uma proteína útil nos métodos da invenção, ácidos nucleicos que hibridizam aos ácidos nucleicos que codificam uma proteína útil nos métodos da invenção, variantes de junção de ácidos nucleicos que codificam uma proteína útil nos métodos da invenção, variantes alélicas de ácidos nucleicos que codificam uma proteína útil nos métodos da invenção e variantes de ácidos nucleicos que codificam uma proteína útil nos métodos da invenção que são obtidas pelo embaralhamento de gene. Os termos porção, seqüência hibridizadora, variante de junção, variante alélica e embaralhamento de gene serão agora descritos.
De acordo com a presente invenção, é fornecido um método para realçar traços relacionados com o rendimento em plantas, que compreende introduzir e expressar em uma planta uma porção de qualquer uma das seqüências de ácido nucleico dadas na tabela do Exemplo 40 ou uma porção de um ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na tabela do Exemplo 40.
Porções úteis nos métodos da invenção, codificam um polipeptídeo que cai dentro da definição de um ácido nucleico que codifica uma proteína útil nos métodos da invenção como aqui definidos e tendo substancialmente a mesma atividade biológica como as seqüências de aminoácido dadas na tabela do Exemplo 40. Preferivelmente, a porção é uma porção de qualquer um dos ácidos nucleicos dadas na tabela do Exemplo 40. A porção é tipicamente pelo menos 200 nucleotídeos consecutivos no comprimento, preferivelmente pelo menos 300 nucleotídeos consecutivos no comprimento, mais preferivelmente pelo menos 400 nucleotídeos consecutivos no comprimento e mais preferivelmente pelo menos 500 nucleotídeos consecutivos no comprimento, os nucleotídeos consecutivos sendo de qualquer uma das seqüências de ácido nucleico dadas na tabela do Exemplo 40. Mais preferivelmente a porção é uma porção do ácido nucleico da SEQ ID NO: 285. Preferivelmente, a porção codifica uma seqüência de aminoácido que compreende três Domínios de dedo de zinco do tipo ZnF_RBZ como aqui definidos. Preferivelmente, a porção codifica uma seqüência de aminoácido que quando usada na construção de uma árvore filogenética de SYB1, tal como aquela representada na figura 23b, tende a formar grupo com o grupo de proteínas SYB1 que compreendem a seqüência de aminoácido representada pela SEQ ID NO: 286 ao invés de com qualquer outro grupo.
Uma porção de um ácido nucleico que codifica uma proteína SYB1 como aqui definido pode ser preparada, por exemplo, fazendo-se uma ou mais deleções ao ácido nucleico. As porções podem ser usadas na forma isolada ou ela pode ser fundida a outras seqüências codificadoras (ou não codificadoras) de modo a, por exemplo, produzir uma proteína que combine diversas atividades. Quando fundida a outras seqüências codificadoras, o polipeptídeo resultante produzido na tradução pode ser maior do que aquele prognosticado para a porção de proteína de SYB1.
Uma outra variante de ácido nucleico útil nos métodos da invenção é um ácido nucleico capaz de hibridizar, sob condições de severidade reduzida, preferivelmente sob condições severas, com um ácido nucleico que codifica uma proteína de SYB1 como aqui definida ou com uma porção como aqui definida.
As seqüências hibridizadoras úteis nos métodos da invenção, codificam um polipeptídeo tendo três domínios de dedo de zinco do tipo ZnF_RBZ (ver o alinhamento da Figura 23a) e tendo substancialmente a mesma atividade biológica como a proteína de SYBl representada por qualquer um das seqüências de aminoácido dadas na tabela do Exemplo 40. A seqüência hibridizadora tem tipicamente pelo menos 200 nucleotídeos consecutivos no comprimento, preferivelmente pelo menos 300 nucleotídeos consecutivos no comprimento, mais preferivelmente pelo menos 400 nucleotídeos consecutivos no comprimento e mais preferivelmente pelo menos 500 nucleotídeos consecutivos no comprimento, os nucleotídeos consecutivos sendo de qualquer uma das seqüências de ácido nucleico dadas na tabela do Exemplo 40. Preferivelmente, a seqüência hibridizadora é uma que é capaz de hibridizar a qualquer um dos ácidos nucleicos dados na tabela do Exemplo 40 ou a uma porção de qualquer uma destas seqüências, uma porção sendo como definida acima. Mais preferivelmente, a seqüência hibridizadora é capaz de hibridizar a um ácido nucleico como representado pela SEQ ID NO: 285 ou a uma porção desta. Preferivelmente, a seqüência hibridizadora codifica uma seqüência de aminoácido que compreende qualquer um ou mais dos motivos ou domínios como aqui definidos. Preferivelmente, a seqüência hibridizadora codifica uma seqüência de aminoácido que quando usada na construção de uma árvore filogenética de SYB1, tal como aquela representada na figura 23 b, tende a formar grupo com o grupo de proteínas de SYB1 que compreendem a seqüência de aminoácido representada pela SEQ ID NO: 286 ao invés de com qualquer outro grupo.
De acordo com a presente invenção, é fornecido um método para realçar traços relacionados com o rendimento em plantas, que compreende introduzir e expressar em uma planta um ácido nucleico capaz de hibridizar a qualquer um dos ácidos nucleicos dados na tabela do Exemplo 40 ou que compreende introduzir e expressar em uma planta um ácido nucleico capaz de hibridizar a um ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de ácido nucleico dadas na tabela do Exemplo 40.
Uma outra variante de ácido nucleico útil nos métodos da invenção é uma variante de junção que codifica uma proteína SYBl como definida acima, o termo "variante de junção" sendo como definido acima. De acordo com a presente invenção, é fornecido um método
para realçar traços relacionados com o rendimento em plantas, que compreende introduzir e expressar em uma planta uma variante de junção de qualquer uma das seqüências de ácido nucleico dadas na tabela do Exemplo 40 ou uma variante de junção de um ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na tabela do Exemplo 40.
As variantes de junção preferidas são variantes de junção de um ácido nucleico representado pela SEQ ID NO: 285 ou uma variante de junção de um ácido nucleico que codifica um ortólogo ou parálogo da SEQ ID NO: 286. Preferivelmente, a seqüência de aminoácido codificada pela variante de junção compreende qualquer um ou mais dos motivos ou domínios como aqui definidos. Preferivelmente, a seqüência de aminoácido codificada pela variante de junção, quando usada na construção de uma árvore filogenética de SYB1, tal como aquela representada na figura 23b, tende a formar grupo com o grupo de proteínas de SYBl que compreendem a seqüência de aminoácido representada pela SEQ ID NO: 286 ao invés de com qualquer outro grupo.
Uma outra variante de ácido nucleico útil na realização dos métodos da invenção é uma variante alélica de um ácido nucleico que codifica uma proteína de SYBl como definida acima. Variantes alélicas existem na natureza e abrangidas dentro dos métodos da presente invenção é o uso destes alelos naturais. As variantes alélicas úteis nos métodos da presente invenção têm substancialmente a mesma atividade biológica como a proteína de SYB1 da SEQ ID NO: 286.
De acordo com a presente invenção, é fornecido um método para realçar traços relacionados com o rendimento em plantas, que compreendem introduzir e expressar em uma planta uma variante alélica de qualquer um dos ácidos nucleicos dados na tabela do Exemplo 40 ou que compreende introduzir e expressar em uma planta uma variante alélica de um ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na tabela do Exemplo 40.
Preferivelmente, a variante alélica é uma variante alélica da SEQ ID NO: 285 ou uma variante alélica de um ácido nucleico que codifica um ortólogo ou parálogo da SEQ ID NO: 286. Preferivelmente, a seqüência de aminoácido codificada pela variante alélica compreende qualquer um ou mais dos motivos ou domínios como aqui definidos. Preferivelmente, a seqüência de aminoácido codificada pela variante alélica, quando usada na construção de uma árvore filogenética de SYB1, tal como aquela representada na figura 23b, tende a formar grupo com o grupo de proteínas de SYB1 que compreendem a seqüência de aminoácido representada pela SEQ ID NO: 286 ao invés de com qualquer outra grupo.
Uma outra variante de ácido nucleico útil nos métodos da invenção é uma variante de ácido nucleico obtida pelo embaralhamento de gene, o termo "embaralhamento de gene" como descrito acima.
De acordo com a presente invenção, é fornecido um método para realçar traços relacionados com o rendimento em plantas, que compreende introduzir e expressar em uma planta uma variante de qualquer uma das seqüências de ácido nucleico dadas na tabela do Exemplo 40 ou que compreende introduzir e expressar em uma planta uma variante de um ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na tabela do Exemplo 40, ácido nucleico variante este que é obtido pelo embaralhamento de gene.
Preferivelmente, o ácido nucleico variante obtido pelo embaralhamento de gene codifica uma seqüência de aminoácido que compreende qualquer um ou mais dos motivos ou domínios como aqui definidos. Preferivelmente, a seqüência de aminoácido codificada pelo ácido nucleico variante obtido pelo embaralhamento de gene, quando usado na construção de uma árvore filogenética de SYB1 tal como aquela representada na figura 23b, tende a formar grupo com o grupo de proteínas de SYBl que compreendem a seqüência de aminoácido representada pela SEQ ID NO: 286 ao invés de com qualquer outro grupo.
Além disso, variantes de ácido nucleico também podem ser obtidos pela mutagênese direcionada ao sítio. Diversos métodos são disponíveis para se obter mutagênese direcionada ao sítio, os mais comuns sendo métodos com base em PCR (Current Protocols in Molecular Biology. Wiley Eds.).
Ácidos nucleicos que codificam proteínas de SYB1 podem ser derivados de qualquer fonte natural ou artificial. O ácido nucleico pode ser modificado a partir da sua forma nativa em composição e/ou ambiente genômico através da manipulação humana deliberada. Preferivelmente o ácido nucleico que codifica SYBl é de uma planta, mais preferivelmente de uma planta dicotiledônea, mais preferivelmente da família das Brassicaceae; mais preferivelmente o ácido nucleico é de Arabidopsis thaliana.
Qualquer referência aqui a uma proteína de SYBl é portanto considerada significar uma proteína de SYB1 como definida acima. Qualquer ácido nucleico que codifica uma tal proteína de SYB1 é adequado para o uso na realização dos métodos da invenção. A presente invenção também abrange plantas ou partes destas (incluindo sementes) obteníveis pelos métodos de acordo com a presente invenção. As plantas ou partes destas compreendem um transgene de ácido nucleico que codifica uma proteína de SYBl como definido acima.
A invenção também fornece construções genéticas e vetores para facilitar a introdução e/ou expressão da seqüências de ácido nucleico úteis nos métodos de acordo com a invenção, em uma planta. Construções úteis nos métodos de acordo com a presente invenção podem ser construídas usando tecnologia de DNA recombinante bem conhecida pelas pessoas habilitadas na técnica. As construções de gene podem ser inseridas em vetores, que podem ser comercialmente disponíveis, adequados para a transformação em plantas e adequados para a expressão do gene de interesse nas células transformadas. A invenção também fornece o uso de uma construção de gene como aqui definida nos métodos da invenção.
Mais especificamente, a presente invenção fornece uma construção que compreende:
(i) um ácido nucleico de SYBl ou variante deste, como definido acima;
(ii) uma ou mais seqüências de controle operavelmente ligadas à seqüência de ácido nucleico de (i); e opcionalmente
(iii) uma seqüência de terminação de transcrição.
Preferivelmente, o ácido nucleico que codifica um
polipeptídeo de SYBl é como definido acima. Os termos "seqüência de controle" e "terminação seqüência" são como aqui definidos.
As plantas são transformadas com um vetor que compreende a seqüência de interesse (isto é, um ácido nucleico que codifica um polipeptídeo de SYBl como aqui definido. O técnico habilitado está bem ciente dos elementos genéticos que devem estar presentes no vetor de modo a transformar, selecionar e propagar com êxito as células hospedeiras contendo a seqüência de interesse. A seqüência de interesse é operavelmente ligada a uma ou mais seqüências de controle (pelo menos a um promotor). Os termos "elemento regulador", "seqüência de controle" e "promotor" são todos aqui usados intercambiavelmente e são definidos acima.
Vantajosamente, qualquer tipo de promotor pode ser usado
para direcionar a expressão da seqüência de ácido nucleico. Preferivelmente, o ácido nucleico de SYB1 ou variante deste são operavelmente ligados a um promotor constitutivo. Um promotor constitutivo preferido é um que também é expressado de modo substancialmente ubíquo. Mais preferivelmente o promotor é derivado de uma planta, mais preferivelmente de uma planta monocotiledônea. Mais preferido é o uso de um Promotor GOS2 (do arroz) (SEQ ID NO: 56 ou 343). Deve estar claro que a aplicabilidade da presente invenção não está restrita ao ácido nucleico de SYB1 representado pela SEQ ID NO: 285, nem é a aplicabilidade da invenção restrita à expressão de um ácido nucleico de SYBl quando direcionado por um Promotor GOS2. Os exemplos de outros promotores constitutivos que também podem ser usados para direcionar a expressão de um ácido nucleico de SYBl são mostrados acima.
Opcionalmente, uma ou mais seqüências terminadoras podem ser usadas na construção introduzida em uma planta. Elementos reguladores adicionais podem incluir realçadores transcricionais assim como traducionais. Aqueles habilitados na técnica estarão cientes de seqüências terminadoras e realçadoras que podem ser adequadas para o uso na realização da invenção. Uma seqüência de intron também pode ser adicionada à região não traduzida 5' (UTR) ou na seqüência codificadora para aumentar a quantidade da mensagem madura que acumula no citossol, como descrito na seção de definição. Outras seqüências de controle (além do promotor, realçador, silenciador, seqüências de intron, regiões 3'UTR e/ou 5'UTR) podem ser elementos estabilizadores de proteína e/ou RNA. Tais seqüências podem ser conhecidas ou podem ser facilmente obtidas por uma pessoa habilitada na técnica.
As construções genéticas da invenção podem incluir ainda uma seqüência de origem de replicação que é requerida para a manutenção e/ou replicação em um tipo de célula específico. Um exemplo é quando uma construção genética é requerida ser mantida em uma célula bacteriana como um elemento genético epissômico (por exemplo, molécula de plasmídeo ou cosmídeo). As origens preferidas de replicação incluem, mas não são limitadas ao fl-ori e colEl. Para a detecção da transferência bem sucedida das seqüências
de ácido nucleico como usadas nos métodos da invenção e/ou seleção de plantas transgênicas que compreendem estes ácidos nucleicos, é vantajoso usar genes marcadores (ou genes repórteres). "Marcadores selecionáveis" são descritos em mais detalhes na seção de definição. Os genes marcadores podem ser removidos ou excisados da célula transgênica uma vez que elas não são mais necessárias. As técnicas para a remoção de marcador são conhecidas no ramo, técnicas úteis são descritas acima na seção de definição.
A invenção também fornece um método para a produção de plantas transgênicas tendo traços realçados relacionados com o rendimento em relação às plantas de controle, que compreendem a introdução e expressão em uma planta de qualquer ácido nucleico que codifica uma proteína de SYB1 como definido acima.
Mais especificamente, a presente invenção fornece um método para a produção de plantas transgênicas tendo rendimento aumentado, método este que compreende:
(i) introduzir e expressar em uma planta ou célula vegetal um ácido nucleico de SYB1 ou variante deste; e
(ii) cultivar a célula vegetal sob condições que promovam o crescimento e desenvolvimento da planta. O ácido nucleico de (i) pode ser qualquer um dos ácidos nucleicos capazes de codificar um polipeptídeo de SYBl como aqui definido.
O ácido nucleico pode ser introduzido diretamente em uma célula vegetal ou na planta por si só (incluindo a introdução em um tecido, órgão ou qualquer outra parte de uma planta). De acordo com uma característica preferida da presente invenção, o ácido nucleico é preferivelmente introduzido em uma planta pela transformação. O termo "transformação" é descrito em mais detalhes nas seção "definições" aqui.
As células vegetais geneticamente modificadas podem ser regeneradas por intermédio de todos os métodos com que o técnico habilitado está familiarizado. Os métodos adequados podem ser encontrados nas publicações supra citadas por S. D. Kung e R. Wu, Potrykus ou Hõfgen e Wil lmitzer.
No geral depois da transformação, as células vegetais ou agrupamentos de célula são selecionados quanto a presença de um ou mais marcadores que são codificados pelos genes expressáveis em planta co- transferidos com o gene de interesse, seguindo que o material transformado é regenerado em uma planta inteira. Para selecionar plantas transformadas, o material vegetal obtido na transformação é, como uma regra, submetido às condições selecionativas de modo que plantas transformadas possam ser distinguidas das plantas não transformadas. Por exemplo, as sementes obtidas na maneira descrita acima podem ser plantadas e, depois de um período de crescimento inicial, submetidas a uma seleção adequada pela pulverização. Uma outra possibilidade consiste em cultivar as sementes, se apropriado depois da esterilização, em placas de ágar usando um agente de seleção adequado de modo que apenas as sementes transformadas podem crescer em plantas. Alternativamente, as plantas transformadas são tríadas quanto a presença de um marcador selecionável tal como aqueles descritos acima.
Após a transferência de DNA e regeneração, plantas putativamente transformadas também podem ser avaliadas, por exemplo, usando a análise de Southern, quanto a presença do gene de interesse, número de cópia e/ou organização genômica. Alternativa ou adicionalmente, os níveis de expressão do DNA recém introduzido podem ser monitorados usando a análise de Northern e/ou Western, ambas as técnicas sendo bem conhecidas pelas pessoas tendo habilidade comum na técnica.
As plantas transformadas geradas podem ser propagadas por uma variedade de meios, tais como pela propagação clonal ou técnicas de procriação clássicas. Por exemplo, uma planta transformada de primeira geração (ou TI) pode ser auto-polinizada e transformantes homozigotos de segunda geração (ou T2) selecionados e as plantas T2 pode ser depois ainda propagadas através de técnicas de procriação clássicas.
Os organismos transformados gerados podem tomar uma variedade de formas. Por exemplo, ela pode ser quimeras de células transformadas e células não transformadas; transformantes clonais (por exemplo, todas as células transformadas para conter o cassete de expressão); os enxertos de tecidos transformados e não transformados (por exemplo, em plantas, um rizoma transformado enxertado a uma muda não transformada).
A presente invenção claramente estende-se a qualquer célula vegetal ou planta produzida por qualquer um dos métodos aqui descritos e a todas as partes de plantas e propágulos destas. A presente invenção estende-se ainda para abranger a progênie de uma célula primária transformada ou transfectada, tecido, órgão ou planta inteira que foram produzidos por qualquer um dos métodos anteriormente mencionados, a única exigência sendo que a progênie exiba a(s) mesma(s) característica(s) genotípica(s) e/ou fenotípica(a) como aquela(s) produzida(s) pelo precursor nos métodos de acordo com a invenção.
A invenção também inclui células hospedeiras contendo um ácido nucleico isolado que codifica uma proteína de SYBl como definido acima. As células hospedeiras preferidas de acordo com a invenção são células vegetais.
As plantas hospedeiras para os ácidos nucleicos ou o vetor usado no método de acordo com a invenção, o cassete de expressão ou construção ou vetor são, em princípio, vantajosamente todas as plantas, que são capazes de sintetizar os polipeptídeos usados no método inventivo.
Os métodos da invenção são vantajosamente aplicáveis a qualquer planta. As plantas que são particularmente úteis nos métodos da invenção incluem todas as plantas que pertencem à superfamília Viridiplantae, em particular plantas monocotiledôneas e dicotiledôneas incluindo forragem ou legumes forrageiros, plantas ornamentais, safras alimentícias, árvores ou arbustos. De acordo com uma forma de realização preferida da presente invenção, a planta é uma planta de cultivo. Os exemplos de plantas de safra incluem soja, girassol, canola, alfafa, colza, algodão, tomate, batata e tabaco. Mais preferivelmente, a planta é uma planta monocotiledônea. Os exemplos de plantas monocotiledôneas incluem cana de açúcar. Mais preferivelmente a planta é um cereal. Os exemplos de cereais incluem arroz, milho, trigo, cevada, painço, centeio, triticale, sorgo e aveia.
A invenção também estende-se às partes colhíveis de uma planta tais como, mas não limitado às sementes, folhas, frutas, flores, hastes, rizomas, tubérculos e bulbos. A invenção além disso diz respeito aos produtos derivados, preferivelmente diretamente derivados, de uma parte colhível de uma tal planta, tais como pelotas ou pós secos, óleo, gordura e ácidos graxos, amido ou proteínas.
De acordo com uma característica preferida da invenção, a
expressão modulada é a expressão aumentada. Como mencionado acima, um método preferido para modular (preferivelmente, aumentar) a expressão de um ácido nucleico que codifica uma proteína de SYBl é pela introdução e expressão em uma planta de um ácido nucleico que codifica uma proteína de SYB1; entretanto os efeitos de realizar o método, isto é realçar os traços relacionados com o rendimento também podem ser obtidos usando outras técnicas bem conhecidas. Uma tal técnica é a ativação da rotulação de T- DNA. Os efeitos da invenção também podem ser reproduzidos usando as técnica de TILLING ou com recombinação homóloga, que permite a introdução em um genoma de um ácido nucleico selecionado em uma posição selecionada definida.
O desempenho dos métodos da invenção dá plantas tendo traços realçados relacionados com o rendimento. Em particular o desempenho dos métodos da invenção dá plantas tendo rendimento aumentado, especialmente rendimento de semente aumentado em relação às plantas de controle. Os termos "rendimento" e "rendimento de semente" são descritos em mais detalhes na seção "definições" aqui.
Referência aqui aos traços realçados relacionados com o rendimento é considerado significar um aumento na biomassa (peso) de uma ou mais partes de uma planta, que pode incluir partes acima do solo (colhíveis) e/ou partes abaixo do solo (colhíveis).
Em particular, tais partes colhíveis são sementes e o desempenho dos métodos da invenção resulta em plantas tendo rendimento de semente aumentado em relação ao rendimento de semente de plantas de controle adequadas.
Tomando-se o milho como um exemplo, um aumento de rendimento pode ser manifestado como um ou mais dos seguintes: aumento no número de plantas estabelecidas por metro quadrado, um aumento no número de espigas por planta, um aumento no número de carreiras, número de grãos por carreira, peso do grão, peso de mil grãos, comprimento/diâmetro da espiga, aumento na taxa de enchimento da semente (que é o número de sementes cheias dividido pelo número total de sementes e multiplicado por 100), entre outras. Tomando-se o arroz como um exemplo, um aumento de rendimento pode manifestar-se por si só como um aumento em um ou mais dos seguintes: número de plantas por metro quadrado, número de panículas por planta, número de espiguetas por panícula, número de flores (flósculos) por panícula (que é expressado como uma razão do número de sementes cheias em relação ao número de panículas primárias), aumento na taxa de enchimento da semente (que é o número de sementes cheias dividido pelo número total de sementes e multiplicado por 100), aumento no peso de mil grãos, entre outros.
Visto que as plantas transgênicas de acordo com a presente invenção têm rendimento aumentado, é provável que estas plantas exibam uma taxa de crescimento aumentada (durante pelo menos parte do seu ciclo de vida), em relação à taxa de crescimento de plantas de controle em um estágio correspondente em seu ciclo de vida. A taxa de crescimento aumentada pode ser específica a uma ou mais partes de uma planta (incluindo sementes) ou pode ser por toda a parte da planta substancialmente inteira. As plantas tendo uma taxa de crescimento aumentada pode ter um ciclo de vida mais curto. O ciclo de vida de uma planta pode ser considerado significar o tempo necessário para crescer a partir de uma semente madura seca até o estágio onde a planta produziu sementes maduras secas, similares ao material de partida. Este ciclo de vida pode ser influenciado por fatores tais como vigor inicial, taxa de crescimento, índice de verdor, tempo de florescimento e velocidade de maturação de semente. O aumento na taxa de crescimento pode ocorrer em um ou mais estágios no ciclo de vida de uma planta ou durante substancialmente o ciclo de vida inteiro da planta. A taxa de crescimento aumentada durante os estágios iniciais no ciclo de vida de uma planta pode refletir o vigor realçado. O aumento na taxa de crescimento pode alterar o ciclo de colheita de uma planta possibilitando que as plantas sejam semeadas mais tarde e/ou colhida mais cedo do que de outro modo seria possível (um efeito similar pode ser obtido com tempo de florescimento mais cedo). Se a taxa de crescimento é suficientemente aumentada, a mesma pode possibilitar a semeadura adicional de sementes da mesma espécie de planta (por exemplo semeadura e colheita de plantas de arroz seguidas pela semeadura e colheita de mais plantas de arroz todas dentro de um período de crescimento convencional). Similarmente, se a taxa de crescimento é suficientemente aumentada, a mesma pode possibilitar a semeadura adicional de sementes de espécies de plantas diferentes (por exemplo a plantação e colheita de plantas de milho seguidas, por exemplo, pela plantação e colheita opcional de soja, batata ou qualquer outra planta adequada). Tempos de colheita adicionais do mesmo rizoma no caso de algumas plantas de safra também podem ser possível. Alterar o ciclo de colheita de uma planta pode levar a um aumento na produção de biomassa anual por metro quadrado (devido a um aumento no número de vezes (digamos em um ano) que qualquer planta particular pode ser cultivada e colhida). Um aumento na taxa de crescimento também pode possibilitar o cultivo de plantas transgênicas em uma área geográfica mais ampla do que as suas contrapartes do tipo selvagem, visto que as limitações territoriais para o cultivo de um safra são freqüentemente determinadas pelas condições ambientais adversas no tempo de plantação (estação inicial) ou no tempo de colheita (estação tardia). Tais condições adversas podem ser evitadas se o ciclo de colheita é encurtado. A taxa de crescimento pode ser determinada pela derivatização de vários parâmetros a partir de curvas de crescimento, tais parâmetros podem ser: T-Mid (o tempo levado para as plantas atingir 50% do seu tamanho máximo) e T-90 (tempo levado pelas plantas para atingirem 90% do seu tamanho máximo), entre outros. De acordo com uma característica preferida da presente
invenção, o desempenho dos métodos da invenção dá plantas tendo uma taxa de crescimento aumentada em relação às plantas de controle. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar a taxa de crescimento de plantas, método este que compreende modular a expressão, preferivelmente aumentar a expressão, em uma planta de um ácido nucleico que codifica uma proteína de SYB1 como aqui definida.
Um aumento no rendimento e/ou taxa de crescimento ocorre se a planta está sob condições não estressantes ou se a planta é exposta a vários estresses comparados com as plantas de controle. As plantas tipicamente respondem à exposição ao estresse pelo crescimento mais lento. Em condições de estresse severo, a planta pode mesmo parar o crescimento completamente. O estresse brando por outro lado é aqui definido como sendo qualquer estresse ao qual uma planta é exposta que não resulta na planta cessando de crescer completamente sem a capacidade para retomar o crescimento. O estresse brando no sentido da invenção leva a uma redução no crescimento das plantas estressadas de menos do que 40%, 35% ou 30%, preferivelmente menor do que 25%, 20% ou 15%, mais preferivelmente menor do que 14%, 13%, 12%, 11% ou 10% ou menos em comparação com a planta de controle sob condições não estressantes. Devido aos avanços nas práticas agrícolas (irrigação, fertilização, tratamentos com pesticida) estresses severos não são freqüentemente encontrados em plantas de safra cultivadas. Como uma conseqüência, o crescimento comprometido induzido pelo estresse brando é freqüentemente uma característica indesejável para a agricultura. Os estresses brandos são os estresses bióticos e/ou abióticos (ambientais) diários aos quais uma planta é exposta. Estresse abióticos podem ser devido à seca ou água em excesso, estresse anaeróbico, estresse salino, toxicidade química, estresse oxidativo e temperaturas quentes, frias ou congelantes. O estresse abiótico pode ser um estresse osmótico causado por um estresse pela água (particularmente devido à seca), estresse salino, estresse oxidativo ou um estresse iônico. Estresses bióticos são tipicamente aqueles estresses causados pelos patógenos, tais como bactérias, vírus, fungos e insetos.
Em particular, o métodos da presente invenção pode ser realizado sob condições não estressantes ou sob condições de seca branda para dar plantas tendo rendimento aumentado em relação às plantas de controle. Como relatado em Wang et al. (Plant (2003) 218: 1-14), estresse abiótico leva a uma série de mudanças morfológicas, fisiológicas, bioquímicas e moleculares que afetam adversamente o crescimento e produtividade da planta. Seca, salinidade, temperaturas extremas e estresse oxidativo são conhecidos como estando interconectados e podem induzir crescimento e dano celular através de mecanismos similares. Rabbani et al. (Plant Physiol (2003) 133: 1755-1767) descreve um grau particularmente alto de "conversa cruzada" entre estresse pela seca e estresse de salinidade alta. Por exemplo, seca e/ou salinização são manifestadas primariamente como estresse osmótico, resultando no rompimento da homeostase e distribuição iônica na célula. O estresse oxidativo, que freqüentemente acompanha a temperatura alta ou baixa, salinidade ou estresse pela seca, podem causar desnaturação de proteínas funcionais e estruturais. Como uma conseqüência, estes estresses ambientais diversos freqüentemente ativam os caminhos da sinalização de célula similares e respostas celulares, tais como a produção de proteínas de estresse, supra-regulagem de anti-oxidantes, acúmulo de solutos compatíveis e parada de crescimento. O termo condições "não estressantes" como aqui usado são aquelas condições ambientais que possibilitam crescimento ideal de plantas. As pessoas habilitadas na técnica estão cientes de condições de solo e condições climáticas normais para uma dada localização.
O desempenho dos métodos da invenção dá plantas cultivadas sob condições não estressantes ou sob condições de seca branda rendimento aumentado em relação às planta adequadas de controle cultivadas sob condições comparáveis. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar o rendimento em plantas cultivadas sob condições não estressantes ou sob condições de seca branda, método este que compreende aumentar a expressão em uma planta de um ácido nucleico que codifica um polipeptídeo de SYB1.
O desempenho dos métodos da invenção dá plantas cultivadas sob condições de deficiência de nutriente, particularmente sob condições de deficiência de nitrogênio, rendimento aumentado em relação às plantas de controle cultivadas sob condições comparáveis. Portanto, de acordo com a presente invenção, é fornecido um método para aumentar o rendimento em plantas cultivadas sob condições de deficiência de nutriente, método este que compreende aumentar a expressão em uma planta de um ácido nucleico que codifica um polipeptídeo de SYB1. A deficiência de nutriente pode resultar de uma falta de nutrientes tal como nitrogênio, fosfatos e outros compostos contendo fósforo, potássio, cálcio, cádmio, magnésio, manganês, ferro e boro, entre outros.
Em uma forma de realização preferida da invenção, o aumento no rendimento e/ou taxa de crescimento ocorre de acordo com os métodos da presente invenção sob condições não estressantes.
A presente invenção também abrange o uso de ácidos nucleicos que codificam a proteína de SYBl aqui descrita e o uso destas proteínas de SYBl no realce de traços relacionados com o rendimento em plantas. A presente invenção além disso abrange o uso de plantas.
Ácidos nucleicos que codificam a proteína de SYBl aqui descrita ou as próprias proteínas de SYB1, podem encontrar uso em programas de procriação em que um marcador de DNA é identificado que pode ser geneticamente ligado a um gene que codifica SYB1. Os ácidos nucleicos/genes ou as próprias proteínas de SYBl podem ser usados para definir um marcador molecular. Este DNA ou marcador de proteína podem ser depois usados em programas de procriação para selecionar plantas tendo traços realçados relacionados com o rendimento como definido acima nos métodos da invenção.
As variantes alélicas de um ácido nucleico/gene que codifica a proteína de SYB1 também podem encontrar uso em programas de procriação assistidas por marcador. Tais programas de procriação algumas vezes requerem a introdução de variação alélica pelo tratamento mutagênico das plantas, usando por exemplo EMS mutagênese; alternativamente, o programa pode começar com uma coleção de variantes alélicas da chamada origem "natural" causada involuntariamente. A identificação de variantes alélicas depois ocorre, por exemplo, pela PCR. Isto é seguido por uma etapa para a seleção de variantes alélicas superiores da seqüência em questão e que dão rendimento aumentado. A seleção é tipicamente realizada monitorando-se o desempenho de crescimento de plantas contendo diferentes variantes alélicas da seqüência em questão. O desempenho de crescimento pode ser monitorado em um estufa ou no campo. Outras etapas opcionais incluem cruzar plantas em que a variante alélica superior foi identificada com uma outra planta. Isto pode ser usado, por exemplo, para fabricar uma combinação de características fenotípicas interessantes.
Os ácidos nucleicos que codificam proteínas de SYB1 também podem ser usados como sondas para mapear genética e fisicamente os genes que eles são uma parte e como marcadores para traços ligados àqueles genes. Tal informação pode ser útil na procriação de planta de modo a desenvolver linhagens com fenótipos desejados. Tal uso de ácidos nucleicos que codificam proteína de SYBl requer apenas uma seqüência de ácido nucleico de pelo menos 15 nucleotídeos no comprimento. Os ácidos nucleicos que codificam a proteína de SYBl podem ser usados como marcadores de polimorfismo de comprimento de fragmento de restrição (RFLP). Southern blots (Sambrook J, Fritsch EF e Maniatis T (1989) Molecular Cloning, A Laboratory Manual) de DNA genômico vegetal digerido com restrição pode ser sondadas com os ácidos nucleicos que codificam a proteína de SYB1. Os padrões de faixa resultantes podem ser depois submetidos às análises genéticas usando programas de computador tais como MapMaker (Lander et al. (1987) Genomics 1: 174-181) de modo a construir um mapa genético. Além disso, os ácidos nucleicos podem ser usados para sondar Southern blots contendo DNAs genômicos tratados com endonuclease de restrição de um conjunto de indivíduos que representam precursor e progênie de um cruzamento genético definido. A segregação dos polimorfismos de DNA é mencionada e usada para calcular a posição do ácido nucleico que codifica a proteína de SYB1 no mapa genético anteriormente obtido usando esta população (Botstein et al. (1980) Am. J. Hum. Genet. 32: 314-331).
A produção e uso de sondas derivadas de gene vegetal para o uso no mapeamento genético é descrito em Bernatzky e Tanksley (1986) Plant Mol. Biol. Repórter 4: 37-41. Numerosas publicações descrevem mapeamento genético de clones de cDNA específicos usando a metodologia esboçada acima ou variações desta. Por exemplo, populações de intercruzamento F2, populações de retrocruzamento, populações aleatoriamente acasaladas, linhagens quase isogênicas e outros conjuntos de indivíduos podem ser usados para o mapeamento. Tais metodologias são bem conhecidos por aqueles habilitados na técnica.
As sondas de ácido nucleico também podem ser usadas para o mapeamento físico (isto é, colocação das seqüências nos mapas físicos; ver Hoheisel et al. Em: Non-mammalian Genomic Analysis: A Practical Guide, Academic press 1996, pp. 319-346 e referências citadas nesta).
Em uma outra forma de realização, as sondas de ácido nucleico podem ser usadas na hibridização in situ pelo mapeamento de fluorescência direta (FISH) (Trask (1991) Trends Genet. 7: 149-154). Embora métodos correntes de mapeamento FISH favoreçam o uso de clones grandes (diversos kb a diversas centenas de kb; ver Laan et al. (1995) Genome Res. 5: 13-20), melhorias na sensibilidade podem possibilitar o desempenho do mapeamento de FISH usando sondas mais curtas.
Uma variedade de métodos com base na amplificação de ácido nucleico para o mapeamento genético e físico pode ser realizada usando os ácidos nucleicos. Os exemplos incluem a amplificação específica de alelo (Kazazian (1989) J. Lab. Clin. Med 11: 95-96), polimorfismo de fragmentos amplificados pela PCR (CAPS; Sheffield et al. (1993) Genomics 16: 325- 332), ligação específica de alelo (Landegren et al. (1988) Science 241: 1077- 1080), reações de extensão de nucleotídeo (Sokolov (1990) Nucleic Acids Res. 18: 3671), Mapeamento de Híbrido por Radiação (Walter et al. (1997) Nat. Genet. 7: 22-28) e Mapeamento Happy (Dear e Cook (1989) Nucleic Acids Res. 17: 6795-6807). Para estes métodos, a seqüência de um ácido nucleico é usada para planejar e produzir pares de iniciador para o uso na reação de amplificação ou nas reações de extensão de iniciador. O planejamento de tais iniciadores é bem conhecida por aqueles habilitados na técnica. Em métodos que utilizam mapeamento genético com base na PCR, pode ser necessário identificar as diferenças de seqüência de DNA entre os precursores da cruz de mapeamento na região que corresponde à seqüência de ácido nucleico presente. Isto, entretanto, no geral não é necessário para os métodos de mapeamento.
Os métodos de acordo com a presente invenção resultam em plantas tendo traços relacionados com o rendimento realçados, como descrito mais acima. Estes traços também podem ser combinados com outros traços economicamente vantajosos, tais como outros traços que realçam o rendimento, tolerância a outros estresses abióticos e bióticos, traços que modificam várias características de arquitetura e/ou características bioquímicas e/ou fisiológicas. Descrição das figuras
A presente invenção será agora descrita com referência às seguintes figuras em que:
A Fig. 1 mostra um exemplo da estrutura de domínio de um polipeptídeo de AZ. A proteína codificada pela SEQ ID NO: 2 compreende duas repetições de anquirina (negrito, sublinhado) e dois domínios C3H1 (itálicos, sublinhado).
A Fig. 2 mostra as seqüências de consenso de Anquirina (ANK) e Dedo de zinco C3H1 (C3H1) de acordo com a base de dados SMART, os símbolos para os vários grupos de aminoácido são dados na legenda.
A Fig. 3 representa uma matriz de identidade de seqüência/ similaridade preparada com MATGAT (BLOSUM62, penalidade de abertura de intervalo 11, penalidade de extensão de intervalo 1). Acima da diagonal, em negrito, as identidades de seqüência são demonstradas, abaixo da diagonal, as similaridades de seqüência são dadas para: A) seqüências de proteína de tamanho natural, B) seqüências de proteína parciais que compreendem a maior parte do domínio de dedo de Zn de terminal C putativo.
A Fig. 4 mostra o vetor binário p056, para a expressão em Oryza sativa de uma seqüência codificadora AZ de Arabidopsis thaliana sob o controle de um promotor WSI18 (referência interna PROOl51).
A Fig. 5 mostra a estrutura de domínio típica dos polipeptídeos de SYT de plantas e mamíferos. O domínio SNH conservado está localizado na extremidade do terminal N do polipeptídeo. O resto do terminal C do polipeptídeo consiste de um domínio rico em QG nos polipeptídeos de SYT vegetais e de um domínio rico em QPGY em polipeptídeos de SYT de mamífero. Um domínio rico em Met é tipicamente compreendido dentro da primeira metade do rico em QG (do terminal N para o terminal C) em plantas ou rico em QPGY em mamíferos. Um segundo domínio rico em Met pode preceder o domínio SNH em polipeptídeos de SYT vegetais.
A Fig. 6 mostra um alinhamento múltiplo da extremidade do terminal N de diversos polipeptídeos de SYT, usando o programa de alinhamento múltiplo VNTI AlignX, com base em um algoritmo ClustalW modificado (InforMax, Bethesda, MD, http: //www. informaxinc.com), com ajustes de default para a penalidade de abertura de intervalo de 10 e uma extensão de intervalo de 0,05). O domínio SNH é colocado em caixa através da planta e polipeptídeos de SYT humanos. A última linha no alinhamento consiste de uma seqüência de consenso derivada das seqüências alinhadas.
A Fig. 7 mostra um alinhamento múltiplo de diversos polipeptídeos de SYT vegetais, usando o programa de alinhamento múltiplo VNTI AlignX, com base em um algoritmo ClustalW modificado (InforMax, Bethesda, MD, http: //www.informaxinc.com), com ajustes de default para a penalidade de abertura de intervalo de 10 e uma extensão de intervalo de 0,05). Os dois domínios principais, do terminal N para o terminal C, são colocados em caixa e identificados como domínio SNH e o domínio rico em Met/rico em QG. Adicionalmente, o domínio de terminal N rico em Met também é colocado em caixa e as posições da SEQ ID NO: 90 e SEQ ID NO 91 são sublinhadas em negrito.
A Fig. 8 mostra uma árvore de união de vizinho que resulta do alinhamento de polipeptídeos de SYT múltiplos usando CLUSTALW 1.83 (http: //align.genoma.jp/sit-bin/clustalw). Os clades SYTl e SYT2/SYT3 são identificados com colchetes. A Fig. 9 mostra um vetor binário p0523, para a expressão em
Oryza sativa de um AtSYTl de Arabidopsis thaliana sob o controle de um Promotor GOS2 (referência interna PROO129).
A Figura 10 é uma vista geral do ciclo de Calvin. As treze reações enzimáticas são mostradas, assim como os nomes das enzimas que realizam estas reações. A seta preta mostra a posição de cpFBPase no ciclo.
A Figura 11 é um esquema mostrando a ativação pela luz de cpFBPase por intermédio do sistema de ferredoxina-tiorredoxina.
A Figura 12 é um alinhamento de polipeptídeos de cyFBPase e polipeptídeos de cpFBPase. As seqüências de polipeptídeo foram alinhadas usando o programa AlignX do conjunto Vetor NTI (InforMax, Bethesda, MD). O alinhamento múltiplo foi feito com uma penalidade de abertura de intervalo de 10 e uma extensão de intervalo de 0,01. O peptídeo de trânsito cloroplástico prognosticado dos polipeptídeos de cpFBPase é colocado em caixa. A inserção reguladora de redox e as cisteínas envolvidas na formação de ponte de dissulfeto são indicadas. Finalmente, a região de sítio ativo também é colocada em caixa e os resíduos de aminoácido Asn237, Tyr269, Tyr289 e Arg268 que ligam o 6-fosfato da frutose-l,6-bisfosfato e Lys299 que liga a frutose são mostrados.
A Figura 13 mostra um vetor binário ρ 1597, para a expressão aumentada em Oryza sativa de um ácido nucleico de Chlamydomonas reindhardtii que codifica um polipeptídeo de cpFBPase sob o controle de um Promotor GOS2 (referência interna PROO129).
A Fig. 14 é um alinhamento de ácidos nucleicos de SIK que codificam ortólogos de SIK putativos descrito na Tabela 2.
A Fig. 15 é um alinhamento de polipeptídeo de SIK do arroz (SEQ ID NO: 2) e polipeptídeo de SIK de Arabidopsis (SEQ ID NO: 4) e polipeptídeo de OSSIK tendo o número de acesso do NCBI OS BAD73441.
A Fig. 16 representa o binário para o silenciamento do gene endógeno de vetor no Oryza sativa usando um ácido nucleico de SIK representado pela SEQ ID NO: 1 usando uma construção de grampo de cabelo sob o controle de um promotor constitutivo, GOS2.
A Fig. 17 mostra um vetor binário para a expressão em Oryza sativa de um ácido nucleico que codifica SIK de Oryza sativa sob o controle de um Promotor GOS2.
A Fig. 18 mostra uma seção de uma árvore filogenética de HD-Zip mostrando membros HD-Zip de Classe II.
A Fig. 19 mostra um alinhamento de diversas seqüências de polipeptídeo de HD-Zip de Classe II. Fig. 20 é um alinhamento tirado de Henrikson et al., 2005 (Plant Physiol, Vol. 139, pp. 509-518). Os domínios Zip de Leu em todas as proteínas HDZip I e II estão em posições idênticas, do terminal C para o HD. Os domínios HDZip das proteínas de HDZip I e II são similares entre si em seqüência, embora várias posições de aminoácido distinguem HDZip I de II. O aminoácido na posição 46 é invariável dentro de HDZip I e II, mas distinto entre as classes. Diversos outros aminoácidos, por exemplo, aqueles nas posições 6, 25, 29, 30, 58 e 61, são invariáveis dentro de HDZip II e diferem dos aminoácidos de HDZip I, que mostra variação nestas posições. A Fig. 21 mostra um vetor binário para a expressão aumentada
em Oryza sativa do fator de transcrição do ácido nucleico que codifica HD- Zip de Classe II (HAT4) de Arabidopsis thaliana sob o controle de um Promotor GOS2.
A Fig. 22 mostra a estrutura de domínio de dois exemplos de proteínas de SYB1. Os Domínios de dedo de zinco são indicados em negrito sublinhado.
A Fig. 23a mostra um alinhamento múltiplo de várias proteínas de SYBl (as seqüências usadas são: CDS2671 (SEQ ID NO: 2), AAZ94630 (SEQ ID NO: 4), Q53AV6 (SEQ ID NO: 6), Q6Z6E6 (SEQ ID NO: 8), Q8GWD1 (SEQ ID NO: 10), Q9SW92 (SEQ ID NO: 12), Q8RYZ5 (SEQ ID NO: 14), beta vulgaris (SEQ ID NO: 16), Q8S8K1 (SEQ ID NO: 18), Q8GZ43 (SEQ ID NO: 20), Q7F1K4 (SEQ ID NO: 22), Q7XHQ8 (SEQ ID NO: 24)); a Fig. 23b mostra uma árvore filogenética em que a caixa preta delineia o grupo de proteínas de SYB1. A Fig. 24 mostra o vetor binário para a expressão aumentada
em Oryza sativa de um ácido nucleico que codifica a proteína de SYBl de Arabidopsis thaliana sob o controle de um Promotor GOS2 (referência interna PROO129).
A Fig. 25 detalha exemplos de seqüências úteis na realização dos métodos de acordo com a presente invenção. A SEQ ID NO: 1 até a SEQ ID NO: 56 dizem respeito às seqüências AZ. As SEQ ID NOs: 1 e 2 representam a seqüência codificadora de AZ CDS3104 e a seqüência de proteína deduzida. As SEQ ID NOs: 53 e 47 representam a seqüência codificadora de AZ CDS3108 e a seqüência de proteína deduzida. As SEQ ID NOs: 3 a 6 representam as seqüências conservadas que podem estar presentes em uma proteína de AZ, as SEQ ID NOs: 9 e 55 representam seqüências do promotor WSI18 usadas na seção de exemplos. As SEQ ID NOs: 10 a 52 são exemplos de seqüências de outras proteínas de AZ e ácidos nucleicos que codificam estas proteínas, as SEQ ID NOs: 54 e 56 são as seqüências do Promotor GOS2 do arroz.
As SEQ ID NOs: 56 a 153 dizem respeito às seqüências SYT. As seqüências de ácido nucleico de SYT são apresentadas do início até a parada. A maioria destas seqüências são derivadas do sequenciamento de EST, que é de qualidade mais baixa. Portanto, as substituições de ácido nucleico podem ser encontradas.
As SEQ ID NO: 56 e SEQ ID NO: 154 a 208 representam exemplos de seqüências que dizem respeito a cpFBPase, úteis na realização dos métodos de acordo com a presente invenção. As SEQ ID NOs: 56 e 209 a 228 são exemplos de seqüências úteis na realização dos métodos de acordo com a presente invenção que dizem respeito às proteínas/ácidos nucleicos de SIK ou úteis na isolação de tais seqüências. As seqüências podem resultar de montagens de EST públicas, com sequenciamento de menor qualidade. Como uma conseqüência, umas poucas substituições de ácido nucleico podem ser esperadas. As 5' e 3' UTR das seqüências naturalmente transcritas também podem ser usadas para a realização dos métodos da invenção para a redução ou eliminação substanciais da expressão de gene SIK endógeno.
As SEQ ID NOs: 229 a 284 são exemplos de seqüências úteis na realização dos métodos de acordo com a presente invenção que dizem respeito ao fator de transcrição de HD-Zip de Classe II (HAT4).
As SEQ ID NO: 56 e SEQ ID NO: 285 a 347 são exemplos de seqüências que dizem respeito às proteínas de SYB1 e ácidos nucleicos e são úteis na realização dos métodos de acordo com a presente invenção.
Exemplos
A presente invenção será agora descrita com referência aos seguintes exemplos, que são apenas por via de ilustração. Os seguintes exemplos não são intencionados a definir completamente ou de outro modo limitar o escopo da invenção. Manipulação de DNA: a menos que de outro modo
estabelecido, as técnicas de DNA recombinante são realizadas de acordo com protocolos padrão descritos em (Sambrook (2001) Molecular Cloning: A laboratory manual, 3a Edição Cold Spring Harbor Laboratory Press, CSH, Nova Iorque) ou nos Volumes 1 e 2 de Ausubel et al. (1994), Current Protocols in Molecular Biology, Current Protocols. Os materiais e métodos padrão para o trabalho molecular vegetal são descritos em Plant Molecular Biology Labfax (1993) por R. D. D. Croy, publicado por BIOS Scientific Publications Ltd (UK) e Blackwell Scientific Publications (UK). Exemplo 1: Identificação de seqüências relacionadas com a seqüência de ácido nucleico usadas nos métodos da invenção
As seqüências (cDNA de tamanho natural, ESTs ou genômico) relacionadas com a seqüência de ácido nucleico usadas nos métodos da presente invenção foram identificadas entre aquelas mantidas na base de dados Entrez Nucleotides no National Center for Biotechnology Information (NCBI) usando as ferramentas de pesquisa de seqüência da base de dados, tal como the Basic Local Alignment Tool (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215: 403-410; e Altschul et al (1997) Nucleic Acids Res. 25: 3389-3402). O programa é usado para encontrar regiões de similaridade local entre as seqüências comparando-se as seqüências de ácido nucleico ou polipeptídeo com a base de dados de seqüências e calculando-se a significância estatística de emparelhamentos. Por exemplo, o polipeptídeo codificado pelo ácido nucleico usado na presente invenção foi usado para o algoritmo TBLASTN, com ajustes de default e o filtro para ignorar a compensação das seqüências de baixa complexidade. O rendimento da análise foi visualizada pela comparação aos pares e classificada de acordo com a contagem de probabilidade (valor E), onde a contagem reflete a probabilidade de que um alinhamento particular ocorra ao acaso (quanto mais baixo o valor E, mais significante o acerto). Além dos valores E, comparações foram também contadas pela identidade percentual. Identidade percentual refere-se ao número de nucleotídeos idênticos (ou aminoácidos) entre as duas seqüências de ácido nucleico (ou polipeptídeo) comparadas em relação a um comprimento particular. Em alguns casos, os parâmetros de default podem ser ajustados para modificar a severidade da pesquisa. Por exemplo o valor E pode ser aumentado para mostrar emparelhamentos menos severos. Deste modo, emparelhamentos curtos quase exatos podem ser identificados.
A Tabela A fornece uma lista de seqüências de ácido nucleico relacionadas com a seqüência de ácido nucleico usada nos métodos da presente invenção. Tabela A: Os exemplos de polipeptídeos de AZ:
Fonte de Planta ψ Acido nucleico Proteína SEQ ID NO: SEQ ID NO: Arabidopsis thaliana 1 2 Eucalyptus grandis 10 11 Oryza sativa 12 13 Medicago truncatula 14 15 Oryza sativa 16 17 Arabidopsis thaliana 18 19 Oryza sativa 20 21 Arabidopsis thaliana 22 23 Arabidopsis thaliana 24 25 Eucalyptus grandis 26 27 Eucalyptus grandis 28 29 Glieina max 30 31 Eucalyptus grandis 32 33 Arabidopsis thaliana 34 35 Oryza sativa 36 37 Hordeum vulgare 38 39 Pinus radiata 40 41 Pinus radiata 42 43 Glicina max 44 Glicina max 45 Glicina max 46 Arabidopsis thaliana 47 Arabidopsis thaliana 48 Arabidopsis thaliana 49 Arabidopsis thaliana 50 Arabidopsis thaliana 51 Arabidopsis thaliana 52 Arabidopsis thaliana 53
Em alguns casos, as seqüências relacionadas foram experimentalmente montadas e publicamente divulgadas pelas instituições de pesquisa, tais como The Institute for Genomic Research (TIGR). A base de dados do The Eucariotic Gene Orthologs (EGO) pode ser usada para identificar tais seqüências relacionadas, pela pesquisa de palavras chave ou usando-se o algoritmo BLAST com a seqüência de ácido nucleico ou polipeptídeo de interesse. Exemplo 2: Clonagem de Gene de AZ
O gene que codifica AZ de Arabidopsis (CDS3104) foi amplificado pela PCR usando como padrão uma biblioteca de cDNA de muda de Arabidopsis thaliana (Invitrogen, Paisley, UK). Depois da transcrição reversa do RNA extraído das mudas, os cDNAs foram clonados em pCMV Sport 6.0. O tamanho de inserto médio do banco foi de 1,5 kb e o número original de clones foi de 1,59 χ IO7 cfu. O título original foi determinado ser 9,6 χ IO5 cfu/ml, depois de uma primeira amplificação de 6 χ IO11 cfu/ml. Depois da extração de plasmídeo, 200 ng de padrão foram usados em uma mistura de PCR de 50 μΐ. Iniciadores prm06717 (sentido, sítio AttBl em itálico, códon de partida em negrito: 5'-
ggggacaagtttgtacaaaaaagcaggcttaaacaatgtgctgtggatcsigacc-3'') (SEQ ID NO 7) e prm06718 (reverso, complementares, sítio AttB2 em itálico: 5'- ggggaccactffgtacaagaaagctgggtggttaggtctctcaattctgc-3') (SEQ ID NO 8), que incluem os sítios AttB para a recombinação de Gateway, foram usados para a amplificação pela PCR. A PCR foi realizada usando Hifi Taq DNA polimerase em condições padrão. Um fragmento de PCR do tamanho esperado foi amplificado e purificado também usando métodos padrão. A primeira etapa do procedimento Gateway, a reação BP, foi depois realizada, durante a qual os fragmentos de PCR recombinam in vivo com o plasmídeo pDC)NR201 para produzir, de acordo com a terminologia Gateway, um "clone de entrada", p07. O plasmídeo pDC)NR201 foi adquirido da Invitrogen, como parte da tecnologia Gateway®. Exemplo 3: Construção de Vetor
O clone de entrada p07 foi subseqüentemente usado em uma reação LR com p02417, um vetor de destinação usado para a transformação de planta (Oryza sativa). Este vetor contém como elementos funcionais dentro das bordas de T-DNA: um marcador selecionável vegetal; um cassete de expressão de marcador triável; e um cassete Gateway intencionado para recombinação LR in vivo com a seqüência de interesse já clonada no clone de entrada. Um promotor WSI18 do arroz (SEQ ID NO: 9) para a expressão específica de semente (PR00151) foi localizada a montante deste cassete Gateway (p056, Figura 4). Muitos sistemas de vetor binário (e super binário) diferente
foram descritos para a transformação de planta (por exemplo, An, G. em Agrobacterium Protocols. Methods in Molecular Biology vol 44, pp 47-62, Gartland KMA e MR Davey eds. Humana Press, Totowa, New Jersey). Muitos são fundamentados no vetor pBIN19 descrito por Bevan (Nucleic Acid Research. 1984. 12: 8711-8721) que inclui um cassete de expressão de gene vegetal flanqueado pelas seqüências das bordas esquerda e direita e a partir do plasmídeo Ti de Agrobacterium tumefaciens. Um cassete de expressão de gene vegetal consiste de pelo menos dois genes - um gene marcador de seleção e um promotor vegetal que regula a transcrição do cDNA ou DNA genômico do gene traço. Vários genes marcadores de seleção podem ser usados incluindo o gene de Arabidopsis que codifica uma enzima da acetoidróxi ácido sintase (AHAS) mutada (patentes US 57673666 e 6225105). Similarmente, vários promotores podem ser usados para regular o gene de traço para fornecer a regulagem constitutiva, desenvolvimental, de tecido ou ambiental da transcrição do gene.
Depois da etapa de recombinação LR, o vetor de expressão resultante, p056 (Figura 4), foi transformado na cepa de Agrobacterium LBA4044 usando protocolos de choque térmico ou eletroporação. As colônias transformadas foram cultivadas em meio YEP e selecionadas pelos respectivos antibióticos por dois dias a 28°C. Estas culturas de Agrobaeterium foram usadas para a transformação de planta.
Outras cepas de Agrobaeterium tumefaeiens podem ser usadas para a transformação de planta e são bem conhecidas na técnica. Os exemplos de tais cepas são C58C1 ou EHA105. Exemplo 4: Transformação de Planta Transformação de Arroz
A Agrobaeterium contendo o vetor de expressão foi usado para transformar plantas de Oryza sativa. As sementes secas maduras do arroz japoniea cultivar Nipponbare foram descascadas. A esterilização foi realizada pela incubação por um minuto em etanol a 70%, seguido por 30 minutos em HgCl2 a 0,2%, seguido por uma lavagem de 6 vezes 15 minutos com água destilada estéril. As sementes estéreis foram depois germinadas em um meio contendo 2,4-D (meio de indução de calo). Depois da incubação no escuro popr quatro semanas, os calos embriogênicos, derivados de escutelo foram excisados e propagados no mesmo meio. Depois de duas semanas, os calos foram multiplicados ou propagados pela subcultura no mesmo meio por mais 2 semanas. Os pedaços de calo embriogênico foram subcultivados em meio fresco 3 dias antes do co-cultivo (para reforçar a atividade de divisão celular). A cepa de Agrobacterium LBA4404 contendo o vetor de expressão foi usado para o co-cultivo. A Agrobaeterium foi inoculada em meio AJB com os antibióticos apropriados e cultivados por 3 dias a 28°C. As bactérias foram depois coletadas e colocadas em suspensão em meio de co- cultivo líquido a uma densidade (ODóOO) de cerca de 1. A suspensão foi depois transferida a uma placa de Petri e os calos imersos na suspensão por 15 minutos. Os tecidos de calo foram depois manchados secos sobre um papel de filtro e transferidos para meio de co-cultivo solidificado e incubados por 3 dias no escuro a 25°C. os calos co-cultivados foram cultivados em meio contendo 2,4-D por 4 semanas no escuro a 28°C na presença de um agente de seleção. Durante este período, ilhas de calo resistente de crescimento rápido desenvolveram-se. Depois da transferência deste material para um meio de regeneração e incubação na luz, o potencial embriogênico foi liberado e brotos desenvolvidos nas quatro a cinco semanas seguintes. Os brotos foram excisados dos calos e incubados por 2 a 3 semanas em um meio contendo auxina a partir do qual os mesmos foram transferidos para o solo. Os brotos endurecidos foram cultivados sob umidade alta e dias curtos em uma estufa.
Aproximadamente 35 transformantes de arroz TO independentes foram gerados para uma construção. Os transformantes primários foram transferidos de uma câmara de cultura de tecido para uma estufa. Depois de uma análise de PCR quantitativa para verificar o número de cópia do inserto de T-DNA, apenas plantas transgênicas de cópia única que exibem tolerância ao agente de seleção foram mantidos para a colheita de semente Tl. As sementes foram depois colhidas três a cinco meses depois do transplante. O método produziu transformantes locais únicos a uma taxa de mais de 50% (Aldemita e Hodges 1996, Chan et al. 1993, Hiei et al. 1994). Transformação de Milho
A transformação de milho (Zea mays) é realizada com uma modificação do método descrito por Ishida et ai. (1996) Nature Biotech 14(6): 745-50. A transformação é dependente de genótipo em milho e apenas genótipos específicos são passíveis de transformação e regeneração. A linhagem congênita Al88 (University of Minnesota) ou híbridos com Al88 como um precursor são boas fontes de material doador para a transformação, mas outros genótipos também podem ser usados com êxito. As espigas são colhidas da planta de milho aproximadamente 11 dias depois da polinização (DAP) quando o comprimento do embrião imaturo foi de cerca de 1 a 1,2 mm. Os Embriões imaturos são co-cultivados com Agrobacterium tumefaciens contendo o vetor de expressão e plantas transgênicas são recuperadas através da organogênese. Os embriões excisados são cultivados em meio de indução de calo, depois meio de regeneração de milho, contendo o agente de seleção (por exemplo imidazolinona mas vários marcadores de seleção podem ser usados). As placas de Petri são incubadas na luz a 250C por 2 a 3 semanas ou até que os brotos se desenvolvam. Os brotos verdes são transferidos de cada embrião para o meio de enraizamento de milho e incubados a 25°C por 2 a 3 semanas, até que as raízes se desenvolvam. Os brotos enraizados são transplantados para o solo na estufa. As sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma cópia única do inserto de T-DNA. Transformação de Trigo
A transformação de trigo é realizada com o método descrito por Ishida et ai. (1996) Nature Biotech 14(6): 745-50. O cultivar Bobwhite (disponível da CIMMYT, México) é habitualmente usado na transformação. Os embriões imaturos são co-cultivados com Agrobacterium tumefaciens contendo o vetor de expressão e as plantas transgênicas são recuperadas através da organogênese.
Depois da incubação com Agrobacterium, os embriões são cultivados in vitro em meio de indução de calo, depois meio de regeneração, contendo o agente de seleção (por exemplo imidazolinona mas vários marcadores de seleção podem ser usados). As placas de Petri são incubados na luz a 25 0C por 2 a 3 semanas ou até que os brotos se desenvolvam. Os brotos verdes são transferidos de cada embrião para meio de enraizamento e incubados a 25°C por 2 a 3 semanas, até que as raízes se desenvolvam. Os brotos enraizados são transplantados para o solo na estufa. As sementes Tl são produzidas a partir das plantas que exibem tolerância ao agente de seleção e que contêm uma cópia única do inserto de T-DNA. Transformação de Soja
A soja é transformada de acordo com uma modificação do método descrito na patente US 5.164.310 da Texas A&M. Diversas variedades de soja comercial são passíveis de transformação por este método. O cultivar Jack (disponível da Illinois Seed Foundation) é habitualmente usado para a transformação. As sementes de soja são esterilizadas para a semeadura in vitro. O hipocotilédone, o radículo e um cotilédone são excisados de mudas jovens de sete dias de idade. O epicotilédone e o cotilédone remanescente são ainda cultivados para desenvolver nodos axilares. Estes nodos axilares são excisados e incubados com Agrobacterium tumefaciens contendo o vetor de expressão. Depois do tratamento de co- cultivo, os explantes são lavados e transferidos para meio de seleção. Os brotos regenerados são excisados e colocados em um meio de alongamento de broto. Os brotos não mais longos do que 1 cm são colocados em meio de enraizamento até que as raízes se desenvolvam. Os brotos enraizados são transplantados para o solo na estufa. As sementes Tl são produzida a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma cópia única do inserto de T-DNA.
Transformação de Colza/Canola
Os pecíolos cotiledonários e hipocotilédones de mudas jovens de 5 a 6 dias de idade são usados como explantes para a cultura de tecido e transformados de acordo com Babic et al. (1998, Plant Cell Rep 17: 183-188). O cultivar comercial Westar (Agriculture Canadá) é a variedade padrão usada para a transformação, mas outras variedades também podem ser usadas. As sementes de canola são esterilizadas na superfície para a semeadura in vitro. Os explantes de pecíolo cotiledonários com o cotilédone ligado são excisados das mudas in vitro e inoculados com Agrobacterium (contendo o vetor de expressão) imergindo-se a extremidade de corte do explante de pecíolo na suspensão bacteriana. Os explantes são depois cultivados por 2 dias em meio de MSBAP-3 contendo 3 mg/l de BAP, 3% de sacarose, 0,7% de Phytagar a 23°C, 16 horas de luz. Depois de dois dias de co-cultivo com Agrobaeterium, os explantes de pecíolo são transferidos para meio de MSBAP-3 contendo 3 mg/l de BAP, cefotaxima, carbenicilina ou timentina (300 mg/l) por 7 dias e depois cultivados em meio de MSBAP-3 com cefotaxima, carbenicilina ou timentina e agente de seleção até a regeneração de broto. Quando os brotos estão com 5 a 10 mm no comprimento, eles são cortados e transferidos para meio de alongamento de broto (MSBAP-0,5, contendo 0,5 mg/l de BAP). Os brotos de cerca de 2 cm no comprimento são transferidos para o meio de enraizamento (MSO) para a indução de raiz. Os brotos enraizados são transplantados para o solo na estufa. As sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma cópia única do inserto de T-DNA. Transformação de alfafa
Um clone de regeneração de alfafa {Medieago sativa) é transformado usando o método de (McKersie et ai, 1999 Plant Physiol 119: 839-847). A regeneração e transformação da alfafa é dependente de genótipo e portanto uma planta de regeneração é requerida. Os métodos para se obter planta de regeneração foram descritos. Por exemplo, estes podem ser selecionados do cultivar Rangelander (Agriculture Canada) ou qualquer outra variedade de alfafa comercial como descrito por Brown DCW e A Atanassov (1985. Plant Cell Tissue Organ Culture 4: 111-112). Alternativamente, a variedade RA3 (University of Wisconsin) foi selecionada para o uso na cultura de tecido (Walker et al., 1978 Am J Bot 65: 654-659).
Os explantes de pecíolo são co-cultivados com uma cultura durante a noite de Agrobacterium tumefaciens C58C1 pMP90 (McKersie et al., 1999 Plant Physiol 119: 839-847) ou LBA4404 contendo o vetor de expressão. Os explantes são co-cultivados por 3 d no escuro em meio de indução de SH contendo 288 mg/L de Pro, 53 mg/L de tioprolina, 4,35 g/L de K2SO4 e 100 μηι de acetosseringinona. Os explantes são lavados em meio de Murashige-Skoog na metade da concentração (Murashige e Skoog, 1962) e plaqueado no mesmo meio de indução de SH sem acetosseringinona mas com um agente de seleção adequado e antibiótico adequado para inibir o crescimento de Agrobacterium. Depois de diversas semanas, embriões somáticos são transferidos para meio de desenvolvimento BOÍ2Y não contendo nenhum regulador de crescimento, nenhum antibiótico e 50 g/L de sacarose. Os embriões somáticos são subseqüentemente germinados em meio de MurashigeSkoog na metade da concentração. As mudas enraizadas foram transplantadas em vasos e cultivadas em uma estufa. As sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma cópia única do inserto de T-DNA. Exemplo 5: Configuração da avaliação da expressão de AZ em arroz sob o controle do promotor WSI18 do arroz
Aproximadamente 15 a 20 transformantes do arroz TO independentes foram gerados. Os transformantes primários foram transferidos de uma câmara de cultura de tecido para uma estufa para o cultivo e colheita de semente TI. Sete eventos, dos quais a progênie Tl segregou 3:1 quanto a presença/ausência do transgene, foram retidos. Para cada um destes eventos, aproximadamente 10 mudas Tl contendo o transgene (hetero- e homo- zigotos) e aproximadamente 10 mudas Tl que carecem do transgene (nulizigotos) foram selecionados monitorando-se a expressão do marcador visual. As plantas Tl selecionadas foram transferidas para uma estufa. Cada planta recebeu um único rótulo de código de barras para ligar de modo não ambíguo os dados de fenotipagem com a planta correspondente. As plantas Tl selecionadas foram cultivadas em solo em vasos de 10 cm de diâmetro, especialmente planejados com fundos transparentes para possibilitar a visualização das raízes, sob os seguintes ajustes ambientais: fotoperíodo = 11,5 h, intensidade de luz do dia = 30.000 Iux ou mais, temperatura diuturna = 28°C, temperatura noturna = 22°C, umidade relativa = 60 a 70%. Plantas transgênicas e os nulizigotos correspondentes foram cultivados lado a lado nas posições aleatórias. Cuidado foi tomado para que as plantas não fossem submetidas a qualquer estresse. A partir do estágio de semeadura até o estágio de maturidade as plantas foram passadas diversas vezes através de uma cabina de formação de imagem digital. Em cada ponto de tempo imagens digitais (2048 χ 1536 pixéis, 16 milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulos diferentes. Uma câmara digital também registrou imagens através do fundo do vaso durante o crescimento da planta. Triagem pela Seca
As plantas de sementes T2 são cultivadas em solo de vaso sob condições normais até que elas se aproximaram do estágio de formação de cabeça. Estas são depois transferidas para uma seção "seca" onde a irrigação é retida. As sondas de umidade são inseridas em vasos aleatoriamente escolhidas para monitorar o teor de água do solo (SWC). Quando o SWC vai abaixo de certos patamares, as plantas são automaticamente regadas continuamente até que um nível normal fosse novamente atingido. As plantas são depois re-transferidas mais uma vez para as condições normais. O resto do cultivo (maturação da planta, colheita de semente) é a mesmo como para as plantas não cultivadas sob condições de estresse abiótico. Os parâmetros de crescimento e rendimento são registrados como detalhado para o crescimento sob condições normais. Triagem da eficiência no uso de Nitrogênio
Plantas de arroz de sementes T2 são cultivadas em solo de vaso sob condições normais exceto para a solução de nutriente. Os vasos são regados do transplante até a maturação com uma solução nutriente específica contendo teor de N nitrogênio (N) reduzido, usualmente entre 7 a 8 vezes menos. O resto do cultivo (maturação da planta, colheita de semente) é o mesmo como para as plantas não cultivadas sob estresse abiótico. Os parâmetros de crescimento e rendimento são registrados como detalhado para o crescimento sob condições normais. A área de planta acima do solo (ou biomassa folhosa) foi
determinada contando-se o número total de pixéis nas imagens digitais de partes de planta acima do solo discriminadas do fundo. Este valor foi calculado em média para as imagens tiradas no mesmo ponto de tempo a partir de ângulos diferentes e foi convertido a um valor de superfície física expressado em mm quadrado pela calibração. Os experimentos mostram que a área de planta acima do solo medida deste modo correlaciona-se com a biomassa da parte de plantas acima do solo. A área acima do solo é o ponto no tempo no qual a planta atingiu a sua biomassa folhosa máxima. As características de raiz tais como área projetada total (que pode ser correlacionada com o volume de raiz total), diâmetro médio e comprimento de raízes acima de uma certo patamar de espessura (comprimento das raízes espessas ou comprimento das raízes finas) foram deduzidos da imagem gerada usando software apropriado.
As panículas primárias maduras foram colhidas, ensacadas, rotuladas com código de barras e depois secadas por três dias na estufa a 37°C. As panículas foram depois debulhadas e todas as sementes coletadas. As cascas cheias foram separadas das vazias usando um dispositivo de sopro de ar. Depois da separação, ambos os lotes de semente foram depois contados usando uma máquina contadora comercialmente disponível. As cascas vazias foram descartadas. As cascas cheias foram pesadas em uma balança analítica e a área transversal das sementes foi medida usando a formação de imagem digital. Este procedimento resultou no conjunto dos seguintes parâmetros relacionados com semente: O número de sementes cheias foi determinado contando-se o
número de cascas cheias que permaneceram depois da etapa de separação. O peso de semente total foi medido pesando-se todas as cascas cheias colhidas de uma planta. O número de semente total por planta foi medido contando-se o número de cascas colhidas de uma planta. O índice de colheita (HI) na presente invenção é definido como a razão entre o rendimento de semente total e a área acima do solo (mm2), multiplicado por um fator de 106. O Peso de Mil Grãos (TKW) é extrapolado a partir do número de sementes cheias contadas e seu peso total. A taxa de enchimento de semente como definida na presente invenção é a proporção (expressada como um%) do número de sementes cheias em relação ao número total de sementes (ou flósculos). Estes parâmetros foram derivados em uma maneira automatizada a partir das imagens digitais usando o software de análise de imagem e foram analisados estatisticamente. Os parâmetros de semente individuais (incluindo largura, comprimento, área, peso) foram medidos usando um dispositivo feito de encomenda consistindo de dois componentes principais, um dispositivo de pesagem e formação de imagem, ligados ao software para a análise de imagem.
Um fator ANOYA duplo (análise de variância) corrigido quanto ao planejamento desequilibrado foi usado como modelo estatístico para a avaliação global de características fenotípicas vegetais. Um teste F foi realizado em todos os parâmetros medidos de todas as plantas de todos os eventos transformados com este gene. O teste F foi realizado para checar quanto a um efeito do gene sobre todos os eventos de transformação e para verificar quanto a um efeito global do gene, também aqui chamado de "efeito de gene global". Se os valores do teste F mostram que os dados são significantes, então é concluído que existe um efeito de "gene", significando que não apenas a presença ou a posição do gene está causando o efeito. O limiar para significância para um efeito de gene global verdadeiro é ajustado ao nível de probabilidade de 5% para o teste F.
Para checar quanto a um efeito dos genes dentro de um evento, isto é, quanto a um efeito específico de linhagem, um teste t foi realizado dentro de cada evento usando conjuntos de dados das plantas transgênicas e das plantas nulas correspondentes. "Plantas nulas" ou "segregantes nulos" ou "nulizigotos" são as plantas tratadas do mesmo modo como a planta transgênica, mas da qual o transgene segregou. As plantas nulas também podem ser descritas como as plantas transformadas negativas homozigotas. O limiar para significância para o teste t é ajustado ao nível de 10% de probabilidade. Os resultados para alguns eventos podem estar acima ou abaixo deste limiar. Isto está fundamentado na hipótese de que um gene teria apenas um efeito em certas posições no genoma e que a ocorrência deste efeito dependente de posição não é incomum. Este tipo de efeito de gene também é chamado aqui de um "efeito de linhagem do gene". O valor ρ é obtido comparando-se o valor t com a distribuição t ou alternativamente, comparando-se o valor F com a distribuição F. O valor ρ depois dá a probabilidade de que a hipótese nula (isto é, que não existe nenhum efeito do transgene) esteja correta.
Os dados obtidos para AZ no primeiro experimento foram confirmados em um segundo experimento com plantas T2. Quatro linhagens que tiveram o padrão de expressão corrigido foram selecionadas para mais análise. Os lotes de semente das plantas positivas (tanto hetero- quanto homozigotas) em TI, foram triados monitorando-se a expressão de marcador. Para cada evento escolhido, os lotes de semente heterozigota foram depois retidos para a avaliação T2. Dentro de cada lote de semente um número igual de plantas positivas e negativas foram cultivadas na estufa para avaliação.
Um número total de 120 plantas transformadas por AZ foram avaliadas na geração T2, isto é 30 plantas por evento das quais 15 positivas para o transgene e 15 negativas.
Porque dois experimentos com eventos sobrepostos foram realizados, uma análise combinada foi realizada. Isto é útil para checar a compatibilidade dos efeitos em relação aos dois experimentos e se este for o caso, acumular evidência de ambos experimentos de modo a aumentar a confidência na conclusão. O método usado foi um método de modelo misto que leva em conta a estrutura de nível múltiplo dos dados (isto é, experimento - evento - segregantes). Os valores ρ são obtidos comparando-se o teste de razão de probabilidade com as distribuições de qui quadrado. Exemplo 6: Avaliação de transformantes AZ: medição de parâmetros relacionados com o rendimento
Na análise das sementes como descrita acima, os inventores descobriram que as plantas transformadas com a construção de gene AZ tiveram um rendimento de semente mais alto, expressado como peso de mil grãos, comparado com plantas que carecem do transgene AZ. Além disso, o vigor de emergência aumentado e o índice de verdor aumentado foram observados em plantas que carregam o transgene comparado com as plantas de controle.
Para uma das construções, o peso de mil grãos foi aumentado com 2,7% na geração TI. Estes resultados positivos foram mais uma vez obtidos na geração T2 (aumento de 2,1%). Os dados de T2 foram re-avaliados em uma análise combinada com os resultados para a geração Tl e os valores ρ obtidos mostraram que os efeitos observados foram altamente significantes. Exemplo 7: Clonagem de Gene de AtSYTl
O gene AtSYTl de Arabidopsis thaliana foi amplificado pela PCR usando como padrão uma biblioteca de cDNA de muda de Arabidopsis thaliana (Invitrogen, Paisley, UK). Depois da transcrição reversa do RNA extraído de mudas, os cDNAs foram clonados em pCMV Sport 6.0. O tamanho do inserto médio do banco foi de 1,5 kb e o número de clones original foi da ordem de 1,59 χ IO7 cfu. O título original foi determinado ser 9,6 χ IO5 cfu/ml depois da primeira amplificação de 6 χ IO11 cfu/ml. Depois da extração de plasmídeo, 200 ng de padrão foram usados em uma mistura de PCR de 50 μΐ. Iniciadores prm06681 (SEQ ID NO: 148; sentido, códon de partida em negrito, sítio AttBl em itálico: 5'- GGGGA CAA GTTTGTA CAAA AA A GCA G GCTT AA ACAATGCAACAGCACCTGATG-3') e prm06682 (SEQ ID NO: 149; reverso, complementares, sítio AttB2 em itálico: 5"-GGGGACCACTTT GTA CAA GAAA GCTGGGTC ATC ATTAAGATTCCTTGTGC-3'), que
incluem os sítios AttB para a recombinação Gateway, foram usados para a amplifícação pela PCR. A PCR foi realizada usando Hifi Taq DNA polimerase em condições padrão. Um fragmento de PCR de 727 pares de base (incluindo os sítios attB) foi amplificado e purificado também usando métodos padrão. A primeira etapa do procedimento Gateway, a reação BP, foi depois realizada, durante a qual o fragmento de PCR recombina in vivo com o plasmídeo pDONR201 para produzir, de acordo com a terminologia Gateway, um "clone de entrada", p07466. O plasmídeo pDONR201 foi adquirido da Invitrogen, como parte da tecnologia Gateway®. Exemplo 8: Construção de Vetor
O clone de entrada p07466 foi subseqüentemente usado em uma reação de LR com p00640, um vetor de destinação usado para a transformação de planta (Oryza sativa). Este vetor contém como elementos funcionais dentro das bordas de T-DNA: um marcador selecionável vegetal; um cassete de expressão de marcador triável; e um cassete Gateway intencionado para recombinação LR in vivo com a seqüência de interesse já clonada no clone de entrada. Um Promotor GOS2 do arroz (SEQ ID NO: 145) para a expressão constitutiva (PR00129) foi localizada a montante deste cassete Gateway.
Muitos sistemas de vetor binário (e super binário) diferentes foram descritos para a transformação de planta (por exemplo, A, G. em Agrobacterium Protocols. Methods in Molecular Biology vol 44, pp 47-62, Gartland KMA e MR Davey eds. Humana Press, Totowa, New Jersey). Muitas são fundamentadas no vetor pBIN19 descrito por Bevan (Nucleic Acid Research. 1984. 12: 8711-8721) que inclui um cassete de expressão de gene vegetal flanqueado pelas seqüências da borda esquerda e direita do plasmídeo Ti de Agrobacterium tumefaciens. Um cassete de expressão de gene vegetal consiste de pelo menos dois genes - um gene marcador de seleção e um promotor vegetal que regula a transcrição do cDNA ou DNA genômico do gene traço. Vários genes marcadores de seleção podem ser usados incluindo o gene da Arabidopsis que codifica uma enzima da acetoidróxi ácido sintase (AHAS) mutada (patentes US 57673666 e 6225105). Similarmente, vários promotores podem ser usados para regular o gene de traço para fornecer a regulagem constitutiva, desenvolvimental, de tecido ou ambiental da transcrição do gene.
Depois da etapa de recombinação LR, o vetor de expressão pGOS2: .AtSYTl resultante (Figura 9) foi transformada na cepa de Agrobaeterium LBA4044 usando os protocolos de choque térmico ou eletroporação. As colônias transformadas foram cultivadas em meio YEP e selecionadas pelos respectivos antibióticos por dois dias a 28°C. Estas culturas de Agrobaeterium foram usadas para a transformação vegetal. Outras cepas da Agrobaeterium tumefaciens podem ser usadas
para a transformação de planta e são bem conhecidas na técnica. Os exemplos de tais cepas são C58C1 ou EHA105. Exemplo 9: Transformação de Planta Transformação de Arroz
A Agrobacterium contendo o vetor de expressão foi usado para transformar plantas de Oryza sativa. As sementes secas maduras do arroz japoniea cultivar Nipponbare foram descascadas. A esterilização foi realizada pela incubação por um minuto em etanol a 70%, seguido por 30 minutos em HgCl2 a 0,2%, seguido por uma lavagem de 6 vezes 15 minutos com água destilada estéril. As sementes estéreis foram depois germinadas em um meio contendo 2,4-D (meio de indução de calo). Depois da incubação no escuro popr quatro semanas, os calos embriogênicos, derivados de escutelo foram excisados e propagados no mesmo meio. Depois de duas semanas, os calos foram multiplicados ou propagados pela subcultura no mesmo meio por mais 2 semanas. Os pedaços de calo embriogênico foram subcultivados em meio fresco 3 dias antes do co-cultivo (para reforçar a atividade de divisão celular).
A cepa de Agrobacterium LBA4404 contendo o vetor de expressão foi usado para o co-cultivo. A Agrobaeterium foi inoculada em meio AB com os antibióticos apropriados e cultivados por 3 dias a 28°C. As bactérias foram depois coletadas e colocadas em suspensão em meio de co- cultivo líquido a uma densidade (ODóOO) de cerca de 1. A suspensão foi depois transferida a uma placa de Petri e os calos imersos na suspensão por 15 minutos. Os tecidos de calo foram depois manchados secos sobre um papel de filtro e transferidos para meio de co-cultivo solidificado e incubados por 3 dias no escuro a 25°C. os calos co-cultivados foram cultivados em meio contendo 2,4-D por 4 semanas no escuro a 28°C na presença de um agente de seleção. Durante este período, ilhas de calo resistente de crescimento rápido desenvolveram-se. Depois da transferência deste material para um meio de regeneração e incubação na luz, o potencial embriogênico foi liberado e brotos desenvolvidos nas quatro a cinco semanas seguintes. Os brotos foram excisados dos calos e incubados por 2 a 3 semanas em um meio contendo auxina a partir do qual os mesmos foram transferidos para o solo. Os brotos endurecidos foram cultivados sob umidade alta e dias curtos em uma estufa.
Aproximadamente 35 transformantes de arroz TO independentes foram gerados para uma construção. Os transformantes primários foram transferidos de uma câmara de cultura de tecido para uma estufa. Depois de uma análise de PCR quantitativa para verificar o número de cópia do inserto de T-DNA, apenas plantas transgênicas de cópia única que exibem tolerância ao agente de seleção foram mantidos para a colheita de semente Tl. As sementes foram depois colhidas três a cinco meses depois do transplante. O método produziu transformantes locais únicos a uma taxa de mais de 50% (Aldemita e Hodges 1996, Chan et al. 1993, Hiei et al. 1994). Transformação de Milho
A transformação de milho (Zea mays) é realizada com uma modificação do método descrito por Ishida et al. (1996) Nature Biotech 14(6): 745-50. A transformação é dependente de genótipo em milho e apenas genótipos específicos são passíveis de transformação e regeneração. A linhagem congênita Al88 (University of Minnesota) ou híbridos com Al88 como um precursor são boas fontes de material doador para a transformação, mas outros genótipos também podem ser usados com êxito. As espigas são colhidas da planta de milho aproximadamente 11 dias depois da polinização (DAP) quando o comprimento do embrião imaturo foi de cerca de 1 a 1,2 mm. Os Embriões imaturos são co-cultivados com Agrobacterium tumefaciens contendo o vetor de expressão e plantas transgênicas são recuperadas através da organogênese. Os embriões excisados são cultivados em meio de indução de calo, depois meio de regeneração de milho, contendo o agente de seleção (por exemplo imidazolinona mas vários marcadores de seleção podem ser usados). As placas de Petri são incubadas na luz a 25 0C por 2 a 3 semanas ou até que os brotos se desenvolvam. Os brotos verdes são transferidos de cada embrião para o meio de enraizamento de milho e incubados a 25°C por 2 a 3 semanas, até que as raízes se desenvolvam. Os brotos enraizados são transplantados para o solo na estufa. As sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma cópia única do inserto de T-DNA. Transformação de Trigo
A transformação de trigo é realizada com o método descrito por Ishida et al. (1996) Nature Biotech 14(6): 745-50. O cultivar Bobwhite (disponível da CIMMYT, México) é habitualmente usado na transformação. Os embriões imaturos são co-cultivados com Agrobacterium tumefaciens contendo o vetor de expressão e as plantas transgênicas são recuperadas através da organogênese.
Depois da incubação com Agrobacterium, os embriões são cultivados in vitro em meio de indução de calo, depois meio de regeneração, contendo o agente de seleção (por exemplo imidazolinona mas vários marcadores de seleção podem ser usados). As placas de Petri são incubados na luz a 250C por 2 a 3 semanas ou até que os brotos se desenvolvam. Os brotos verdes são transferidos de cada embrião para meio de enraizamento e incubados a 25°C por 2 a 3 semanas, até que as raízes se desenvolvam. Os brotos enraizados são transplantados para o solo na estufa. As sementes Tl são produzidas a partir das plantas que exibem tolerância ao agente de seleção e que contêm uma cópia única do inserto de T-DNA. Transformação de Soja
A soja é transformada de acordo com uma modificação do método descrito na patente US 5.164.310 da Texas A&M. Diversas variedades de soja comercial são passíveis de transformação por este método. O cultivar Jack (disponível da Illinois Seed Foundation) é habitualmente usado para a transformação. As sementes de soja são esterilizadas para a semeadura in vitro. O hipocotilédone, o radículo e um cotilédone são excisados de mudas jovens de sete dias de idade. O epicotilédone e o cotilédone remanescente são ainda cultivados para desenvolver nodos axilares. Estes nodos axilares são excisados e incubados com Agrobacterium tumefaciens contendo o vetor de expressão. Depois do tratamento de co- cultivo, os explantes são lavados e transferidos para meio de seleção. Os brotos regenerados são excisados e colocados em um meio de alongamento de broto. Os brotos não mais longos do que 1 cm são colocados em meio de enraizamento até que as raízes se desenvolvam. Os brotos enraizados são transplantados para o solo na estufa. As sementes Tl são produzida a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma cópia única do inserto de T-DNA. Transformação de Colza/Canola
Os pecíolos cotiledonários e hipocotilédones de mudas jovens de 5 a 6 dias de idade são usados como explantes para a cultura de tecido e transformados de acordo com Babic et al (1998, Plant Cell Rep 17: 183-188). O cultivar comercial Westar (Agriculture Canada) é a variedade padrão usada para a transformação, mas outras variedades também podem ser usadas. As sementes de canola são esterilizadas na superfície para a semeadura in vitro. Os explantes de pecíolo cotiledonários com o cotilédone ligado são excisados das mudas in vitro e inoculados com Agrobaeterium (contendo o vetor de expressão) imergindo-se a extremidade de corte do explante de pecíolo na suspensão bacteriana. Os explantes são depois cultivados por 2 dias em meio de MSBAP-3 contendo 3 mg/l de BAP, 3% de sacarose, 0,7% de Phytagar a 23°C, 16 horas de luz. Depois de dois dias de co-cultivo com Agrobaeterium, os explantes de pecíolo são transferidos para meio de MSBAP-3 contendo 3 mg/l de BAP, cefotaxima, carbenicilina ou timentina (300 mg/l) por 7 dias e depois cultivados em meio de MSBAP-3 com cefotaxima, carbenicilina ou timentina e agente de seleção até a regeneração de broto. Quando os brotos estão com 5 a 10 mm no comprimento, eles são cortados e transferidos para meio de alongamento de broto (MSBAP-0,5, contendo 0,5 mg/l de BAP). Os brotos de cerca de 2 cm no comprimento são transferidos para o meio de enraizamento (MSO) para a indução de raiz. Os brotos enraizados são transplantados para o solo na estufa. As sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma cópia única do inserto de T-DNA.
Transformação de alfafa
Um clone de regeneração de alfafa (.Medicago sativa) é transformado usando o método de (McKersie et al., 1999 Plant Physiol 119: 839-847). A regeneração e transformação da alfafa é dependente de genótipo e portanto uma planta de regeneração é requerida. Os métodos para se obter planta de regeneração foram descritos. Por exemplo, estes podem ser selecionados do cultivar Rangelander (Agriculture Canada) ou qualquer outra variedade de alfafa comercial como descrito por Brown DCW e A Atanassov (1985. Plant Cell Tissue Organ Culture 4: 111-112). Alternativamente, a variedade RA3 (University of Wisconsin) foi selecionada para o uso na cultura de tecido (Walker et al., 1978 Am J Bot 65: 654-659).
Os explantes de pecíolo são co-cultivados com uma cultura durante a noite de Agrobacterium tumefaeiens C58C1 pMP90 (McKersie et al., 1999 Plant Physiol 119: 839-847) ou LBA4404 contendo o vetor de expressão. Os explantes são co-cultivados por 3 d no escuro em meio de indução de SH contendo 288 mg/L de Pro, 53 mg/L de tioprolina, 4,35 g/L de K2SO4 e 100 μηι de acetosseringinona. Os explantes são lavados em meio de Murashige-Skoog na metade da concentração (Murashige e Skoog, 1962) e plaqueado no mesmo meio de indução de SH sem acetosseringinona mas com um agente de seleção adequado e antibiótico adequado para inibir o crescimento de Agrobacterium. Depois de diversas semanas, embriões somáticos são transferidos para meio de desenvolvimento BOÍ2Y não contendo nenhum regulador de crescimento, nenhum antibiótico e 50 g/L de sacarose. Os embriões somáticos são subseqüentemente germinados em meio de MurashigeSkoog na metade da concentração. As mudas enraizadas foram transplantadas em vasos e cultivadas em uma estufa. As sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma cópia única do inserto de T-DNA.
Exemplo 10: Configuração da avaliação de plantas de arroz transgênicas em AtSYTl sob estresse abiótico
Quatro eventos, dos quais a progênie Tl segregou 3:1 quanto a presença/ausência do transgene, foram retidos. Para cada um destes eventos, aproximadamente 15 mudas Tl contendo o transgene (hetero- e homo- zigotos) e aproximadamente 15 mudas Tl que carecem do transgene (nulizigotos) foram selecionadas monitorando-se a expressão do marcador visual. As plantas transgênicas e os nulizigotos correspondentes foram cultivadas lado a lado nas posições aleatórias. As condições de estufa foram de dias curtos (12 horas de luz), com temperaturas em média de 28°C na luz e 22°C no escuro e uma umidade relativa em média de 70%. Triagem de estresse salino
As plantas foram cultivadas em um substrato fabricado de fibras de coco e argex (razão 3 para 1). Uma solução nutriente normal foi usada durante as primeiras duas semanas depois do transplante das plantinhas na estufa. Depois das primeiras duas semanas, 25 mM de sal (NaCl) foram adicionados à solução nutriente, até que as plantas fossem colhidas. Os parâmetros relacionados com a semente foram depois medidos. Triagem pela seca
As plantas são cultivadas em solo de vaso sob condições normais até que elas se aproximem do estágio de formação de cabeça. Estas são depois transferidas para uma seção "seca" onde a irrigação é contida. As sondas de umidade são inseridas em vasos aleatoriamente escolhidos para monitorar o teor de água do solo (SWC). Quando SWC vai abaixo de certos limiares, as plantas são automaticamente regadas continuamente até que um nível normal seja novamente atingido. As plantas são depois re-transferidas mais uma vez para as condições normais. O resto do cultivo (maturação da planta, colheita de semente) é o mesmo como para as plantas não cultivadas sob condições de estresse abiótico. Os parâmetros relacionados com a semente são depois medidos.
Um método alternativo para fixar o estresse pela água nas plantas transgênicas é pelo tratamento com água contendo um osmólito tal como polietileno glicol (PEG) no potencial de água específico. Visto que PEG pode ser tóxico, as plantas são administradas apenas com uma exposição de curta duração e depois a rega normal é retomada. Triagem da disponibilidade de nutriente (nitrogênio) reduzida
As plantas de arroz são cultivadas em solo de vaso sob condições normais exceto quanto a solução nutriente. Os vasos são regados do transplante até a maturação com uma solução nutriente específica contendo teor de N nitrogênio (N) reduzida, usualmente entre 7 a 8 vezes menos. O resto do cultivo (maturação da planta, colheita de semente) é o mesmo como para as plantas não cultivadas sob estresse abiótico. Os Parâmetros relacionados com a semente são depois medidos Análise estatística: teste F
Um ANOVA de dois fatores (análise de variantes) foi usado como um modelo estatístico para a avaliação global das características fenotípicas da planta. Um teste F foi realizado em todos os parâmetros medidos de todas as plantas de todos os eventos transformados com o gene da presente invenção. O teste F foi realizado para checar quanto a um efeito do gene em relação a todos os eventos de transformação e quanto a um efeito global do gene, também conhecido como um efeito de gene global. O limiar para a significância para um efeito de gene global verdadeiro foi ajustado a um nível de probabilidade de 5% para o teste F. Um valor de teste F significante aponta para um efeito de gene, significando que não é apenas a presença ou posição do gene que estão causando as diferenças no fenótipo. Medição de parâmetro relacionado com a biomassa
A partir do estágio de semeadura até o estágio de maturidade as plantas foram passadas diversas vezes através de uma cabina de formação de imagem digital. Em cada ponto de tempo imagens digital (2048 χ 1536 pixéis, 16 milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulos diferentes.
A área de planta acima do solo (ou biomassa folhosa) foi determinada pela contagem do número total de pixéis nas imagens digitais das partes de planta acima do solo discriminadas do fundo. Este valor foi calculado em média para as fotografias tiradas no mesmo ponto de tempo dos ângulos diferentes e foi convertida a um valor de superfície física expressado em mm quadrado pela calibração. Os experimentos mostram que a área de planta acima do solo medida deste modo correlaciona-se com a biomassa de partes de planta acima do solo. A área acima do solo é o ponto de tempo no qual a planta atingiu o seu máximo de biomassa folhosa. O vigor inicial é a área da planta (muda) acima do solo três semanas após a germinação. Medições de parâmetro relacionadas com a semente
As panículas primárias maduras foram colhidas, contadas, ensacadas, rotuladas com código de barras e depois secadas por três dias em uma estufa a 37°C. As panículas foram depois debulhadas e todas as sementes foram coletadas e contadas. As cascas cheias foram separadas das vazias usando um dispositivo de sopro de ar. As cascas vazias foram descartadas e a fração remanescente foi novamente contada. As cascas cheias foram pesadas em uma balança analítica. O número de sementes cheias foi determinada contando-se o número de cascas cheias que permaneceram depois da etapa de separação. O rendimento de semente total foi medido pesando-se todas as cascas cheias colhidas de uma planta. O número de semente total por planta foi medido contando-se o número de cascas colhidas de uma planta. O peso de mil grãos (TKW) é extrapolado do número de sementes cheias contadas e seu peso total. O índice de colheita (HI) na presente invenção é definido como a razão entre o rendimento de semente total e a área acima do solo (mm ), multiplicado por um fator de IO6. O número total de flores por panícula como definido na presente invenção é a razão entre o número total de sementes e o número de panículas primárias maduras. A taxa de enchimento de semente como definida na presente invenção é a proporção (expressada como uma% do número de sementes cheias em relação ao número total de sementes (ou flósculos).
Exemplo 11: Resultados da avaliação de plantas de arroz transgênicas em AtSYTl sob estresse abiótico (estresse salino)
Os resultados da avaliação de plantas de arroz transgênicas em AtSYTl submetidas ao estresse salino são apresentados na Tabela Β. A diferença de porcentagem entre os transgênicos e os nulizigotos correspondentes também são mostrados, com um valor P do teste F abaixo de 0,05.
A biomassa acima do solo, vigor inicial, rendimento de semente total, número de sementes cheias, taxa de enchimento de semente, TKW e índice de colheita são significantemente aumentados nas plantas transgênicas de AtSYTl comparado com as plantas de controle (neste caso, os nulizigotos), sob estresse abiótico.
Tabela B: Resultados da avaliação de plantas de arroz transgênicas em AtSYTl sob estresse abiótico.
Traço % Diferença Biomassa acima do solo 19 Vigor inicial 18 Rendimento total de semente 30 Número de sementes cheias 18 Taxa de enchimento 15 TKW 10 índice de colheita 16
Exemplo 12: Identificação de seqüências relacionadas com SEQ ID NO: 154 e SEQ ID NO: 155 As seqüências (cDNA de tamanho natural, ESTs ou genômico) relacionadas com SEQ ID NO: 154 e SEQ ID NO: 155 foram identificadas entre aquelas mantidas na base de dados Entrez Nucleotides no National Center for Biotechnology Information (NCBI) usando as ferramentas de pesquisa de seqüência de base de dados, tais como a ferramenta de Alinhamento Local Básico (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215: 403-410; e Altschul et al. (1997) Nucleic Acids Res. 25: 3389-3402). O programa é usado para encontrar regiões de similaridade local entre as seqüências comparando-se seqüências de ácido nucleico ou polipeptídeo com as base de dados de seqüências e calculando-se a significância estatística dos emparelhamentos. O polipeptídeo codificado pela SEQ ID NO: 154 foi usado para o algoritmo TBLASTN, com ajustes de default e o filtro para ignorar a compensação das seqüências de baixa complexidade.
O rendimento da análise foi visualizada pela comparação aos pares e classificada de acordo com a contagem de probabilidade (valor E), onde a contagem reflete a probabilidade de que um alinhamento particular ocorra ao acaso (quanto mais baixo o valor E, mais significante o acerto). Além dos valores E, comparações foram também contadas pela identidade percentual. Identidade percentual refere-se ao número de nucleotídeos idênticos (ou aminoácidos) entre as duas seqüências de ácido nucleico (ou polipeptídeo) comparadas em relação a um comprimento particular. Em alguns casos, os parâmetros de default podem ser ajustados para modificar a severidade da pesquisa.
Além das seqüências publicamente disponíveis de ácido nucleico disponíveis na NCBI, a base de dados de seqüências patenteada também são pesquisadas seguindo o mesmo procedimento como aqui descrito acima.
A Tabela C fornece uma lista de seqüências de ácido nucleico relacionadas com a seqüência de ácido nucleico como representada pela SEQ ID NO: 154.
Tabela C: As seqüências de ácido nucleico relacionadas com a seqüência de ácido nucleico (SEQ ID NO: 154) úteis nos métodos da presente invenção e os polipeptídeos deduzidos correspondentes.
Nome Organismo fonte Acido nucleico SEQ ID NO: Polipeptídeo SEQ ID NO: Número de acesso na base de dados Situação ChlrecpFBPase Chlamydomonas reinhardtii 154 155 Derivado de AW721488 BQ811919 CF555540 Tamanho natural BignacpFBPase Bigelowiella natans 156 157 AY267678 Tamanho natural AqufocpFBPase Aquilegia formosa χ Aquilegia üubescens 158 159 DR944021 DT749545 Tamanho natural ArathepFBPase Arabidopsis thaliana 160 161 X58148 Tamanho natural BranaepFB Pase Brassica napus 162 163 AF081796 Tamanho natural Cyame epFBPase Cyanidioschyzon merolae 164 165 CM0245C* Tamanho natural GlimaepFBPase Glicina max 166 167 L34841 Tamanho natural LycescpFBPase Lycopersicon eseulentum 168 169 BT014319 Tamanho natural MedtrepFBPase Medieago truneatula 170 171 B1310407 B1265103 00516140 Tamanho natural NictaepFBPase Nicotiana tabacum 172 173 DW000613 EB680028 Tamanho natural OrysaepFBPase Oryza sativa 174 175 AB007194 Tamanho natural OstlucpFBPase Ostreoeoecus lucimarinus 176 177 Jgi|0st9901 31 9 2356 ost 03 0 0 2 042** Tamanho natural OsttaepFBPase Ostreoeoecus tauri 178 179 CR954203 Tamanho natural PhatrepFBPase Phaeodaetilum trimilhoutum 180 181 armação 27: 145102- 145476** Tamanho natural PissacpFBPase Pisum sativa 182 183 L34806 Tamanho natural PontrepFBPase Poneirus trifoliata 184 185 CV705787 CV705786 Tamanho natural PoptrcpFBPase Populus tremuloides 186 187 CV241715 DT474034 Tamanho natural SoltucpFBPase Solanum uberosum 188 189 AF1340451 Tamanho natural Spiol_cpFBPase Spinaeia oleracea 190 191 L76555 Tamanho natural TriaeepFBPase Triticum lestivum | 192 193 X07780 Tamanho natural ZeamacpFBPase Zea mays 194 195 DR792524.1 DT645374.1 Tamanho natural PhypaepFBPase Physicom itrel l a patens 196 197 BY991118.1 BJ168552.1 Tamanho natural + propnetary GalsucpFBPase Galderia sulphuraria 198 199 AJ302644 Parcial MarpoepFB Pase Marchantia polimorpha 200 201 BJ862191 Parcial Contig CON Olb- TagpacpFB Pase Tagetes patula 202 203 cs scarletade- 4-e3.bl patenteado Parcial LinuscpFBPase 204 204 205 contig6298 Parcial patenteado
* Base de dados do Cyanidioschyzon merolae no Departement of Biological Science, University of Tokyo
** Bases de dados de Ostreococcus lueimarinus e Phaeodaetilum trimilhoutum no DOE Joint Genome Institute, US Department of Energy Exemplo 13: Alinhamento de seqüências de polipeptídeo relevantes
AlignX da Vector NTI (Invitrogen) está fundamentado no algoritmo Clustal popular de alinhamento progressivo (Thompson et al. (1997) Nucleic Acids Res 25: 4876-4882; Chenna et ai. (2003). Nucleic Acids Res 31: 3497-3500). Uma árvore filogenética pode ser construída usando um algoritmo de formação de grupos de união de vizinhos. Os valores de default são para a penalidade de abertura de intervalo de 10, para a penalidade de extensão de intervalo de 0,1 e a matriz de peso selecionada é Blosum 62 (se polipeptídeos são alinhados).
O resultado do alinhamento de seqüência múltipla usando polipeptídeos relevantes na identificação daqueles úteis na realização dos métodos da invenção é mostrados na figura 12 do presente pedido. Polipeptídeos de FBPase cloroplásticos (cpFBPase) diferem de polipeptídeos FBPase citoplásmico (cyFBPase) pela presença de um peptídeo de trânsito no seu terminal N para o alvejamento subcelular plastídico (cloroplástico) (colocados em caixa na figura). Além disso, o primeiro contém uma inserção de aminoácidos (também colocados em caixa e denominados inserção reguladora de redox) que compreendem pelo menos dois resíduos de cisteína necessários para a formação da ponte de dissulfeto (isto é regulagem de redox). As cisteínas conservadas são denominadas depois da sua posição no polipeptídeo de cpFBPase da ervilha madura CPisum sativa), isto é Cysl 53, Cys 173 e Cys 178. Cys 153 e Cys 173 usualmente são os dois parceiros envolvidos na formação da ponte de dissulfeto (Chiadmi et al. (1999) EMBO J 18(23): 6809-6815). O motivo de sítio ativo de cpFBPase como definido na base de dados Prosite é PSOO124 e corresponde à seguinte seqüência de aminoácido: [AG]-[RKHLIFX(1,2)-[LIV]-[FYFE-X(2)-P-[LIVM]-[GSA], em que [RK] é o sítio ativo que liga e X qualquer aminoácido. O motivo de sítio ativo prognosticado e o próprio sítio ativo prognosticado (compreendido dentro do motivo) também foram colocados em caixa na figura 12. Também identificados na figura 12 são resíduos de aminoácido Asn237, Tyr269, Tyr289 e Arg268 que liga o 6-fosfato da frutose-l,6-bisfosfato e Lys299 que liga a frutose (Chiadmi et al. (1999) EMBO J 18(23): 6809-6815). Estes últimos também estão numerados depois da sua posição no polipeptídeo de cpFBPase da ervilha madura (Pisum sativa).
Exemplo 14: Cálculo da identidade percentual global entre seqüências de polipeptídeo úteis na realização dos métodos da invenção As porcentagens globais de similaridade e identidade entre
seqüências de polipeptídeo de tamanho natural úteis na realização dos métodos da invenção foram determinadas usando um dos métodos disponíveis na técnica, o software MatGAT (Ferramenta de Alinhamento Global de Matriz) (BMC Bioinformatics. 2003 4: 29. MatGAT: a application that generates similarity/identity matrices using protein or DNA sequences. Campanella JJ, Bitincka L, Smalley J; software abrigado por Ledion Bitincka). O software MatGAT gera matrizes de similaridade/identidade para seqüências de DNA ou proteína sem necessidade de pré-alinhamento dos dados. O programa realiza uma série de alinhamentos aos pares usando o algoritmo de alinhamento global de Myers e Miller (com uma penalidade de abertura de intervalo de 12 e uma penalidade de extensão de intervalo de 2), calcula similaridade e identidade usando por exemplo Blosum 62 (para os polipeptídeos) e depois coloca os resultados em uma matriz de distância. A similaridade de seqüência é mostrada na metade de fundo da linha divisória e a identidade de seqüência é mostrada na metade de topo da linha divisória diagonal.
Parâmetros usados na comparação foram: Matriz de Contagem: Blosum62 Primeiro Intervalo: 12
Intervalo de extensão: 2
Os resultados da análise de software são mostrados na Tabela D para a similaridade e identidade globais em relação às seqüências de polipeptídeo de tamanho natural (excluindo as seqüências de polipeptídeo parciais). A identidade percentual é dada acima da diagonal e a similaridade percentual é dada abaixo da diagonal.
A identidade percentual entre as seqüências de polipeptídeo úteis na realização dos métodos da invenção podem ser tão baixos quanto 40% da identidade de aminoácido comparada com a SEQ ID NO: 155. Tabela D: Resultados de MatGAT para a similaridade e identidade globais em relação às seqüências de polipeptídeo de tamanho natural.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 1. Arath epFBPase 79 67 76 51 62 42 40 79 74 74 79 92 60 80 79 80 58 42 39 16 35 2. Soltu cpFBPase 87 69 77 51 62 43 41 79 76 74 82 80 58 82 94 97 58 42 40 15 36 3. Phymi_cpFBPase 81 81 69 50 62 42 41 67 70 68 69 68 60 68 68 69 60 41 38 13 34 4. Orysa epFBPase 85 86 81 52 65 43 41 76 85 88 78 78 59 77 77 78 57 41 39 16 35 5. Bigna_cpFBPase 68 68 67 69 52 49 42 51 51 51 51 51 52 52 52 50 51 43 40 16 36 6. ChIreepFBPase 75 73 76 76 66 45 41 61 63 63 63 64 63 62 62 63 61 42 40 17 33 7. Phatr epFBPase 61 60 61 61 64 61 42 44 45 44 44 42 47 43 42 43 48 40 35 15 32 8. CyameepFBPase 59 61 59 60 61 60 59 41 41 41 41 40 41 42 41 42 41 36 32 15 34 9. Pissa_cpFBPase 86 89 80 84 68 72 60 59 73 75 83 79 59 81 80 80 56 41 39 15 35 10. Triae_cpFBPase 83 85 81 90 67 74 60 61 83 81 75 75 61 74 74 75 60 41 39 15 35 11. ZeamaepFBPase 84 84 81 92 68 76 61 60 84 89 75 76 59 75 75 76 57 40 38 15 33 12. Pontr cpFBPase 88 90 81 84 67 74 62 61 92 84 84 80 59 85 82 82 56 41 40 16 35 13. BranaepFBPase 96 87 81 86 67 76 60 60 87 85 85 87 59 81 80 80 57 42 39 15 36 14. Ostta_e pFBPase 72 71 72 73 69 73 60 57 72 71 72 71 71 58 58 59 85 45 44 15 38 15. Poptr_cpFBPase 89 89 82 85 67 73 63 60 89 84 84 91 88 71 82 82 56 41 39 13 35 16. Nieta_cpFBPase 87 98 81 85 68 73 59 61 88 84 86 89 87 70 89 93 57 41 40 15 36 17. Lyces_cpFBPase 86 98 80 86 67 73 61 60 89 85 85 89 86 72 89 96 58 42 40 16 36 18. Ostlu_cpFBPase 72 70 72 73 66 72 60 58 72 72 71 70 73 91 71 70 72 44 43 16 37 19. Arath cyFBPase 56 57 56 56 58 57 53 50 56 56 56 55 57 60 55 56 57 61 48 16 42 20. Euggr_cy FBPase 57 57 57 59 57 58 57 51 57 58 57 56 58 63 58 56 58 61 63 15 35 21. Synec FBPase SBPase 31 30 30 31 31 34 31 30 31 28 30 30 31 29 29 29 31 32 32 32 16 22. SynecJFBPaseII 52 53 53 53 52 51 47 45 52 52 51 52 52 57 52 53 54 57 61 53 33
Exemplo 15: Identificação de domínios compreendidos nas seqüências de
polipeptídeo úteis na realização dos métodos da invenção
A base de dados Integrated Resource of Protein Families, Domains and Sites (InterPro) é uma interface integrada para as bases de dados de assinatura habitualmente usadas para as pesquisas com base em texto e seqüência. A base de dados InterPro combina estas bases de dados, que usam metodologias diferentes e graus variáveis de informação biológica a cerca de proteínas bem caracterizadas para derivar assinaturas de proteína. As bases de dados colaboradoras incluem SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom e Pfam, Smart e TIGRFAMs. Interpro é hospedada no European Bioinformatics Institute no Reino Unido.
Os resultados da varredura da InterPro da seqüência de polipeptídeo como representada pela SEQ ID NO: 155 são apresentados na Tabela E.
Tabela E: Resultados de varredura na InterPro da seqüência de polipeptídeo
como representada pela SEQ ID NO: 155
Base de dados Número de Acesso Nome do Acesso InterPro IPROOO146 Inositol fosfatase/írutose-1,6-bisfosfatase ProDom PDOO1491 Inositol fosfatase/írutose-1,6-bisfosfatase PRINTS PROOl 15 FBPHPHTASE Superfamília PtR PIRSF000904 Frutose-1,6-bisfosfatase/sedoeptulose-1,7- bisfosfatase PANTHER PTHRl 1556 RELACIONADO COM A FRUTOSE-1,6- BISFOSFATASE Pfam PF00316 FBPase PROFILE PSOO124 sítio ativo de FBPASE PROSITE PSOO124 sítio ativo de FBPASE
Exemplo 16: Prognóstico de topologia das seqüências de polipeptídeo úteis na realização dos métodos da invenção (localização subcelular, transmembrana...)
AlvoP 1.1 prognostica a locação subcelular de proteínas eucarióticas. A designação de localização está fundamentada na presença prognosticada de qualquer uma das pré-sequências de terminal N: peptídeo de trânsito de cloroplasto (cTP), peptídeo de alvejamento mitocondrial (mTP) ou peptídeo de sinal do caminho secretor (SP). As contagens nas quais o prognóstico final está fundamentado não são realmente probabilidades e eles não somam necessariamente um. Entretanto, a localização com a contagem mais alta é a mais provável de acordo com AlvoP e a relação entre as contagens (a classe de confiabilidade) pode ser uma indicação de quão certo o prognóstico é. A classe de confiabilidade (RC) varia de 1 a 5, onde 1 indica o prognóstico mais forte. AlvoP é mantido no servidor da Technical University of Denmark.
Para as seqüências prognosticadas conter uma pré seqüência de terminal N um sítio de clivagem potencial também pode ser prognosticado.
Vários parâmetros foram selecionados, tais como grupo de organismo (não planta ou planta), conjuntos de corte (nenhum, conjunto pré definido de cortes ou conjunto especificado pelo usuário de cortes) e o cálculo de prognóstico de sítios de clivagem (sim ou não).
Os resultados da análise da seqüência de polipeptídeo pelo AlvoP 1.1 como representada pela SEQ ID NO: 155 são apresentados na Tabela F. O grupo de organismo "planta" foi selecionado, nenhum corte definido e o comprimento prognosticado do peptídeo de trânsito requisitado. A localização subcelular da seqüência de polipeptídeo como representado pela SEQ ID NO: 155 é o cloroplasto e o comprimento prognosticado do peptídeo de trânsito é de 56 aminoácidos partindo do terminal N (não tão confiável quanto o prognóstico da própria localização subcelular, pode variar no comprimento de uns poucos aminoácidos). A cpFBPase da ervilha madura tem um peptídeo de trânsito de 53 aminoácidos no comprimento. Quando do alinhamento da cpFBPase da ervilha e da cpFBPase da SEQ ID NO: 155, é possível deduzir o comprimento do peptídeo de trânsito na última, também de 53 aminoácidos.
Tabela F: Análise da seqüência de polipeptídeo pelo AlvoP 1.1 como representado pela SEQ ID NO: 155
Comprimento (AA) 415 Peptídeo de trânsito cloroplástico 0,832 Peptídeo de trânsito mitocondrial 0,106 Peptídeo de sinal do caminho secretor 0,003 Outro alvejamento subcelular 0,065 Locação Prognosticada Cloroplástico Classe de confiabilidade 2 Comprimento do peptídeo de trânsito prognosticado 56
Muitos outros algoritmos podem ser usados para realizar tais análises, incluindo:
• ChloroP 1.1 abrigado no servidor do Technical University of
Denmark;
• Protein Prowler Subcellular Localization Predictor versão 1.2 abrigado no servidor of the Institute for Molecular Bioscience, University
of Queensland, Brisbane, Austrália;
• PENCE Proteoma Analyst PA-GOSUB 2.5 abrigado no servidor da University of Alberta, Edmonton, Alberta, Canadá;
Exemplo 17: Ensaio relacionado com as seqüências de polipeptídeo úteis na realização dos métodos da invenção As seqüência de polipeptídeo como representadas pela SEQ ID
NO: 155 é uma enzima com como Enzyme Commission (EC; classificação de enzimas pelas reações que elas catalisam) número EC 3.1.3.11 para frutose- bisfosfatase (também chamada de D-frutose-1,6-bisfosfato 1-fosfoidrolase). O ensaio funcional pode ser um ensaio para a atividade de FBPase com base em um ensaio Pi colorimétrico, como descrito por Huppe e Buchanan (1989) em Naturforsch. 44c: 487-494. Outros métodos para ensaiar a atividade enzimática são descritos por Alscher-Herman (1982) em Plant Physiol 70: 728-734.
Exemplo 18: Clonagem de seqüência de ácido nucleico como representada pela SEQ ID NO: 154
A menos que de outro modo estabelecido, as técnicas de DNA recombinantes são realizadas de acordo com protocolos padrão descritos em (Sambrook (2001) Molecular Cloning: A laboratory manual, 3a Edição Cold Spring Harbor Laboratory Press, CSH, Nova Iorque) ou nos Volumes 1 e 2 de Ausubel et al. (1994), Current Protocols in Molecular Biology, Current Protocols. Materiais e métodos padrão para o trabalho molecular vegetal são descritos em Plant Molecular Biology Labfax (1993) por R. D. D. Croy, publicado por BIOS Scientific Publications Ltd (UK) e Blackwell Scientific Publications (UK).
A seqüência de ácido nucleico usada nos métodos da invenção foi amplificada pela PCR usando como padrão uma biblioteca de cDNA de Chlamydomonas reinhardtii CC-1690 ("Core Library") (no vetor Lambda ZAP II da Stratagene) adquirido no Chlamy Center (antigamente the Chlamydomonas Genetics Center) na Duke University, Carolina do Norte, USA. A PCR foi realizada usando Hifi Taq DNA polimerase em condições padrão, usando 200 ng de padrão em uma mistura de PCR de 50 μΐ. Os iniciadores usados foram
- prm08448 SEQ ID NO: 206; sentido, sítio AttBl em letra minúscula: 5 '-ggggacaagtttgtacaaaaaagcaggcttaaacaatggccgccaccatg-3'; e
- prm08449 (SEQ ID NO: 207; reversa, complementares, sítio AttB2 em letra minúscula: 5'- ggggaccactttgtacaagaaagctgggtagctgcttagtgcttcttggt-3', que incluem os sítios AttB para a recombinação de Gateway. O fragmento de PCR amplificado foi purificado também usando métodos padrão. A primeira etapa do procedimento Gateway, a reação BP, foi depois realizada, durante a qual o fragmento de PCR recombina in vivo com o plasmídeo pDC)NR201 para produzir, de acordo com a terminologia Gateway, um "clone de entrada", ρ 15972. O plasmídeo pDC)NR201 foi adquirido da Invitrogen, como parte da tecnologia Gateway®.
Exemplo 19: Construção do vetor de expressão usando a seqüência de ácido nucleico como representada pela SEQ ID NO: 154
O clone de entrada ρ 15972 foi subseqüentemente usado em uma reação LR com p05050, um vetor de destinação usado para transformação de Oryza sativa. Este vetor contém como elementos funcionais dentro das bordas T-DNA: um marcador selecionável de planta; um cassete de expressão de marcador triável; e um cassete Gateway intencionado para a recombinação de LR in vivo com a seqüência de ácido nucleico de interesse já clonada no clone de entrada. Um promotor GOS2 do arroz (SEQ ID NO: 208) para a expressão constitutiva (PR00129) foi localizado a montante deste cassete Gateway.
Depois da etapa de recombinação de LR, o vetor de expressão pGOS2::FBPase resultante (Figura 13) foi transformado em Agrobacterium cepa LBA4044 de acordo com métodos bem conhecidos no ramo. Exemplo 20: Transformação de Planta Transformação de Arroz
A Agrobacterium contendo o vetor de expressão foi usado para transformar plantas de Oryza sativa. As sementes secas maduras do arroz japonica cultivar Nipponbare foram descascadas. A esterilização foi realizada pela incubação por um minuto em etanol a 70%, seguido por 30 minutos em HgCl 2 a 0,2%, seguido por uma lavagem de 6 vezes 15 minutos com água destilada estéril. As sementes estéreis foram depois germinadas em um meio contendo 2,4-D (meio de indução de calo). Depois da incubação no escuro popr quatro semanas, os calos embriogênicos, derivados de escutelo foram excisados e propagados no mesmo meio. Depois de duas semanas, os calos foram multiplicados ou propagados pela subcultura no mesmo meio por mais 2 semanas. Os pedaços de calo embriogênico foram subcultivados em meio fresco 3 dias antes do co-cultivo (para reforçar a atividade de divisão celular).
A cepa de Agrobacterium LBA4404 contendo o vetor de expressão foi usado para o co-cultivo. A Agrobaeterium foi inoculada em meio AB com os antibióticos apropriados e cultivados por 3 dias a 28°C. As bactérias foram depois coletadas e colocadas em suspensão em meio de co- cultivo líquido a uma densidade (ODóOO) de cerca de 1. A suspensão foi depois transferida a uma placa de Petri e os calos imersos na suspensão por 15 minutos. Os tecidos de calo foram depois manchados secos sobre um papel de filtro e transferidos para meio de co-cultivo solidificado e incubados por 3 dias no escuro a 25°C. os calos co-cultivados foram cultivados em meio contendo 2,4-D por 4 semanas no escuro a 28°C na presença de um agente de seleção. Durante este período, ilhas de calo resistente de crescimento rápido desenvolveram-se. Depois da transferência deste material para um meio de regeneração e incubação na luz, o potencial embriogênico foi liberado e brotos desenvolvidos nas quatro a cinco semanas seguintes. Os brotos foram excisados dos calos e incubados por 2 a 3 semanas em um meio contendo auxina a partir do qual os mesmos foram transferidos para o solo. Os brotos endurecidos foram cultivados sob umidade alta e dias curtos em uma estufa.
Aproximadamente 35 transformantes de arroz TO independentes foram gerados para uma construção. Os transformantes primários foram transferidos de uma câmara de cultura de tecido para uma estufa. Depois de uma análise de PCR quantitativa para verificar o número de cópia do inserto de T-DNA, apenas plantas transgênicas de cópia única que exibem tolerância ao agente de seleção foram mantidos para a colheita de semente Tl. As sementes foram depois colhidas três a cinco meses depois do transplante. O método produziu transformantes locais únicos a uma taxa de mais de 50% (Aldemita e Hodges 1996, Chan et al. 1993, Hiei et al. 1994). Transformação de Milho
A transformação de milho (Zea mays) é realizada com uma modificação do método descrito por Ishida et al. (1996) Nature Biotech 14(6): 745-50. A transformação é dependente de genótipo em milho e apenas genótipos específicos são passíveis de transformação e regeneração. A linhagem congênita Al88 (University of Minnesota) ou híbridos com Al88 como um precursor são boas fontes de material doador para a transformação, mas outros genótipos também podem ser usados com êxito. As espigas são colhidas da planta de milho aproximadamente 11 dias depois da polinização (DAP) quando o comprimento do embrião imaturo foi de cerca de 1 a 1,2 mm. Os Embriões imaturos são co-cultivados com Agrobacterium tumefaciens contendo o vetor de expressão e plantas transgênicas são recuperadas através da organogênese. Os embriões excisados são cultivados em meio de indução de calo, depois meio de regeneração de milho, contendo o agente de seleção (por exemplo imidazolinona mas vários marcadores de seleção podem ser usados). As placas de Petri são incubadas na luz a 250C por 2 a 3 semanas ou até que os brotos se desenvolvam. Os brotos verdes são transferidos de cada embrião para o meio de enraizamento de milho e incubados a 25°C por 2 a 3 semanas, até que as raízes se desenvolvam. Os brotos enraizados são transplantados para o solo na estufa. As sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma cópia única do inserto de T-DNA. Transformação de Trigo
A transformação de trigo é realizada com o método descrito por Ishida et al. (1996) Nature Biotech 14(6): 745-50. O cultivar Bobwhite (disponível da CIMMYT, México) é habitualmente usado na transformação. Os embriões imaturos são co-cultivados com Agrobacterium tumefaciens contendo o vetor de expressão e as plantas transgênicas são recuperadas através da organogênese.
Depois da incubação com Agrobacterium, os embriões são cultivados in vitro em meio de indução de calo, depois meio de regeneração, contendo o agente de seleção (por exemplo imidazolinona mas vários marcadores de seleção podem ser usados). As placas de Petri são incubados na luz a 250C por 2 a 3 semanas ou até que os brotos se desenvolvam. Os brotos verdes são transferidos de cada embrião para meio de enraizamento e incubados a 25°C por 2 a 3 semanas, até que as raízes se desenvolvam. Os brotos enraizados são transplantados para o solo na estufa. As sementes Tl são produzidas a partir das plantas que exibem tolerância ao agente de seleção e que contêm uma cópia única do inserto de T-DNA. Transformação de Soja
A soja é transformada de acordo com uma modificação do método descrito na patente US 5.164.310 da Texas A&M. Diversas variedades de soja comercial são passíveis de transformação por este método. O cultivar Jack (disponível da Illinois Seed Foundation) é habitualmente usado para a transformação. As sementes de soja são esterilizadas para a semeadura in vitro. O hipocotilédone, o radículo e um cotilédone são excisados de mudas jovens de sete dias de idade. O epicotilédone e o cotilédone remanescente são ainda cultivados para desenvolver nodos axilares. Estes nodos axilares são excisados e incubados com Agrobacterium tumefaeiens contendo o vetor de expressão. Depois do tratamento de co- cultivo, os explantes são lavados e transferidos para meio de seleção. Os brotos regenerados são excisados e colocados em um meio de alongamento de broto. Os brotos não mais longos do que 1 cm são colocados em meio de enraizamento até que as raízes se desenvolvam. Os brotos enraizados são transplantados para o solo na estufa. As sementes Tl são produzida a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma cópia única do inserto de T-DNA. Transformação de Colza/Canola
Os pecíolos cotiledonários e hipocotilédones de mudas jovens de 5 a 6 dias de idade são usados como explantes para a cultura de tecido e transformados de acordo com Babic et al. (1998, Plant Cell Rep 17: 183-188). O cultivar comercial Westar (Agriculture Canada) é a variedade padrão usada para a transformação, mas outras variedades também podem ser usadas. As sementes de canola são esterilizadas na superfície para a semeadura in vitro. Os explantes de pecíolo cotiledonários com o cotilédone ligado são excisados das mudas in vitro e inoculados com Agrobacterium (contendo o vetor de expressão) imergindo-se a extremidade de corte do explante de pecíolo na suspensão bacteriana. Os explantes são depois cultivados por 2 dias em meio de MSBAP-3 contendo 3 mg/l de BAP, 3% de sacarose, 0,7% de Phytagar a 23°C, 16 horas de luz. Depois de dois dias de co-cultivo com Agrobacterium, os explantes de pecíolo são transferidos para meio de MSBAP-3 contendo 3 mg/l de BAP, cefotaxima, carbenicilina ou timentina (300 mg/l) por 7 dias e depois cultivados em meio de MSBAP-3 com cefotaxima, carbenicilina ou timentina e agente de seleção até a regeneração de broto. Quando os brotos estão com 5 a 10 mm no comprimento, eles são cortados e transferidos para meio de alongamento de broto (MSBAP-0,5, contendo 0,5 mg/l de BAP). Os brotos de cerca de 2 cm no comprimento são transferidos para o meio de enraizamento (MSO) para a indução de raiz. Os brotos enraizados são transplantados para o solo na estufa. As sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma cópia única do inserto de T-DNA. Transformação de alfafa
Um clone de regeneração de alfafa (Medicago sativa) é transformado usando o método de (McKersie et al., 1999 Plant Physiol 119: 839-847). A regeneração e transformação da alfafa é dependente de genótipo e portanto uma planta de regeneração é requerida. Os métodos para se obter planta de regeneração foram descritos. Por exemplo, estes podem ser selecionados do cultivar Rangelander (Agriculture Canada) ou qualquer outra variedade de alfafa comercial como descrito por Brown DCW e A Atanassov (1985. Plant Cell Tissue Organ Culture 4: 111-112). Alternativamente, a variedade RA3 (University of Wisconsin) foi selecionada para o uso na cultura de tecido (Walker et ai., 1978 Am J Bot 65: 654-659).
Os explantes de pecíolo são co-cultivados com uma cultura durante a noite de Agrobacterium tumefaciens C58C1 pMP90 (McKersie et al., 1999 Plant Physiol 119: 839-847) ou LBA4404 contendo o vetor de expressão. Os explantes são co-cultivados por 3 d no escuro em meio de indução de SH contendo 288 mg/L de Pro, 53 mg/L de tioprolina, 4,35 g/L de K2SO4 e 100 μηι de acetosseringinona. Os explantes são lavados em meio de Murashige-Skoog na metade da concentração (Murashige e Skoog, 1962) e plaqueado no mesmo meio de indução de SH sem acetosseringinona mas com um agente de seleção adequado e antibiótico adequado para inibir o crescimento de Agrobacterium. Depois de diversas semanas, embriões somáticos são transferidos para meio de desenvolvimento ΒΟΪ2Υ não contendo nenhum regulador de crescimento, nenhum antibiótico e 50 g/L de sacarose. Os embriões somáticos são subseqüentemente germinados em meio de MurashigeSkoog na metade da concentração. As mudas enraizadas foram transplantadas em vasos e cultivadas em uma estufa. As sementes Tl são produzidas a partir de plantas que exibem tolerância ao agente de seleção e que contêm uma cópia única do inserto de T-DNA. Exemplo 21: Procedimento de avaliação fenotípica 21.1 Planejamento da Avaliação
Aproximadamente 35 transformantes do arroz TO independentes foram gerados. Os transformantes primários foram transferidos de uma câmara de cultura de tecido para uma estufa para o cultivo e colheita de semente Tl. Oito eventos, dos quais a progênie Tl segregou 3:1 quanto a presença/ausência do transgene, foram retidos. Para cada um destes eventos, aproximadamente 10 mudas Tl contendo o transgene (hetero- e homo- zigotos) e aproximadamente 10 mudas Tl que carecem do transgene (nulizigotos) foram selecionadas monitorando-se a expressão do marcador visual. As plantas transgênicas e os nulizigotos correspondentes foram cultivadas lado a lado nas posições aleatórias. As condições de estufa foram de dias curtos (12 horas de luz), 28°C na luz e 22°C no escuro e uma umidade relativa de 70%. Triagem pela Seca
As plantas de sementes T2 são cultivadas em solo de vaso sob condições normais até que elas se aproximaram do estágio de formação de cabeça. Estas são depois transferidas para uma seção "seca" onde a irrigação é retida. As sondas de umidade são inseridas em vasos aleatoriamente escolhidas para monitorar o teor de água do solo (SWC). Quando o SWC vai abaixo de certos patamares, as plantas são automaticamente regadas continuamente até que um nível normal fosse novamente atingido. As plantas são depois re-transferidas mais uma vez para as condições normais. O resto do cultivo (maturação da planta, colheita de semente) é a mesmo como para as plantas não cultivadas sob condições de estresse abiótico. Os parâmetros de crescimento e rendimento são registrados como detalhado para o crescimento sob condições normais. Triagem da eficiência no uso de Nitrogênio
Plantas de arroz de sementes T2 são cultivadas em solo de vaso sob condições normais exceto para a solução de nutriente. Os vasos são regados do transplante até a maturação com uma solução nutriente específica contendo teor de N nitrogênio (N) reduzido, usualmente entre 7 a 8 vezes menos. O resto do cultivo (maturação da planta, colheita de semente) é o mesmo como para as plantas não cultivadas sob estresse abiótico. Os parâmetros de crescimento e rendimento são registrados como detalhado para o crescimento sob condições normais.
Quatro eventos Tl foram ainda avaliados na geração T2 seguindo o mesmo procedimento de avaliação como para a geração Tl mas com mais indivíduos por evento. A partir do estágio de semeadura até o estágio de maturidade as plantas foram passadas diversas vezes através de uma cabina de formação de imagem digital. Em cada ponto de tempo as imagens digitais (2048 χ 1536 pixéis, 16 milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulos diferentes. 21.2 Análise estatística: teste F
Um ANOVA de dois fatores (análise de variantes) foi usado como um modelo estatístico para a avaliação global das características fenotípicas da planta. Um teste F foi realizado em todos os parâmetros medidos de todas as plantas de todos os eventos transformados com o gene da presente invenção. O teste F foi realizado para checar quanto a um efeito do gene em relação a todos os eventos de transformação e para verificar quanto a um efeito global do gene, também conhecido como um efeito de gene global. O limiar para a significância para um efeito de gene global verdadeiro foi ajustado a um nível de probabilidade de 5% para o teste F. Um valor de teste F significante aponta para um efeito de gene, significando que não é apenas a presença ou posição do gene que estão causando as diferenças no fenótipo. 21,3 Parâmetros medido
Medição de parâmetro relacionado com a biomassa
A partir do estágio de semeadura até o estágio de maturidade as plantas foram passadas diversas vezes através de uma cabina de formação de imagem digital. Em cada ponto de tempo imagens digital (2048 χ 1536 pixéis, 16 milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulos diferentes.
A área de planta acima do solo (ou biomassa folhosa) foi determinada pela contagem do número total de pixéis nas imagens digitais das partes de planta acima do solo discriminadas do fundo. Este valor foi calculado em média para as fotografias tiradas no mesmo ponto de tempo dos ângulos diferentes e foi convertida a um valor de superfície física expressado em mm quadrado pela calibração. Os experimentos mostram que a área de planta acima do solo medida deste modo correlaciona-se com a biomassa de partes de planta acima do solo. A área acima do solo é o ponto de tempo no qual a planta atingiu o seu máximo de biomassa folhosa. O vigor inicial é a área da planta (muda) acima do solo três semanas após a germinação. Medições de parâmetro relacionadas com a semente
As panículas primárias maduras foram colhidas, contadas, ensacadas, rotuladas com código de barras e depois secadas por três dias em uma estufa a 37°C. As panículas foram depois debulhadas e todas as sementes foram coletadas e contadas. As cascas cheias foram separadas das vazias usando um dispositivo de sopro de ar. As cascas vazias foram descartadas e a fração remanescente foi novamente contada. As cascas cheias foram pesadas em uma balança analítica. O número de sementes cheias foi determinada contando-se o número de cascas cheias que permaneceram depois da etapa de separação. O rendimento de semente total foi medido pesando-se todas as cascas cheias colhidas de uma planta. O número de semente total por planta foi medido contando-se o número de cascas colhidas de uma planta. O peso de mil grãos (TKW) é extrapolado do número de sementes cheias contadas e seu peso total. O índice de colheita (HI) na presente invenção é definido como a razão entre o rendimento de semente total e a área acima do solo (mm ), multiplicado por um fator de IO6. O número total de flores por panícula como definido na presente invenção é a razão entre o número total de sementes e o número de panículas primárias maduras. A taxa de enchimento de semente como definida na presente invenção é a proporção (expressada como uma% do número de sementes cheias em relação ao número total de sementes (ou flósculos).]
Exemplo 22: Resultados da avaliação fenotípica das plantas transgênicas
Os resultados da avaliação de plantas transgênico de arroz que expressam a seqüência de ácido nucleico úteis na realização dos métodos da invenção são apresentados na Tabela G. A diferença porcentual entre os transgênicos e os nulizigotos correspondentes também é mostrada, com um valor P do teste F abaixo de 0,05.
O rendimento de semente total, número de sementes cheias, taxa de enchimento de semente e índice de colheita são significantemente aumentados nas plantas transgênicas que expressam a seqüência de ácido nucleico úteis na realização dos métodos da invenção, comparado com as plantas de controle (neste caso, os nulizigotos).
Tabela G: Resultados da avaliação de plantas transgênicas de arroz que expressam a seqüência de ácido nucleico úteis na realização dos métodos da invenção.
Traço % de Aumento na % de Aumento na geração Tl geração T2 Total rendimento de semente 7 28 Número de sementes cheias 5 28 Taxa de enchimento 6 19 índice de colheita 4 21
Exemplo 23: Clonagem do gene
O gene SIK de arroz foi amplificado por PCR com iniciadores (SEQ ID N°: 227; sentido, códon de partida em negrito, local AttBl em itálico: 5'-ggggacaagtttgtacaaaaaagcaggcttaaacaatgatgggttgcttc actgtc-3') e (SEQ ID N°: 228; reverso, complementares, local AttB2 em itálico: 5'- ggggaccactttgtacaagaaagctgggtatggacaatcaaaaaccctca-3'), que incluem os locais AttB para a recombinação de Gateway, foram usados pela amplificação de PCR. O PCR foi realizado usando a polimerase de DNA Hifi Taq sob condições padrão. O fragmento de PCR foi purificado usando métodos padrão. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada, durante que o fragmento de PCR recombina in vivo com o plasmídeo pDC)NR201 para produzir, de acordo com a tecnologia Gateway, um "clone de entrada". O plasmídeo pDC)NR201 foi adquirido de Invitrogen, como parte da tecnologia Gateway®. Exemplo 24: Sub-regulação da construção do vetor O clone de entrada foi subseqüentemente usado em uma
reação LR com um vetor de destinação usado para a transformação da Oryza sativa para a construção da sub-regulação. Estes vetores contendo dentro dos inseticidas de T-DNA: uma planta marcadora selecionável; um cassete de expressão marcador avaliável; e um cassete Gateway intencionado pela recombinação LR in vivo de modo como integrar uma seqüência de interesse a partir do clone de entrada em orientação de sentido ou anti-sentido. Um promotor GOS2 de arroz (SEQ ID N°: 226) para a expressão constitutiva que foi localizada a montante deste cassete Gateway.
Depois da Etapa de recombinação de LR, o vetor de expressão resultante (Figura 16) foi transformado em cepa de Agrobacterium LBA4044 e subseqüentemente por plantas Oryza sativa. As plantas de arroz transformadas foram deixadas desenvolver e foram então examinadas pelos parâmetros descritos no Exemplo 26. Exemplo 25: Super-expressão da construção do vetor O clone de entrada foi subseqüentemente usado em uma
reação LR com um vetor de destinação usado para a transformação da planta (Oryza sativa). Este vetor contendo dentro dos inseticidas de T-DNA: uma planta marcadora selecionável; um cassete de expressão marcador avaliável; e um cassete Gateway intencionado pela recombinação LR in vivo com uma seqüência de interesse já clonadas no clone de entrada. Um promotor GOS2 de arroz para a expressão constitutiva foi localizado a montante deste cassete Gateway.
Depois da etapa de recombinação de LR, o vetor de expressão resultante (Figura 17) foi transformado em cepa de Agrobacterium LBA4044. As colônias transformadas foram cultivadas em meio YEP e selecionadas por antibióticos respectivos por dois dias a 28°C. Estas culturas de Agrobacterium foram usadas para uma transformação da planta. As plantas de arroz transformadas foram deixadas desenvolver e foram então examinadas pelos parâmetros descritos no Exemplo 26.
Exemplo 26: Avaliação das plantas transformada com SIK em orientação anti-sentido
Aproximadamente 15 a 20 transformantes de arroz TO independentes foram gerados. Os transformantes primários foram transferidos a partir de uma câmara de cultura de tecido para uma estufa para o cultivo de e colheita da semente TI. Seis eventos para que o progênie Tl segregado 3:1 pela presença/ausência do transgene, foram retidos. Para cada um destes eventos, aproximadamente 10 mudas de Tl contendo o transgene (hetero e homozigotos) e aproximadamente 10 mudas de Tl que precisam do transgene (nulizigotos) foram selecionados monitorando-se a expressão marcadora visual.
As plantas Tl selecionadas foram transferidas para uma estufa. Cada planta recebeu um único rótulo de código de barra para ligar-se ambiguamente aos dados de fenotipo que correspondem as plantas. As plantas Tl selecionadas foram cultivadas no solo em potes de 10 cm de diâmetros sob os seguintes ajustes ambientais: fotoperíodo =11,5 horas, intensidade de luz do dia = 30.000 Iux ou mais, período de temperatura do dia = 28°C, período de temperatura da noite = 22°C, umidade relativa = 60 a 70%. As plantas foram cultivadas sob ótimas condições de água até estas se aproximarem do estágio superior quando a irrigação foi retida. As sondas de umidade foram inseridas em potes escolhidos aleatoriamente para monitorar o teor de água no solo (SWC). Quando SWC caiu abaixo de 20%, as plantas foram automaticamente re-umidificadas para se obter ótimas condições de água novamente. As plantas transgênicas e os nulizigotos correspondentes foram cultivados lado a lado em posições aleatórias. A partir do estágio de semeadura até o estágio de maturidade as plantas foram passadas diversas vezes através de um gabinete de imagem digital. Em cada período de tempo as imagens digitais (2048 xl536 pixéis, 16 milhões de cores) foram tiradas de cada planta de pelo menos 6 ângulos diferentes. Triagem pela seca
As plantas a partir das sementes T2 são cultivadas plantando- se em solo sob condições normais até esta se aproximar do estágio superior. Estas são então transferidas por uma seção "seca" onde a irrigação é retida. As sondas de umidade são inseridas em potes escolhidos aleatoriamente para monitorar o teor de água no solo (SWC). Quando SWC vai abaixo de certos limiares, as plantas são automaticamente re-umidificadas continuamente até um nível normal ser atingido novamente. As plantas são então re-transferidas novamente por condições normais. O resto do cultivo (maturação da planta, colheita da semente) é o mesmo como por plantas não cultivadas sob condições abióticas de estresse. Os parâmetros de crescimento e rendimento são registrados como detalhados pelo crescimento sob condições normais. Avaliação da eficiência do uso de nitrogênio
As plantas de arroz das sementes T2 são cultivadas plantando- se em solo sob condições normais exceto pela solução de nutriente. Os potes são irrigadas a partir da transplantação pela maturação com uma solução de nutriente específica contendo teor de nitrogênio (N) reduzido por N, usualmente entre 7 a 8 vezes menos. O resto do cultivo (maturação da planta, colheita da semente) é o mesmo como para as plantas não cultivadas sob estresse abiótico. Os parâmetros de crescimento e rendimento são registrados como detalhados pelo crescimento sob condições normais.
A planta acima da área do solo (ou biomassa folhosa) foi determinada pela contagem do número total de pixéis nas imagens digitais a partir da parte acima do solo das plantas discriminadas do fundo. Este valor foi medidas pelas fotos tiradas no mesmo período de tempo a partir de ângulos diferentes e foi convertida por um valor de superfície físico expressado em mm quadrados pela calibração. Os experimentos mostram que a área da planta acima do solo mede este caminho e dizem respeito com as biomassas da parte das plantas acima do solo. A Areamax é a área acima do solo no período de tempo em que a planta tem atingido este máximo de biomassa folhosa.
As panículas primárias maduras foram colhidas, ensacadas, rotuladas por códigos de barra e então secadas por três dias no forno a 37°C. As panículas foram então debulhadas e todas as sementes coletadas. As cascas enchidas foram separadas a partir de um vácuo usando um dispositivo de sopro de ar. Depois da separação, ambos os lotes da semente foram então contados usando uma máquina de contagem comercialmente disponível. As cascas esvaziadas foram descartadas. As cascas enchidas foram pesadas em uma balança analítica e a área cruzada secional das sementes foram medidas usando a imagem digital. Este procedimento resultou no conjunto dos seguintes parâmetros relatados por semente:
As flores-por-panícula é uma estimulação por parâmetro do número médio de flósculos por panícula em uma planta, derivado do número de sementes totais divididas pelo número de primeiras panículas. A panícula mais alta e todas as panículas que sobreponham com a panícula mais alta quando alinhadas verticalmente, foram consideradas como as primeiras panículas e foram contadas manualmente. O número de sementes cheias foi determinada pela contagem do número de cascas enchidas que permaneceram depois da etapa de separação. O rendimento total da semente (peso total da semente) foi medido pela pesagem de todas as cascas enchidas, colhida a partir de uma planta. O número total das sementes por planta foi medido pela contagem do número de cascas colhidas a partir de uma planta e correspondem aos número de flósculos por planta. Estes parâmetros foram derivados em uma maneira automática a partir das imagens digitais usando o software de análise da imagem e foram analisadas estatisticamente. Os parâmetros individual da semente (incluindo largura, comprimento, área, peso) foram medidos usando um dispositivo feito sob-encomenda que consiste de dois principais componentes, um dispositivo de pesagem e imagem, ligados aos software para análise da imagem. O índice de colheita na presente invenção é definida como a razão entre o rendimento da semente total (g) e a área de trituração acima (mm2), multiplicado por um fator 106.
Um ANOVA de dois fatores (análises de diferença) corrigidos pelo projeto não balanceado foi usado como modelo estatístico para a avaliação total das características de plantas fenotípicas. Um teste F foi realizado em todos os parâmetros medidos de todas as plantas de todos os eventos transformados com o gene. O teste F foi realizado para checar por um efeito do gene em relação a todos os eventos de transformação e para verificar por um efeito total do gene, também nomeado aqui "efeito global do gene". Se o valor do teste F mostra que os dados são significantes, do que este é concluído que aqui é um efeito do "gene", significando que não apenas a presença ou a posição do gene é a causa do efeito. O limiar para a importância por um efeito global verdadeiro do gene é conjunto a 5% do nível de probabilidade para o teste F.
Para checar por um efeito do gene dentro de um evento, isto é, por um efeito específico de linha, um teste t foi realizado dentro de cada evento usando conjuntos de dados a partir das plantas transgênicas e que correspondem as plantas nulas. As "plantas nulas" ou "segregantes nulos" ou "nulizigotos" são as plantas tratadas na mesma maneira como a planta transgênica, mas de que o transgene tem segregado. As plantas nulas também podem ser descritas como as plantas transformadas de homozigotos negativos. O limiar para a importância para o teste t é conjunto a 10% do nível de probabilidade. Os resultados para alguns eventos podem ser acima ou abaixo deste limiar. Este é baseado na hipótese que um gene pode ter apenas um efeito em certas posições no genoma e que a ocorrência deste efeito dependente da posição não é incomum. Este tipo de efeito do gene também é nomeado aqui um "efeito linha do gene". O valor ρ foi obtido comparando-se o valor t à distribuição t ou alternativamente, comparando-se o valor F à distribuição F. O valor ρ então dá a probabilidade que a hipótese nula (isto é, que não existe efeito do transgene) é correta. Exemplo 27: Resultados
1. Peso de mil grãos
As linhas transgênicas transformadas com a construção de sub- regulação dão uma porcentagem total do aumento de 3% comparado aos controles com uma melhor linha dando 10% de aumento comparado aos controles.
2. índice da colheita
As linhas transgênicas transformadas com a construção de sub- regulação dão uma porcentagem total do aumento de 16% comparado aos controles com uma melhor linha dando 61% de aumento comparado aos controles.
3. Taxa de enchimento
As linhas transgênicas transformadas com a construção de sub- regulação dão uma porcentagem total do aumento de 14% comparado aos controles com uma melhor linha dando 41% de aumento comparado aos controles.
4. Flores por panícula (número de flores por planta)
As linhas transgênicas transformadas com a construção de sub- regulação dão uma porcentagem total de diminuição de -3% comparado aos controles com uma melhor linha dando -11% de diminuição comparado aos controles. Uma diminuição no número de flores pode ser importante para as gramas (quando usado para gramados por exemplo). As linhas transgênicas transformadas com a construção de super-expressão dão uma porcentagem total do aumento de 6% comparado aos controles com uma melhor linha dando 14% de aumento comparado aos controles.
Exemplo 28: Identificação das seqüências relacionadas com as SEQ ID N°: 229 e SEQ ID N°: 230
As seqüências (tamanho natural cDNA, ESTs ou genômicas) relacionadas com SEQ ID N°: 229 e SEQ ID N°: 230 foram identificadas entre aquelas mantidas no banco de dados de nucleotídeos Entrez no National Center for Biotechnology Information (NCBI) usando as ferramentas de busca das seqüência de base de dados, tal como a ferramenta de alinhamento de local básico (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215: 403410; e Altschul et al. (1997) Nucleic Acids Res. 25: 3389-3402). Este programa foi usado para encontrar regiões de similaridade local entre as seqüências comparando-se seqüências de ácidos nucleicos ou polipeptídeos às base de dados de seqüências e pelo cálculo da importância estatística de emparelhamentos. O polipeptídeo codificado pela SEQ ID N°: 229 foi usado pelo algoritmo TBLASTN, com ajustes default e com o filtro para ignorar o conjunto de seqüências de baixa complexidade. A produção da análise foi vista pela comparação de formação de par e classificada de acordo com a contagem da probabilidade (Valor E), onde a contagem reflete a probabilidade que um alinhamento particular ocorra pela oportunidade (quanto mais baixo o valor E, mais significante o acerto). Em adição aos valores E, as comparações foram também contadas pelo percentual de identidade. O percentual de identidade refere-se ao número de nucleotídeos idênticos (ou aminoácidos) entre as duas seqüências de ácido nucleico (ou polipeptídeo) comparadas em relação a um comprimento particular.
A Tabela H fornece uma lista das seqüências de ácido nucleico relacionado com uma seqüência de ácido nucleico como representado pela SEQ ID Ν°: 229.
Tabela Η: Seqüências de ácido nucleico e polipeptídeo relacionadas com uma seqüência de ácido nucleico da SEQ ID N°: 229 e SEQ ID N°: 230 que são úteis na realização dos métodos da presente invenção.
Nome Fonte do organismo Acido nucleico SEQ ID N°: Polipeptídeo SEQ ID N°: Acesso na base de dados Número Estado HAT4 Arabidopsis thaliana 229 230 AT4G16780 Comprimento total LD Arabidopsis thaliana 231 232 NP_192165,1 Comprimento total Oryza sativa 233 234 0s03g47022 Comprimento total Oryza sativa 235 236 0s03gl2860 Comprimento total HAT22 Oryza sativa 237 238 Os IOgO1470 Comprimento total AT14 Oryza sativa 239 240 0s08g36220 Comprimento total Oryza sativa 241 242 0s09g27450 Comprimento total HAT3 Oryza sativa 243 244 0s06g04850 Comprimento total S1HDL2 Oryza sativa 245 246 0s06g04870 Comprimento total HD-ZIP Oryza sativa 247 248 0sl0g41230 Comprimento total Arabidopsis thaliana 249 250 NP_174025,3 Comprimento total HAT14 Arabidopsis thaliana 251 252 NP_974743,1 Comprimento total HAT4 Arabidopsis thaliana 253 254 NP_193411,1 Comprimento total HATl Arabidopsis thaliana 255 256 NP_ 193476,1 Comprimento total HAT2 Arabidopsis thaliana 257 258 NP_199548,1 Comprimento total HB-4 Arabidopsis thaliana 259 260 tNP 182018,1 Comprimento total HAT3 Arabidopsis thaliana 261 262 NPl 91598,1 Comprimento total Oryza sativa 263 264 0s04g46350 Comprimento total Oryza sativa 265 266 0sl0g23090 Comprimento total Oryza sativa 267 268 0sl0g23090 Comprimento total Oryza sativa 269 270 0s03g08960 Comprimento total Oryza sativa 271 272 0s08g37580 Comprimento total Oryza sativa 273 274 0s09g29460 Comprimento total Oryza sativa 275 276 0sl0g39720 Comprimento total Oryza sativa 277 278 0s05g09630 Comprimento total
Exemplo 29: Alinhamento das seqüências de polipeptídeos relevantes
O AlignX a partir do vetor NTI (Invitrogen) é baseado no algoritmo Clustal popular do alinhamento progressivo (Thompson et al. (1997) Nucleic Acids Res 25: 4876-4882; Chenna et ai. (2003). Nucleic Acids Res 31: 3497-3500). Um árvore filogenétiea foi construída usando uma ligação próxima a formação de algoritmos de grupos (ver Figura 18). Os valores default são para a penalidade de abertura de fenda de 10, para a penalidade de extensão de intervalo de 0,1 e a matriz do peso selecionado é Blosum 62 (se os polipeptídeos são alinhados). O resultado da seqüência alinhamento múltiplo usado é mostrados na figura 19.
Exemplo 30: Identificação dos domínios compreendidos nas seqüências de polipeptídeo úteis na realização dos métodos da invenção
O recurso integrado das famílias de proteínas, domínios e base de dados dos locais (InterPro) é uma interface integrada para os bases de dados de assinatura habitualmente usados por buscas com base no texto e seqüência. Os base de dados InterPro combinam estas bases de dados, que usam as metodologias diferentes e variam de grau da informação biológica cerca de proteínas bem caracterizadas para derivar as assinaturas da proteína. Os bases de dados de colaboração incluem SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom e Pfam, Smart e TIGRFAMs. O Interpro é hospedado no European Bioinformatics Institute no Reino Unido.
Os resultados da varredura InterPro da seqüência de polipeptídeo como representado pela SEQ ID N°: 230 são apresentadas na Tabela I.
25 Tabela I: Resultados da varredura de InterPro da seqüência de polipeptídeo
como representado pela SEQID N°: 230
Base de dados Número de acesso Nome de acesso InterPro IPR006712 HDZIP InterPro IPROO13 56 homeobox InterPro IPR003106 HALZ ProDom PDAOK5J1 ligação de homeobox PPHB4 DNA ProDom PD728753 Ligação de DNA ProDom PD064887 Ligação de DNA Superfamília de PIR PIRPSOOOO1 motivo de glicosilação asn Superfamília de PER PS00004 local de fosforilação cAMP Superfamília de PIR PS00005 local de fosforilação PKC Superfamília de PIR PS00006 local de fosforilação CK2 Superfamília de PIR PS00008 miristoilação Superfamília de PIR PS00009 Amidação Superfamília de PIR PS00027 Homeobox Superfamília de PIR PS00029 zíper de leucina Pfam PF04618 HDZIP Pfam PF00046 Homeobox Pfam PF02183 HALZ
Exemplo 31: Clonagem da seqüência de ácido nucleico representado pela SEQ ID N°: 229.
O HAT4 Arabidopsis thaliana que codifica o gene foi
amplificado por PCR usando como um modelo de uma biblioteca de cDNA Arabidopsis thaliana (Invitrogen, Paisley, UK). Depois a transcrição reversa de RNA extraído a partir das mudas, os cDNAs foram clonados em pCMV Sport 6,0. O tamanho médio do suplemento do banco foi de 1,6 kb e o número original dos clones foi da ordem de 1,67 χ 107 cfu. O titulador original foi determinado a ser 3,34 χ 106 cfii/ml depois da primeira amplificação de 6 χ 1010 cfu/ml. Depois da extração do plasmídeo, 200 ng do modelo foi usado em uma mistura de PCR de 50 μΐ. Os iniciadores usados foram: Avançado (SEQ ID N°: 283) ggggacaagtttgtacaaaaaagcaggcttcacaatgatgttcgagaaagacgatctg Reverso (SEQ ID N°: 284)
ggggaccactttgtacaagaaagctgggtttaggacctaggacgaagagcgt
que incluem os locais AttB para a recombinação de Gateway. O fragmento de
PCR amplificado foi purificado também usando métodos padrão. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada, durante o fragmento de PCR recombinado in vivo com o plasmídeo pDC)NR201 para produzir, de acordo com a tecnologia Gateway, um "clone de entrada". O plasmídeo pDC)NR201 foi adquirido de Invitrogen, como parte da tecnologia Gateway®.
Exemplo 32: Construção do vetor de expressão usando uma seqüência de ácido nucleico como representado pela SEQ ID N°: 229
O clone de entrada foi subseqüentemente usado em uma reação LR com um vetor de destinação usado para a transformação da Oryza sativa. Este vetor contém como elementos funcionais dentro dos inseticidas de T-DNA: uma planta marcadora selecionável; um cassete de expressão marcador avaliável; e um cassete Gateway intencionado pela recombinação LR in vivo com uma seqüência de ácido nucleico de interesse já clonada no clone de entrada. Um promotor GOS2 de arroz (SEQ ID N°: 282) para a expressão constitutiva que foi localizada a montante deste cassete Gateway.
Depois da etapa de recombinação de LR, o vetor de expressão resultante (Figura 21) foi transformado em cepa de Agrobacterium LBA4044 de acordo com métodos bem conhecido na técnica. Exemplo 33: Transformação da planta Transformação do arroz
O Agrobacterium contendo o vetor de expressão foi usado para transformar as plantas Oryza sativa. As sementes secas maduras de arroz japonica cultivar Nipponbare foram descascadas. A esterilização foi realizada pela incubação por um minuto em 70% de etanol, seguido por 30 minutos em 0,2% de HgC12, seguido por umas 6 vezes em 15 minutos de lavagem com água destilada estéril. As sementes estéreis foram então germinadas em um meio contendo 2,4-D (meio de indução de calo). Depois a incubação no escuro por quatro semanas, embriogênico, calo derivado de escutelo foram excisados e propagados no mesmo meio. Depois de duas semanas, os calos foram multiplicados ou propagados pela sub-cultura no mesmo meio por outras 2 semanas. Os fragmentos de calos embriogênicos foram submetidos à cultura em meio fresco por 3 dias antes da co-cultivação (por atividade de divisão celular auxiliar).
A cepa Agrobacterium LBA4404 contendo o vetor de expressão foi usado para a co-cultivação. O Agrobacterium foi inoculado em meio AB com os antibióticos apropriados e culturas por 3 dias a 28°C. As bactérias foram então coletadas e recolocadas em suspensão em meio de co- cultivação líquido por uma densidade (ODóOO) de cerca de 1. A suspensão foi então transferida para uma placa de Petri e os calos submetidos à imersão na suspensão por 15 minutos. Os tecidos dos calos foram então manchados secos em um filtro de papel e transferidos pelo meio de co-cultivação solidificado e incubados por 3 dias no escuro a 25°C. Os calos co-cultivados foram cultivados em meio contendo 2,4D por 4 semanas no escuro a 28°C na presença de um agente de seleção. Durante este período, rapidamente os calos resistentes às ilhas de crescimento desenvolvidas. Depois da transferência deste material para um meio de regeneração e incubação na luz, o potencial embriogênico foi liberado e os brotos desenvolvidos nas próximas quatro a cinco semanas. Os brotos foram excisados a partir dos calos e incubados por 2 a 3 semanas em um meio contendo auxina de que estes foram transferidos ao solo. Os brotos endurecidos foram cultivados sob alta umidade e dias curtos em uma estufa.
Aproximadamente 35 transformantes de arroz TO independentes foram gerados por uma construção. Os transformantes primários foram transferidos a partir de uma câmara de cultura de tecido para uma estufa. Depois uma análise de PCR quantitativo para verificar o número de cópia do suplemento de T-DNA, apenas a cópia simples das plantas transgênicas que exibiram a tolerância do agente de seleção e foram mantidas para a colheita da semente Tl. As sementes foram então colhidas três a cinco meses depois que se pode plantar. O método produziu os transformantes de locais simples em uma taxa de 50% em relação (Aldemita e Hodges 1996, Chan et ai. 1993, Hiei et al. 1994). Exemplo 34: Procedimento de avaliação fenotípica 34.1 Apresentação da avaliação
Aproximadamente 35 transformantes de arroz TO independentes foram gerados. Os transformantes primários foram transferidos a partir de uma câmara de cultura de tecido para uma estufa para o cultivo da colheita da semente TI. Oito eventos, de que os progênies Tl segregados 3:1 pela presença/ausência do transgene, foram retidos. Para cada um destes eventos, aproximadamente 10 mudas de Tl contendo o transgene (hetero e homozigotos) e aproximadamente 10 mudas de Tl que precisam do transgene (nulizigotos) foram selecionadas monitorando-se a expressão marcadora visual. As plantas transgênicas e os nulizigotos correspondentes foram cultivados lado a lado em posições aleatórias. As condições das estufas das plantas foram de dias curtos (12 horas de luz), 28°C na luz e 22°C no escuro e um umidade relativa de 70%.
Quatro eventos Tl ainda foram avaliados na geração T2 seguindo o mesmo procedimento de avaliação como para a geração Tl mas com mais indivíduos por evento. Avaliação da seca
As plantas a partir das sementes T2 são cultivadas plantando- se em solo sob condições normais até estas se aproximarem do estágio superior. Estas são então transferidas por uma seção "seca" onde a irrigação é retida. As sondas de umidade são inseridas em potes escolhidos aleatoriamente para monitorar o teor de água no solo (SWC). Quando SWC vai abaixo de certos limiares, a plantas são automaticamente re-umidificadas continuamente até um nível normal for atingido novamente. As plantas são então re-transferidas novamente pelas condições normais. O resto do cultivo (maturação da planta, colheita da semente) é o mesmo como para as plantas não cultivadas sob condições abióticas de estresse. Os parâmetros de crescimento e rendimento são registrados como detalhados pelo crescimento sob condições normais.
Avaliação da eficiência do uso de nitrogênio
As plantas de arroz das sementes T2 são cultivadas plantando- se em solo sob condições normais exceto pela solução de nutriente. Os potes são irrigados a partir da transplantação pela maturação com uma solução de nutriente específico contendo teor de nitrogênio (N) reduzido por N, usualmente entre 7 a 8 vezes menos. O resto do cultivo (maturação da planta, colheita da semente) é o mesmo como para as plantas não cultivadas sob estresse abiótico. Os parâmetros de crescimento e rendimento são registrados como detalhados pelo crescimento sob condições normais.
As medições de óleo não destrutivo a partir das sementes de arroz foi medido usando o Oxford QP20+ NMR disposto. As sementes totais foram usadas sem descascar.
34.2 Análise estatística: teste F
Um dos dois fatores ANOVA (análise das variantes) foi usado como um modelo estatístico para a avaliação total das características de plantas fenotípicas. Um teste F foi realizado em todos os parâmetros medidos de todas as plantas de todos os eventos transformados com o gene da presente invenção. O teste F foi realizado para checar um efeito do gene em relação a todos os eventos de transformação e para verificar um efeito total do gene, também conhecido como um efeito global do gene. O limiar para a importância por um efeito global verdadeiro do gene foi conjunto a um nível de probabilidade de 5% para o teste F. Um ponto de valor significante do teste F por um efeito do gene, significando que este não é apenas a mera presença ou posição do gene que é a causa das diferenças no fenotipo.
34.3 Resultados A melhor linha mostrou um aumento de 11 % no teor de óleo comparado as plantas de controle, com um aumento médio no teor de óleo de 6% em relação a todas as linhas e um valor ρ a partir do teste F de < 0,0001 Exemplo 35: Transformação do Milho
A transformação do Milho (Zea mays) é realizada com uma modificação do método descrito por Ishida et al. (1996) Nature Biotech 14(6): 745-50. A transformação é dependente do genotipo em milho e apenas genotipos específicos são responsáveis pela transformação e regeneração. A linha inata Al88 (University of Minnesota) ou híbridos com Al88 como um precursor são boas fontes do material do doador para a transformação, mas outros genotipos podem ser usados com êxito bem como. As espigas são colhidas a partir da planta do milho aproximadamente 11 dias depois da polinização (DAP) quando o comprimento do embrião imaturo é de cerca de 1 a 1,2 mm. Os embriões imaturos são co-cultivados com Agrobacterium tumefaciens contendo o vetor de expressão e as plantas transgênicas são recuperadas através da organogênese. Os embriões excisados são cultivados em meio de indução de calo, então o meio do milho de regeneração, contendo o agente de seleção (por exemplo imidazolinona mas vários marcadores de seleção podem ser usados). As placas de Petri são incubadas na luz a 250C por 2 a 3 semanas ou até os brotos crescerem. Os brotos verdes são transferidos a partir de cada embrião pelo meio enraizado do milho e incubados a 25°C por 2 a 3 semanas, até as raízes crescerem. Os brotos enraizados são transplantados em solo na estufa. As sementes Tl são produzidas a partir das plantas que exibem a tolerância ao agente de seleção e que contenham uma cópia simples do suplemento de T-DNA. Exemplo 36: Transformação do Trigo
A transformação do trigo é realizado com o método descrito por Ishida et al. (1996) Nature Biotech 14(6): 745-50. O cultivo de Bobwhite (disponíveis de CIMMYT, México) é habitualmente usado na transformação. Os embriões imaturos são co-cultivados com as Agrobacterium tumefaciens contendo o vetor de expressão e as plantas transgênicas são recuperadas através de organogênese. Depois da incubação com Agrobacterium, os embriões são cultivados in vitro em meio de indução de calo, então o meio de regeneração, contendo o agente de seleção (por exemplo imidazolinona mas vários marcadores de seleção podem ser usados). As placas de Peltri são incubados na luz a 25°C por 2 a 3 semanas ou até os brotos crescerem. Os brotos verdes são transferidos a partir de cada embrião para o meio enraizado e incubados a 250C por 2 a 3 semanas, até as raízes crescerem. Os brotos enraizados são transplantados em solo na estufa. As sementes Tl são produzidas a partir das plantas que exibem a tolerância ao agente de seleção e que contenham uma cópia simples do suplemento de T-DNA. Exemplo 37: Transformação da Soia
A soja é transformada de acordo com uma modificação do método descrito ma Patente U.S. Texas A&M 5.164.310. Diversas variedades de soja comercial são responsáveis pela transformação destes métodos. O cultivo de Jack (disponíveis dos Illinois Seed foundation) é habitualmente usado para a transformação. As sementes de soja são esterilizadas por semeadura in vitro. A hipocotila, a radícula e um cotilédone são excisados a partir de mudas jovens de sete dias de idade. A epicotila e o cotilédone remanescente ainda são cultivadas por nós auxiliares de desenvolvimento. Estes nós auxiliares são excisados e incubados com Agrobacterium tumefaciens contendo o vetor de expressão. Depois do tratamento de co- cultivação, as explantes são lavadas e transferidas para o meio de seleção. Os brotos regeneradas são excisados e colocados em um meio de alongamento do broto. Nenhum dos brotos mais longos do que 1 cm são colocados no meio enraizado até as raízes crescerem. Os brotos enraizados são transplantados em solo na estufa. As sementes Tl são produzidas a partir das plantas que exibem a tolerância ao agente de seleção e que contenham uma cópia simples do suplemento de T-DNA.
Exemplo 38: Transformação de Colza/Canola
Os pecíolos e hipocotilas cotiledôneas de mudas jovens de 5 a 6 dias de idade são usados como explantes para a cultura do tecido e transformados de acordo com Babic et ai. (1998, Plant Cell Rep 17: 183-188). O cultivo comercial de Westar (Agriculture Canada) é a variedade padrão usada para a transformação, mas outras variedades também podem ser usadas. As sementes de canola são esterilizadas por superfície por semeadura in vitro. Os explantes de pecíolo de cotilédone com o cotilédone ligado são excisados a partir de mudas in vitro e inoculados com Agrobacterium (contendo o vetor de expressão) pela imersão da extremidade cortada do explante pecíolo em uma suspensão bacteriana. Os explantes são então cultivados por 2 dias em meio MSBAP-3 contendo 3 mg/l de BAP, 3% de sacarose, 0,7% de Phytagar a 23°C, 16 horas na luz. Depois de dois dias de co-cultivação com Agrobacterium, os explantes de pecíolos são transferidos ao meio MSBAP-3 contendo 3 mg/l de BAP, cefotaxima, carbenicilina ou timentina (300 mg/l) por 7 dias e então cultivadas em meio MSBAP-3 com cefotaxima, carbenicilina ou timentina e agente de seleção até a regeneração dos brotos. Quando os brotos são de 5 a 10 mm no comprimento, estes são cortados e transferidos por meio de alongamento do broto (MSBAP de 0,5, contendo 0,5 mg/l de BAP). Os brotos de cerca de 2 cm no comprimento são transferidos ao meio enraizado (MSO) para a indução da raiz. Os brotos enraizados são transplantados em solo na estufa. As sementes Tl são produzidas a partir das plantas que exibem a tolerância ao agente de seleção e que contenham uma cópia simples do suplemento de T-DNA. Exemplo 39: Transformação de Alfafa
Um clone de regeneração de Alfafa (.Medicago sativa) é transformado usando o método de (McKersie et ai, 1999 Plant Physiol 119: 839-847). A regeneração e transformação de Alfafa é dependente do genotipo e portanto uma planta de regeneração é requerido. Os métodos para se obter as plantas de regeneração foram descritos. Por exemplo, estes podem ser selecionados do cultivo de Rangelander (Agriculture Canada) ou qualquer outra variedade de alfafa comercial como descrito por Brown DCW e A Atanassov (1985. Plant Cell Tissue Organ Culture 4: 111-112).
Alternativamente, a variedade RA3 (University of Wisconsin) foram selecionadas para o uso na cultura do tecido (Walker et ai, 1978 Am J Bot 65: 654-659). O explante de pecíolos são co-cultivados com uma cultura durante a noite de Agrobacterium tumefaciens C58C1 pMP90 (McKersie et ai., 1999 Planta Physiol 119: 839-847) ou LBA4404 contendo o vetor de expressão. Os explantes são co-cultivados por 3 dias no escuro em meio SH de indução contendo 288 mg/ L Pro, 53 mg/ L tioprolina, 4,35 g/ L K2S04 e 100 μηι de acetosiringinona. Os explantes são lavados em meio de comprimento Murashige-Skoog (Murashige e Skoog, 1962) e colocados no mesmo meio SH de indução sem acetosiringinona mas com um agente de seleção adequado e antibiótico adequado para inibir o crescimento Agrobacterium. Depois de diversas semanas, os embriões somáticos são transferidos pelo meio de desenvolvimento BOÍ2Y contendo nenhum regulado de crescimento, nenhum antibiótico e 50 g/ L de sacarose. Os embriões somáticos são subseqüentemente germinados em meio de comprimento Murashige Skoog. As mudas enraizadas foram transplantadas em potes e cultivadas em uma estufa. As sementes Tl são produzidas a partir das plantas que exibem a tolerância ao agente de seleção e que contenham uma cópia simples do suplemento de T-DNA.
Exemplo 40: Identificação das seqüências relacionadas com SEQ ID N°: 285 e SEQ ID N°: 286
As seqüências (tamanho natural cDNA, ESTs ou genômica) relacionadas com SEQ ID N°: 285 e/ou seqüência de proteínas relacionadas com SEQ ID N°: 286 foram identificadas entre aquelas mantidas no banco de dados de nucleotídeo Entrez no National Center for Biotechnology Information (NCBI) usando as ferramentas de busca das seqüência de base de dados, tal como a ferramenta de alinhamento de local básico (BLAST) (Altschul et al. (1990) J. Mol. Biol. 215: 403-410; e Altschul et al. (1997) Nucleic Acids Res. 25: 33893402). O programa é usado para encontrar as regiões de similaridade local entre as seqüências comparando-se as seqüências de ácidos nucleicos ou polipeptídeos às base de dados de seqüências e pelo cálculo da importância estatística de emparelhamentos. O polipeptídeo codificado pela SEQ ID N0: 285 foi usado pelo algoritmo TBLASTN, com ajustes default e o filtro para ignorar o conjunto de seqüências de baixa complexidade. A produção da análise foi vista pela comparação de formação de par e classificada de acordo com a contagem da probabilidade (Valor E), onde a contagem reflete a probabilidade que um alinhamento particular ocorra pela oportunidade (quanto mais baixo o valor E, mais signifícante o acerto).
Além disso os valores E, em comparações foram também contados pelo percentual de identidade. O percentual de identidade refere-se a o número de nucleotídeos idênticos (ou aminoácidos) entre as duas seqüências de ácido nucleico (ou polipeptídeo) comparados em relação um comprimento particular. Em alguns casos, os parâmetros de default podem ser ajustados para modificar a severidade da pesquisa.
Em adição às seqüências disponíveis de publicidade de ácido nucleico disponíveis a NCBI, a base de dados proprietária das seqüências também são procuradas pelos seguintes procedimento como aqui descrito acima.
A Tabela J fornece uma lista do ácido nucleico e seqüência de proteínas relacionadas com uma seqüência de ácido nucleico como representado pela SEQ ID N°: 285 e a seqüência de proteína representado pela SEQ ID N°: 286. Tabela J: As seqüências de ácido nucleico relacionadas com uma seqüência de ácido nucleico (SEQ ID N°: 1) úteis nos métodos da presente invenção e que correspondem aos polipeptídeos de deduzidos.
Nome Fonte do Organismo Acido nucleico SEQ ID N°: Polipeptídeo SEQ ID N°: Número de acesso da base de dados Estado SYBl Arabidopsis thaliana 285 286 NMl 12438 Comprimento total Proteína semelhante à proteína de dedc de zinco Gossypium hirsutum 287 288 AAZ94630 Comprimento total ZF2 da proteína de dedo de zincc putativo Zea mays 289 290 Q53AV6 Comprimento total ZFP30 de fator de transcrição do dedo de zinco Oryza sativa 291 292 Q6Z6E6 Comprimento total Proteína At5g25490 hipotética Arabidopsis thaliana 293 294 Q8GWD1 Comprimento total proteína do dedo de zinco putativo Oryza sativa 295 296 Q9SW92 Comprimento total fator de transcrição do dedo de zinco Oryza sativa 297 298 Q8RYZ5 Comprimento total proteína 152 de GlimmerM Beta vulgaris 299 300 ABD83289 Comprimento total Predicted proteína At2g17975 Arabidopsis thaliana 301 302 Q8S8K1 Comprimento total Atlg67325 de proteína de dedo de zinco tipo RanBP2 hipotético Arabidopsis thaliana 303 304 Q8GZ43 Comprimento total Proteína semelhante a ligação P53 Oryza sativa 305 306 Q7F1K4 Comprimento total Proteína de ligação p53 putativa Oryza sativa 307 308 Q7XHQ8 Comprimento total proteína Hipotética Brassica rapa 309 310 CX272690 Comprimento total proteína Hipotética Euphorbia esula 311 312 DV143669 Comprimento total proteína Hipotética Gossypium lirsutum 313 314 DR459119 Comprimento total proteína Hipotética Vitis vinifera 315 316 DV221228 Comprimento total proteína Hipotética Populus trichocarpa 317 318 DT496999 Comprimento total proteína Hipotética Gossypium lirsutum 319 320 DT457997 Comprimento total proteína Hipotética Lactuca serriola 321 322 DW105125 Comprimento total proteína Hipotética Glicina max 323 324 BG238374 Comprimento total proteína Hipotética Populus trichocarpa 325 226 DT494117 Comprimento total proteína Hipotética Populus sp. 327 328 DV465465 Comprimento total fator de transcrição Dryza sativa 329 330 AY219846 Comprimento de dedo de zinco total proteína Hipotética Panicum virgatum 331 332 DN152082 Comprimento total Tipo RanB P2 de dedo de zinco Medicago truncatula 333 334 Q1RWK5 Comprimento total Tipo RanB P2 de dedo de zinco Medicago truncatula 335 336 Q1S406 Comprimento total proteína Hipotética Yucca filamentosa 337 338 DT581158 Comprimento total proteína Hipotética Hordeum vu lgare 339 340 BQ471337 Comprimento total Exemplo 41: Alinhamento das seqüências de polipeptídeos relevantes
O AlignX a partir do vetor NTI (Invitrogen) é baseado no algoritmo Clustal popular do alinhamento progressivo (Thompson et al. (1997) Nucleic Acids Res 25: 4876-4882; Chenna et al. (2003). Nucleic
Aeids Res 31: 3497-3500). Um árvore filogenétiea pode ser construída usando uma ligação próxima a formação de algoritmos de grupos. Os valores Default são para a penalidade de abertura de fenda de 10, para a penalidade de extensão de intervalo de 0,1 e a matriz do peso selecionado é Blosum 62 (se os polipeptídeos são alinhados). O resultado de uma seqüência múltipla de alinhamento usando
polipeptídeos relevantes na identificação de um útil na realização dos métodos da invenção é mostrado na figura 23a da presente aplicação. Os três domínios de dedo de zincos podem ser facilmente identificados.
Exemplo 42: Cálculo do percentual global da identidade entre as seqüências de polipeptídeo úteis na realização dos métodos da invenção
As porcentagens globais de similaridade e identidade entre as seqüências de polipeptídeo de tamanho natural úteis na realização dos métodos da invenção foram determinadas usando um dos métodos disponíveis na técnica, o software MatGAT (ferramenta de alinhamento global de matriz) (BMC Bioinformatics. 2003 4: 29. MatGAT: uma aplicação que gera a matriz de similaridade/identidade usando a proteína ou uma seqüência de DNA. Campanella JJ, Bitincka L, Smalley J; software hospedado por Ledion Bitincka). O software MatGAT gera a matriz de similaridade/identidade pelo DNA ou as seqüência de proteínas sem necessidade do pré-alinhamento de dados. O programa realiza uma série de alinhamentos de formação em par usando o algoritmo de alinhamento global Myers e Miller (com uma penalidade de abertura de intervalo de 12 e uma penalidade de extensão de intervalo de 2), e calcula a similaridade e identidade usando por exemplo Blosum 62 (para os polipeptídeos) e então colocando os resultados em uma matriz de distância. A seqüência de similaridade é mostrada no meio fundo da linha que divide e a identidade da seqüência é mostrados no meio superior da linha diagonal que divide.
Parâmetros usados na comparação foram:
Contagem de matriz: Blosum62: 12 Primeira fenda: 12 Extensão da fenda: 2 Os resultados da análise de software são mostrados na Tabela K para a similaridade e identidade global em relação ao tamanho natural da seqüência de polipeptídeos (excluindo as seqüências parciais de polipeptídeo). O percentual de identidade é dado acima da diagonal e porcentagem da similaridade é dada abaixo da diagonal.
O percentual de identidade entre uma seqüência de polipeptídeos úteis na realização dos métodos da invenção podem ser como abaixo como 16,9% de identidade de aminoácido comparado à SEQ ID N°: 286. ω Ό
σΐ
- ι~Η
O
α
cr ω
OO
cd -O
13
J-I
td C
O 1
cd O
Cd
O
*cd
V-I
S
ω
ω Ό cd Ό
Έ
ω Ό
ω
ω Ό cd Ό
• «-Η
13
O "bb cd
cd £
Oh
H C O
S
C/5
O Ό cd
-(-J
3
CO
ω
Ptí *
"3
es H
ο ω
Ό -<->
Oh 1)
"ο ο.
OO CN OO t-^ ιο 1— V) 79,9 80,5 I co ιο 1/5 VO OO Tf 38,5 Tt ι/Γ VO OO Tt CS Ovi CS OO CS ro CS 41,9 OO •/5 OO VO Tt CO VO Oni rí SO Tt rí SO r- Tt VO IO Γ-^ IO rs VO ro OO IO © OO η © oo 38,4 IO Tt IO On VO Γ- (Ν Tt VO η «o VO ιο Os VO IO r- OO CS VO r·^ «/5 VO VO Tf Tt VO Tt CS QC © CS OO VD Tt © N Tt OO Tt OO o\ VO 9I t- Γ- co r- IO rí Γ- On VO so Γ- © Γ- IO Ov VO rs © t- Tt IO Γ- η CO r- VO Tt CS co so CS1 co" P- >ο CN © VO CS oí IO ©s VO IO ©C ιo VO ©V 1/5 Tt SO Tt ^H Ov ro t^ CS VO Tt ro «N ro © CS OO VO OO OO VO ^t IO CO VO t^ VO K SO Ov IO VO SO © Γ- Tt VO CS ro VO vo Γ-" VO 9\ IO VO VO OO IO τ Γ-" IO © Tf OO1 P- CSii P-" VO V) CS OO O Tt ro VO Tt OO OO CO ΙΛ Tt Tt CO OO CO CS Tt CS Tt OO CO <s vI CS Vi K1 Tf ov oT rs Tt Tt OV ro Tt r^" Tt Ovi rí Tt ΟΟ ro Tt Tt CO Tt IO IO Tt CO Tf Tt IO ^t Tt r- CS Tf Tt" Wi ro V vo Wi Tf CS rO © VO ro vo IO OO »-< ©ν η r- 1/5 η ^H Tt Ov Tt VO OO CS OO © CS SO r-" w CN CO CS ■•t ro Tf CS vO t^ VO VO OO VO r- SO SO 1/5 VO so Tt CS VO t- CS VO OOi oT IO CS ro SO Tt © Ov o" VO Tt On" vO Tf ©" OO VOfi ro" OO ro CS Tt VO VO ©C «Λ Γ- ιο OO Tt OV OV SO IO Tt V? U5 η CS Tt m CS VO r- CO CS CO © CS CO V? CS CS CS VO Tt 1/5 Tt SO VO VO OO K" SO IO IO VO CS oC VO Tf IO VO IO VO CS Tt SO Tf Ov OV WJ vO P- r- ©" OO VO1 co" OO cn CS η IO VO K VO η Ov V) -t CS VO VO V5 W5 VO VO CO CS η © CS in r^ η CS CS © V) CS © r- rs t- OO Γ- VO r- OV1 CS OO rí Γ- CS 00 VO Ovi S Γ- Tt Γ» W1 Wi" r- COs VO WI1 co" r- Γ-Λ oo" P- CO1 oo" VO CS N co vo OO^ VO Tt © VO VO VO cs «O Tt rí 1/5 OO © Tf •Λ VO Tt co CS ro © CS CS r-^" ro CS t Ov ^ r- oT VO CO r- ΟΟ Γ- VO ro" Γ- Ov Γ- ΟΟ ro Γ- h SO CO Tt Ov ro cs" P- CN Tt Γ—■ ov" Wi Tf P- vo" P- r- O CS t^ VO T © r- Γ- ΟΟ V) l/í VO VO V) OO co 1/5 CO rí Tt Tf VO Tf CO <N 1/5 oC co SO 1/5 OO Tt W5 Tt VO r- r- Γ- CS ©c Γ- ON1 rí Γ- η Γ- Ov IO VO Tf P-" Γ— Tti Os" P- Tt" P- νθ„ co" P- OOfi Wl" vo Tt rs" P- Os Ov" P- VO wi" vO On η VO VO ©v io VO vq VO OV vT vo FN 1/5 VO CO 1/5 OO OO CO V) VO 1/5 © CS OO ov CS Ov OO Tt vO VO ΟΟ t^ so ΙΟ CO t·» VO OO SO ΟΟ Γ- Tti ro" P- ro On" γ- oo" P- VO Tt P- Tt P- VO1 oo" Wl W1 ro" r- Tt Γ— cs" r- οο Ov VO CS oC vo IO ro VO OO ©C VO r^ fO VO OO 1/5 ir, Tt Tt ^ VO ιη Tt <N Ι- Ο η Ov OO ro CS Ov CS V3 r^ Tt r- CS OO r- © OO ro vo" Γ- oo" r- vo oo όο vo" OO On Ovi oo" r- Wl oo" P- VO cn" vo P-" P- COi OO Tf Ov" vO ρ- VO η Tt Γ- CO SO IO ιο VO Ov CS VO CS CO U5 ro I-H Tf r- vT VO Tt ro rs OO oC *H Ov VO M5 CS VO © Wt OO Tt cT OO 9I CS OO W1 vo" OO ro vo" r- Tf ro' 00 oo IO OO 0\ Wl" Γ— r- vo" Γ- VO1 co" vo Γ— Tt" P- OO1 OO Tf On" vO vo η r- Ιo IO Γ- ro VO OO K VO Tf VO co ri V5 ΙΛ co Tt U5 oT SO CO *N © CS 1/5 © CS CS ro- io OOv r- es © OO CN Ov On OO ro Ov" Γ- ro^ P-" oo Ovi OO Wl vo" OO Ov oo" Γ— όο Γ— Tt" vo Wi co" P- Wl" OO VO^ Γ— Wl wI r- ΟΟ 2- VO h VO VO VO © so uf 1/5 OV CO Tt VC CS CS OO OO CO VOv oC VO rí ΙΛ ro OO r- Γ- o" Os r-^ oo" OO Wi Tt" oo Tf ro" P- Wi, Tf OO OO1 OO CS^i co" OO Ov rs" r— oo V P- CN vo" vO Tt CN r— On On" P- CS P-" VO Tt r- Tt r- co h Ov ©C tf) V) Tt VO ©Γ 1/5 Tt 1/5 CS σΓ CO OO VO VO CS OO OO OO Tt ©* CS vO IO VO1 Tt OO Wl vo" 00 Wi vo" OO VO Tt" CO Ov vo" P- cs" OO OO Γ- rs" OO P-^ Tt" Γ— vo" P- Tf" vO W1 ro" r- Wi On" Γ— oo Γ-" vo ri ©Γ IO O IO r- ©c CO N VO CO OO CO Ov οΓ fS Tt VO VO ^H CS1 ^H ^H ι/Γ OO vo" Tt vo" Wl oo oo" Wl OO Wl Oni oo" Wl OO vo" Wl rrI ro" Wl CO VO W1 co" Wl CN Ttv Wl ro Wl Ov o" Wi Tti Tf" Tf W1 co" Wl VO cs" Wi P- Tt CN Γ- © CS rOj OO ΙΛ CS 1/5 «S CS Tf cT CS CO OO Ov 00* so CS CS ^H CS VO ro CS^ co CN VO Ov" CN ^ vo" CN Ovi oo" CN IO oo" CS Tt ro CNi oo" cs CS Tf" CN P- o" CO CN Ov" CN CN Os" CS rs" ro vO CN Tti P-" CN P-" rs rs" ro Π Ov SO γ- ι/Γ ^ r- Γ- CS Γ-- r- SO 115 00 oC OV t- Tt co o" On ro^ ro" CS Wi cs" CS COri ro" CS CS1 rs" CN Wl" CN vq, co" CN Wi rs" CN W1 Tt" CS VOi co" CS OO Tf rs Oni ro" rs Wi rs" CS CS vo" CS ro" CS Tf Wl" CN O © I-H Tt © CS ΙΟ © N OO ©C oT t- CO1 JN CO rs IS r-" W) r» oT Tj- Oni CN η Wi" CS Wl CS ^ vo" CS VO CS r- vo" CN Tt P-" CN Wl CN oo oo" CS Wl^ oo" CS Wi Os" rs CS Os" CS Wi oo" CS OO1 oo" rs W1 oo" rs On ro ON CS © CS <a vo CS r^ COw N ro N CS s© CO rs © CS 1/5 Tf η Ov Ov" CO r» co" co wT co ro" CS Wl cs" ro CS o" ro ro COi ro CO^ ro Ov On" CN CS ro ro CS CO VO1 co" CO Tf Wi" ro CN ro ro rf ro Tf wf CO Tf Wi" ro OO CS co VO CS1 ©C OO VO se ΙΛ c-í VO On oC U5 VO OO Tf t- co W1 cn" co oo" CS OO CN rs Ov" CN ro^ CS W) 00 vO CS Os" VO Wl r- CO ©" Γ- Tt Tt Γ- Tt Tf Γ— OO Ov" vo P- cs" P- CO ro" Γ— P- rs" P- On Γ- P- Wi cs" P- CO P- Tt Wl" P- P- Ov h·' PO ro Tt Ov^ OO co 9I CS Tt ^H Ov ro OO ir? Tt Γ- Tt W) rV co OO o" CN On On" CN Tt" <N Tt w> IO1 CS cs" VO Tt" vo On VO Osi ro" vO CS vo" Wi ro rs" VO Γ-Λ Ov" Wl CS Wl" vO OO Γ-" Wl Γ-" Wi -«f vo Wi vo" Wl CS vO* «O Os_ Wi VO VO © IO h- Tt IO Tt ©C Tt Tt ΙΛ •o VO OO Tt Tt VO r^ oo" w» cn" CO Tt r·»* CS CN CN CS Ov V CN ro oo" ro vO CS co" vO vo vo CN oo" VO WI1 vo" vo ro" vO On On" vO CSi Tf" VO Ov VO Wi Tf vO OO1 ro* VO vq, oo" Wl OO oo* Wi CN OO* VO OO vo" Wi Wl r^ oo" V3 N oo" IO uI ιo <N OO 1/5 m vo" Wl wT Wl W1 r- Wl CN CO Tt r-" CS W1 Tt" CN VO Ov" CN VO ©" W) O r- Γ-" VO ιη ro" r- © Γ- W1 ro" Γ- P-^ Tt P- P-" vO Tf P- W1 ro" P- Wi vO* VO r— VO Os^ Wi* Wl W1 ro* r— Tf Ov* VO Tf^ ro" VO Tf vo fS © VO <1 Tf OO VO w> Tt" VO Tt oo" Wl CO1 co" Tt CO On oC CN CS Tt CN CN On" CN VO1 ro" Wl r- W1 co" r- Wl Ov" r- Wl vo" Γ- W) Ov" Γ- Wi" P- Γ- Tf P- Ov rs" r- Γ- Tt P- Tt Ov Ov vO Ov OV Wl CS P- ro OO CS Tf OO CO IO U5 OO Os" OO OO oo" VO OO o" vO Tt Wl Wl r- Ov vo" CO Ov Ov" CS Tt wT CS CN oo" CN ro oo" ^ VOi r- ro os" VO Tt Tt" Γ- Wi o" r- (O ro" Γ- m co" r- oo oo" vO Ov On" VO OO oo" VO <N Ov OO OO On OO P-^ Wl Wl OO oo' vo P- vo' Γ— CN1 Wi" OO CN vL ©Γ VO r- VO On Os" VO Wl vo" VO Ov vO On vo" VO Wl vO Ov" CS VOi cs" CS CO1 CN On Ttr CS VO r-" Wi cs" OO Wl" OO Γ- Tt OO ^ Wi" OO Γ- όο" r- r— VOfi ro" OO vo" Γ— oo" P- CO Os' VO OO P- P- vo' vO t—^ V VO Wi' P- OS1 ro" VO _ VOi wf Γ- r- VO Γ— CN oo" vO Tt CO VO vO" Wl OO vO Wl cs" co CN Ovi ro" CN Wi OO CN Tt ro" vo Tr" OO Γ- όο' r- Ov Ov" Γ- Tt r-' Γ- oo" r- P-^ Wi f- Tf Tf P- Wi P- CS vo" ρ- Wl ©' P- ©' P- (O P-' Wl SO Γ- CS Γ- vo" VO VO OO CN 9 <y ω CO^ ΟΟ OO CN a <y IU C>f O Ov CN Q & UJ C/5 co" CN Ov CS G cH Iti COfi Tf" Tj- Os cs Q ^ wT VO Ov CS Q σ Iti CO vo" 00 Os CS Q σ Iti CO O 0 CO 9 01 Iti CO oo" (N © ro Q σ \ti co oT Tt O ro S α ω CO vo © ro Q α ω oo O ro Q O Iti CO1 cs" © ro 9 α ω CO ro" CN ro O 5 tü CO Tt tj- ro Q Õ Iti CO Wi" VO ro Q <y ω CO vo" ΟΟ ro 9 o ω CO Γ-* © CS ro Q 5 UJ CO 00 CN CS (O Q δ ω co Ov Tf CN ro Q Õ W co ©" rs VO CN ro 9 α ω CO CN οο CS ro Q δ Iti CO CN rs © ro ro Q δ ω CO ro' CN CN CO co Q δ ω CO V rs Tt ro ro D δ UJ CO wí rs vO co co Q δ Iti CO VO CS ΟΟ ro ro Q δ Iti CO P- CS O Tt ro Q δ UJ CO1 oo* CN Exemplo 43: Identificação dos domínios compreendidos nas seqüências de polipeptídeo úteis na realização dos métodos da invenção
O recurso integrado das famílias de proteínas, domínios e base de dados dos locais (InterPro) é uma interface integrada para os bases de dados de assinatura habitualmente usados por buscas com base no texto e seqüência. Os base de dados InterPro combinam estas bases de dados, que usam metodologias diferentes e variam o grau da informação biológica cerca de proteínas bem caracterizadas para derivar as assinaturas da proteína. Os bases de dados de colaboração incluem SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom e Pfam, Smart e TIGRFAMs. Interpro é hospedado no European Bioinformatics Institute no Reino Unido.
Os resultados da varredura InterPro da seqüência de polipeptídeo como representado pela SEQ ID N°: 286 são apresentados na Tabela L.
Tabela L: Resultados da varredura de InterPro da seqüência de polipeptídeo como representado pela SEQ ID N°: 286
Base de dados Número de acesso Nome de acesso InterPro I PROO1878 Tipo RanBP2 de dedo de zinco PROFILE PS50199 ZF RANBP2 2 PROSITE PS01358 ZF RANBP2 1 PFAM PF00641 zf-RanBP SMART SM00547 ZnF RBZ
Exemplo 44: Predição da topologia da seqüência de polipeptídeos úteis na realização dos métodos da invenção (localização subcelular, transmembrana...)
O alvo P 1.1 prediz a localização subcelular das proteínas
eucarióticas. A indicação da localização é baseado no prognóstico da presença de qualquer uma das pré-sequências de terminal N: peptídeo de trânsito de cloroplasto (cTP), peptídeo de alvejamento mitocrondial (mTP) ou peptídeo de sinal do caminho secretório (SP). As contagens na predição final não são
baseadas realmente em probabilidades e estas não necessariamente adicionam. Entretanto, a localização com uma contagem maior é a mais provável de acordo com o alvoP e a conexão entre a contagens (a classe de confiança) pode ser uma indicação de que é certa a predição. As faixas da classes de confiança (RC) de 1 a 5, onde 1 indica a predição mais forte. O alvoP é mantido no servidor da Technical University of Denmark.
Para uma seqüência prognosticada por conter uma pré- sequência de terminal N um local de clivagem potencial também pode ser prognosticado.
Vários parâmetros foram selecionados, tal como grupo de organismo (não planta ou planta), conjuntos cortados (nenhum, conjunto pré- definido dos cortes ou conjunto de uso específico dos cortes) e o cálculo da predição dos locais de clivagem (sim ou não).
Os resultados da análise da seqüência do alvoP 1.1 de polipeptídeo como representado pela SEQ ID N°: 286 são apresentados na Tabela M. As "plantas" do grupo de organismo foram selecionadas, nenhum corte definido e o comprimento prognosticado do peptídeo de trânsito requerido. Não existe nenhuma predição clara da localização subcelular, apenas uma fraca predição para uma localização mitocondrial (classe de confiança 5, que é inferior a confiança). As proteínas de SYBl portanto também podem ser localizadas no citoplasma.
Tabela M: Análise da seqüência de alvoP 1.1 de polipeptídeo como representado pela SEQ ID N°: 286
Comprimento (AA) 164 peptídeo de trânsito cloroplastóico 0,417 Peptídeo de trânsito mitocondrial 0,505 Peptídeo de sinal do caminho secretório 0,014 Outro alvejamento subcelular 0,184 Localização predita Mitocondrial Classe de confiança 5 Comprimento do peptídeo de trânsito predito 12
Muitos outros algoritmos podem ser usados para realizar tal análise, incluindo:
• CloroP 1.1 hospedado no servidor da Technical University of Denmark;
• Protein Prowler Subcellular Localisation Predietor versão 1.2 hospedado no servidor do Institute for Molecular Bioscience, University of Queensland, Brisbane, Australia;
· PENCE Proteome Analyst PA-GOSUB 2.5 hospedado no
servidor da University of Alberta, Edmonton, Alberta, Canada; Exemplo 45: Ensaio relacionado com uma seqüência de polipeptídeos útil na realização dos métodos da invenção
Uma seqüência de polipeptídeo como representado pela SEQ ID N°: 286 pode interagir com ácidos nucleicos assim como com as proteínas, em virtude da presença dos domínios de dedo de zinco. Os ensaios de ligação de DNA são bem conhecidos na técnica, incluindo seleção do local de ligação do DNA assistido por PCR e um ensaio substituído por gel na ligação de DNA; por uma referência geral, ver Current Protocols in Molecular Biology, Volumes 1 e 2, Ausubel et ai. (1994), Current Protocols.
A proteína representada pela SEQ ID N°: 286 é prognosticada para interagir com diversas proteínas (Resultados de análise com o base de dados SMART), como mostrados na Tabela Ν. A funcionalidade de uma proteína de SYBl pode ser deste modo testada em uma avaliação de duas leveduras híbridas com proteínas de ligando candidato.
Tabela N: Interadores putativos da SEQ ID N°: 286
Descrição Identificador citocromo P450 putativo At2g46960 Desconhecidos At5g03670 Fraca similaridade pela sub-unidade B de citocromo Ò558/566 F18B3,90 proteína de resposta induzida pela hipersensibilidade MQB2,6" família 9 de hidrolase de glicosila T21L14,7 Desconhecidos F26013,50 proteína contendo domínio brix At5g61770 Peterpan At5g61770 Desconhecidos/ GTPase predita Q9SJF1/Atlg08410 Proteína de ligação de nucleotídeo Q9SHS8/At2g27200
Além disso, a expressão de uma proteína de SYBl de acordo com os métodos da presente invenção os resultados no rendimento de semente aumentado como descrito abaixo.
Exemplo 46: Clonagem da seqüência de ácido nucleico como representado pela SEQ ID N°: 285
A não ser estado de outra maneira, as técnicas de DNA recombinante são realizadas de acordo com os protocolos padrão descritos em (Sambrook (2001) Molecular Cloning: A laboratory manual, 3o Edição Cold Spring Harbor Laboratory Press, CSH, New York) ou em Volumes 1 e 2 de Ausubel et al. (1994), Current Protocols in Molecular Biology, Current Protocols. Os materiais e métodos padrão para o trabalho molecular da planta são descritos em Plant Molecular Biology Labfax (1993) by R.D.D. Croy, publicado por BIOS Scientific Publications Ltd (UK) e Blackwell Scientific Publications (UK).
O gene de Arabidopsis thaliana SYBl foi amplificado por PCR usado como modelo em bibliotecas de cDNA de mudas de Arabidopsis thaliana (Invitrogen, Paisley, UK). Depois a transcrição reversa de RNA extraída das mudas, os cDNAs foram clonados em pCMV Sport 6.0. O tamanho médio do suplemento no banco foi 1,5 kb e o número original dos clones foi da ordem de 1,59 χ 107 cfu. O titulador original foi determinado a ser 9,6 χ 105 cfu/ml depois da primeira amplificação de 6 χ 1011 cfu/ml. Depois da extração do plasmídeo, 200 ng do modelo foi usado em uma mistura de PCR de 50 μΐ. Os iniciadores prm5539 (SEQ ID N°: 341; sentido, códon de partida em negrito, local AttBl em itálico: 5'- ggggacaagtttgtacaaaaaagcaggcttaaacaatgagcagacccggagatt -3') e prm5540 (SEQ ID N°: 342; reverso, complementares, local Att B2 em itálico: 5'- ggggaccactttgtacaagaaagctgggtagacaaggctacttcaaaagca -3'), que incluem os locais AttB para a recombinação de Gateway, foram usados pela amplificação de PCR. O PCR foi realizado usando a polimerase de DNA Hifi Taq em condições padrão. Um fragmento de PCR de 559 pares de base (incluindo locais attB) foi amplificado e purificado também usando os métodos padrão. A primeira etapa do procedimento Gateway, a reação BP, foi então realizada, durante o fragmento de PCR que recombina in vivo com o plasmídeo pDC)NR201 para produzir, de acordo com a tecnologia Gateway, um "clone de entrada", p58a. O plasmídeo pDC)NR201 foi adquirido de Invitrogen, como parte da tecnologia Gateway®.
Exemplo 47: Construção do vetor de expressão usando uma seqüência de ácido nucleico como representado pela SEQ ID N°: 285
O clone de entrada p58a foi subseqüentemente usado em uma reação LR com p0640, um vetor de destinação usado para a transformação da Oryza sativa. Este vetor contém como elementos funcionais dentro dos inseticidas de T-DNA: uma planta marcadora selecionável; um cassete de expressão marcador avaliável; e um cassete Gateway intencionado pela recombinação LR in vivo com uma seqüência de ácido nucleico de interesse já clonado no clone de entrada.
Um promotor GOS2 de arroz (SEQ ID N°: 343) para a expressão constitutiva (pGOS2) foi localizado a montante deste cassete Gateway.
Depois da etapa de recombinação de LR, o vetor de expressão resultante pGOS2:: SYBl (Figura 24) foi transformada em cepa de Agrobacterium LBA4044 de acordo com métodos bem conhecido na técnica. Exemplo 48: Transformação da planta Transformação do arroz
O Agrobacterium contendo o vetor de expressão foi usado para transformar as plantas Oryza sativa. As sementes secas maduras do arroz japonica cultivar Nipponbare foram descascadas. A esterilização foi realizada pela incubação por um minuto em 70% de etanol, seguido por 30 minutos em 0,2% de HgC12, seguido por uma 6 vezes de 15 minutos de lavagem com água destilada estéril. As sementes estéreis foram então germinadas em um meio contendo 2,4-D (meio de indução de calo). Depois da incubação no escuro por quatro semanas, embriogênico, os calos derivados de escutelo foram excisados e propagados no mesmo meio. Depois de duas semanas, os calos foram multiplicado ou propagados pela subcultura no mesmo meio por outras 2 semanas. Os fragmentos de calos embriogênicos foram submetidos à cultura em meio fresco 3 dias antes da co-cultivação (pela atividade de divisão celular auxiliar).
A cepa Agrobacterium LBA4404 contendo o vetor de expressão foi usado para a co-cultivação. A Agrobacterium foi inoculada em meio AB com os antibióticos apropriados e cultivadas por 3 dias a 28°C. A bactéria foi então coletada e recolocada em suspensão em meio de co- cultivação líquido por uma densidade (ODóOO) de cerca de 1. A suspensão foi então transferida para uma placa de Petri e os calos submetidos à imersão na suspensão por 15 minutos. Os tecidos dos calos foram então manchados secos em um filtro de papel e transferidos pelo meio de co-cultivação solidificado e incubados por 3 dias no escuro a 25°C. Os calos co-cultivados foram cultivados em meio contendo 2,4D por 4 semanas no escuro a 28°C na presença de um agente de seleção. Durante este período, rapidamente os calos resistentes às ilhas de crescimento desenvolvidas. Depois a transferência deste material a um meio de regeneração e incubação na luz, o potencial embriogênico foi liberado e os brotos desenvolvidos nas próximas quatro a cinco semanas. Os brotos foram excisados a partir dos calos e incubados por 2 a 3 semanas em um meio contendo auxina de que estes foram transferidos ao solo. Os brotos endurecidos foram cultivados sob alta umidade e dias curtos em um estufa.
Aproximadamente 35 transformantes de arroz TO independentes foram gerados por uma construção. Os transformantes primários foram transferidos a partir de uma câmara de cultura de tecido para uma estufa. Depois de uma análise de PCR quantitativa para verificar o número de cópias do suplemento de T-DNA, apenas a cópia simples da planta transgênicas que exibi a tolerância ao agente de seleção foram mantidas para colheita da semente Tl. As sementes foram então colhidas três a cinco meses depois que se pode plantar. O método produziu transformantes de locais simples em uma taxa de em relação 50% (Aldemita e Hodges 1996, Chan et al. 1993, Hiei et al. 1994). Transformação do milho
A transformação do Milho (Zea mays) é realizada com uma modificação do método descrito por Ishida et al. (1996) Nature Biotech 14(6): 745-50. A transformação é dependente do genotipo no milho e apenas os genotipos específicos são responsáveis pela transformação e regeneração. A linha inata Al 88 (University of Minnesota) ou híbridos com A188 como um precursor são boas fontes do material do doador para a transformação, mas outros genotipos podem ser usados com êxito bem como. As espigas são colhidas a partir das plantas de milho aproximadamente 11 dias depois a polinização (DAP) quando o comprimento do embrião imaturo é cerca de 1 a 1,2 mm. Os embriões imaturos são co-cultivados com Agrobacterium tumefaciens contendo o vetor de expressão e as plantas transgênicas são recuperadas através de organogênese. Os embriões excisados são cultivados em meio de indução de calo, então o meio do milho de regeneração, contendo o agente de seleção (por exemplo imidazolinona mas vários marcadores de seleção podem ser usados). As placas de Peltri são incubados na luz a 250C por 2 a 3 semanas ou até os brotos crescerem. Os brotos verdes são transferidos a partir de cada embrião pelo meio enraizado do milho e incubados a 25°C por 2 a 3 semanas, até as raízes crescerem. Os brotos enraizados são transplantados ao solo na estufa. As sementes Tl são produzidas a partir das plantas que exibem a tolerância ao agente de seleção e que contenham uma cópia simples do suplemento de T-DNA. Transformação do Trigo A transformação do trigo é realizada com os método descritos por Ishida et ai. (1996) Nature Biotech 14(6): 745-50. O cultivo de Bobwhite (disponíveis de CIMMYT, México) é habitualmente usado na transformação. Os embriões imaturos são co-cultivados com Agrobacterium tumefaciens contendo o vetor de expressão e as plantas transgênicas são recuperadas através de organogênese. Depois da incubação com Agrobacterium, os embriões são cultivados in vitro em meio de indução de calo, então os meio de regeneração, contendo o agente de seleção (por exemplo imidazolinona mas vários marcadores de seleção podem ser usados). As placas de Peltri são incubadas na luz a 250C por 2 a 3 semanas ou até os brotos crescerem. Os brotos verdes são transferidos a partir de cada embrião para o meio enraizado e incubados a 250C por 2 a 3 semanas, até as raízes crescerem. Os brotos enraizados são transplantados ao solo na estufa. As sementes Tl são produzidas a partir das plantas que exibem a tolerância ao agente de seleção e que contenham uma cópia simples do suplemento de T-DNA. Transformação da Soja
A soja é transformada de acordo com uma modificação do método descrito na Patente U.S. Texas A&M 5.164.310. Diversas variedades de soja comerciais são responsáveis pela transformação por este método. O cultivo de Jack (disponíveis de Illinois Seed foundation) é habitualmente usado para a transformação. As sementes de soja são esterilizadas por semeadura in vitro. A hipocotila, a radícula e um cotilédone são excisados a partir de mudas jovens de sete dias de idade.
A epicotila e o cotilédone remanescentes ainda são cultivados por nós auxiliares de desenvolvimento. Estes nós auxiliares são excisados e incubados com Agrobacterium tumefaciens contendo o vetor de expressão. Depois do tratamento de co-cultivação, os explantes são lavados e transferidos para o meio de seleção. Os brotos regenerados são excisados e colocados em um meio de alongamento do broto. Nenhuma das raízes mais longos do que 1 cm são colocadas no meio enraizado até as raízes crescerem. Os brotos enraizados são transplantados ao solo na estufa. As sementes Tl são produzidas a partir das plantas que exibem a tolerância ao agente de seleção e que contenham uma cópia simples do suplemento de T-DNA. Transformação de Colza/canola
Os pecíolos e hipocotilas cotiledonêos de mudas jovens de 5 a 6 dias de idade são usados como explantes para a cultura do tecido e transformada de acordo com Babic et ai (1998, Plant Cell Rep 17: 183-188). O cultivo comercial de Westar (Agriculture Canada) é a variedade padrão usada para a transformação, mas outras variedades também podem ser usadas. As sementes de canola são esterilizadas por superfície pela semeadura in vitro. Os explantes de pecíolo de cotilédone com o cotilédone ligado são excisados a partir de mudas in vitro e inoculados com Agrobacterium (contendo o vetor de expressão) pela imersão da extremidade cortada do explante pecíolo em uma suspensão bacteriana. Os explantes são então cultivados por 2 dias em meio MSBAP-3 contendo 3 mg/l de BAP, 3% de sacarose, 0,7% de Phytagar a 23°C, 16 horas de luz. Depois de dois dias de co-cultivação com Agrobacterium, o explante de pecíolos são transferidos para o meio MSBAP-3 contendo 3 mg/l de BAP, cefotaxima, carbenicilina ou timentina (300 mg/l) por 7 dias e então cultivados em meio MSBAP-3 com cefotaxima, carbenicilina ou timentina e agente de seleção até a regeneração dos brotos. Quando os brotos estão com comprimento de 5 a 10 mm, estes são cortados e transferidos ao meio de alongamento do broto (MSBAP-0,5, contendo 0,5 mg/l de BAP). As raízes de cerca de 2 cm no comprimento são transferidas ao meio enraizado (MSO) para a indução da raiz. Os brotos enraizados são transplantados ao solo na estufa. As sementes Tl são produzidas a partir das plantas que exibem a tolerância ao agente de seleção e que contenham uma cópia simples do suplemento de T-DNA. Transformação da Alfafa Um clone de regeneração da Alfafa (Medicago sativa) é transformado usando o método de (McKersie et al., 1999 Planta Physiol 119: 839-847). A regeneração e transformação de Alfafa é dependente do genotipo e portanto uma planta de regeneração é requerida. Os métodos para se obter a planta de regeneração foram descritos. Por exemplo, estes podem ser selecionados do cultivo de Rangelander (Agriculture Canada) ou qualquer outra variedade de alfafa comercial como descrito por Brown DCW e A Atanassov (1985. Plant Cell Tissue Organ Culture 4: 111-112). Alternativamente, uma variedade RA3 (University of Wisconsin) foram selecionadas para o uso na cultura do tecido (Walker et al., 1978 Am J Bot 65: 654-659). O explante de pecíolos são co-cultivados com uma cultura durante a noite de Agrobacterium tumefaciens C58C1 pMP90 (McKersie et al., 1999 Plant Physiol 119: 839-847) ou LBA4404 contendo o vetor de expressão. Os explantes são co-cultivados por 3 dias no escuro em meio SH de indução contendo 288 mg/ L Pro, 53 mg/ L de tioprolina, 4,35 g/ L de K2S04 e 100 μπι de acetosiringinona. Os explantes são lavados em meio de comprimento Murashige-Skoog (Murashige e Skoog, 1962) e colocados no mesmo meio de indução SH sem acetosiringinona mas com um agente de seleção adequado e o antibiótico adequado para inibir o crescimento da Agrobacterium. Depois de diversas semanas, os embriões somáticos são transferida ao meio de desenvolvimento BOÍ2Y contendo nenhum regulador de crescimento, nenhum antibiótico e 50 g/ L de sacarose. Os embriões somáticos são subseqüentemente germinados em meio MurashigeSkoog de comprimento médio. As mudas enraizadas foram transplantadas em potes e cultivadas em um estufa. As sementes Tl são produzidas a partir das plantas que exibem a tolerância ao agente de seleção e que contenham uma cópia simples do suplemento de T-DNA. Exemplo 49: Procedimento de avaliação fenotípica 49.1 Apresentação da avaliação Aproximadamente 35 transformantes de arroz TO independentes foram gerados. Os transformantes primários foram transferidos a partir de uma câmara de cultura de tecido para uma estufa para o cultivo da colheita da semente TI. Seis eventos, que o progênie Tl segregado 3:1 pela presença/ausência do transgene, foram retidos. Para cada um destes eventos, aproximadamente 10 mudas de Tl contendo o transgene (hetero e homozigotos) e aproximadamente 10 mudas de Tl que precisam do transgene (nulizigotos) foram selecionadas monitorando-se a expressão marcadora visual. As plantas transgênicas e os nulizigotos correspondentes foram cultivados lado a lado em posições aleatórias. As condições das estufas das plantas foram de dias curtos (12 horas de luz), 28°C na luz e 22°C no escuro e uma umidade relativa de 70%. Triagem pela seca
As plantas a partir da sementes T2 são cultivadas plantando-se em solo sob condições normais até estas se aproximarem do estágio superior. Estas são então transferidas por uma seção "seca" onde a irrigação é retida. As sondas de umidade são inseridas em potes escolhidos aleatoriamente para monitorar o teor de água no solo (SWC).
Quando SWC vai abaixo de certos limiares, a plantas são automaticamente re-umidificadas continuamente até um nível normal for atingido novamente. A plantas são então re-transferidas novamente às condições normais. O resto do cultivo (maturação da planta, colheita da semente) é o mesmo como para as plantas não cultivadas sob condições abióticas de estresse. Os parâmetros de crescimento e rendimento são registrados como detalhados pelo crescimento sob condições normais. Avaliação da eficiência do uso de nitrogênio
As plantas de arroz das sementes T2 são cultivadas plantando- se em solo sob condições normais exceto pela solução de nutriente. Os potes são irrigados a partir da transplantação pela maturação com uma solução de f
nutriente específica contendo teor de nitrogênio (N) reduzido por N, usualmente entre 7 a 8 vezes menos. O resto do cultivo (maturação da planta, colheita da semente) é o mesmo como para as plantas não cultivadas sob estresse abiótico. Os parâmetros de crescimento e rendimento são registrados como detalhados pelo crescimento sob condições normais.
Quatro eventos Tl ainda foram avaliados na geração T2 seguindo o mesmo procedimento da avaliação como para a geração Tl mas com mais indivíduos por evento. A partir do estágio de semeadura até o estágio de maturidade as plantas foram passadas diversas vezes através um gabinete de imagem digital. Em cada período de tempo imagens digitais (2048 χ 1536 pixéis, 16 milhões de cores) foram tiradas de cada planta de pelo menos de 6 ângulos diferentes. 49.2 Análise estatística: teste F
Um dos dois fatores ANOVA (análise de variantes) foi usado como um modelo estatístico para a avaliação total das características de plantas fenotípicas. Um teste F foi realizado em todos os parâmetros medidos de todas as plantas de todos os eventos transformados com o gene da presente invenção. O teste F foi realizado para checar um efeito do gene em relação a todos os eventos de transformação e para verificar um efeito total do gene, também conhecido como um efeito global do gene. O limiar para a importância de um efeito global verdadeiro do gene foi conjunto a um nível de probabilidade de 5% para o teste F. Um ponto de valor significante do teste F a um efeito do gene, significando que este não é apenas a mera presença ou posição do gene que é a causa das diferenças no fenotipo. 49.3 Parâmetros medidos
Medição de parâmetro relacionados à biomassa
A partir do estágio de semeadura até o estágio de maturidade as plantas foram passadas diversas vezes através de um gabinete de imagem digital. Em cada período de tempo as imagens digitais (2048 χ 1536 pixéis, 16 milhões de cores) foram tiradas de cada planta de pelo menos de 6 ângulos diferentes.
A planta acima da área do solo (ou biomassa folhosa) foi determinada pela contagem do número total de pixéis nas imagens digitais a partir da parte acima do solo de plantas discriminadas do fundo. Este valor foi medido pelas fotos tiradas no mesmo período de tempo a partir de ângulos diferentes e foi convertida por uma valor de superfície física expressada em mm quadrados pela calibração. Os experimentos mostram que a área da planta acima do solo mede este caminho e dizem respeito com as biomassas da parte de plantas acima desenvolvidas. A área de trituração acima é o ponto de tempo em que a planta tem atingida esta máxima da biomassa folhosa. O vigor inicial é a planta (semeadura) acima da área do solo de três semanas pós-germinação. O aumento na biomassa da raiz é expressada como um aumento na biomassa total da raiz (medido como biomassa máxima da raízes observada durante o tempo de vida de uma planta); ou como um aumento no índice raiz/broto (medido como a razão entre massa da raiz e massa de broto no período do crescimento ativo de raiz e broto). Medições dos parâmetros relacionados a semente
As panículas primárias maduras foram colhidas, contadas, ensacadas, rotuladas por códigos de barra e então secadas por três dias em um forno a 37°C. As panículas foram então debulhadas e todas as sementes foram coletadas e contadas. As cascas enchidas foram separadas a partir de um vácuo usando um dispositivo de sopro de ar. As cascas esvaziadas foram descartadas e a fração remanescente foi contada novamente. As cascas enchidas foram pesadas em uma balança analítica. O número de sementes cheias foi determinada pela contagem do número de cascas enchidas que permaneceram depois da etapa de separação. O rendimento da semente total foi medido pela pesagem de todas as cascas enchidas colhidas a partir de uma planta. O número de semente total por planta foi medido pela contagem do número de cascas colhidas a partir de uma planta. Peso de mil grãos (TKW) é extrapolado do número de sementes cheias contadas e seu peso total. O índice da colheita (HI) na presente invenção é definido como a razão entre o rendimento da semente total e a área de trituração acima (mm2), multiplicado por um fator 106. Do número total de flores por panícula como definido na presente invenção é a razão entre do número total das sementes e o número das panículas maduras primárias. A taxa de enchimento das semente como definido na presente invenção é a proporção (expressado como uma%) do número das sementes cheias em relação ao número total das sementes (ou flósculos).
Exemplo 50: Resultados da avaliação fenotípica das plantas transgênicas
Os resultados da avaliação de plantas transgênicas de arroz expressam uma seqüência de ácido nucleico úteis na realização dos métodos da invenção que são apresentados na Tabela 0. A diferença na porcentagem entre os transgênicos e os nulizigotos correspondentes também e são mostrados, com um valor P do teste F abaixo de 0,05.
O rendimento total das sementes, número das sementes cheias, taxa de enchimento de semente, índice de colheita e peso de mil grãos são significantemente aumentado nas plantas transgênicas que expressam uma seqüência de ácido nucleico úteis na realização dos métodos da invenção, comparados às plantas de controle (neste caso, os nulizigotos).
Tabela O: Resultados da avaliação das plantas transgênicas de arroz que expressam uma seqüência de ácido nucleico úteis na realização dos métodos da invenção.
Traço % do aumento (geração TI) % do aumento (geração T2) Semente de rendimento total 20 23 Número de sementes cheias 17 19 Taxa de enchimento 12 20 índice da colheita 15 20 Peso de mil grãos 2 4

Claims (154)

1. Método para aumentar o rendimento de semente de plantas em relação às plantas de controle, caracterizado pelo fato de que compreende modular a expressão em uma planta de um ácido nucleico que codifica um polipeptídeo AZ e opcionalmente selecionar quanto a plantas que tenham rendimento aumentado, em que o dito polipeptídeo AZ compreende pelo menos uma repetição de anquirina e pelo menos um domínio de dedo de zinco C3H1.
2. Método de acordo com a reivindicação 1, caracterizado pelo fato de que a dita expressão modulada é efetuada pela introdução de uma modificação genética preferivelmente no local de um gene que codifica um polipeptídeo AZ ou um homólogo do mesmo.
3. Método de acordo com a reivindicação 2, caracterizado pelo fato de que a dita modificação genética é efetuada por um de: ativação de T- DNA, TILLING, mutagênese direcionada ao sítio ou evolução direta.
4. Método para aumentar o rendimento de semente de plantas em relação às plantas do tipo selvagem correspondentes, caracterizado pelo fato de que compreende introduzir e expressar em uma planta um ácido nucleico de AZ ou uma variante do mesmo, em que o dito ácido nucleico de AZ codifica um polipeptídeo que compreende pelo menos uma repetição de anquirina e pelo menos um domínio de dedo de zinco C3H1.
5. Método de acordo com a reivindicação 4, caracterizado pelo fato de que o dito ácido nucleico codifica um homólogo da proteína de AZ da SEQ ID NO: 2.
6. Método de acordo com a reivindicação 4, caracterizado pelo fato de que a dita variante é uma porção de um ácido nucleico de AZ ou uma seqüência capaz de hibridizar a um ácido nucleico de AZ, porção ou seqüência hibridizadora estas que codificam um polipeptídeo que compreende pelo menos uma repetição de anquirina e pelo menos um domínio de dedo de zinco C3H1.
7. Método de acordo com as reivindicações 5 ou 6, caracterizado pelo fato de que o dito ácido nucleico de AZ ou variante do mesmo são super expressados em uma planta.
8. Método de acordo com qualquer uma das reivindicações de a 7, caracterizado pelo fato de que o dito ácido nucleico de AZ ou variante do mesmo são de origem vegetal, preferivelmente de uma planta dicotiledônea, mais preferivelmente da família Brassicaceae, o mais preferivelmente o ácido nucleico é de Arabidopsis thaliana.
9. Método de acordo com qualquer uma das reivindicações de a 8, caracterizado pelo fato de que o dito ácido nucleico de AZ ou variante do mesmo são operavelmente ligados a um promotor específico de semente.
10. Método de acordo com a reivindicação 9, caracterizado pelo fato de que o dito promotor específico de semente é um promotor de WSIl 8.
11. Método de acordo com qualquer uma das reivindicações de1 a 10, caracterizado pelo fato de que o dito rendimento de semente aumentado compreende o peso de mil grãos aumentado.
12. Planta, caracterizada pelo fato de que é obtenível por um método como definido em qualquer uma das reivindicações de 1 a 11.
13. Construção, caracterizada pelo fato de que compreende: (i) um ácido nucleico de AZ ou uma variante do mesmo; (ii) uma ou mais seqüências de controle operavelmente ligadas à seqüência de ácido nucleico de (i)
14. Construção de acordo com a reivindicação 13, caracterizada pelo fato de que a dita seqüência de controle é um promotor específico de semente ou um promotor constitutivo.
15. Construção de acordo com a reivindicação 14, caracterizada pelo fato de que o dito promotor específico de semente é um promotor WSI18, preferivelmente um promotor WSI18 como representado pela SEQ ID NO: 55 ou SEQ ID NO: 9.
16. Construção de acordo com a reivindicação 13, caracterizada pelo fato de que o dito promotor constitutivo é um promotor GOS2, preferivelmente um promotor GOS2 como representado pela SEQ ID NO: 56 ou SEQ ID NO: 54.
17. Planta, caracterizada pelo fato de que é transformada com uma construção como definida em qualquer uma das reivindicações de 13 a 16.
18. Método para produzir uma planta transgênica tendo rendimento de semente aumentado comparado com plantas do tipo selvagem correspondentes, caracterizado pelo fato de que compreende: (i) introduzir e expressar em uma planta ou célula vegetal um ácido nucleico de AZ ou variante do mesmo; e (ii) cultivar a célula vegetal sob condições que promovam o crescimento e desenvolvimento da planta.
19. Planta transgênica, caracterizada pelo fato de que tem rendimento de semente aumentado, resultante de um ácido nucleico de AZ ou uma variante do mesmo introduzida na dita planta.
20. Planta transgênica de acordo com as reivindicações 12, 17 ou 19, caracterizada pelo fato de que a dita planta é uma planta monocotiledônea, tal como cana de açúcar ou em que a planta é um cereal, tal como arroz, milho, trigo, cevada, painço, centeio, aveia ou sorgo.
21. Partes colhíveis de uma planta, caracterizadas pelo fato de que a planta é como definida em qualquer uma das reivindicações de 12, 17, 19 ou 20.
22. Partes colhíveis de uma planta como definida na reivindicação 21, caracterizadas pelo fato de que as ditas partes colhíveis são sementes.
23. Produtos, caracterizados pelo fato de serem diretamente derivados de uma planta como definida na reivindicação 20 e/ou de partes colhíveis de uma planta como definidas na reivindicações 21 ou 22.
24. Uso de um ácido nucleico/gene de AZ ou variante dos mesmos ou uso de um polipeptídeo de AZ ou um homólogo do mesmo, caracterizado pelo fato de ser no aumento do rendimento de semente, em relação às plantas do tipo selvagem correspondentes.
25. Uso de acordo com a reivindicação 24, caracterizado pelo fato de que o dito rendimento de semente aumentado compreende peso de mil grãos aumentado.
26. Uso de um ácido nucleico/gene de AZ ou variante do mesmo ou uso de um polipeptídeo de AZ ou um homólogo do mesmo, caracterizado pelo fato de ser como um marcador molecular.
27. Uso de uma construção como definida em qualquer uma das reivindicações de 13 a 16, caracterizado pelo fato de ser em um método para fabricar plantas tendo rendimento de semente aumentado em relação às plantas de controle.
28. Método para aumentar o rendimento da planta sob estresse abiótico em relação às plantas de controle, caracterizado pelo fato de que compreende modular a expressão em uma planta de uma seqüência de ácido nucleico que codifica um polipeptídeo de translocação de sarcoma sinovial (SYT) e opcionalmente selecionar quanto a plantas que tenham rendimento aumentado, em que o dito polipeptídeo de SYT compreende do terminal N para o terminal C: (i) um domínio SNH tendo em ordem crescente de preferência pelo menos 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%,65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%,98%, 99% de identidade de seqüência com o domínio SNH da SEQ ID NO:58; e (ii) um domínio rico em Met; e (iii) um domínio rico em QG.
29. Método de acordo com a reivindicação 28, caracterizado pelo fato de que o dito domínio SNH compreende os resíduos mostrados em preto na figura 6.
30. Método de acordo com a reivindicação 28, caracterizado pelo fato de que o dito domínio SNH é representado pela SEQ ID NO: 57.
31. Método de acordo com qualquer uma das reivindicações de 28 a 30, caracterizado pelo fato de que o dito polipeptídeo de SYT compreende ainda um ou mais dos seguintes: (i) SEQ ID NO: 146; (ii) SEQ ID NO: 147; (iii) um domínio rico em Met no terminal N que precede o domínio SNH.
32. Método de acordo com qualquer uma das reivindicações de 28 a 31, caracterizado pelo fato de que o dito estresse abiótico é um dos dois: estresse salino ou estresse pela seca.
33. Método de acordo com qualquer uma das reivindicações de28 a 31, caracterizado pelo fato de que o dito estresse abiótico é o estresse da disponibilidade de nutriente reduzida, preferivelmente disponibilidade de nitrogênio reduzida.
34. Método de acordo com qualquer uma das reivindicações de 28 a 33, caracterizado pelo fato de que a dita expressão modulada é efetuada por qualquer um ou mais dos seguintes: ativação de T-DNA, TILLING ou recombinação homóloga.
35. Método de acordo com qualquer uma das reivindicações de28 a 33, caracterizado pelo fato de que a dita expressão modulada é efetuada pela introdução e expressão em uma planta, parte de planta ou célula vegetal de uma seqüência de ácido nucleico que codifica um polipeptídeo de SYT.
36. Método de acordo com qualquer uma das reivindicações de 28 a 35, caracterizado pelo fato de que o dito rendimento aumentado é um ou mais dos seguintes: rendimento de semente total, número de sementes cheias, taxa de enchimento de semente, TKW e índice de colheita.
37. Método de acordo com a reivindicação 35, caracterizado pelo fato de que a dita seqüência de ácido nucleico é uma ou mais das seguintes variantes de ácido nucleico de SYT: (i) uma porção de uma seqüência de ácido nucleico de SYT; (ii) uma seqüência de ácido nucleico capaz de hibridizar com uma seqüência de ácido nucleico de SYT; (iii) uma variante de junção de uma seqüência de ácido nucleico de SYT; (iv) uma variante alélica de uma seqüência de ácido nucleico de SYT; (v) uma seqüência de ácido nucleico de SYT obtida pelo embaralhamento de gene; (vi) uma seqüência de ácido nucleico de SYT obtida pela mutagênese direcionada ao sítio.
38. Método de acordo com as reivindicações 35 ou 37, caracterizado pelo fato de que a dita seqüência de ácido nucleico codifica qualquer um dos polipeptídeos de SYT dados na Tabela 6 ou ortólogos ou parálogos de qualquer uma das SEQ ID NOs anteriormente mencionado.
39. Método de acordo com as reivindicações 35 ou 37, caracterizado pelo fato de que a dita seqüência de ácido nucleico codifica os polipeptídeos de SYT como representado pela SEQ ID NO: 60, SEQ ID NO: 151 ou SEQ ID NO: 153.
40. Método de acordo com qualquer uma das reivindicações de 28 a 39, caracterizado pelo fato de que a dita seqüência de ácido nucleico que codifica um polipeptídeo de SYT é super expressada em uma planta.
41. Método de acordo com qualquer uma das reivindicações 35, 37 ou 38, caracterizado pelo fato de que a dita seqüência de ácido nucleico que codifica um polipeptídeo de SYT é de origem vegetal.
42. Método de acordo com qualquer uma das reivindicações 35, 37 a 41, caracterizado pelo fato de que a dita seqüência de ácido nucleico que codifica um polipeptídeo de SYT é operavelmente ligado a um promotor constitutivo.
43. Método de acordo com a reivindicação 42, caracterizado pelo fato de que o dito promotor constitutivo é derivado de planta, preferivelmente de uma planta monocotiledônea.
44. Método de acordo com as reivindicações 42 ou 43, caracterizado pelo fato de que o dito promotor constitutivo é um promotor GOS2.
45. Planta, parte de planta ou célula vegetal, caracterizadas pelo fato de que são obteníveis por um método como definido em qualquer uma das reivindicações de 28 a 44.
46. Seqüência de ácido nucleico isolada, caracterizada pelo fato de que compreende uma seqüência de ácido nucleico selecionada do grupo que consiste de: (a) uma seqüência de ácido nucleico isolada como representada na SEQ ID NO: 150 e SEQ ID NO: 152; (b) uma seqüência de ácido nucleico isolada que codifica o polipeptídeo como representado na SEQ ID NO: 151 e SEQ ID NO: 153; (c) uma seqüência de ácido nucleico isolada cuja seqüência pode ser deduzida de um polipeptídeo como representado na SEQ ID NO: 151 e SEQ ID NO: 153 como um resultado da degenerescência do código genético; (d) uma seqüência de ácido nucleico isolada que codifica um polipeptídeo que tem pelo menos 70% de identidade com o polipeptídeo codificado pela seqüência de ácido nucleico de (a) a (c); (e) uma seqüência de ácido nucleico isolada que codifica um homólogo, derivado ou fragmento ativo do polipeptídeo como representado na SEQ ID NO: 151 e SEQ ID NO: 153, homólogo, derivado ou fragmento estes que são de origem vegetal e compreende vantajosamente do terminal N para o terminal C: (i) um domínio SNH tendo em ordem crescente de preferência pelo menos 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%,75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% de identidade de seqüência com o domínio SNH da SEQ ID NO: 58; (ii) um domínio rico em Met; (iii) um domínio rico em QG; (f) uma seqüência de ácido nucleico isolada capaz de hibridizar com um ácido nucleico de (a) a (c) acima ou seu complemento, em que a seqüência hibridizadora ou o seu complemento codificam a proteína vegetal de (a) a (e); (g) por meio do qual a expressão modificada da seqüência de ácido nucleico aumenta o rendimento em plantas sob estresse abiótico comparado com as plantas de controle.
47. Construção, caracterizada pelo fato de que compreende: (i) uma seqüência de ácido nucleico que codifica um polipeptídeo de SYT, como definido acima; (ii) uma ou mais seqüências de controle capazes de direcionar a expressão da seqüência de ácido nucleico de (i); e opcionalmente (iii) uma seqüência de terminação de transcrição; ou (iv) uma seqüência de ácido nucleico como definida na reivindicação 46.
48. Construção de acordo com a reivindicação 47, caracterizada pelo fato de que a dita seqüência de controle é um promotor constitutivo.
49. Construção de acordo com a reivindicação 48, caracterizada pelo fato de que o dito promotor constitutivo é um promotor GOS2.
50. Construção de acordo com a reivindicação 48, caracterizada pelo fato de que o dito promotor GOS2 é como representado pela SEQ ID NO: 56 ou SEQ ID NO: 145.
51. Planta, parte de planta ou célula vegetal, caracterizadas pelo fato de que são transformadas com uma construção como definida em qualquer uma das reivindicações de 47 a 50.
52. Método para a produção de uma planta transgênica, preferivelmente uma planta monocotiledônea, tendo rendimento aumentado sob estresse abiótico, caracterizado pelo fato de que compreende: (i) introduzir e expressar em uma planta ou célula vegetal uma seqüência de ácido nucleico que codifica um polipeptídeo de SYT; (ii) cultivar a célula vegetal sob condições que promovam o crescimento e desenvolvimento da planta.
53. Método de acordo com a reivindicação 52, caracterizado pelo fato de que compreende gerar uma ou mais gerações de plantas subsequentes e partes destas incluindo sementes pela procriação de plantas obtidas pela dita etapa de cultivo (ii).
54. Planta transgênica ou parte da mesma, caracterizada pelo fato de que tem rendimento aumentado sob estresse abiótico, que resulta de uma seqüência de ácido nucleico que codifica um polipeptídeo de SYT introduzida na dita planta ou parte de planta, o dito rendimento aumentado sendo em relação às plantas de controle.
55. Planta transgênica de acordo com as reivindicações 45, 51 ou 54, caracterizada pelo fato de que a dita planta é uma planta monocotiledônea, tal como cana de açúcar ou em que a planta é um cereal, tal como arroz, milho, trigo, cevada, painço, centeio, aveia, triticale ou sorgo.
56. Partes colhíveis de uma planta, caracterizadas pelo fato de que a planta é como definida em qualquer uma das reivindicações 45, 51, 54 ou 55.
57. Partes colhíveis de uma planta de acordo com a reivindicação 56, caracterizadas pelo fato de que são sementes.
58. Produtos, caracterizados pelo fato de que são derivados, preferivelmente diretamente derivados, de uma planta como definida na reivindicação 45 e/ou das partes colhíveis de uma planta como definidas na reivindicações 56 ou 57.
59. Uso de uma seqüência de ácido nucleico de SYT ou uso de um polipeptídeo de SYT ou uso de uma construção como definida em qualquer uma das reivindicações de 47 a 50, caracterizado pelo fato de ser na melhora de rendimento sob estresse abiótico em relação às plantas de controle.
60. Uso de acordo com a reivindicação 59, caracterizado pelo fato de que o dito rendimento aumentado é um ou mais dos seguintes: rendimento de semente total, número de sementes cheias, taxa de enchimento de semente, TKW e índice de colheita.
61. Uso de uma seqüência de ácido nucleico que codifica um polipeptídeo de SYT ou uso de um polipeptídeo de SYT, caracterizado pelo fato de ser como um marcador molecular.
62. Método para aumentar o rendimento da planta em relação às plantas de controle, caracterizado pelo fato de que compreende aumentar a expressão nas partes acima do solo de uma planta, de uma seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase e opcionalmente selecionar quanto as plantas tendo rendimento aumentado, em que o dito polipeptídeo de cpFBPase funciona no cloroplasto e compreende: (i) pelo menos um domínio de FBPase; e (ii) pelo menos uma inserção reguladora de redox.
63. Método de acordo com a reivindicação 62, caracterizado pelo fato de que a dita expressão aumentada é efetuada por qualquer uma ou mais de: ativação de T-DNA, TILLING e recombinação homóloga.
64. Método de acordo com a reivindicação 62, caracterizado pelo fato de que a dita expressão aumentada é efetuada pela introdução e expressão nas partes acima do solo de uma planta de uma seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase.
65. Método de acordo com qualquer uma das reivindicações de 62 a 64, caracterizado pelo fato de que a dita seqüência de ácido nucleico é uma ou mais das seguintes variantes de ácido nucleico de cpFBPase: (i) uma porção de uma seqüência de ácido nucleico de cpFBPase; (ii) uma seqüência de ácido nucleico capaz de hibridizar com uma seqüência de ácido nucleico de cpFBPase; (iii) uma variante de junção de uma seqüência de ácido nucleico de cpFBPase; (iv) uma variante alélica de uma seqüência de ácido nucleico de cpFBPase; (v) uma seqüência de ácido nucleico de cpFBPase obtida pelo embaralhamento de gene; (vi) uma seqüência de ácido nucleico de cpFBPase obtida pela mutagênese direcionada ao sítio.
66. Método de acordo com qualquer uma das reivindicações de 62 a 65, caracterizado pelo fato de que a dita seqüência de ácido nucleico codifica qualquer um dos polipeptídeos de cpFBPase dados na Tabela C ou ortólogos ou parálogos de qualquer uma das SEQ ID NOs anteriormente mencionadas.
67. Método de acordo com qualquer uma das reivindicações de 62 a 66, caracterizado pelo fato de que a dita seqüência de ácido nucleico origina-se de uma célula fotossintética, preferivelmente de plantas de solo, mais preferivelmente de algas verdes.
68. Método de acordo com qualquer uma das reivindicações de 62 a 67, caracterizado pelo fato de que a dita seqüência de ácido nucleico codifica o polipeptídeo de cpFBPase como representado pela SEQ ID NO:155.
69. Método de acordo com qualquer uma das reivindicações de 62 a 68, caracterizado pelo fato de que a dita seqüência de ácido nucleico é operavelmente ligada a um promotor capaz de direcionar a expressão em partes acima do solo de uma planta.
70. Método de acordo com a reivindicação 69, caracterizado pelo fato de que o dito promotor é um promotor constitutivo, preferivelmente um promotor de GOS2.
71. Método de acordo com qualquer uma das reivindicações de 62 a 70, caracterizado pelo fato de que o dito rendimento aumentado é selecionado de um ou mais de: i) peso de semente aumentado; ii) número de sementes cheias aumentado; iii) taxa de enchimento de semente aumentada; e iv) índice de colheita aumentado.
72. Planta, partes e células de tais plantas incluindo sementes obteníveis por um método como definido em qualquer uma das reivindicações de 62 a 71, caracterizadas pelo fato de que a dita planta ou partes desta compreendem a expressão aumentada de uma seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase, seqüência de ácido nucleico esta que é operavelmente ligada a um promotor que direciona a expressão em partes acima do solo de uma planta.
73. Construção, caracterizada pelo fato de que compreende: (i) uma seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase; (ii) uma ou mais seqüências de controle capazes de direcionar a expressão em partes acima do solo de uma planta, de uma seqüência de ácido nucleico de (i); e opcionalmente (iii) uma seqüência de terminação de transcrição.
74. Construção de acordo com a reivindicação 73, caracterizada pelo fato de que a dita seqüência de ácido nucleico origina-se de algas verdes e a dita seqüência de controle é um promotor de GOS2.
75. Uso de uma construção como definida na reivindicação 73 ou 74, caracterizado pelo fato de ser para aumentar o rendimento em plantas.
76. Planta, parte de planta ou célula vegetal, caracterizada pelo fato de ser transformada com uma construção como definida nas reivindicações 73 ou 74.
77. Método para a produção de uma planta transgênica tendo rendimento aumentado em relação às plantas de controle, caracterizado pelo fato de que compreende: (i) introduzir e expressar em partes acima do solo de uma planta ou célula vegetal uma seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase; e (ii) cultivar a célula vegetal sob condições que promovam o crescimento e desenvolvimento da planta.
78. Planta transgênica, caracterizada pelo fato de que tem rendimento aumentado em relação às plantas de controle, o dito rendimento aumentado resultando da expressão aumentada em partes acima do solo de uma planta de uma seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase.
79. Planta de acordo com as reivindicações 72, 76 ou 78, caracterizada pelo fato de que a dita planta é uma planta de cultivo ou uma monocotiledônea ou um cereal, tal como arroz, milho, trigo, cevada, painço, centeio, sorgo e aveia.
80. Partes colhiveis de uma planta de acordo com qualquer uma das reivindicações 72, 76, 78 ou 79, caracterizadas pelo fato de que as ditas partes colhíveis são sementes.
81. Produtos, caracterizados pelo fato de serem derivados de uma planta como definida na reivindicação 79 e/ou de partes colhíveis de uma planta como definidas na reivindicação 80.
82. Uso de uma seqüência de ácido nucleico que codifica um polipeptídeo de cpFBPase, caracterizado pelo fato de ser no aumento do rendimento de planta em relação às plantas de controle.
83. Uso de acordo com a reivindicação 82, caracterizado pelo fato de que o dito rendimento aumentado da planta é selecionado de um ou mais de: i) peso de semente aumentado; ii) número de sementes cheias aumentado; iii) taxa de enchimento de semente aumentada; e iv) índice de colheita aumentado.
84. Método para melhorar vários traços relacionados com o rendimento em plantas em relação às plantas de controle, caracterizado pelo fato de que compreende modular a expressão em uma planta de um ácido nucleico de quinase indutível pequena (SIK) e/ou um polipeptídeo de SIK, em que o dito traço relacionado com o rendimento é um aumento no número de flores por planta quando a dita expressão modulada consiste da superexpressão em uma planta de um ácido nucleico que codifica um polipeptídeo de SIK e em que o dito traço relacionado com o rendimento é um ou mais de peso de mil grãos aumentado (TKW), índice de colheita aumentado (HI) e taxa de enchimento aumentada quando a dita expressão modulada consiste de uma redução ou eliminação substancial da expressão de um gene SIK endógeno em uma planta.
85. Método de acordo com a reivindicação 84, caracterizado pelo fato de que a dita redução ou eliminação substanciais da expressão de um gene SIK endógeno é efetuada pelo silenciamento mediado por RNA da expressão de gene.
86. Método de acordo com a reivindicação 85, caracterizado pelo fato de que o dito silenciamento mediado por RNA é efetuado pela co- supressão.
87. Método de acordo com a reivindicação 85, caracterizado pelo fato de que o dito silenciamento mediado por RNA é efetuado pelo uso de seqüências de ácido nucleico SIK de anti-sentido.
88. Método de acordo com as reivindicações 84 ou 85, caracterizado pelo fato de que a dita redução ou eliminação substanciais da expressão de um gene SIK endógeno é efetuada usando uma repetição invertida de um ácido nucleico de SIK, preferivelmente capaz de formar uma estrutura de grampo de cabelo.
89. Método de acordo com qualquer uma das reivindicações de 84 a 88, caracterizado pelo fato de que o dito gene SIK endógeno ou ácido nucleico de SIK usados na redução ou eliminação substanciais da expressão de um gene SIK endógeno é de uma fonte vegetal ou fonte artificial.
90. Método de acordo com a reivindicação 89, caracterizado pelo fato de que o dito ácido nucleico de SIK é de uma planta monocotiledônea e é usado para a transformação de plantas monocotiledôneas ou é de uma planta dicotiledônea e é usado para a transformação de plantas dicotiledôneas.
91. Método de acordo com a reivindicação 90, caracterizado pelo fato de que o dito ácido nucleico de SIK é da família Poaceae e é usado para a transformação de plantas da família Poaceae, mais preferivelmente em que o dito ácido nucleico de SIK é do arroz e é usado para transformar plantas de arroz.
92. Método de acordo com qualquer uma das reivindicações de 89 a 91, caracterizado pelo fato de que o dito ácido nucleico compreende um comprimento suficiente de nucleotídeos substancialmente contíguos da SEQ ID NO: 209 ou SEQ ID NO: 211 ou qualquer uma das SEQ ID NOs 213 a 225 ou qualquer um dos ácidos nucleicos dados na Tabela8 ou Tabela 9.
93. Método de acordo com a reivindicação 84, caracterizado pelo fato de que a dita superexpressão é efetuada pela introdução e expressão em uma planta de um ácido nucleico que codifica um polipeptídeo de SIK.
94. Método de acordo com as reivindicações 84 ou 93, caracterizado pelo fato de que o dito polipeptídeo de SIK é representado pela SEQ ID NO: 210 ou um ortólogo ou parálogo desta.
95. Método de acordo com as reivindicações 84, 93 ou 94, caracterizado pelo fato de que o dito polipeptídeo de SIK compreende um ou mais de, preferivelmente todos dos seguintes: (i) uma região de ligação de ATP; (ii) uma assinatura de sítio ativo da serina treonina quinase; (iii) um domínio rico em serina; (iv) um ou mais sítios de miristoilação; (v) atividade de quinase.
96. Planta, parte de planta ou célula vegetal da mesma, caracterizadas pelo fato de que são obteníveis por um método como definido em qualquer uma das reivindicações de 84 a 92 em que a dita planta, parte de planta ou célula vegetal da mesma têm expressão reduzida de um gene SIK endógeno usando uma seqüência de ácido nucleico de SIK e tendo um ou mais de peso de mil grãos aumentado (TKW), índice de colheita aumentado (HI) e taxa de enchimento aumentada em relação às plantas de controle.
97. Planta, parte de planta ou célula vegetal da mesma, caracterizadas pelo fato de que são obteníveis por um método como definido em qualquer uma das reivindicações de 93 a 95, e que a dita planta, parte de planta ou célula vegetal da mesma tem expressão aumentada de um ácido nucleico que codifica SIK em relação às plantas de controle e tem um número de flores aumentado por plantas em relação às plantas de controle.
98. Construção, caracterizada pelo fato de que compreende: (a) um ácido nucleico que codifica um polipeptídeo de SIK representado pela SEQ ID NO: 210 ou um ortólogo ou parálogo deste; (b) uma ou mais seqüências de controle capazes de direcionar a expressão da seqüência de ácido nucleico de (a); e opcionalmente (c) uma seqüência de terminação de transcrição.
99. Construção de acordo com a reivindicação 98, caracterizada pelo fato de que a dita seqüência de controle compreende um promotor constitutivo, preferivelmente um promotor GOS2 do arroz, preferivelmente um promotor tendo perfil de expressão comparável ao promotor da SEQ ID NO: 56 ou SEQ ID NO: 226.
100. Construção para a expressão reduzida em uma planta de um gene SIK endógeno caracterizada pelo fato de compreender uma ou mais seqüências de controle, um ácido nucleico de SIK e opcionalmente uma seqüência de terminação de transcrição.
101. Construção de acordo com a reivindicação 100, caracterizada pelo fato de que o dito ácido nucleico de SIK é uma repetição invertida, preferivelmente capaz de formar uma estrutura de grampo de cabelo, repetição invertida esta que está sob o controle de um promotor constitutivo.
102. Construção de acordo com a reivindicação 101, caracterizada pelo fato de que o dito promotor constitutivo é um promotor de GOS2 do arroz, preferivelmente um promotor tendo perfil de expressão comparável ao promotor da SEQID NO: 56 ou SEQ ID NO: 226.
103. Planta, parte de planta ou célula vegetal, caracterizadas pelo fato de que são transformadas com uma construção como definida em qualquer uma das reivindicações de 98 a 102.
104. Método para a produção de uma planta transgênica tendo número de flores aumentado por planta em relação às plantas de controle, caracterizado pelo fato de que compreende: (i) introduzir e expressar em uma planta um ácido nucleico que codifica um polipeptídeo de SIK representado pela SEQ ID NO: 210 ou um ortólogo ou parálogo desta; e (ii) cultivar a célula vegetal sob condições que promovam o crescimento e desenvolvimento da planta.
105. Método para a produção de uma planta transgênica tendo um ou mais de peso de mil grãos aumentado (TKW), índice de colheita aumentado (HI) e rendimento aumentado de taxa de enchimento aumentado em relação às plantas de controle, caracterizado pelo fato de que compreende: (i) introduzir e expressar em uma planta, parte de planta ou célula vegetal uma construção genética que compreende uma ou mais seqüências de controle para reduzir a expressão em uma planta de um gene SIK endógeno usando uma seqüência de ácido nucleico de SIK; e (ii) cultivar a planta, parte de planta ou célula vegetal sob condições que promovam o crescimento e desenvolvimento da planta.
106. Planta transgênica tendo um número de flores aumentado por planta em relação às plantas de controle, caracterizada pelo fato de que a dita planta tem expressão aumentada de um ácido nucleico que codifica um polipeptídeo de SIK comparado com as plantas de controle.
107. Planta transgênica tendo um ou mais de peso de mil grãos aumentado (TKW), índice de colheita aumentado (HI) e rendimento de taxa de enchimento aumentado em relação às plantas de controle, caracterizada pelo fato de que a dita planta tem expressão de um gene SIK endógeno reduzida comparada com plantas de controle.
108. Planta transgênica de acordo com as reivindicações 96, 97, 103, 106 ou 107, caracterizada pelo fato de que a dita planta é uma planta monocotiledônea, tal como cana de açúcar ou em que a planta é um cereal, tal como arroz, milho, trigo, cevada, painço, centeio, aveia ou sorgo.
109. Partes colhíveis de uma planta transgênica, caracterizadas pelo fato de que a planta transgênica é como definida na reivindicação 108.
110. Partes colhíveis de acordo com a reivindicação 109, caracterizadas pelo fato de que as ditas partes colhíveis são sementes.
111. Produtos, caracterizados pelo fato de serem derivados de uma planta como definida na reivindicação 108 ou de partes colhíveis como definidas na reivindicação 110.
112. Uso de um ácido nucleico que codifica SIK, caracterizado pelo fato de ser para aumentar o número de flores por planta em relação às plantas de controle pela superexpressão de um ácido nucleico que codifica SIK em uma planta.
113. Uso de um ácido nucleico de SIK, caracterizado pelo fato de ser para aumentar um ou mais de peso de mil grãos (TKW), índice de colheita (HI) e rendimento de taxa de enchimento em relação às plantas de controle pela redução ou eliminação substanciais em uma planta de um gene SIK endógeno.
114. Método para modificar o teor de compostos de armazenagem em sementes em relação às plantas de controle, caracterizado pelo fato de que compreende modular a expressão em uma planta de um ácido nucleico que codifica um fator de transcrição de HD-Zip de Classe II.
115. Método de acordo com a reivindicação 114, caracterizado pelo fato de que o dito fator de transcrição de HD-Zip de Classe II compreende os seguintes: (i) uma caixa de homeodomínio; (ii) um zíper de leucina; e (iii) Motivos I, II e III em qualquer ordem - Motivo I: RKKLRL ou Motivo I com uma ou mais substituições de aminoácido conservativas em qualquer posição, e/ou Motivo I com uma ou duas mudanças não conservativas em qualquer posição; e - Motivo II: TKLKQTEVDCEFLRRCCENLTEEN ou Motivo II com uma ou mais substituições de aminoácido conservativas em qualquer posição, e/ou um motivo tendo em ordem crescente de preferência pelo menos 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% ou mais de identidade de seqüência ao Motivo II; e - Motivo III: TLTMCPSCER ou Motivo III com uma ou mais substituições de aminoácido conservativa em qualquer posição, e/ou Motivo III com uma, duas ou três mudanças não conservativas em qualquer posição.
116. Método de acordo com as reivindicações 114 ou 115, caracterizado pelo fato de que o dito ácido nucleico que codifica um fator de transcrição de HD-Zip de Classe II é qualquer uma das seqüências de ácido nucleico dadas na Tabela H ou uma porção destas ou uma seqüência capaz de hibridizar com qualquer um dos ácidos nucleicos dados na Tabela H.
117. Método de acordo com qualquer uma das reivindicações de 114 a 116, caracterizado pelo fato de que a dita expressão modulada é efetuada por qualquer uma ou mais de ativação de rotulação de T-DNA, TILLING ou recombinação homóloga.
118. Método de acordo com qualquer uma das reivindicações de 114 a 117, caracterizado pelo fato de que a dita expressão modulada é efetuada pela introdução e expressão em uma planta de um ácido nucleico que codifica um fator de transcrição de HD-Zip de Classe II.
119. Método de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que o dito teor modificado de compostos de armazenagem compreende sementes tendo um teor modificado de um ou mais de lipídeos, óleo, ácidos graxos, amido, açúcar e proteínas em relação àqueles de plantas de controle.
120. Método de acordo com a reivindicação 119, caracterizado pelo fato de que o dito teor modificado é o teor de óleo aumentado em relação às sementes de plantas de controle.
121. Método de acordo com qualquer uma das reivindicações de 118 a 120, caracterizado pelo fato de que o dito ácido nucleico está operavelmente ligado a um promotor constitutivo, preferivelmente a um promotor de GOS2.
122. Método de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que o dito ácido nucleico que codifica um fator de transcrição de HD-Zip de Classe II é de origem vegetal, preferivelmente de uma planta dicotiledônea, mais preferivelmente da família Brassicaceae, mais preferivelmente de Arabidopsis thaliana.
123. Planta ou parte da mesma incluindo sementes obteníveis por um método como definido em qualquer uma das reivindicações precedentes, caracterizada pelo fato de que a dita planta ou parte da mesma compreende um ácido nucleico que codifica um fator de transcrição de HD- Zip de Classe II.
124. Construção, caracterizada pelo fato de que compreende: (i) um ácido nucleico que codifica um fator de transcrição de HD-Zip de Classe II como definido acima; (ii) uma ou mais seqüências de controle operavelmente ligadas ao ácido nucleico de (i).
125. Construção de acordo com a reivindicação 124, caracterizada pelo fato de que as ditas uma ou mais seqüências de controle são pelo menos um promotor constitutivo, preferivelmente um promotor GOS2.
126. Construção de acordo com as reivindicações 124 ou 125, caracterizada pelo fato de que o dito ácido nucleico que codifica um fator de transcrição de HD-Zip de Classe II é qualquer uma das seqüências de ácido nucleico dadas na Tabela H ou qualquer seqüência de ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de polipeptídeo dadas na Tabela H.
127. Uso de uma construção como definido em qualquer uma das reivindicações de 124 a 126, caracterizado pelo fato de ser para fabricar plantas tendo teor de armazenagem de semente modificado em relação às plantas de controle.
128. Planta, parte de planta ou célula vegetal, caracterizadas pelo fato de serem transformadas com uma construção como definida em qualquer uma das reivindicações de 124 a 127.
129. Método para a produção de uma planta transgênica tendo teor modificado de compostos de armazenagem em sementes em relação às plantas de controle, caracterizado pelo fato de que compreende: (i) introduzir e expressar em uma planta, parte de planta ou célula vegetal um ácido nucleico que codifica um fator de transcrição de HD- Zip de Classe II, preferivelmente uma seqüência de ácido nucleico dada na Tabela H ou que compreendem introduzir e expressar em uma planta uma seqüência de ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na Tabela H; e (ii) cultivar a célula vegetal sob condições que promovam crescimento e desenvolvimento da planta; e (iii) colher sementes da planta de (ii); e opcionalmente (iv) extração de qualquer um ou mais de lipídeos, óleos, ácidos graxos, amido, açúcar ou proteína das sementes de (iii).
130. Planta transgênica, caracterizada pelo fato de que tem teor modificado de compostos de armazenagem em sementes em relação às plantas de controle, o dito teor modificado resultando da expressão aumentada de um ácido nucleico que codifica um fator de transcrição de HD-Zip de Classe II.
131. Planta transgênica de acordo com a reivindicação 123, 128 ou 130, caracterizada pelo fato de que a dita planta é uma planta de cultivo cultivada para a produção de óleo, preferivelmente colza, canola, linhaça, soja, girassol, milho, aveia, centeio, cevada, trigo, pimenta, tagetes, algodão, dendê, coqueiro, linho, mamona, amendoim, oliva, abacate, gergelim, jatropha.
132. Partes colhíveis de uma planta como definida na reivindicação 131, caracterizadas pelo fato de que são sementes.
133. Produtos derivados de uma planta como definida na reivindicação 131 e/ou de partes colhíveis de uma planta como definidas na reivindicação 132, caracterizados pelo fato de que preferivelmente são um ou mais de lipídeos, óleos, ácidos graxos, amido, açúcar e proteínas.
134. Uso de um ácido nucleico que codifica um fator de transcrição de HD-Zip de Classe II, caracterizado pelo fato de ser na modificação do teor de compostos de armazenagem em sementes em relação às plantas de controle.
135. Uso de acordo com a reivindicação 134, caracterizado pelo fato de que o dito fator de transcrição de HD-Zip de Classe II é uma seqüência de ácido nucleico dada na Tabela H ou é uma seqüência de ácido nucleico que codifica um ortólogo, parálogo ou homólogo de qualquer uma das seqüências de aminoácido dadas na Tabela H.
136. Método para intensificar traços relacionados com o rendimento em plantas, caracterizado pelo fato de que compreende modular a expressão em uma planta de um ácido nucleico que codifica uma proteína de SYB1, em que a seqüência da dita proteína de SYB1 compreende 3 domínios de dedo de zinco do tipo RanBP e opcionalmente um ou mais domínios de baixa complexidade, mas nenhum outro domínio que não se sobreponha com os ditos domínios de dedo de zinco.
137. Método de acordo com a reivindicação 136, caracterizado pelo fato de que o dito ácido nucleico que codifica uma proteína de SYB1 é qualquer um dos ácido nucleico SEQ ID NOs dados na Tabela J ou uma porção destes ou uma seqüência capaz de hibridizar com qualquer um dos ácidos nucleicos SEQ ID NOs dados na Tabela J.
138. Método de acordo com as reivindicações 136 ou 137, caracterizado pelo fato de que a dita expressão modulada é efetuada por qualquer um ou mais de ativação da rotulação de T-DNA, TILLING, mutagênese direcionada ao sítio, evolução direta ou recombinação homóloga.
139. Método de acordo com as reivindicações 136 ou 137, caracterizado pelo fato de que a dita expressão modulada é efetuada pela introdução e expressão em uma planta de um ácido nucleico que codifica a proteína SYB1, e em que a seqüência da dita proteína SYBl compreende 3 domínios de dedo de zinco do tipo RanBP e opcionalmente um ou mais domínios de baixa complexidade, mas nenhum outro domínio que não se sobreponha com os ditos domínios de dedo de zinco.
140. Método de acordo com qualquer uma das reivindicações de 136 a 139, caracterizado pelo fato de que o dito traço relacionado com o rendimento intensificado é o rendimento de semente aumentado.
141. Método de acordo com as reivindicações 139 ou 140, caracterizado pelo fato de que o dito ácido nucleico é operavelmente ligado a um promotor constitutivo, preferivelmente a um promotor GOS2.
142. Método de acordo com qualquer uma das reivindicações de 136 a 141, caracterizado pelo fato de que o dito ácido nucleico que codifica uma proteína SYBl é de origem vegetal, preferivelmente de uma planta dicotiledônea, mais preferivelmente da família Brassicaceae, mais preferivelmente do gênero Arabidopsis, o mais preferivelmente de Arabidopsis thaliana.
143. Planta ou parte da mesma incluindo sementes obteníveis por um método como definido em qualquer uma das reivindicações de 136 a 142, a dita planta ou parte da mesma caracterizadas pelo fato de que compreendem um ácido nucleico recombinante que codifica uma proteína de SYB1.
144. Construção, caracterizada pelo fato de que compreende: (i) ácido nucleico que codifica uma proteína de SYB1, em que a seqüência de aminoácido da dita proteína de SYBl compreende 3 domínios de dedo de zinco do tipo RanBP e opcionalmente um ou mais domínios de baixa complexidade, mas nenhum outro domínio que não se sobreponha com os ditos domínios de dedo de zinco; (ii) uma ou mais seqüências de controle capazes de direcionar a expressão da seqüência de ácido nucleico de (a); e opcionalmente (iii) uma seqüência de terminação de transcrição.
145. Construção de acordo com a reivindicação 144, caracterizada pelo fato de que as ditas uma ou mais seqüências de controle são pelo menos um promotor constitutivo, preferivelmente um promotor de GOS2.
146. Uso de uma construção como definida nas reivindicações 144 ou 145, caracterizado pelo fato de ser para fabricar plantas tendo traços intensificados relacionados com o rendimento, particularmente rendimento de semente aumentado, em relação às plantas de controle.
147. Planta, parte de planta ou célula vegetal, caracterizadas pelo fato de que são transformadas com uma construção como definida na reivindicação 144 ou 145.
148. Método para a produção de uma planta transgênica tendo traços intensificados relacionados com o rendimento em relação às plantas de controle, caracterizado pelo fato de que compreende: (i) introduzir e expressar em uma planta um ácido nucleico que codifica uma proteína de SYB1, em que a seqüência de aminoácido da dita proteína de SYB1 compreende 3 domínios de dedo de zinco do tipo RanBP e opcionalmente um ou mais domínios de baixa complexidade, mas nenhum outro domínio que não se sobreponha com os ditos domínios de dedo de zinco; e (ii) cultivar a célula vegetal sob condições que promovam o crescimento e desenvolvimento da planta.
149. Planta transgênica, caracterizada pelo fato de que tem rendimento aumentado em relação às plantas de controle adequadas, o dito rendimento aumentado resultando da expressão aumentada de um ácido nucleico que codifica uma proteína de SYB1, em que a seqüência de aminoácido da dita proteína de SYBl compreende 3 domínios de dedo de zinco do tipo RanBP e opcionalmente um ou mais domínios de baixa complexidade, mas nenhum outro domínio que não se sobreponha com os ditos domínios de dedo de zinco; ou uma célula vegetal derivada da dita planta transgênica.
150. Planta transgênica de acordo com as reivindicações 143, 147 ou 149, caracterizada pelo fato de que a dita planta é uma planta de cultivo ou uma monocotiledônea ou um cereal, tal como arroz, milho, trigo, cevada, painço, centeio, sorgo e aveia; ou uma célula vegetal derivada da dita planta transgênica.
151. Partes colhíveis de uma planta como definida em qualquer uma das reivindicações de 143, 147, 149 ou 150, caracterizadas pelo fato de que as ditas partes colhíveis são preferivelmente sementes.
152. Produtos, caracterizados pelo fato de serem derivados de uma planta como definida na reivindicação 150 e/ou de partes colhíveis de uma planta como definidas na reivindicação 151.
153. Uso de um ácido nucleico que codifica uma proteína SYB1, caracterizado pelo fato de ser na intensificação de traços relacionados com o rendimento em plantas, em que a seqüência de aminoácido da dita proteína SYBl compreende 3 domínios de dedo de zinco do tipo RanBP e opcionalmente um ou mais domínios de baixa complexidade, mas nenhum outro domínio que não se sobrepõem com os ditos domínios de dedo de zinco.
154. Uso de acordo com a reivindicação 153, caracterizado pelo fato de que o dito traço relacionado com rendimento é o rendimento de semente aumentado em relação às plantas de controle.
BRPI0714723-6A 2003-08-02 2007-08-02 mÉtodos para aumentar o rendimento de semente de plantas e o rendimento da planta, para melhorar vÁrios traÇos e para intensificar traÇos relacionados co o rendimento em plantas, para modificar o teor de compostos de armazenagem em sementes, e para a produÇço de uma planta transgÊnica, construÇço, partes colhÍveis, produtos, usos de um Ácido nucleico/gene de az ou variante dos mesmos ou uso de um polipeptÍdeo de az ou um homàlogo do mesmo, de uma construÇço, de uma seqÜÊncia de Ácido nucleico de syt ou uso de um polipeptÍdeo de syt, de uma seqÜÊncia de Ácido nucleico e de um Ácido nucleico, planta, parte de planta ou cÉlula vegetal, seqÜÊncia de Ácido nucleico isolada, planta, partes e cÉlulas de tais plantas BRPI0714723A2 (pt)

Applications Claiming Priority (23)

Application Number Priority Date Filing Date Title
EP06118347.1 2006-08-02
EP06118347 2006-08-02
US83680406P 2006-08-10 2006-08-10
US60/836804 2006-08-10
EP06120994 2006-09-20
EP06120994.6 2006-09-20
EP06121856 2006-10-05
EP06121856.6 2006-10-05
EP06121928.3 2006-10-06
EP06121928 2006-10-06
US85125806P 2006-10-12 2006-10-12
US85125006P 2006-10-12 2006-10-12
US85126506P 2006-10-12 2006-10-12
US60/851265 2006-10-12
US30/851250 2006-10-12
US60/851258 2006-10-12
EP06123066.0 2006-10-27
EP06123066 2006-10-27
US85971706P 2006-11-17 2006-11-17
US60/859717 2006-11-17
US86809506P 2006-12-01 2006-12-01
US60/868095 2006-12-01
PCT/EP2007/058043 WO2008015263A2 (en) 2006-08-02 2007-08-02 Plants having improved characteristics and a method for making the same

Publications (1)

Publication Number Publication Date
BRPI0714723A2 true BRPI0714723A2 (pt) 2013-05-14

Family

ID=48327922

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0714723-6A BRPI0714723A2 (pt) 2003-08-02 2007-08-02 mÉtodos para aumentar o rendimento de semente de plantas e o rendimento da planta, para melhorar vÁrios traÇos e para intensificar traÇos relacionados co o rendimento em plantas, para modificar o teor de compostos de armazenagem em sementes, e para a produÇço de uma planta transgÊnica, construÇço, partes colhÍveis, produtos, usos de um Ácido nucleico/gene de az ou variante dos mesmos ou uso de um polipeptÍdeo de az ou um homàlogo do mesmo, de uma construÇço, de uma seqÜÊncia de Ácido nucleico de syt ou uso de um polipeptÍdeo de syt, de uma seqÜÊncia de Ácido nucleico e de um Ácido nucleico, planta, parte de planta ou cÉlula vegetal, seqÜÊncia de Ácido nucleico isolada, planta, partes e cÉlulas de tais plantas

Country Status (1)

Country Link
BR (1) BRPI0714723A2 (pt)

Similar Documents

Publication Publication Date Title
ES2390919T3 (es) Plantas que tienen rasgos relacionados con el rendimiento mejorados y un método para elaborar las mismas
US20160369293A1 (en) Plants having improved characteristics and method for making the same
US9617557B2 (en) Plants having increased yield-related traits by expressing a growth-regulating factor (GRF) polypeptide and method for making the same
ES2542311T3 (es) Plantas que tienen rasgos potenciados relacionados con el rendimiento y un procedimiento de producción de las mismas
US8748699B2 (en) Plants having enhanced yield-related traits and a method for making the same by overexpressing a polynucleotide encoding a TFL1-like protein
ES2485384T3 (es) Plantas que tienen rasgos potenciados relacionados con el rendimiento y/o mayor resistencia al estrés abiótico y un procedimiento para fabricar las mismas
US8697948B2 (en) Plants having enhanced yield-related traits and a method for making the same
ES2440265T3 (es) Plantas que tienen un aumento de características relacionadas con el rendimiento y un método para elaboración de las mismas
US20150232874A1 (en) Plants having enhanced yield-related traits and a method for making the same
US20140189910A1 (en) Plants having enhanced yield-related traits and a method for making the same
US8946512B2 (en) Plants having enhanced yield-related traits and a method for making the same
MX2008015093A (es) Plantas que tienen caracteristicas relacionadas con rendimiento mejorado y un metodo para formar las mismas.
MX2011002675A (es) Plantas que tienen rasgos mejorados relacionados con el rendimiento y un metodo para obtenerlas.
BRPI0615941A2 (pt) método para aumentar o rendimento de planta em relação às plantas de controle, planta, construção, método para a produção de uma planta transgênica, planta transgênica, partes colhìveis de uma planta, produtos, uso de um ácido nucleico/gene oslea3a ou variante do mesmo ou uso de um polipeptìdeo oslea3a ou um homólogo do mesmo, e, semente de planta
BRPI0808415A2 (pt) Métodos para aperfeiçoar características relacionadas ao rendimento em plantas em relação às plantas de controle, e para produzir uma planta transgênica, planta, parte de planta ou célula de planta, construto, usos de um construto, de um ácido nucléico, e de uma seqüência de ácido nucléico, planta transgênica, partes colhíveis de uma planta, e, produtos.
MX2011006178A (es) Plantas que tienen mejores rasgos relacionados con el rendimiento y/o mejor tolerancia al estres abiotico y un metodo para producirlas.
US20090222952A1 (en) Plants Having Improved Growth Characteristics And A Method For Making The Same
ES2451669T3 (es) Plantas que tienen características mejoradas y un procedimiento de fabricación de las mismas
BRPI0714723A2 (pt) mÉtodos para aumentar o rendimento de semente de plantas e o rendimento da planta, para melhorar vÁrios traÇos e para intensificar traÇos relacionados co o rendimento em plantas, para modificar o teor de compostos de armazenagem em sementes, e para a produÇço de uma planta transgÊnica, construÇço, partes colhÍveis, produtos, usos de um Ácido nucleico/gene de az ou variante dos mesmos ou uso de um polipeptÍdeo de az ou um homàlogo do mesmo, de uma construÇço, de uma seqÜÊncia de Ácido nucleico de syt ou uso de um polipeptÍdeo de syt, de uma seqÜÊncia de Ácido nucleico e de um Ácido nucleico, planta, parte de planta ou cÉlula vegetal, seqÜÊncia de Ácido nucleico isolada, planta, partes e cÉlulas de tais plantas
MX2008006975A (en) Plants having improved growth characteristics and methods for making the same
BRPI0718898A2 (pt) Método para melhorar características relacionadas ao rendimento em plantas, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico

Legal Events

Date Code Title Description
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]
B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]