BR112020021399A2 - Proteínas mads box e aprimoramento de características agronômicas em plantas - Google Patents

Proteínas mads box e aprimoramento de características agronômicas em plantas Download PDF

Info

Publication number
BR112020021399A2
BR112020021399A2 BR112020021399-3A BR112020021399A BR112020021399A2 BR 112020021399 A2 BR112020021399 A2 BR 112020021399A2 BR 112020021399 A BR112020021399 A BR 112020021399A BR 112020021399 A2 BR112020021399 A2 BR 112020021399A2
Authority
BR
Brazil
Prior art keywords
plant
fact
polynucleotide
polypeptide
amino acid
Prior art date
Application number
BR112020021399-3A
Other languages
English (en)
Inventor
Carlos M. La Rota
Rosana Melo
Bo Shen
Carl Simmons
Jingrui Wu
Original Assignee
Pioneer Hi-Bred International, Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Hi-Bred International, Inc. filed Critical Pioneer Hi-Bred International, Inc.
Priority claimed from PCT/US2019/027782 external-priority patent/WO2019204373A1/en
Publication of BR112020021399A2 publication Critical patent/BR112020021399A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8262Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield involving plant development
    • C12N15/8269Photosynthesis
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Physiology (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

trata-se de composições que compreendem polinucleotídeos que codificam polipeptídeos. também são fornecidos construtos de dna recombinante, plantas, células vegetais, sementes, grãos que compreendem os polinucleotídeos e plantas, células vegetais, sementes, grãos que compreendem uma modificação genética em um locus genômico que codifica um polipeptídeo. além disso, vários métodos de empregar os polinucleotídeos e modificações genéticas em plantas, tais como métodos para modular o nível de expressão em uma planta e métodos para aumentar o rendimento de uma planta também são fornecidos no presente documento.

Description

PROTEÍNAS MADS BOX E APRIMORAMENTO DE CARACTERÍSTICAS AGRONÔMICAS EM PLANTAS REFERÊNCIA À LISTAGEM DE SEQUÊNCIAS APRESENTADA ELETRONICAMENTE
[0001] A cópia oficial da listagem de sequências é enviada eletronicamente através de EFS-Web como uma listagem de sequências em formato ASCII com um arquivo nomeado 7845WOPCT_ST25.txt, criado em 11 de abril de 2019, e que tem um tamanho de 118 quilobytes e é depositado simultaneamente com o relatório descritivo. A listagem de sequências compreendida neste documento em formato ASCII faz parte do relatório descritivo e está incorporada ao presente documento em sua totalidade a título de referência.
CAMPO TÉCNICO
[0002] Esta invenção se refere a composições e métodos para melhorar o rendimento em plantas.
ANTECEDENTES
[0003] A demanda global e o consumo de culturas agrícolas estão aumentando em um ritmo rápido. Consequentemente, existe a necessidade de desenvolver novas composições e métodos para aumentar o rendimento nas plantas. Esta invenção fornece tais composições e métodos. Vários polipeptídeos vegetais MADS-box são fornecidos aqui.
SUMÁRIO
[0004] São fornecidos aqui polinucleotídeos que codificam um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% a 99% idêntica a um aminoácido ou à sequência de comprimento total selecionada dentre o grupo que consiste nas SEQ ID NOS: 1 a 10, 12 a 51.
[0005] Também são fornecidos construtos de DNA recombinante que compreendem um elemento regulador operacionalmente ligado a um polinucleotídeo que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 80% idêntica a uma sequência de aminoácidos ou à sequência de comprimento total selecionada dentre o grupo que consiste nas SEQ ID NOS: 1 a 10, 12 a 51. Em certas concretizações, o elemento regulador é um promotor heterólogo, como, por exemplo, o promotor GOS2 moderadamente constitutivo.
[0006] São fornecidas células vegetais, plantas e sementes que compreendem o polinucleotídeo que codifica um polipeptídeo ou o construto de DNA recombinante que compreende um elemento regulador operacionalmente ligado ao polinucleotídeo que codifica um polipeptídeo. Em certas concretizações, o elemento regulador é um promotor heterólogo. Em certas concretizações, a planta e/ou a semente é de uma planta monocotiledônea. Em certas concretizações, a planta é uma planta monocotiledônea. Em certas concretizações, a planta monocotiledônea é milho.
[0007] São fornecidas, ainda, células vegetais, plantas e sementes que compreendem uma modificação genética direcionada em um locus genômico que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 80% idêntica a uma sequência de aminoácidos selecionada dentre o grupo que consiste nas SEQ ID NOS: 1 a 10, 12 a 51, em que a modificação genética aumenta o nível e/ou a atividade do polipeptídeo codificado. Em certas concretizações, a modificação genética é selecionada dentre o grupo que consiste em uma inserção, deleção, polimorfismo de nucleotídeo único (SNP) e uma modificação de polinucleotídeo. Em certas concretizações, a modificação genética direcionada está presente (a) na região de codificação; (b) em uma região não codificadora; (c) em uma sequência reguladora; (d) em uma região não traduzida; ou (e) em qualquer combinação de (a) a (d) do locus genômico que codifica o polipeptídeo. Em certas concretizações, a planta e/ou a semente é de uma planta monocotiledônea. Em certas concretizações, a planta é uma planta monocotiledônea. Em certas concretizações, a planta monocotiledônea é milho.
[0008] São fornecidos métodos para aumentar o rendimento em uma planta expressando-se em uma célula vegetal regenerável um construto de DNA recombinante que compreende um elemento regulador operacionalmente ligado a um polinucleotídeo que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 80% idêntica a uma sequência de aminoácidos selecionada dentre o grupo que consiste nas SEQ ID NOS: 1 a 10, 12 a 51; e gerar a planta, em que a planta compreende em seu genoma o construto de DNA recombinante. Em certas concretizações, o elemento regulador é um promotor heterólogo. Em certas concretizações, a planta é uma planta monocotiledônea. Em certas concretizações, a planta monocotiledônea é milho. Em certas concretizações, o rendimento é rendimento de grãos.
[0009] São fornecidos ainda métodos para aumentar o rendimento em uma planta introduzindo-se em uma célula vegetal regenerável uma modificação genética direcionada em um locus genômico que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% idêntica a uma sequência de aminoácidos ou a sequência de comprimento total selecionada dentre o grupo que consiste nas SEQ ID NOS: 1 a 10, 12 a 51; e gerar a planta, em que o nível e/ou a atividade do polipeptídeo codificado é aumentada na planta. Em certas concretizações, a modificação genética direcionada é introduzida com o uso de uma técnica de modificação de genoma selecionada dentre o grupo que consiste em uma endonuclease guiada por polinucleotídeo, endonucleases CRISPR-Cas, desaminases de edição de base, uma nuclease de dedo de zinco, uma nuclease efetora semelhante a ativador de transcrição (TALEN), uma meganuclease sítio-específica geneticamente modificada ou uma Argonaute. Em certas concretizações, a modificação genética direcionada está presente (a) na região de codificação; (b) em uma região não codificadora; (c) em uma sequência reguladora; (d) em uma região não traduzida; ou (e) em qualquer combinação de (a) a (d) do locus genômico que codifica o polipeptídeo. Em certas concretizações, a célula vegetal é de uma planta monocotiledônea. Em certas concretizações, a planta monocotiledônea é milho. Em certas concretizações, o rendimento é rendimento de grãos.
[0010] São fornecidos métodos para aumentar a atividade fotossintética em uma planta expressando-se em uma célula vegetal regenerável um construto de DNA recombinante que compreende um elemento regulador operacionalmente ligado a um polinucleotídeo que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 80%
a 98% idêntica a uma sequência de aminoácidos selecionada dentre o grupo que consiste nas SEQ ID NOS: 1 a 10, 12 a 51; e gerar a planta, em que a planta compreende em seu genoma o construto de DNA recombinante. Em certas concretizações, o elemento regulador é um promotor heterólogo. Em certas concretizações, a planta é uma planta monocotiledônea. Em certas concretizações, a planta monocotiledônea é milho.
[0011] Também são fornecidos métodos para aumentar a atividade fotossintética em uma planta introduzindo-se em uma célula vegetal regenerável uma modificação genética direcionada em um locus genômico que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 80% a cerca de 98% idêntica a um aminoácido sequência selecionada dentre o grupo que consiste nas SEQ ID NOS: 1 a 10, 12 a 51; e gerar a planta, em que o nível e/ou a atividade do polipeptídeo codificado é aumentada na planta. Em certas concretizações, a modificação genética direcionada é introduzida com o uso de uma técnica de modificação de genoma selecionada dentre o grupo que consiste em uma endonuclease guiada por polinucleotídeo, endonucleases CRISPR-Cas, desaminases de edição de base, uma nuclease de dedo de zinco, uma nuclease efetora semelhante a ativador de transcrição (TALEN), uma meganuclease sítio-específica geneticamente modificada ou uma Argonaute. Em certas concretizações, a modificação genética direcionada está presente em (a) a região de codificação; (b) uma região não codificadora; (c) uma sequência reguladora; (d) uma região não traduzida; ou (e) qualquer combinação de (a) a (d) do locus genômico que codifica o polipeptídeo. Em certas concretizações, a célula vegetal é de uma planta monocotiledônea. Em certas concretizações, a planta monocotiledônea é milho.
BREVE DESCRIÇÃO DOS DESENHOS E LISTAGEM DE SEQUÊNCIAS
[0012] A Figura 1 demonstra o rendimento de nove linhagens de milho que aumentaram a expressão de Os-MADS18 em teste de rendimento em múltiplas localizações. Os valores plotados são aumento de rendimento em quilogramas/hectare (bushels/acre) de eventos transgênicos em relação aos controles. * indica P < 0,1. O rendimento base (rendimento dos controles) foi de 11.549,68 quilogramas/hectare (184 bushels/acre). Os dados são mostrados com a análise BLUP em 8 localizações.
[0013] A Figura 2 demonstra o rendimento de quatro linhagens de milho que têm a expressão aumentada de SB-MADS28 em teste de rendimento em múltiplas localizações. Os valores plotados são aumento de rendimento em alqueires/acre de eventos transgênicos em relação aos controles. * indica P < 0,1. O rendimento base (rendimento dos controles) foi de
8.913,34 quilogramas/hectare (142 bushels/acre) em condições de baixo N e 10.796,44 quilogramas/hectare (172 bushels/acre) em condições normais de nitrogênio. Os dados são mostrados com análise BLUP.
[0014] A Figura 3 mostra a árvore filogenética de proteínas MADS box relacionadas. Análise filogenética de ZMM28 (Zm00001d022088) com membros do clado AP1-FUL de Arabidopsis e monocotiledôneas representativas. O clado contendo ZMM28 é destacado.
[0015] A invenção pode ser mais completamente entendida a partir da seguinte descrição detalhada e dos desenhos anexos e da Listagem de Sequências, que formam uma parte deste pedido.
[0016] As descrições de sequência e a listagem de sequências anexada aqui estão em conformidade com as regras que regem as revelações de sequência de nucleotídeos e aminoácidos nos pedidos de patente apresentados no título 37 C.F.R. §§1.821 e 1.825. As descrições de sequência compreendem os códigos de três letras para aminoácidos conforme definido no título 37 C.F.R. §§ 1.821 e 1.825, que estão incorporadas ao presente documento a título de referência. Tabela 1: Listagem de Sequências % de Identidade com a SEQ SEQ ID NOS DESCRIÇÃO ID NO: 11 SEQ ID NO: aminoácido OsMADS18 75 1 SEQ ID NO: aminoácido SB-MADS28 94 2 SEQ ID NO: ZM-ZMM28 (ALT1) 99 3 SEQ ID NO: ZM-MADS27 (MOD) 41 4 SEQ ID NO: ZM-ANR1PT 38 5 SEQ ID NO: Sequência AA OS-MADS BOX GENÔMICA 75 6 (ALT1)
SEQ ID NO: Sequência AA OS-MADS BOX GENÔMICA 75 7 (ALT2) SEQ ID NO: Sequência AA OS-MADS BOX GENÔMICA 75 8 (ALT3) SEQ ID NO: Sequência AA OS-MADS BOX GENÔMICA 74 9 (ALT4) SEQ ID NO: isoforma ZMM28 MO17 99 10 SEQ ID NO: Milho Zmm28 100 11 SEQ ID NO: Milho truncado Zmm28 75 12 SEQ ID NO: Panicum virgatum APL3 87 13 SEQ ID NO: Fator de transcrição MADS-box (Setaria 87 14 italica) SEQ ID NO: Fator de transcrição MADS-box 85 15 Dichanthelium oligosanthes SEQ ID NO: Proteína MADS-box Phyllostachys edulis 80 16 SEQ ID NO: Fator de transcrição MADS-box 80 17 Brachypodium distachyon SEQ ID NO: Phyllostachys praecox 79 18 SEQ ID NO: Proteína MADS-box semelhante a Agamous 79 19 Zea mays SEQ ID NO: Proteína MADS-box Hordeum vulgare 78 20 subsp.
Vulgare
SEQ ID NO: Fator de transcrição MADS-box Aegilops 77 21 tauschii subsp.
Tauschii SEQ ID NO: Fator de transcrição MADS-box de 77 22 Triticum aestivum SEQ ID NO: Brachypodium distachyon 77 23 SEQ ID NO: Fator de transcrição MADS-box Triticum 76 24 aestivum SEQ ID NO: MADS Lolium perenne 76 25 SEQ ID NO: Fator de transcrição MADS box Oryza 74 26 sativa EEC82413.1 SEQ ID NO: Fator de transcrição MADS-box 73 27 Brachypodium distachyon AIG21814.1 SEQ ID NO: Fator de transcrição MADS-box Oryza 72 28 brachyantha SEQ ID NO: MADS Hordeum vulgare subsp.
Vulgare 72 29 SEQ ID NO: Fator de transcrição MADS-box Aegilops 71 30 tauschii subsp.
Tauschii SEQ ID NO: Fator de transcrição MADS-box Phoenix 62 31 dactylifera SEQ ID NO: Fator de transcrição MADS-box Elaeis 62 32 guineensis SEQ ID NO: Fator de transcrição MADS-box Ananas 62 33 comosus SEQ ID NO: Alstroemeria ligtu subsp.
Ligtu 61 34
SEQ ID NO: Fator de transcrição Musa acuminata 61 35 subsp.
Malaccensis SEQ ID NO: Tricyrtis sp.
Shinonome 61 36 SEQ ID NO: Fator de transcrição Musa acuminata 61 37 subsp.
Malaccensis (truncated) SEQ ID NO: Proteína semelhante a APETALA1 Alpinia 60 38 oblongifolia SEQ ID NO: Fator de transcrição MADS-box Crocus 60 39 sativus SEQ ID NO: Fator de transcrição truncado Ananas 59 40 comosus SEQ ID NO: Fator de transcrição truncado 59 41 Dendrobium catenatum SEQ ID NO: Fator de transcrição truncado 59 42 Phalaenopsis equestris SEQ ID NO: Lilium formosanum x Lilium longiflorum 58 43 SEQ ID NO: Proteína MADS-box Dendrobium nobile 58 44 SEQ ID NO: Fator de transcrição Musa acuminata 57 45 subsp.
Malaccensis SEQ ID NO: Fator de transcrição Ricinus communis 57 46 SEQ ID NO: Vitis vinifera 57 47 SEQ ID NO: Fator de transcrição MADS-box Tulipa 56 48 gesneriana
SEQ ID NO: Fator de transcrição MADS box Daucus 56 49 carota subsp. Sativus SEQ ID NO: Papaver atlanticum 56 50 SEQ ID NO: Theobroma cacao 55 51 SEQ ID NO: DNA genômico OsMADS18 N/A 52 I. Composições A. Polinucleotídeos e polipeptídeos
[0017] A presente invenção fornece polinucleotídeos que codificam polipeptídeos. Consequentemente, conforme usado no presente documento, "polipeptídeo", "proteína" ou semelhantes, refere-se a uma proteína representada por uma SEQ ID NO.
[0018] Um aspecto da invenção fornece um polinucleotídeo que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 80 a 99%% idêntica à sequência de aminoácidos de qualquer uma das SEQ ID NOS: 1 a 10, 12 a 51).
[0019] A análise filogenética de ZMM28 (Zm00001d022088) com os genes MADS-box do clado AP1-FUL de Arabidopsis, arroz, sorgo, cevada, Brachypodium e milho é mostrada na Figura 1b. Aglomerados ZMM28 com e compartilha 94%, 75%, 69% e 76% de identidade de sequência de aminoácidos com proteínas de sorgo Sb02g038780.1, cevada AK361063 e AK361227 e arroz LOC_Os07g41370.1 (OsMADS18), respectivamente.
[0020] Conforme usado no presente documento, "codificação", "codificado" ou semelhantes, em relação a um ácido nucleico especificado, pretende compreender as informações para tradução na proteína especificada. Um ácido nucleico que codifica uma proteína pode compreender sequências não traduzidas (por exemplo, íntrons) dentro de regiões traduzidas do ácido nucleico ou podem não ter tais sequências não traduzidas intervenientes (por exemplo, como no cDNA). As informações através das quais uma proteína é codificada são especificadas pelo uso de códons. Normalmente, a sequência de aminoácidos é codificada pelo ácido nucleico usando o código genético "universal". No entanto, variantes do código universal, como está presente em algumas mitocôndrias de plantas, animais e fungos, a bactéria Mycoplasma capricolum (Yamao, et al., (1985) Proc. Natl. Acad. Sci. EUA 82: 2.306 a 2.309) ou o Macronúcleo ciliado, podem ser usadas quando o ácido nucleico é expresso usando esses organismos.
[0021] Quando o ácido nucleico é preparado ou alterado sinteticamente, pode-se tirar vantagem das preferências de códon conhecidas do hospedeiro pretendido em que o ácido nucleico deve ser expresso. Por exemplo, embora as sequências de ácidos nucleicos da presente invenção possam ser expressas em espécies de planta tanto monocotiledôneas quanto dicotiledôneas, as sequências podem ser modificadas de modo a representar as preferências específicas de códon e as preferências de teor de GC de plantas monocotiledôneas ou plantas dicotiledôneas, uma vez que se demonstrou que essas preferências diferem (Murray, et al., (1989) Nucleic Acids Res. 17:477 a 498).
[0022] Tal como aqui utilizado, "polinucleotídeo" inclui referência a um desoxirribopolinucleotídeo, ribopolinucleotídeo ou análogos dos mesmos que têm a natureza essencial de um ribonucleotídeo natural em que se hibridizam, sob condições de hibridização rigorosas, substancialmente a mesma sequência de nucleotídeos que os nucleotídeos de ocorrência natural e/ou permitem tradução no mesmo aminoácido (ou aminoácidos) que o nucleotídeo (ou nucleotídeos) de ocorrência natural. Um polinucleotídeo pode ser de comprimento completo ou uma subsequência de um gene estrutural ou regulador. Salvo indicação em contrário, o termo inclui referência à sequência especificada, bem como à sequência complementar da mesma. Assim, os DNAs ou RNAs com cadeias principais modificadas para estabilidade ou por outras razões são "polinucleotídeos" como esse termo é entendido no presente documento. Além disso, DNAs ou RNAs que compreendem bases incomuns, como a inosina, ou bases modificadas, como bases tritiladas, para citar apenas dois exemplos, são polinucleotídeos como o termo é usado no presente documento. Será entendido que uma grande variedade de modificações foram feitas ao DNA e RNA que servem a muitos propósitos úteis conhecidos pelos versados na técnica. O termo polinucleotídeo, tal como é empregado aqui, abrange tais formas química, enzimática ou metabolicamente modificadas de polinucleotídeos, bem como as formas químicas de DNA e RNA características de vírus e células, incluindo, entre outros, células simples e complexas.
[0023] Os termos "polipeptídeo", "peptídeo" e "proteína" são usados indistintamente aqui para referir um polímero de resíduos de aminoácidos. Os termos se aplicam a polímeros de aminoácido em que um ou mais resíduos de aminoácido são um análogo químico artificial de um aminoácido de ocorrência natural correspondente, assim como a polímeros de aminoácido de ocorrência natural.
[0024] Conforme usado no presente documento, "identidade de sequência" ou "identidade" no contexto de duas sequências de ácidos nucleicos ou polipeptídeo inclui referência aos resíduos nas duas sequências que são os mesmos quando alinhados para correspondência máxima por uma janela de comparação especificada. Quando a porcentagem de identidade de sequência é usada com referência a proteínas, é reconhecido que posições de resíduos que não são idênticos muitas vezes diferem por substituições de aminoácidos conservativas, em que resíduos de aminoácidos substituem outros resíduos de aminoácidos com propriedades químicas similares (por exemplo, carga ou hidrofobicidade) e, portanto, não alteram as propriedades funcionais da molécula. Quando as sequências diferem em substituições conservativas, a porcentagem de identidade de sequência pode ser ajustada para cima para corrigir a natureza conservativa da substituição. É dito que sequências que diferem por tais substituições conservativas têm "similaridade de sequência" ou "similaridade". Os meios para fazer esse ajuste são bem conhecidos pelos versados na técnica. Tipicamente isto envolve a classificação de uma substituição conservativa como um emparelhamento errado parcial em vez de um completo,
aumentando assim a percentagem de identidade de sequência. Assim, por exemplo, quando a um aminoácido idêntico é dada uma classificação de 1 e a uma substituição não conservativa é dada uma classificação de zero, a uma substituição conservativa é dada uma classificação entre zero e 1. A classificação das substituições conservativas é calculada, por exemplo, de acordo com o algoritmo de Meyers e Miller, (1988) Computer Applic. Biol. Sci. 4:11 a 17, por exemplo, conforme implementado no programa PC/GENE (Intelligenetics, Mountain View, Califórnia, EUA).
[0025] Conforme usado no presente documento, "porcentagem de identidade de sequência" significa o valor determinado comparando-se duas sequências alinhadas de maneira ideal sobre uma janela de comparação, sendo que a porção da sequência de polinucleotídeos na janela de comparação pode compreender adições ou deleções (isto é, lacunas) em comparação com a sequência de referência (que não compreende adições ou deleções) para alinhamento ideal das duas sequências. A porcentagem é calculada determinando- se o número de posições em que a mesma base de ácido nucleico ou resíduo de aminoácido ocorre em ambas as sequências para gerar o número de posições correspondentes, dividindo-se o número de posições correspondentes pelo número total de posições na janela de comparação e multiplicando-se o resultado por 100 para gerar a percentagem de identidade de sequência.
[0026] Conforme usado no presente documento, "sequência de referência" é uma sequência definida usada como base para comparação de sequências. Uma sequência de referência pode ser um subconjunto ou a totalidade de uma sequência especificada; por exemplo, como um segmento de um cDNA ou sequência genética de comprimento completo ou o cDNA ou sequência genética completa.
[0027] Tal como aqui utilizado, "janela de comparação" significa referência a um segmento contíguo e especificado de uma sequência de polinucleotídeos, em que a sequência de polinucleotídeos pode ser comparada a uma sequência de referência e em que a porção da sequência de polinucleotídeos na janela de comparação pode compreender adições ou deleções (isto é, lacunas) em comparação com a sequência de referência (que não compreende adições ou deleções) para o alinhamento ideal das duas sequências. De modo geral, a janela de comparação tem um comprimento de pelo menos 20 nucleotídeos contíguos e, opcionalmente, pode ter 30, 40, 50, 100 ou mais. Aqueles versados na técnica compreendem que, para evitar uma elevada similaridade com uma sequência de referência devido à inclusão de intervalos na sequência de polinucleotídeos, é tipicamente introduzida uma penalidade de intervalo e é subtraída do número de correspondências.
[0028] Os métodos de alinhamento das sequências de nucleotídeos e aminoácidos para comparação são bem conhecidos na arte. O algoritmo de homologia local (BESTFIT) de Smith e Waterman, (1981) Adv. Appl. Math 2:482, pode conduzir o alinhamento ideal de sequências para comparação; pelo algoritmo de alinhamento de homologia (GAP) de Needleman e Wunsch, (1970) J. Mol. Biol. 48: 443 a 453; pelo método de pesquisa de similaridade (Tfasta e Fasta) de Pearson e
Lipman, (1988) Proc.
Natl.
Acad.
Sci.
EUA 85: 2.444; por implementações computadorizadas desses algoritmos, incluindo, porém sem limitação: CLUSTAL no programa PC/Gene da Intelligenetics, Mountain View, Califórnia, GAP, BESTFIT, BLAST, FASTA e TFASTA no Wisconsin Genetics Software Package®, Versão 8 (disponível junto ao Genetics Computer Group (programas GCG® (Accelrys, Inc., San Diego, CA)). O programa CLUSTAL é bem descrito por Higgins and Sharp, (1988) Gene 73:237 44; Higgins and Sharp, (1989) CABIOS 5:151 3; Corpet, et al., (1988) Nucleic Acids Res. 16:10.881 a 10.890; Huang, et al., (1992) Computer Applications in the Biosciences 8:155 a 165, and Pearson, et al., (1994) Meth.
Mol.
Biol. 24:307 a 331. O programa preferencial para usar para o alinhamento global ideal de sequências múltiplas é PileUp (Feng e Doolittle, (1987) J.
Mol.
Evol., 25: 351 a 360 que é semelhante ao método descrito por Higgins e Sharp, (1989) CABIOS 5: 151 a 153 e aqui incorporado a título de referência). A família BLAST de programas que podem ser usados para pesquisas de similaridade de banco de dados inclui: BLASTN para sequências de consulta de nucleotídeos contra sequências de banco de dados de nucleotídeos; BLASTX para sequências de consulta de nucleotídeos contra sequências de banco de dados de proteínas; BLASTP para sequências de consulta de proteínas contra sequências de banco de dados de proteínas; TBLASTN para sequências de consulta de proteínas contra sequências de banco de dados de nucleotídeos; e TBLASTX para sequências de consulta de nucleotídeos contra sequências de banco de dados de nucleotídeos.
Consultar, CURRENT PROTOCOLS IN MOLECULAR
BIOLOGY, Capítulo 19, Ausubel, et al., Eds., Greene Publishing e Wiley-Interscience, New York (1995).
[0029] O programa GAP usa o algoritmo de Needleman e Wunsch, supracitado, para encontrar o alinhamento de duas sequências completas que maximize o número de correspondências e minimize o número de lacunas. GAP considera todos os alinhamentos e posições de lacuna possíveis e cria o alinhamento com o maior número de bases correspondidas e o menor número de lacunas. O mesmo permite a provisão de uma penalidade de criação de lacuna e uma penalidade de extensão de lacuna em unidades de bases correspondidas. GAP deve se beneficiar do número de penalidade de criação de lacuna de correspondências para cada lacuna que insere. Se uma penalidade de extensão de lacuna maior que zero for escolhida, GAP deve, além disso, se beneficiar de cada lacuna inserida do comprimento da lacuna vezes a penalidade de extensão de lacuna. Os valores de penalidade de criação de lacuna padrão e os valores de penalidade de extensão de lacuna na Versão 10 de Wisconsin Genetics Software Package® são 8 e 2, respectivamente. As penalidades de criação de lacuna e extensão de lacuna podem ser expressas como um número inteiro selecionado a partir do grupo de números inteiros que consiste em 0 a 100. Desse modo, por exemplo, as penalidades de criação de lacuna e extensão de lacuna podem ser 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50 ou maiores.
[0030] GAP apresenta um membro da família de melhores alinhamentos. Pode haver muitos membros dessa família, mas nenhum outro membro tem uma qualidade melhor.
GAP exibe quatro figuras de mérito para alinhamentos: Qualidade, Razão, Identidade e Similaridade. A Qualidade é a medida maximizada a fim de alinhar as sequências. A razão é a qualidade dividida pelo número de bases no segmento mais curto. A Porcentagem de Identidade é o por cento dos símbolos que se correspondem realmente. A Porcentagem de Similaridade é o por cento dos símbolos que são similares. Os símbolos que estão através das lacunas são ignorados. A similaridade é pontuada quando o valor de matriz de pontuação para um par de símbolos é maior ou igual a 0,50, o limiar de similaridade. A matriz de escore usada na Versão 10 do Wisconsin Genetics Software Package® é BLOSUM62 (consultar Henikoff e Henikoff (1989) Proc. Natl. Acad. Sci. EUA 89:10.915).
[0031] A menos que indicado de outra forma, os valores de identidade/similaridade de sequência aqui fornecidos se referem ao valor obtido usando o conjunto de programas BLAST 2.0 usando parâmetros padrão (Altschul, et al., (1997) Nucleic Acids Res. 25: 3.389 a 3.402).
[0032] Como aqueles versados na técnica irão entender, as pesquisas BLAST assumem que as proteínas podem ser modeladas como sequências aleatórias. No entanto, muitas proteínas reais compreendem regiões de sequências não aleatórias, que podem ser traços homopoliméricos, repetições de curto período ou regiões enriquecidas em um ou mais aminoácidos. Essas regiões de baixa complexidade podem ser alinhadas entre proteínas não relacionadas, mesmo que outras regiões da proteína sejam totalmente diferentes. Vários programas de filtro de baixa complexidade podem ser empregados para reduzir tais alinhamentos de baixa complexidade. Por exemplo, os filtros de baixa complexidade SEG (Wooten e Federhen, (1993) Comput. Chem. 17:149-63) e XNU (Claverie e States, (1993) Comput. Chem. 17:191 a 201) podem ser empregados sozinhos ou em combinação.
[0033] Consequentemente, em qualquer uma das concretizações aqui descritas, o polinucleotídeo pode codificar um polipeptídeo que é pelo menos 80% idêntico a qualquer uma das SEQ ID NOS: 1 a 10, 12 a 51. Por exemplo, o polinucleotídeo pode codificar um polipeptídeo que é pelo menos 81% idêntico, pelo menos 82% idêntico, pelo menos 83% idêntico, pelo menos 84% idêntico, pelo menos 85% idêntico, pelo menos 86% idêntico, pelo menos 87% idêntico, pelo menos 88% idêntico, pelo menos 89% idêntico, pelo menos 90% idêntico, pelo menos 91% idêntico, pelo menos 92% idêntico, pelo menos 93% idêntico, pelo menos 94% idêntico, pelo menos 95% idêntico, pelo menos 96% idêntico, pelo menos 97% idêntico, pelo menos 98% idêntico ou pelo menos 99% idêntico à sequência de aminoácidos de qualquer uma das SEQ ID NOS: 1 a 10, 12 a 51. B. Construto de DNA recombinante
[0034] Também é fornecido um construto de DNA recombinante que compreende qualquer um dos polinucleotídeos aqui descritos. Em certas concretizações, o construto de DNA recombinante compreende ainda pelo menos um elemento regulador. Em certas concretizações, o pelo menos um elemento regulador do construto de DNA recombinante compreende um promotor. Em certas concretizações, o promotor é um promotor heterólogo.
[0035] Tal como aqui utilizado, um "construto de DNA recombinante" compreende dois ou mais segmentos de DNA operacionalmente ligados, de preferência segmentos de DNA que não estão operacionalmente ligados na natureza (isto é, heterólogos). Os exemplos não limitadores de construtos de DNA recombinante incluem um polinucleotídeo de interesse ligado de maneira operacional a sequências heterólogas, também denominados “elementos reguladores”, que auxiliam na expressão, replicação autóloga e/ou inserção genômica da sequência de interesse. Tais elementos reguladores incluem, por exemplo, promotores, sequências de terminação, acentuadores, etc. ou qualquer componente de um cassete de expressão; um plasmídeo, cosmídeo, vírus, sequência de replicação autônoma, fago ou sequência de nucleotídeos de RNA ou DNA de filamento simples ou filamento duplo linear ou circular; e/ou sequências que codificam polipeptídeos heterólogos.
[0036] Os polinucleotídeos descritos no presente documento podem ser fornecidos em cassetes de expressão para expressão em uma planta de interesse ou qualquer organismo de interesse. O cassete pode incluir sequências reguladoras 5' e 3' ligadas operacionalmente a um polinucleotídeo. "Ligado operacionalmente " se destina a significar uma ligação funcional entre dois ou mais elementos. Por exemplo, uma ligação operativa entre um polinucleotídeo de interesse e uma sequência reguladora (por exemplo, um promotor) é uma ligação funcional que permite a expressão do polinucleotídeo de interesse. Os elementos ligados operacionalmente podem ser contíguos ou não contíguos. Quando usados para se referir à união de duas regiões de codificação de proteína, por operacionalmente ligado entende-se que as regiões de codificação estão no mesmo quadro de leitura. O cassete pode adicionalmente conter pelo menos um gene adicional a ser cotransformado no organismo. Alternativamente, o gene (ou genes) adicional pode ser fornecido em múltiplos cassetes de expressão. Tal cassete de expressão é dotado de uma pluralidade de sítios de restrição e/ou sítios de recombinação para inserção do polinucleotídeo estar sob a regulação transcricional das regiões reguladoras. O cassete de expressão pode adicionalmente conter genes marcadores selecionáveis.
[0037] O cassete de expressão pode incluir na direção 5'-3’ da transcrição, uma região de iniciação da transcrição e tradução (por exemplo, um promotor), um polinucleotídeo e uma região de terminação da transcrição e tradução (por exemplo, região de terminação) funcional em plantas. As regiões reguladoras (por exemplo, promotores, regiões reguladoras de transcrição e regiões de terminação de tradução) e/ou o polinucleotídeo podem ser nativos/análogos à célula hospedeira ou uma à outra. Alternativamente, as regiões reguladoras e/ou o polinucleotídeo podem ser heterólogos à célula hospedeira ou entre si.
[0038] Conforme usado no presente documento, "heterólogo" em referência a uma sequência é uma sequência que se origina de uma espécie estranha, ou, se a mesma espécie, é substancialmente modificada em relação a sua forma nativa em composição e/ou locus genômico por intervenção humana deliberada. Por exemplo, um promotor operacionalmente ligado a um polinucleotídeo heterólogo que é de uma espécie diferente da espécie da qual o polinucleotídeo foi derivado, ou, se de espécie igual/análoga, um ou ambos são substancialmente modificados em relação à sua forma original e/ou locus genômico, ou o promotor não é o promotor nativo para o polinucleotídeo ligado operativamente.
[0039] A região de terminação pode ser nativa com a região de iniciação da transcrição, com a planta hospedeira, ou pode ser derivada de outra fonte (isto é, estranha ou heteróloga) do que o promotor, o polinucleotídeo, a planta hospedeira ou qualquer combinação dos mesmos.
[0040] O cassete de expressão pode conter adicionalmente sequências líderes 5'. Tais sequências líderes podem atuar para aprimorar a tradução. Os líderes de tradução são conhecidos na técnica e incluem sequências líder traducionais virais.
[0041] Na preparação do cassete de expressão, os vários fragmentos de DNA podem ser manipulados de modo a proporcionar as sequências de DNA na orientação adequada e, conforme apropriado, no quadro de leitura adequado. Para esse fim, podem ser empregados adaptadores ou ligantes para juntar os fragmentos de DNA ou podem estar envolvidas outras manipulações para proporcionar locais de restrição convenientes, remoção de DNA supérfluo, remoção de locais de restrição ou semelhantes. Para esse propósito, podem estar envolvidos mutagênese in vitro, reparo de iniciadores, restrição, emparelhamento, novas substituições, por exemplo, transições e transversões.
[0042] Tal como aqui utilizado, "promotor" refere- se a uma região de DNA a montante do início da transcrição e envolvida no reconhecimento e ligação de RNA polimerase e outras proteínas para iniciar a transcrição.
Um "promotor de planta" é um promotor capaz de iniciar a transcrição em células vegetais.
Os promotores de planta exemplificativos incluem, porém sem limitação, aqueles que são obtidos a partir de plantas, vírus de planta e bactérias, que compreendem genes expressos em células vegetais, tal como Agrobacterium ou Rhizobium.
Certos tipos de promotores iniciam preferencialmente a transcrição em certos tecidos, como folhas, raízes, sementes, fibras, vasos do xilema, traqueídeos ou esclerênquima.
Tais promotores são denominados "preferenciais para tecido". Um promotor específico para "tipo de célula" principalmente aciona a expressão em certos tipos de célula e um ou mais órgãos, por exemplo, células vasculares em raízes ou folhas.
Um promotor "induzível" ou "regulável" é um promotor que está sob controle ambiental.
Exemplos de condições ambientais que podem afetar a transcrição por promotores induzíveis incluem condições anaeróbicas ou a presença de luz.
Outro tipo de promotor é um promotor regulado pelo desenvolvimento, por exemplo, um promotor que conduz a expressão durante o desenvolvimento de pólen.
Promotores preferenciais para tecidos, específicos para tipos de células, regulados pelo desenvolvimento e induzíveis constituem a classe de promotores "não constitutivos". Um promotor "constitutivo” é um promotor que é ativo sob a maioria das condições ambientais.
Os promotores constitutivos incluem, por exemplo, o promotor núcleo do promotor Rsyn7 e outros promotores constitutivos no documento WO 99/43838 e Patente nº U.S. 6.072.050; o promotor CaMV 35S núcleo (Odell et al. (1985) Nature 313:810 a 812); actina de arroz (McElroy et al. (1990) Plant Cell 2:163 a 171); ubiquitina (Christensen et al. (1989) Plant Mol. Biol. 12:619 a 632 e Christensen et al. (1992) Plant Mol. Biol. 18:675 a 689); pEMU (Last et al. (1991) Theor. Appl. Genet. 81:581 a 588); MAS (Velten et al. (1984) EMBO J. 3:2.723 a 2.730); promotor ALS (Patente nº U.S. 5.659.026); ZmGOS2 (Patente no U.S. 6.504.083) e similares. Outros promotores constitutivos incluem, por exemplo, as Patentes no U.S. 5.608.149; 5.608.144; 5.604.121;
5.569.597; 5.466.785; 5.399.680; 5.268.463; 5.608.142; e
6.177.611.
[0043] Também são contemplados os promotores sintéticos que incluem uma combinação de um ou mais elementos reguladores heterólogos. C. Plantas e Células Vegetais
[0044] São fornecidas plantas, células vegetais, partes de plantas, sementes e grãos que compreendem uma sequência de polinucleotídeos aqui descrita ou um construto de DNA recombinante aqui descrito, de modo que as plantas, células vegetais, partes de plantas, sementes e/ou grãos tenham expressão aumentada de um polipeptídeo. Em certas concretizações, as plantas, células vegetais, partes de plantas, sementes e/ou grãos incorporaram de forma estável um polinucleotídeo exógeno aqui descrito em seu genoma. Em certas concretizações, as plantas, células de plantas, partes de plantas, sementes e/ou grãos podem compreender vários polinucleotídeos (isto é, pelo menos 1, 2, 3, 4, 5, 6 ou mais).
[0045] Em concretizações específicas, o polinucleotídeo (ou polinucleotídeos) nas plantas, células da planta, partes da planta, sementes e/ou grãos estão operacionalmente ligados a um elemento regulador heterólogo, tal como, porém sem limitação, um promotor constitutivo, um promotor preferencial para tecido, ou um promotor sintético para expressão em plantas ou um acentuador constitutivo. Por exemplo, em certas concretizações, o elemento regulador heterólogo é o promotor GOS2 de milho.
[0046] São também fornecidas no presente documento, plantas, células vegetais, partes de planta, sementes e grãos que compreendem uma modificação genética introduzida em um locus genômico que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 80% idêntica a uma sequência de aminoácidos selecionada dentre o grupo que consiste nas SEQ ID NOS: 1 a 10, 12 a 51.
[0047] Em certas concretizações, a modificação genética aumenta a atividade da proteína. Em certas concretizações, a modificação genética aumenta o nível da proteína. Em certas concretizações, a modificação genética aumenta tanto o nível quanto a atividade da proteína.
[0048] Um "locus genômico", como aqui utilizado, geralmente se refere à localização em um cromossomo da planta em que um gene, tal como um polinucleotídeo que codifica um polipeptídeo, é encontrado. Tal como aqui utilizado, "gene" inclui um fragmento de ácido nucleico que expressa uma molécula funcional, tal como, porém sem limitação, uma sequência de codificação de proteína específica e elementos reguladores, tais como aqueles antecedentes (sequências não codificadoras 5') e seguintes (sequências não codificadoras 3’) à sequência de codificação.
[0049] Um elemento regulador geralmente se refere a um elemento regulador da transcrição envolvido em regulação da transcrição de uma molécula de ácido nucleico, tal como um gene ou um gene-alvo. O elemento regulador é um ácido nucleico e pode incluir um promotor, um acentuador, um íntron, uma região não traduzida 5’ (5'-UTR), também conhecida como sequência líder) ou uma a 3'-UTR ou uma combinação dos mesmos. Um elemento regulador pode atuar em “cis” ou “trans” e geralmente atua em “cis”, isto é, ativa a expressão de genes localizados na mesma molécula de ácido nucleico, por exemplo, um cromossomo, onde o elemento regulador está localizado.
[0050] Um elemento acentuador é qualquer molécula de ácido nucleico que aumenta a transcrição de uma molécula de ácido nucleico quando funcionalmente ligado a um promotor independentemente da sua posição relativa.
[0051] Um repressor (algumas vezes também chamado no presente documento de silenciador) é definido como qualquer molécula de ácido nucleico que inibe a transcrição quando funcionalmente ligado a um promotor independentemente da posição relativa.
[0052] O termo “elemento em cis” geralmente se refere a um elemento regulador da transcrição que afeta ou modula a expressão de um polinucleotídeo apto a ser transcrito operacionalmente ligado, em que o polinucleotídeo apto a ser transcrito está presente na mesma sequência de DNA. Um elemento em cis pode funcionar para ligar fatores de transcrição que são polipeptídeos de atuação em trans que regulam a transcrição.
[0053] Um “íntron” é uma sequência intercalar em um gene que é transcrita em RNA, mas é depois removida durante o processo de geração do RNAm maduro. O termo é também usado para as sequências de RNA removidas. Um “éxon” é uma porção da sequência de um gene que é transcrita e é encontrada no RNA mensageiro maduro derivado do gene, mas não é necessariamente uma parte da sequência que codifica o produto gênico final.
[0054] A região não traduzida 5’ (UTR 5’) (também conhecida como uma sequência líder de tradução ou RNA líder) é a região de um mRNA que se encontra diretamente a montante do códon de iniciação. Essa região está envolvida na regulação da tradução de um transcrito por mecanismos diferentes em vírus, procariotos e eucariotos.
[0055] As “sequências não codificadoras 3’” referem- se a sequências de DNA localizadas a jusante de uma sequência de codificação e incluem sequências de reconhecimento de poliadenilação e outras sequências que codificam sinais reguladores capazes de afetar o processamento de mRNA ou expressão gênica. O sinal de poliadenilação é normalmente caracterizado por afetar a adição de traços de ácido poliadenílico à extremidade 3' do precursor de mRNA.
[0056] “Modificação genética", "modificação de DNA" e semelhantes referem-se a uma modificação sítio-específica que altera ou muda a sequência de nucleotídeos em um locus genômico específico da planta. A modificação genética das composições e métodos descritos neste documento pode ser qualquer modificação conhecida na técnica, como, por exemplo, inserção, deleção, polimorfismo de nucleotídeo único (SNP) e/ou modificação de polinucleotídeo. Além disso, a modificação de DNA direcionada no locus genômico pode estar localizada em qualquer lugar no locus genômico, tal como, por exemplo, uma região de codificação do polipeptídeo codificado (por exemplo, éxon), uma região não codificadora (por exemplo, íntron), um elemento regulador ou região não traduzida.
[0057] Tal como aqui utilizado, uma modificação genética "direcionada" ou modificação de DNA "direcionada" refere-se à manipulação direta dos genes de um organismo. A modificação direcionada pode ser introduzida usando qualquer técnica conhecida na técnica, como, por exemplo, melhoramento de plantas, edição de genoma ou conversão de locus único.
[0058] O tipo e localização da modificação de DNA do polinucleotídeo não são particularmente limitados, desde que a modificação de DNA resulte em expressão e/ou atividade aumentada da proteína codificada pelo polinucleotídeo correspondente.
[0059] Em certas concretizações, a planta, células vegetais, partes de plantas, sementes e/ou grãos compreendem uma ou mais modificações de nucleotídeos presentes dentro da (a) região de codificação; (b) região não codificadora; (c) sequência reguladora; (d) região não traduzida, ou (e)
qualquer combinação de (a) a (d) de um polinucleotídeo endógeno que codifica um polipeptídeo.
[0060] Em certas concretizações, a modificação do DNA é uma inserção de um ou mais nucleotídeos, de preferência contíguos, no locus genômico. Por exemplo, a inserção de um elemento modulador de expressão (EME), como um EME descrito no documento no PCT/US2018/025446, em ligação operável com o gene de interesse aqui descrito. Em certas concretizações, a modificação de DNA direcionada pode ser a substituição de um promotor endógeno por outro promotor conhecido na técnica por ter uma expressão mais elevada, como, por exemplo, o promotor GOS2 de milho. Em certas concretizações, a modificação de DNA direcionada pode ser a inserção de um promotor conhecido na técnica por ter maior expressão, tal como, por exemplo, o promotor GOS2 de milho, na 5'UTR de modo que a expressão do polipeptídeo endógeno seja controlada pelo promotor inserido. Em certas concretizações, a modificação do DNA é uma modificação para otimizar o contexto Kozak para aumentar a expressão. Em certas concretizações, a modificação de DNA é uma modificação de polinucleotídeo ou SNP em um sítio que regula a estabilidade da proteína expressa.
[0061] Tal como aqui utilizado, "aumentado", "aumento" ou semelhante refere-se a qualquer aumento detectável em um grupo experimental (por exemplo, planta com uma modificação de DNA aqui descrita) em comparação com um grupo de controle (por exemplo, planta de tipo selvagem que não compreende a modificação do DNA). Consequentemente, a expressão aumentada de uma proteína compreende qualquer aumento detectável no nível total da proteína em uma amostra e pode ser determinada usando métodos de rotina na técnica, como, por exemplo, Western blotting e ELISA.
[0062] Em certas concretizações, o locus genômico tem mais de uma (por exemplo, 2, 3, 4, 5, 6, 7, 8, 9 ou 10) modificação de DNA. Por exemplo, a região traduzida e um elemento regulador de um locus genômico podem, cada um, compreender uma modificação de DNA direcionada. Em certas concretizações, mais de um locus genômico da planta pode compreender uma modificação de DNA.
[0063] A modificação do DNA do locus genômico pode ser feita usando qualquer técnica de modificação do genoma conhecida na técnica ou aqui descrita. Em certas concretizações, acredita-se que a modificação de DNA direcionada seja introduzida com o uso de uma técnica de modificação de genoma selecionada dentre o grupo que consiste em uma endonuclease guiada por polinucleotídeo, endonucleases CRISPR-Cas, desaminases de edição de base, uma nuclease de dedo de zinco, uma nuclease efetora semelhante a ativador de transcrição (TALEN), uma meganuclease sítio- específica geneticamente modificada ou uma Argonaute.
[0064] Em certas concretizações, a modificação do genoma pode ser facilitada por meio da indução de uma quebra de fita dupla (DSB) ou quebra de fita simples, em uma posição definida no genoma perto da alteração desejada. As DSBs podem ser induzidas com o uso de qualquer agente de indução de DSB disponível, incluindo, mas sem limitação, TALENs, meganucleases, nucleases dedo de zinco, sistemas de Cas9- gRNA (com base em sistemas de CRISPR-Cas bacterianos),
sistemas de endonuclease de cpf1 guiados e similares. Em algumas concretizações, a introdução de uma DSB pode ser combinada com a introdução de um molde polinucleotídico de modificação.
[0065] Os polinucleotídeos ou construtos de DNA recombinante revelados no presente documento podem ser usados para transformação de qualquer espécie de planta, incluindo, porém sem limitação, monocotiledôneas e dicotiledôneas. Além disso, as modificações genéticas aqui descritas podem ser usadas para modificar qualquer espécie de planta, incluindo, porém sem limitação, monocotiledôneas e dicotiledôneas.
[0066] Em concretizações específicas, as plantas da presente invenção são plantas de cultura (por exemplo, milho, alfafa, girassol, Brassica, soja, algodão, açafrão- bastardo, amendoim, sorgo, trigo, milheto, tabaco, etc.). Em outras concretizações, plantas de milho e soja são ideais e, ainda em outras concretizações, plantas de milho são ideais.
[0067] Outras plantas de interesse incluem, por exemplo, plantas de grão que fornecem sementes de interesse, plantas de semente oleaginosa e plantas leguminosas. As sementes de interesse incluem, por exemplo, sementes de grão, como milho, trigo, cevada, arroz, sorgo, centeio, etc. As plantas de semente oleaginosa incluem, por exemplo, algodão, soja, açafrão-bastardo, girassol, Brassica, milho, alfafa, palmeira, coco, etc. As plantas leguminosas incluem feijões e ervilhas. Os feijões incluem goma guar, alfarrobeira, feno- grego, soja, feijão comum, feijão caupi, feijão mungo, feijão-de-lima, feijão-fava, lentilha, grão de bico.
[0068] Por exemplo, em certas concretizações, são fornecidas plantas de milho que compreendem, em seu genoma, um construto de DNA recombinante que compreende um polinucleotídeo que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 80% idêntica a qualquer uma das SEQ ID NOS: 1 a 10, 12 a 51. Em certas concretizações, o polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 80% idêntica à sequência de aminoácidos de qualquer uma das SEQ ID NOS: 1 a 10, 12 a 51. Em certas concretizações, o polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 80% idêntica à sequência de aminoácidos de qualquer uma das SEQ ID NOS: 1 a 10, 12 a 51.
[0069] Em outras concretizações, são fornecidas plantas de milho que compreendem uma modificação genética em um locus genômico que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 80% idêntica à sequência de aminoácidos de qualquer uma das SEQ ID NOS: 1 a 10, 12 a 51. Em certas concretizações, o polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 80% idêntica à sequência de aminoácidos de qualquer uma das SEQ ID NOS: 1 a 10, 12 a 51. Em certas concretizações, o polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 80% idêntica à sequência de aminoácidos de qualquer uma das SEQ ID NOS: 1 a 10, 12 a 51. D. Empilhamento de Outros Traços de Interesse
[0070] Em algumas concretizações, os polinucleotídeos aqui revelados são geneticamente modificados em uma pilha molecular. Assim, as várias células hospedeiras, plantas, células vegetais, partes de plantas, sementes e/ou grãos aqui revelados podem compreender ainda uma ou mais traços de interesse. Em certas concretizações, a célula hospedeira, planta, parte da planta, célula da planta, semente e/ou grão é empilhada com qualquer combinação de sequências de polinucleotídeos de interesse, a fim de criar plantas com uma combinação desejada de traços. Conforme usado neste documento, o termo "empilhado" refere-se a ter múltiplos traços presentes na mesma planta ou organismo de interesse. Por exemplo, "traços empilhados" podem compreender uma pilha molecular em que as sequências são fisicamente adjacentes umas às outras. Um traço, conforme usado no presente documento, refere-se ao fenótipo derivado de uma sequência particular ou grupos de sequências. Em uma concretização, a pilha molecular compreende pelo menos um polinucleotídeo que confere tolerância ao glifosato. Os polinucleotídeos que conferem tolerância ao glifosato são conhecidos na técnica.
[0071] Em certas concretizações, a pilha molecular compreende pelo menos um polinucleotídeo que confere tolerância ao glifosato e pelo menos um polinucleotídeo adicional que confere tolerância a um segundo herbicida.
[0072] Em certas concretizações, a planta, célula vegetal, semente e/ou grão que tem uma sequência de polinucleotídeos da invenção pode ser empilhado com, por exemplo, uma ou mais sequências que conferem tolerância a: um inibidor de ALS; um inibidor de HPPD; 2,4-D; outros herbicidas de fenóxi auxina; herbicidas de ariloxifenoxipropionato; dicamba; herbicidas de glufosinato;
herbicidas que têm como alvo a enzima protox (também denominados "inibidores de protox").
[0073] A planta, célula vegetal, parte da planta, semente e/ou grão com uma sequência de polinucleotídeos da invenção também pode ser combinada com pelo menos um outro traço para produzir plantas que compreendem ainda uma variedade de combinações de traços desejados. Por exemplo, a planta, célula da planta, parte da planta, semente e/ou grão que tem uma sequência de polinucleotídeos da invenção podem ser empilhados com polinucleotídeos que codificam polipeptídeos que têm atividade pesticida e/ou inseticida, ou uma planta, célula vegetal, parte da planta, semente e/ou grão que tem uma sequência de polinucleotídeos da invenção podem ser combinados com um gene de resistência a doenças de plantas.
[0074] Essas combinações empilhadas podem ser criadas por qualquer método, incluindo, porém sem limitação, melhoramento de plantas por qualquer metodologia convencional ou transformação genética. Se as sequências forem empilhadas transformando-se geneticamente as plantas, as sequências de polinucleotídeo de interesse podem ser combinadas em qualquer momento e em qualquer ordem. Os traços podem ser introduzidos simultaneamente em um protocolo de cotransformação com os polinucleotídeos de interesse fornecidos por qualquer combinação de cassetes de transformação. Por exemplo, se duas sequências forem introduzidas, as duas sequências podem estar contidas em cassetes de transformação separados (trans) ou contidas no mesmo cassete de transformação (cis). A expressão das sequências pode ser conduzida pelo mesmo promotor ou por diferentes promotores. Em certos casos, pode ser desejável introduzir um cassete de transformação que irá suprimir a expressão do polinucleotídeo de interesse. Isto pode ser combinado com qualquer combinação de outros cassetes de supressão ou cassetes de sobre-expressão para produzir a combinação desejada de características na planta. É ainda reconhecido que as sequências de polinucleotídeos podem ser sobrepostas em uma localização genômica desejada utilizando um sistema de recombinação sítio-específico. Consultar, por exemplo, os documentos nos WO99/25821, WO99/25854, WO99/25840, WO99/25855, e WO99/25853, todos os quais estão incorporados ao presente documento a título de referência.
[0075] Qualquer planta que tem uma sequência de polinucleotídeos da invenção revelada no presente documento pode ser usada para produzir um alimento ou um produto alimentício. Tais métodos compreendem obter uma planta, explante, semente, célula vegetal ou célula que compreende a sequência de polinucleotídeos e processar a planta, explante, semente, célula vegetal ou célula para produzir um alimento ou produto alimentício. II. Métodos de Uso A. Métodos para Aumentar o Rendimento e/ou Aumentar a Atividade de Polinucleotídeos em uma Planta
[0076] São fornecidos métodos para aumentar o rendimento em uma planta, modificar o tempo de floração de uma planta e/ou aumentar a atividade de um ou mais polinucleotídeos aqui revelados em uma planta que compreende introduzir em uma planta, célula vegetal, parte da planta,
semente e/ou grão um construto de DNA recombinante que compreende qualquer um dos polinucleotídeos da invenção aqui descritos, em que o polipeptídeo é expresso na planta. Também são fornecidos métodos para aumentar o rendimento em uma planta, modificar o tempo de floração de uma planta e/ou aumentar a atividade em uma planta que compreende introduzir uma modificação genética em um locus genômico de uma planta que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 80% a 99% ou 100% idêntica da sequência de aminoácidos definida para qualquer uma das SEQ ID NOS: 1 a 10, 12 a 51.
[0077] A planta para uso nos métodos da invenção pode ser qualquer espécie de planta aqui descrita. Em certas concretizações, a planta é uma planta de grãos, uma planta de semente oleaginosa ou uma planta leguminosa. Em certas concretizações, a planta é uma planta de grãos, como o milho.
[0078] Conforme usado aqui, "rendimento" refere-se à quantidade de produção agrícola colhida por unidade de terra e pode incluir referência a de polinucleotídeos por acre de uma cultura na colheita, conforme ajustado para a umidade do grão (por exemplo, tipicamente 15% para o milho). A umidade do grão é medida no grão na colheita. O peso de teste ajustado do grão é determinado como sendo o peso em libras por bushel, ajustado para o nível de umidade do grão na colheita.
[0079] Em certas concretizações, o rendimento é medido em plantas cultivadas em condições ideais de crescimento. Tal como aqui utilizado, "condições ideais" referem-se a plantas que são cultivadas em condições bem regadas ou sem seca. Em certas concretizações, as condições ideais de crescimento são determinadas com base no rendimento das plantas de controle de tipo selvagem no experimento. Tal como aqui utilizado, as plantas são consideradas cultivadas em condições ideais quando a planta de tipo selvagem fornece pelo menos 75% do rendimento de grãos previsto.
[0080] Tal como aqui utilizado, "modificar o tempo de floração" refere-se a uma mudança no número de dias ou unidades de calor de crescimento necessárias para uma planta florescer. Em certas concretizações, o tempo de floração da planta é atrasado mediante o aumento da expressão do polipeptídeo. Também são contempladas concretizações nas quais o tempo de floração é diminuído (isto é, menos dias ou unidades de calor de crescimento necessárias para uma planta florescer) mediante diminuição da expressão do polipeptídeo.
[0081] Como usado aqui, aumento na atividade fotossintética refere-se a qualquer aumento detectável na atividade funcional da proteína em comparação com um controle adequado. A atividade funcional pode ser qualquer propriedade biológica conhecida de um ou mais dos polipeptídeos aqui revelados e inclui, por exemplo, formação aumentada de complexos de proteínas, modulação de vias bioquímicas e/ou rendimento de grãos aumentado.
[0082] Vários métodos podem ser usados para introduzir uma sequência de interesse em uma planta, parte da planta, célula da planta, semente e/ou grão. “Introduzir” pretende significar apresentar à planta, célula vegetal, semente e/ou grão o polinucleotídeo da invenção ou polipeptídeo resultante de tal maneira que a sequência ganhe acesso ao interior de uma célula da planta. Os métodos da invenção não dependem de um método particular para introduzir uma sequência em uma planta, célula vegetal, semente e/ou grão, apenas que os polinucleotídeo ou polipeptídeo ganhem acesso ao interior de pelo menos uma célula da planta.
[0083] "Transformação estável" se destina a significar que o polinucleotídeo introduzido em uma planta se integra no genoma da planta de interesse e que pode ser herdada pela descendência da mesma. "Transformação temporária" se destina a significar que um polinucleotídeo é introduzido na planta de interesse e não se integra no genoma da planta ou organismo ou um polipeptídeo é introduzido em uma planta ou organismo.
[0084] Os protocolos de transformação assim como os protocolos para introduzir polipeptídeos ou sequências de polinucleotídeos em plantas podem variar dependendo do tipo de planta ou célula vegetal, isto é, monocotiledônea ou dicotiledônea, direcionada para transformação.
[0085] Em concretizações específicas, as sequências de polinucleotídeos reveladas no presente documento podem ser fornecidas a uma planta com o uso de uma variedade de métodos de transformação temporária. Tais métodos de transformação transiente incluem, porém sem limitação, a introdução da proteína codificada diretamente na planta. Tais métodos incluem, por exemplo, microinjeção ou bombardeamento de partículas. Consultar, por exemplo, Crossway et al. (1986) Mol Gen. Genet. 202:179 a 185; Nomura et al. (1986) Plant Sci. 44:53 a 58; Hepler et al. (1994) Proc. Natl. Acad. Sci. 91: 2.176 a 2.180 e Hush et al. (1994)
The Journal of Cell Science 107:775 a 784, todos os quais estão incorporados ao presente documento a título de referência.
[0086] Em outras concretizações, os polinucleotídeos da invenção revelados no presente documento podem ser introduzidos em plantas colocando-se as plantas em contato com um vírus ou ácidos nucleicos virais. De modo geral, tais métodos envolvem incorporar um construto de nucleotídeo da invenção dentro de uma molécula de DNA ou RNA. É reconhecido que a sequência de polinucleotídeos da invenção pode ser inicialmente sintetizada como parte de uma poliproteína viral que pode ser posteriormente processada por proteólise in vivo ou in vitro para produzir a proteína recombinante desejada. Ademais, reconhece-se que os promotores revelados no presente documento também abrangem promotores utilizados para a transcrição por RNA polimerases virais. Os métodos para introduzir polinucleotídeos em plantas e expressar uma proteína codificada nos mesmos, envolvendo moléculas de DNA ou RNA viral, são conhecidos na técnica. Consultar, por exemplo, as Patentes nº U.S. 5.889.191, 5.889.190,
5.866.785, 5.589.367, 5.316.931, e Porta et al. (1996) Molecular Biotechnology 5:209 a 221; incorporados ao presente documento a título de referência.
[0087] Vários métodos podem ser usados para introduzir uma modificação genética em um locus genômico que codifica um polipeptídeo na planta, parte da planta, célula vegetal, semente e/ou grão. Em certas concretizações, acredita-se que a modificação de DNA direcionada seja introduzida com o uso de uma técnica de modificação de genoma selecionada dentre o grupo que consiste em uma endonuclease guiada por polinucleotídeo, endonucleases CRISPR-Cas, desaminases de edição de base, uma nuclease de dedo de zinco, uma nuclease efetora semelhante a ativador de transcrição (TALEN), uma meganuclease sítio-específica geneticamente modificada ou uma Argonaute.
[0088] Em algumas concretizações, a modificação do genoma pode ser facilitada por meio da indução de uma quebra de fita dupla (DSB) ou quebra de fita simples, em uma posição definida no genoma perto da alteração desejada. As DSBs podem ser induzidas com o uso de qualquer agente de indução de DSB disponível, incluindo, mas sem limitação, TALENs, meganucleases, nucleases dedo de zinco, sistemas de Cas9- gRNA (com base em sistemas de CRISPR-Cas bacterianos), sistemas de endonuclease de cpf1 guiados e similares. Em algumas concretizações, a introdução de uma DSB pode ser combinada com a introdução de um molde polinucleotídico de modificação.
[0089] Um molde polinucleotídico de modificação pode ser introduzido em uma célula por qualquer método conhecido na técnica, tal como, mas sem limitação, métodos de introdução transiente, transfecção, eletroporação, microinjeção, entrega mediada por partícula, aplicação tópica, entrega mediada por fibra, entrega através de peptídeos de penetração celular ou entrega direta mediada por nanopartícula de sílica mesoporosa (MSN).
[0090] O molde polinucleotídico de modificação pode ser introduzido em uma célula como uma molécula polinucleotídica de fita simples, uma molécula polinucleotídica de fita dupla ou como parte de um DNA circular (DNA de vetor). O molde polinucleotídico de modificação pode também ser ligado ao RNA-guia e/ou à endonuclease Cas. DNAs ligados podem permitir a colocalização do DNA alvo e molde, o que é útil na edição genômica e regulação genômica direcionada, e podem também ser úteis no direcionamento de células pós-mitóticas onde se espera que a função da maquinaria endógena de HR seja altamente diminuída (Mali et al. 2013 Nature Methods Vol. 10: 957 a 963). O molde polinucleotídico de modificação pode estar presente de forma transiente na célula ou pode ser introduzido através de um replicon viral.
[0091] Um “nucleotídeo modificado” ou “nucleotídeo editado” refere-se a uma sequência nucleotídica de interesse que compreende pelo menos uma alteração em comparação à sua sequência nucleotídica não modificada. Tais "alterações" incluem, por exemplo: (i) substituição de pelo menos um nucleotídeo, (ii) uma deleção de pelo menos um nucleotídeo, (iii) uma inserção de pelo menos um nucleotídeo ou (iv) qualquer combinação de (i) a (iii).
[0092] O termo “molde polinucleotídico de modificação” inclui um polinucleotídeo que compreende pelo menos uma modificação nucleotídica em comparação à sequência nucleotídica a ser editada. Uma modificação nucleotídica pode ser pelo menos uma substituição, adição ou deleção nucleotídica. Opcionalmente, o molde de modificação de polinucleotídeo pode compreender adicionalmente sequências de nucleotídeos homólogas que flanqueiam a pelo menos uma modificação de nucleotídeo, em que as sequências de nucleotídeos homólogas de flanqueamento fornecem homologia suficiente para a sequência de nucleotídeos desejada a ser editada.
[0093] O processo de edição de uma sequência genômica que combina DSB e moldes de modificação compreende em geral: fornecer a uma célula hospedeira, um agente de indução de DSB, ou um ácido nucleico que codifica um agente de indução de DSB, que reconhece uma sequência-alvo na sequência cromossômica e tem capacidade de induzir uma DSB na sequência genômica, e pelo menos um molde polinucleotídico de modificação que compreende pelo menos uma alteração nucleotídica em comparação à sequência nucleotídica a ser editada. O molde polinucleotídico de modificação pode compreender adicionalmente sequências nucleotídicas que flanqueiam a pelo menos uma alteração nucleotídica, em que as sequências flanqueadoras são substancialmente homólogas à região cromossômica que flanqueia a DSB.
[0094] A endonuclease pode ser fornecida a uma célula por qualquer método conhecido na técnica, por exemplo, porém sem limitação, métodos de introdução transitória, transfecção, microinjeção e/ou aplicação tópica ou indiretamente por meio de construtos de recombinação. A endonuclease pode ser fornecida como uma proteína ou como um complexo de polinucleotídeo guiado diretamente a uma célula ou indiretamente através de construções de recombinação. A endonuclease pode ser introduzida em uma célula de maneira transiente ou pode ser incorporada no genoma da célula hospedeira com o uso de qualquer método conhecido na técnica. No caso de um sistema CRISPR-Cas, a captação da endonuclease e/ou do polinucleotídeo guiado na célula pode ser facilitada com um Peptídeo de Penetração Celular (PPC), conforme descrito no documento no WO2016073433, publicado em 12 de maio de 2016.
[0095] Além da modificação por uma tecnologia de quebra de fita dupla, a modificação de uma ou mais bases sem tal quebra de fita dupla é alcançada com o uso de tecnologia de edição de base, consultar, por exemplo, Gaudelli et al., (2017) Programmable base editing of A*T to G*C in genomic DNA without DNA cleavage. Nature 551(7681):464 a 471; Komor et al., (2016) Programmable editing of a target base in genomic DNA without double-stranded DNA cleavage, Nature 533(7603):420-4.
[0096] Essas fusões contêm dCas9 ou Cas9 nicase e uma deaminase adequada, e podem converter, por exemplo, a citosina em uracila sem induzir a quebra de fita dupla do DNA-alvo. A Uracila é, então, convertida em timina através de replicação ou reparo de DNA. Os editores de base aprimorados que têm flexibilidade de direcionamento e especificidade são usados para editar o locus endógeno para criar variações de alvo e aprimorar o rendimento de grão. De modo similar, os editores de base de adenina possibilitam a alteração de adenina em inosina, que é, então, convertida em guanina através de reparo ou replicação. Portanto, as alterações de base direcionadas, isto é, conversão de C•G em T•A e conversão de A•T em G•C em uma ou mais localizações realizadas com o uso adequado de editores de base de sítio específico.
[0097] Em uma concretização, a edição de base é um método de edição de genoma que possibilita a conversão direta de um par de bases em outro em um locus genômico-alvo sem exigir reparo de quebras de DNA de fita dupla (DSBs), processos de reparo direcionado por homologia (HDR) ou moldes de DNA de doador externo. Em uma concretização, os editores de base incluem (i) um mutante de CRISPR–Cas9 cataliticamente danificado que é mutado de modo que um de seus domínios de nuclease não possa realizar a DSBs; (ii) uma desaminase de adenina/citidina específica de fita única que converte C em U ou A em G dentro de um intervalo de nucleotídeo adequado na bolha de DNA de fita única criada por Cas9; (iii) um inibidor de glicosilase de uracila (UGI) que impede a excisão de uracila e processos a jusante que diminuem a eficácia de edição de base e pureza de produto; e (iv) atividade de nicase para clivar a fita de DNA não editada, seguidos por processos de reparo de DNA celular para substituir a fita de DNA contendo G.
[0098] Como usado no presente documento, uma “região genômica” é um segmento de um cromossomo no genoma de uma célula que está presente em qualquer lado do sítio-alvo ou, alternativamente, também compreende uma porção do sítio- alvo. A região genômica pode compreender pelo menos 5-10, 5- 15, 5-20, 5-25, 5-30, 5-35, 5-40, 5-45, 5- 50, 5-55, 5-60, 5-65, 5- 70, 5-75, 5-80, 5-85, 5-90, 5-95, 5-100, 5-200, 5- 300, 5-400, 5-500, 5-600, 5-700, 5-800, 5-900, 5-1000, 5- 1100, 5-1200, 5-1300, 5-1400, 5-1500, 5-1600, 5-1700, 5- 1800, 5-1900, 5-2000, 5-2100, 5-2200, 5-2300, 5-2400, 5- 2500, 5-2600, 5-2700, 5-2800. 5-2900, 5-3000, 5-3100 ou mais de bases de modo que a região genômica tenha homologia suficiente para ser submetida à recombinação homóloga com a região correspondente de homologia.
[0099] As nucleases efetoras TAL (TALEN) são uma classe de nucleases sequência-específicas que podem ser usadas para realizar quebras de fita dupla em sequências- alvo específicas no genoma de uma planta ou outro organismo. (Miller et al. (2011) Nature Biotechnology 29:143 a 148).
[0100] Endonucleases são enzimas que clivam a ligação de fosfodiéster dentro de uma cadeia polinucleotídica. Endonucleases incluem endonucleases de restrição, que clivam DNA em sítios específicos sem danificar as bases, e meganucleases, também conhecidas como endonucleases de endereçamento (HEases), que assim como endonucleases de restrição, se ligam e cortam em um sítio de reconhecimento específico, no entanto, os sítios de reconhecimento para meganucleases são tipicamente mais longos, cerca de 18 pb ou mais (pedido de patente PCT/US12/30061, depositado em 22 de março de 2012). As meganucleases foram classificadas em quatro famílias com base em motivos de sequência conservada. Esses motivos participam da coordenação de íons metálicos e hidrólise de ligações fosfodiéster. As HEases são notáveis por seus longos sítios de reconhecimento e por tolerar alguns polimorfismos de sequência nos seus substratos de DNA. A convenção de nomenclatura para meganucleases é similar à convenção para outras endonucleases de restrição. As meganucleases também são caracterizadas pelo prefixo F-, I- ou PI- para enzimas codificadas por ORFs, íntrons e inteínas independentes, respectivamente. Uma etapa no processo de recombinação envolve uma clivagem polinucleotídica no, ou próximo ao, sítio de reconhecimento. A atividade de clivagem pode ser usada para produzir uma quebra de fita dupla. Para resumos de recombinases sítio-específicas e seus sítios de reconhecimento, consulte Sauer (1994) Curr Op Biotechnol 5:521 a 527; e Sadowski (1993) FASEB 7:760 a 767. Em alguns exemplos, a recombinase é das famílias Integrase ou Resolvase.
[0101] As nucleases dedo de zinco (ZFNs) são agentes de indução de quebra de fita dupla modificados compreendidos por um domínio de ligação ao DNA de dedo de zinco e um domínio de agente de indução de quebra de fita dupla. A especificidade de sítio de reconhecimento é conferida pelo domínio de dedo de zinco, que compreende, tipicamente, dois, três ou quatro dedos de zinco, por exemplo, que tem uma estrutura C2H2, no entanto, outras estruturas de dedo de zinco são conhecidas e foram modificadas. Os domínios de dedo de zinco são propícios para projetar polipeptídeos que se ligam especificamente a uma sequência de reconhecimento de polinucleotídeo selecionada. As ZFNs incluem um domínio de dedo de zinco de ligação ao DNA modificado ligado a um domínio de endonuclease não específico, por exemplo, domínio de nuclease de uma endonuclease do Tipo IIs, tal como FokI. Funcionalidades adicionais podem ser fundidas com o domínio de ligação de dedo de zinco, incluindo domínios de ativador transcricional, domínios de repressor transcricional e metilases. Em alguns exemplos, a dimerização do domínio de nuclease é exigida para a atividade de clivagem. Cada dedo de zinco reconhece três pares de base consecutivos no DNA-
alvo. Por exemplo, um domínio de 3 dedos reconheceu uma sequência de 9 nucleotídeos contíguos, com uma exigência de dimerização da nuclease, dois conjuntos de tripletos de dedo de zinco são usados para ligar uma sequência de reconhecimento de 18 nucleotídeos.
[0102] A edição genômica com o uso de agentes de indução de DSB, tais como complexos de Cas9-gRNA, foi descrita, por exemplo, no Pedido de Patente dos E.U.A. US 2015-0082478 A1, publicado em 19 de março de 2015, WO2015/026886 A1, publicado em 26 de fevereiro de 2015, WO2016007347, publicado em 14 de janeiro de 2016 e WO201625131, publicado em 18 de fevereiro de 2016, todos os quais são incorporados no presente documento a título de referência.
[0103] Um complexo de polinucleotídeo guia/endonuclease Cas pode clivar uma ou ambas as fitas de uma sequência alvo de DNA. Um complexo de polinucleotídeo- guia/endonuclease Cas que pode clivar ambas as fitas de uma sequência-alvo de DNA compreende tipicamente uma proteína Cas que tem todos seus domínios de endonuclease em um estado funcional (por exemplo, os domínios de endonuclease do tipo selvagem ou variantes dos mesmos que retêm alguma ou toda a atividade em cada domínio de endonuclease). Os exemplos não limitadores de nickases Cas9 adequados para uso no presente documento são revelados na Publicação de Pedido de Patente no U.S. 2014/0189896, que está incorporada ao presente documento a título de referência.
[0104] Outros sistemas de endonuclease Cas foram descritos nos pedidos de patente PCT PCT/US16/32073,
depositado em 12 de maio de 2016 e PCT/US16/32028, depositado em 12 de maio de 2016, ambos pedidos incorporados ao presente documento a título de referência.
[0105] Os termos “sítio-alvo”, “sequência-alvo”, “sequência de sítio-alvo”, “DNA-alvo”, “loco-alvo”, “sítio- alvo genômico”, “sequência-alvo genômica”, “loco-alvo genômico” e “protoespaçador” são usados de forma intercambiável no presente documento e se referem a uma sequência polinucleotídica, tal como, mas sem limitação, uma sequência nucleotídica em um cromossomo, epissomo ou qualquer outra molécula de DNA no genoma (incluindo DNA cromossômico, cloroplástico, mitocondrial, DNA plasmidial) de uma célula, a qual um complexo de polinucleotídeo- guia/endonuclease Cas pode reconhecer, se ligar a e, opcionalmente, cortar ou clivar. O sítio-alvo pode ser um sítio endógeno no genoma de uma célula, ou alternativamente, o sítio-alvo pode ser heterólogo à célula e, desse modo, não é de ocorrência natural no genoma da célula, ou o sítio-alvo pode ser encontrado em um local genômico heterólogo comparado a quando ocorre na natureza. Conforme usado no presente documento, os termos "sequência-alvo endógena” e "sequência- alvo nativa" são usados intercambiavelmente no presente documento para se referir a uma sequência-alvo que é endógena ou nativa ao genoma de uma célula e está na posição endógena ou nativa daquela sequência-alvo no genoma da célula. As células incluem, mas sem limitação, células humanas, não humanas, animais, bacterianas, fúngicas, de inseto, levedura, levedura não convencional e vegetais assim como plantas e sementes produzidas por meio dos métodos descritos no presente documento. Um "sítio-alvo artificial" ou "sequência-alvo artificial" são usados intercambiavelmente no presente documento e se referem a uma sequência-alvo que foi introduzida no genoma de uma célula. Tal sequência-alvo artificial pode ser idêntica em sequência a uma sequência- alvo endógena ou nativa no genoma de uma célula, porém, pode estar localizada em uma posição diferente (isto é, uma posição não endógena ou não nativa) no genoma de uma célula.
[0106] Um "sítio-alvo alterado", uma "sequência-alvo alterada", "sítio-alvo modificado", "sequência-alvo modificada" são usados de modo intercambiável no presente documento e se referem a uma sequência-alvo, conforme revelada no presente documento, que compreende pelo menos uma alteração quando comparada a uma sequência-alvo não alterada. Tais "alterações" incluem, por exemplo: (i) substituição de pelo menos um nucleotídeo, (ii) uma deleção de pelo menos um nucleotídeo, (iii) uma inserção de pelo menos um nucleotídeo ou (iv) qualquer combinação de (i) a (iii).
[0107] Os métodos para “modificar um sítio-alvo” e “alterar um sítio-alvo” são usados de forma intercambiável no presente documento e se referem a métodos para produzir um sítio-alvo alterado.
[0108] O comprimento da sequência de DNA-alvo (sítio-alvo) pode variar e inclui, por exemplo, sítios-alvo que têm pelo menos 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 ou mais nucleotídeos de comprimento. É ainda possível que o sítio alvo possa ser palíndromo, ou seja, a sequência em uma fita é lida da mesma forma na direção oposta na fita complementar. O sítio de corte/clivagem pode estar dentro da sequência-alvo ou o sítio de corte/clivagem poderia estar fora da sequência-alvo. Em outra variação, a clivagem poderia ocorrer em posições nucleotídicas imediatamente opostas entre si para produzir um corte de extremidade cega ou, em outros casos, as incisões poderiam ser escalonadas para produzir projeções de fita simples, também chamadas de “extremidades coesivas”, que podem ser projeções 5’ ou projeções 3’. Variantes ativas de sítios-alvo genômicos também podem ser usadas. Tais variantes ativas podem compreender pelo menos 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais de identidade de sequência com o determinado sítio- alvo, em que as variantes ativas retêm atividade biológica e, portanto, têm a capacidade de serem reconhecidas e clivadas por uma endonuclease Cas. Os ensaios para medir a quebra de fita simples ou dupla fita de um sítio-alvo por uma endonuclease são conhecidos na técnica e mede geralmente a atividade e especificidade geral do agente nos substratos de DNA que contêm sítios de reconhecimento.
[0109] No presente documento, um "motivo adjacente a protoespaçador" (PAM) se refere a uma sequência curta de nucleotídeos adjacente a uma sequência-alvo (protoespaçador) que é reconhecido (tido como alvo) por um sistema de polinucleotídeo-guia/endonuclease Cas descrito no presente documento. A endonuclease Cas pode não reconhecer com sucesso uma sequência de DNA-alvo se a sequência de DNA-alvo não for seguida por uma sequência de PAM. A sequência e o comprimento de um PAM no presente documento podem diferir dependendo da proteína Cas ou do complexo de proteína Cas usado. A sequência PAM podem ter qualquer comprimento, porém tem tipicamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 ou 20 nucleotídeos de comprimento.
[0110] Os termos "ter como alvo", "ter gene como alvo" e "ter DNA como alvo" são usados de maneira intercambiável no presente documento. No presente documento, ter o DNA como alvo pode ser a introdução específica de um knockout, edição ou knockin em uma sequência de DNA particular, tal como em um cromossoma ou plasmídeo de uma célula. Em geral, o direcionamento de DNA pode ser realizado no presente documento por clivagem de uma ou de ambas as fitas em uma sequência específica de DNA em uma célula com uma endonuclease associada a um componente polinucleotídico adequado. Tal clivagem de DNA, se for uma quebra de fita dupla (DSB), pode induzir processos de NHEJ ou HDR que podem levar a modificações no sítio-alvo.
[0111] Um método de direcionamento no presente documento pode ser realizado de tal maneira que dois ou mais sítios-alvo de DNA sejam direcionados no método, por exemplo. Tal método pode ser opcionalmente caracterizado como um método multiplex. Dois, três, quatro, cinco, seis, sete, oito, nove, dez ou mais sítios-alvo podem ser direcionados ao mesmo tempo, em determinadas concretizações. Um método multiplex é realizado tipicamente por um método para ter como alvo no presente documento em que múltiplos componentes diferentes de RNA são fornecidos, cada um projetado para o complexo polinucleotídeo-guia/endonuclease Cas a um sítio- alvo de DNA único.
[0112] Os termos "knockout", "knockout de gene” e "knockout genético" são usados no presente documento de maneira intercambiável. Um knockout representa uma sequência de DNA de uma célula que foi tornada parcial ou completamente inoperante direcionando-se com uma proteína Cas; uma tal sequência de DNA antes do knockout poderia ter codificado uma sequência de aminoácidos, ou poderia ter tido uma função reguladora (por exemplo, promotor), por exemplo. Um knockout pode ser produzido por uma indel (inserção ou deleção de bases nucleotídicas em uma sequência de DNA-alvo através de NHEJ), ou por meio de remoção específica de uma sequência que reduz ou destrói completamente a função da sequência no ou próximo ao sítio-alvo.
[0113] O sistema de polinucleotídeo- guia/endonuclease Cas pode ser usado em combinação com um molde polinucleotídico de modificação coentregue para permitir a edição (modificação) de uma sequência nucleotídica genômica de interesse. (Consulte, também, o Pedido de Patente dos EUA US 2015-0082478 A1, publicado em 19 de março de 2015 e WO2015/026886 A1, publicado em 26 de fevereiro de 2015, ambos são dessa forma incorporados em sua totalidade por referência).
[0114] Os termos “knockin”, “knockin de gene”, “inserção de gene” e “knockin genético” são usados de forma intercambiável no presente documento. Um knockin representa a substituição ou inserção de uma sequência de DNA em uma sequência de DNA específica na célula direcionando-se com uma proteína Cas (por RH, em que um polinucleotídeo de DNA doador adequado também é usado). Os exemplos de knockin são uma inserção específica de uma sequência de codificação de aminoácidos heteróloga em uma região de codificação de um gene, ou uma inserção específica de um elemento regulador transcricional em um loco genético.
[0115] A seguir são apresentados exemplos de concretizações específicas de alguns aspectos da invenção. Os exemplos são oferecidos apenas para fins ilustrativos e não se destinam a limitar o escopo da invenção reivindicada, de forma alguma. EXEMPLO 1 Expressão Aumentada e Estendida de OsMADS18 Aumenta o Rendimento de Grãos de Milho
[0116] Este exemplo demonstra que a expressão aumentada e estendida de um fator de transcrição MADS de arroz OsMADS18 (SEQ ID NO: 1) sob o promotor ZmGOS2 em milho aumentou o rendimento de grãos em condições de campo. A expressão recombinante de DNA OsMADS18 com o promotor Zm- Gos2 em milho aumenta o rendimento de grãos em ensaios de eficácia de rendimento de campo em condições normais de crescimento. Como mostrado na Figura 1, nove eventos transgênicos independentes aumentaram o rendimento (p <0,1) em testes de rendimento de acre amplo em 8 localizações em comparação com o controle que não tinha o OsMADS 18 recombinante. O rendimento dos eventos varia de cerca de 357,78 quilogramas/hectare (5,7 bushel/acre) a cerca de 652,8 quilogramas/hectare (10,4 bushel/acre) mais alto do que os controles não transgênicos.
[0117] Como demonstrado, nove eventos de milho transgênico de Os-MADS18 demonstraram rendimento melhorado em várias localizações de teste de rendimento (Figura 1). Os valores plotados são aumento de rendimento em quilogramas/hectare (bushels/acre) de eventos transgênicos em relação aos controles. * indica P < 0,1. O rendimento base (rendimento dos controles) foi de 11.549,68 quilogramas/hectare (184 bushels/acre). Os dados são mostrados com a análise BLUP em 8 localizações.
[0118] Portanto, este Exemplo demonstra que OsMADS18, um ortólogo da proteína MADS box de milho ZMM28 e que exibe cerca de 76% de identidade de aminoácidos em todo o comprimento do ortólogo de MADS box de milho, surpreendentemente exibiu rendimento de grãos aumentado sob condições de crescimento de campo em milho, quando seu o nível de expressão foi aumentado sob um promotor moderadamente constitutivo em comparação com plantas de milho de controle sem tal expressão aumentada e estendida de OsMADS18. EXEMPLO 2 Expressão Aumentada e Estendida de SbMADS28 Aumenta o Rendimento de Grãos de Milho
[0119] A expressão transgênica do DNA genômico Sb- MADS28 com o promotor Zm-Gos2 em milho aumenta a produção de grãos em ensaios de eficácia de produção de campo. Como mostrado na Figura 2, quatro eventos transgênicos demonstraram eficácia de rendimento positiva. Dentre os mesmos, um evento mostrou aumento significativo de rendimento, 251,08 quilogramas/hectare (4 bushels/acre) a p <0,1, sob teste de rendimento de baixo teor de nitrogênio em duas localizações, e três eventos mostraram aumento significativo de rendimento em condições normais de teste de rendimento de nitrogênio. Os 3 eventos produziram 376,62 quilogramas/hectare (6 bushel/acre), 439,39 quilogramas/hectare (7 bushel/acre) e 502,16 quilogramas/hectare (8 bushel/acre) (p<0,1) mais que os controles não transgênicos sob condições normais de nitrogênio, respectivamente.
[0120] Quatro eventos de milho transgênico de SB- MADS28 demonstram melhor rendimento em várias localizações de teste de rendimento. Os valores plotados são aumento de rendimento em quilogramas/hectare (bushels/acre) de eventos transgênicos em relação aos controles. * indica P < 0,1. O rendimento base (rendimento dos controles) foi de 8.913,34 quilogramas/hectare (142 bushels/acre) em condições de baixo N e 10.796,44 quilogramas/hectare (172 bushels/acre) em condições normais de nitrogênio. Os dados são mostrados com análise BLUP.
[0121] Portanto, este Exemplo demonstra que SbMADS28, um ortólogo da proteína MADS box de milho ZMM28 e que exibe cerca de 94% de identidade de aminoácidos com a proteína de milho de comprimento total, surpreendentemente exibiu rendimento de grãos aumentado em condições de crescimento de campo em milho, quando seu nível de expressão foi aumentado sob um promotor moderadamente constitutivo, em comparação com plantas de milho de controle que não apresentaram tal expressão aumentada da proteína SbMADS28. EXEMPLO 3 Análise do Expressão Aumentada de Várias Proteínas MADS Box no Rendimento de Milho
[0122] Este exemplo demonstra a análise da expressão crescente de várias proteínas MADS box monocotiledôneas no rendimento do milho.
Semelhante à análise descrita nos Exemplos 1 e 2, outros ortólogos monocotiledôneas foram usados para avaliar o efeito sobre a produção de milho por diferentes promotores.
Os resultados de rendimento são apresentados na Tabela 2. Os resultados dos testes de campo são baseados em um ano de testes.
Tabela 2: Análise de polipeptídeos MADS box de Cultura Monocotiledônea Número Sinal de de Tipo de Gene de rendiment entrada promotor Promotor interesse o geral constitutivo OS-MADS 43034 fraco ZM-GOS2 GENÔMICO POSITIVO SB-MADS28 constitutivo (genômico 43053 fraco ZM-GOS2 ) POSITIVO ZM-ZMM28 constitutivo (genômico 44759 fraco ZM-GOS2 ) NEGATIVO constitutivo ZM-ZMM28 53759 fraco ZM-GOS2 (ALT1) NEUTRO preferencial ZM-RTM2 ZM-MADS27 67284 para raiz PRO (MOD) NEUTRO preferencial ZM-RTM2 70655 para raiz PRO ZM-ANR1 NEGATIVO
ZM-ZMM28 (genômico 76135 Nativa ZM-ZMM28 ) NEUTRO OS-MADS
BOX constitutivo GENÔMICO 77638 fraco ZM-GOS2 (ALT1) NEUTRO OS-MADS
BOX constitutivo GENÔMICO 77639 fraco ZM-GOS2 (ALT2) NEUTRO OS-MADS
BOX constitutivo GENÔMICO 77640 fraco ZM-GOS2 (ALT2) NA OS-MADS
BOX constitutivo GENÔMICO 77641 fraco ZM-GOS2 (ALT4) NEUTRO
[0123] Conforme mostrado na Tabela 2, várias proteínas MADS box de cultura monocotiledônea que são ortólogos de ZmM28 foram avaliadas e aquelas derivações que mostraram sinal de rendimento positivo/neutro/ negativo com base em um ano de testes de campo foram indicadas. Diferentes promotores ou elementos reguladores, tais como força de expressão (magnitude) ou especificidade (por exemplo, preferencial para tecido) podem ser avaliados adicionalmente e propósitos de aumento de rendimento e testados sob vários ambientes de estresse, como seca e/ou condições de crescimento de baixo teor de nitrogênio. Ortólogos ou proteínas distantes que têm certa semelhança estrutural com ZmM28 foram avaliados a partir de Dennstaedtia punctilobula, Artemisia tridentate, Chlorophytum comosum "Variegatum", Eschscholzia california, Lamium amplexicule, Delosperma nubigenum, Peperomia caperata, Triglochin maritima e o sinal de rendimento de milho foi negativo ou neutro em comparação com um controle de tipo selvagem em ensaios de rendimento limitado sob um promotor moderadamente constitutivo.
[0124] Os termos usados nas reivindicações e no relatório descritivo são definidos conforme apresentado abaixo, a menos que especificado de outro modo. Deve-se observar que, conforme usado no relatório descritivo e nas reivindicações anexas, as formas no singular “um”, “uma”, “o” e “a” incluem referências no plural, a menos que o contexto indique claramente de outro modo.
[0125] Todas as publicações neste relatório descritivo são indicativas do nível de habilidade na técnica à qual esta invenção pertence. Todas as publicações, e pedidos de patente são incorporados ao presente documento a título de referência ao mesmo ponto como se cada publicação individual ou pedido de patente fosse específica e individualmente indicada a título de referência.
[0126] A não ser que definido de outro modo, todos os termos técnicos e científicos usados no presente documento têm o mesmo significado que o comumente entendido por uma pessoa de habilidade comum na técnica à qual esta invenção pertence. A menos que mencionado de outra forma, as técnicas empregadas ou contempladas neste documento são metodologias padrão bem conhecidas por aqueles de habilidade comum na técnica. Os materiais, os métodos e os exemplos são ilustrativos apenas e não limitantes.
[0127] Muitas modificações e outras concretizações das invenções aqui estabelecidas virão à mente de um versado na técnica à qual essas invenções se referem, tendo o benefício dos ensinamentos apresentados nas descrições anteriores e nos desenhos associados. Portanto, deve-se entender que as invenções não devem ser limitadas às concretizações específicas reveladas e que modificações e outras concretizações são concebidas como estando incluídas dentro do escopo das reivindicações anexas. Embora termos específicos sejam empregados no presente documento, os mesmos são usados em um sentido genérico e descritivo apenas e não para propósitos de limitação.
[0128] Unidades, prefixos e símbolos podem ser denotados em sua forma aceita pelo SI. Salvo indicação em contrário, os ácidos nucleicos são escritos da esquerda para a direita em uma orientação de 5' para 3'; as sequências de aminoácidos são escritas da esquerda para a direita na orientação amino para carbóxi, respectivamente. Os intervalos numéricos incluem os números que definem o intervalo. Os aminoácidos podem ser aqui referidos quer pelos seus símbolos de três letras vulgarmente conhecidos quer pelos símbolos de uma letra recomendados pela IUPAC-IUB Biochemical Nomenclature Commission. Os nucleotídeos, do mesmo modo, podem ser referidos pelos seus códigos de uma única letra normalmente aceites.

Claims (50)

REIVINDICAÇÕES
1. Polinucleotídeo caracterizado pelo fato de que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica a uma sequência de aminoácidos selecionada dentre o grupo que consiste nas SEQ ID NOS: 1 a 10, 12 a 51.
2. Polinucleotídeo, de acordo com a reivindicação 1, em que o polinucleotídeo é caracterizado pelo fato de que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 99% idêntica a uma sequência de aminoácidos selecionada dentre o grupo que consiste nas SEQ ID NOS: 1 a 10 e 12.
3. Construto de DNA recombinante caracterizado pelo fato de que compreende o polinucleotídeo conforme definido na reivindicação 1 ou 2, operacionalmente ligado a um elemento regulador.
4. Construto de DNA recombinante, de acordo com a reivindicação 3, caracterizado pelo fato de que o elemento regulador é um promotor heterólogo.
5. Célula vegetal caracterizada pelo fato de que compreende o polinucleotídeo conforme definido na reivindicação 1 ou 2, ou o construto de DNA recombinante conforme definido na reivindicação 4.
6. Célula vegetal, de acordo com a reivindicação 5, em que a célula vegetal é caracterizada pelo fato de que é de uma planta monocotiledônea.
7. Célula vegetal, de acordo com a reivindicação 6, caracterizada pelo fato de que a planta monocotiledônea é milho.
8. Célula vegetal caracterizada pelo fato de que compreende uma modificação genética direcionada em um locus genômico que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica a uma sequência de aminoácidos selecionada dentre o grupo que consiste nas SEQ ID NOS: 1 a 10, 12 a 51, em que a modificação genética direcionada modula o nível de expressão e/ou a atividade do polipeptídeo codificado.
9. Célula vegetal, de acordo com a reivindicação 8, caracterizada pelo fato de que a modificação direcionada resulta em nível de expressão aumentado do polinucleotídeo.
10. Célula vegetal, de acordo com a reivindicação 8 ou 9, caracterizada pelo fato de que a modificação genética direcionada é selecionada dentre o grupo que consiste em uma inserção, deleção, polimorfismo de nucleotídeo único (SNP) e uma modificação de polinucleotídeo.
11. Célula vegetal, de acordo com a reivindicação 8 ou 9, caracterizada pelo fato de que a modificação genética direcionada está presente (a) na região de codificação; (b) em uma região não codificadora; (c) em uma sequência reguladora; (d) em uma região não traduzida; ou (e) em qualquer combinação de (a) a (d) do locus genômico que codifica o polipeptídeo.
12. Célula vegetal, de acordo com qualquer uma das reivindicações 9 a 11, em que a célula vegetal é caracterizada pelo fato de que é de uma planta monocotiledônea.
13. Célula vegetal, de acordo com a reivindicação 12, caracterizada pelo fato de que a planta monocotiledônea é milho.
14. Planta caracterizada pelo fato de que compreende em seu genoma um polinucleotídeo conforme definido na reivindicação 1 ou 2, ou o construto de DNA recombinante conforme definido na reivindicação 3.
15. Planta, de acordo com a reivindicação 14, em que a planta é caracterizada pelo fato de que é uma planta monocotiledônea.
16. Planta, de acordo com a reivindicação 15, caracterizada pelo fato de que a planta monocotiledônea é milho.
17. Planta de milho, arroz ou sorgo caracterizada pelo fato de que compreende uma modificação genética direcionada em um locus genômico que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica a uma sequência de aminoácidos selecionada dentre o grupo que consiste nas SEQ ID NOS: 1 a 10 e 12, em que a modificação genética direcionada modula o nível de expressão e/ou a atividade do polipeptídeo codificado em comparação com uma planta de controle que não compreende a modificação genética.
18. Planta de milho, arroz ou sorgo, de acordo com a reivindicação 17, caracterizada pelo fato de que a modificação direcionada resulta em nível de expressão aumentado de um polinucleotídeo que codifica o polipeptídeo.
19. Planta de milho, arroz ou sorgo, de acordo com a reivindicação 17, caracterizada pelo fato de que a modificação genética direcionada é selecionada dentre o grupo que consiste em uma inserção, deleção, polimorfismo de nucleotídeo único (SNP) e uma modificação de polinucleotídeo.
20. Planta de milho, arroz ou sorgo, de acordo com a reivindicação 18 ou 19, caracterizada pelo fato de que a modificação genética direcionada está presente (a) na região de codificação; (b) em uma região não codificadora; (c) em uma sequência reguladora; (d) em uma região não traduzida; ou (e) em qualquer combinação de (a) a (d) do locus genômico que codifica o polipeptídeo.
21. Planta, de acordo com qualquer uma das reivindicações 18 a 20, em que a planta é caracterizada pelo fato de que exibe expressão aumentada de um polinucleotídeo que codifica um polipeptídeo que é pelo menos 95% idêntico a uma sequência de aminoácidos selecionada dentre o grupo que consiste na SEQ ID NO: 1 ou 2, em comparação com a planta de controle.
22. Planta, de acordo com a reivindicação 21, em que a planta é caracterizada pelo fato de que apresenta maior rendimento de grãos.
23. Semente caracterizada pelo fato de que compreende em seu genoma um polinucleotídeo conforme definido na reivindicação 1 ou 2, ou o construto de DNA recombinante conforme definido na reivindicação 4.
24. Semente, de acordo com a reivindicação 23, em que a semente é caracterizada pelo fato de que é de uma planta monocotiledônea.
25. Semente, de acordo com a reivindicação 24, caracterizada pelo fato de que a planta monocotiledônea é milho.
26. Semente de milho caracterizada pelo fato de que compreende uma modificação genética direcionada em um locus genômico que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica a uma sequência de aminoácidos selecionada dentre o grupo que consiste nas SEQ ID NOS: 3 a 5 e 12, em que a modificação genética direcionada modula o nível de expressão e/ou a atividade do polipeptídeo codificado.
27. Semente de milho, de acordo com a reivindicação 26, caracterizada pelo fato de que a modificação direcionada resulta em nível de expressão aumentado de um polinucleotídeo que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 10.
28. Semente de milho, de acordo com a reivindicação 26 ou 27, caracterizada pelo fato de que a modificação genética direcionada é selecionada dentre o grupo que consiste em uma inserção, deleção, polimorfismo de nucleotídeo único (SNP) e uma modificação de polinucleotídeo.
29. Semente de milho, de acordo com a reivindicação 26 ou 27, caracterizada pelo fato de que a modificação genética direcionada está presente (a) na região de codificação; (b) em uma região não codificadora; (c) em uma sequência reguladora; (d) em uma região não traduzida; ou (e) em qualquer combinação de (a) a (d) do locus genômico que codifica o polipeptídeo.
30. Semente de milho, de acordo com qualquer uma das reivindicações 27 a 30, em que a semente é caracterizada pelo fato de que compreende, ainda, um polipeptídeo que codifica tolerância a herbicidas e/ou resistência a insetos.
31. Semente de milho, de acordo com a reivindicação 30, caracterizada pelo fato de que a planta exibe expressão aumentada de um polinucleotídeo que codifica um polipeptídeo de SEQ ID NO: 10, em comparação com a planta de controle.
32. Método para aumentar o rendimento de grãos ou sementes ou biomassa em uma planta, em que o método é caracterizado pelo fato de que compreende: a. expressar em uma célula vegetal regenerável um construto de DNA recombinante que compreende um elemento regulador operacionalmente ligado a um polinucleotídeo que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica a uma sequência de aminoácidos selecionada dentre o grupo que consiste nas SEQ ID NOS: 1 a 10, 12 a 51; e b. gerar a planta, em que a planta compreende em seu genoma o construto de DNA recombinante.
33. Método, de acordo com a reivindicação 32, caracterizado pelo fato de que o elemento regulador é um promotor heterólogo.
34. Método, de acordo com a reivindicação 32, caracterizado pelo fato de que o polipeptídeo é pelo menos 98% idêntico a uma sequência de aminoácidos selecionada dentre o grupo que consiste nas SEQ ID NOS: 1 a 10, 12 a 51.
35. Método, de acordo com a reivindicação 32, caracterizado pelo fato de que o polinucleotídeo codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 98% idêntica a uma sequência de aminoácidos selecionada dentre o grupo que consiste nas SEQ ID NOS: 1 a 10 e 12.
36. Método, de acordo com qualquer uma das reivindicações 32 a 35, caracterizado pelo fato de que a célula vegetal é de uma planta monocotiledônea.
37. Método, de acordo com a reivindicação 36, caracterizado pelo fato de que a planta monocotiledônea é milho.
38. Método para aumentar o rendimento em uma planta, em que o método é caracterizado pelo fato de que compreende: a. introduzir em uma célula vegetal regenerável uma modificação genética direcionada em um locus genômico que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica a uma sequência de aminoácidos selecionada dentre o grupo que consiste nas SEQ ID NOS: 1 a 10, 12 a 51; e b. gerar a planta, em que o nível e/ou a atividade do polipeptídeo codificado é modulada na planta em comparação com uma planta de controle que não compreende a modificação genética.
39. Método, de acordo com a reivindicação 38, caracterizado pelo fato de que a modificação direcionada resulta em expressão aumentada de um polinucleotídeo que codifica o polipeptídeo, em comparação com a planta de controle.
40. Método, de acordo com a reivindicação 38, caracterizado pelo fato de que o polinucleotídeo codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 98% idêntica a uma sequência de aminoácidos selecionada dentre o grupo que consiste nas SEQ ID NOS: 1 a 10, 12 a 51.
41. Método, de acordo com a reivindicação 38, caracterizado pelo fato de que a modificação genética direcionada é introduzida com o uso de uma técnica de modificação de genoma selecionada dentre o grupo que consiste em uma endonuclease guiada por polinucleotídeo, endonucleases CRISPR-Cas, desaminases de edição de base, uma nuclease de dedo de zinco, uma nuclease efetora semelhante a ativador de transcrição (TALEN), meganucleases sítio- específicas geneticamente modificadas ou Argonaute.
42. Método, de acordo com a reivindicação 38, caracterizado pelo fato de que a modificação genética direcionada está presente (a) na região de codificação; (b) em uma região não codificadora; (c) em uma sequência reguladora; (d) em uma região não traduzida; ou (e) em qualquer combinação de (a) a (d) do locus genômico que codifica o polipeptídeo.
43. Método, de acordo com qualquer uma das reivindicações 39 a 42, caracterizado pelo fato de que a célula vegetal é de uma planta monocotiledônea.
44. Método, de acordo com a reivindicação 43, caracterizado pelo fato de que a planta monocotiledônea é milho.
45. Método para aumentar a atividade fotossintética em uma planta, em que o método é caracterizado pelo fato de que compreende:
a. expressar em uma célula vegetal regenerável um construto de DNA recombinante que compreende um elemento regulador operacionalmente ligado a um polinucleotídeo que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica a uma sequência de aminoácidos selecionada dentre o grupo que consiste nas SEQ ID NOS: 1 a 10, 12 a 51; e b. gerar a planta, em que a planta compreende em seu genoma o construto de DNA recombinante.
46. Método, de acordo com a reivindicação 45, caracterizado pelo fato de que o elemento regulador é um promotor heterólogo.
47. Método, de acordo com a reivindicação 45, caracterizado pelo fato de que a planta exibe expressão aumentada de um polinucleotídeo que codifica o polipeptídeo, em comparação com a planta de controle.
48. Método, de acordo com a reivindicação 45 ou 47, caracterizado pelo fato de que o polinucleotídeo codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 98% idêntica a uma sequência de aminoácidos selecionada dentre o grupo que consiste nas SEQ ID NOS: 1 a 10 e 12.
49. Método, de acordo com a reivindicação 47 ou 48, caracterizado pelo fato de que a célula vegetal é de uma planta monocotiledônea.
50. Método, de acordo com a reivindicação 49, caracterizado pelo fato de que a planta monocotiledônea é milho.
BR112020021399-3A 2018-04-18 2019-04-17 Proteínas mads box e aprimoramento de características agronômicas em plantas BR112020021399A2 (pt)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201862659579P 2018-04-18 2018-04-18
US62/659,579 2018-04-18
US201862741529P 2018-10-04 2018-10-04
US62/741,529 2018-10-04
US201862783309P 2018-12-21 2018-12-21
US62/783,309 2018-12-21
PCT/US2019/027782 WO2019204373A1 (en) 2018-04-18 2019-04-17 Mads box proteins and improving agronomic characteristics in plants

Publications (1)

Publication Number Publication Date
BR112020021399A2 true BR112020021399A2 (pt) 2021-01-19

Family

ID=73442045

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020021399-3A BR112020021399A2 (pt) 2018-04-18 2019-04-17 Proteínas mads box e aprimoramento de características agronômicas em plantas

Country Status (3)

Country Link
US (1) US20210155951A1 (pt)
CN (1) CN111989403A (pt)
BR (1) BR112020021399A2 (pt)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114835788B (zh) * 2022-05-11 2023-06-23 西南大学 蜡梅CpFUL-like基因及其编码的蛋白与应用
CN116640199A (zh) * 2023-06-12 2023-08-25 西南大学 促进枇杷开花和结果时间提前的EjFUL基因及其编码蛋白与应用

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006056590A2 (en) * 2004-11-25 2006-06-01 Cropdesign N.V. Plants having increased yield and a method for making the same
CN101702909A (zh) * 2007-06-06 2010-05-05 克罗普迪塞恩股份有限公司 在植物中通过调节玉米mads框转录因子zmm28的产量增强
CN101629184A (zh) * 2009-08-19 2010-01-20 中国科学院植物研究所 水稻e类基因在培育早花和矮化转基因植物中的应用
CN107287208A (zh) * 2016-03-31 2017-10-24 未名生物农业集团有限公司 花期调控基因和相关载体及其应用

Also Published As

Publication number Publication date
US20210155951A1 (en) 2021-05-27
CN111989403A (zh) 2020-11-24

Similar Documents

Publication Publication Date Title
WO2019204373A1 (en) Mads box proteins and improving agronomic characteristics in plants
US20240110197A1 (en) Expression modulating elements and use thereof
WO2019204266A1 (en) Interactors and targets for improving plant agronomic characteristics
CN107027313A (zh) 用于多元rna引导的基因组编辑和其它rna技术的方法和组合物
BR112020001844A2 (pt) método para reduzir altura de planta, método para identificar um alelo de br1 ou um alelo dw5 em uma população de plantas, planta semianã, planta de sorgo semianã, construção de dna recombinante, célula vegetal, sequência de rna-guia planta, semente, planta de sorgo semianã modificada, planta de sorgo anã, planta de maís mutante, método para reduzir altura de planta, planta de sorgo, população de plantas de sorgo, método para reduzir a frequência de reversão de um alelo anão 3 (dw3) em uma planta de sorgo em um fenótipo alto, planta de arroz, método de seleção assistida por marcador de uma planta
BR112020025311A2 (pt) Métodos para melhorar a engenharia e regeneração do genoma em planta ii
BR112021008330A2 (pt) edição de genoma para aumentar o teor de proteína da semente
EP3546582A1 (en) Promoter activating elements
BR112020025349A2 (pt) Métodos para melhorar a engenharia e regeneração do genoma em planta
US20200123562A1 (en) Compositions and methods for improving yield in plants
US20210403933A1 (en) Soybean gene and use for modifying seed composition
BR112020021399A2 (pt) Proteínas mads box e aprimoramento de características agronômicas em plantas
US20220346341A1 (en) Methods and compositions to increase yield through modifications of fea3 genomic locus and associated ligands
US20240018533A1 (en) Targeting microrna to regulate native gene function by genome editing
US20230024164A1 (en) Compositions and genome editing methods for improving grain yield in plants
BR112020021364A2 (pt) Aprimoramento de características agronômicas em milho por modificação de fatores de transcrição de mads box endógena
US11286496B1 (en) Modified genes to increase seed protein content
US20230220409A1 (en) Alteration of seed composition in plants
US20210388369A1 (en) Expression modulating elements and methods of use
US20230242928A1 (en) Modulating nucleotide expression using expression modulating elements and modified tata and use thereof
BR112020023702A2 (pt) modificação de glutamina sintetase para melhorar o rendimento em plantas

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]