BR112021008330A2 - edição de genoma para aumentar o teor de proteína da semente - Google Patents

edição de genoma para aumentar o teor de proteína da semente Download PDF

Info

Publication number
BR112021008330A2
BR112021008330A2 BR112021008330-8A BR112021008330A BR112021008330A2 BR 112021008330 A2 BR112021008330 A2 BR 112021008330A2 BR 112021008330 A BR112021008330 A BR 112021008330A BR 112021008330 A2 BR112021008330 A2 BR 112021008330A2
Authority
BR
Brazil
Prior art keywords
modification
plant
polypeptide
seed
sequence
Prior art date
Application number
BR112021008330-8A
Other languages
English (en)
Inventor
Zhan-Bin Liu
Bo Shen
Original Assignee
Pioneer Hi-Bred International, Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Hi-Bred International, Inc. filed Critical Pioneer Hi-Bred International, Inc.
Publication of BR112021008330A2 publication Critical patent/BR112021008330A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/54Leguminosae or Fabaceae, e.g. soybean, alfalfa or peanut
    • A01H6/542Glycine max [soybean]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8251Amino acid content, e.g. synthetic storage proteins, altering amino acid biosynthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Nutrition Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Natural Medicines & Medicinal Plants (AREA)
  • Physiology (AREA)
  • Botany (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Abstract

EDIÇÃO DE GENOMA PARA AUMENTAR O TEOR DE PROTEÍNA DA SEMENTE. Trata-se de sementes de soja com teor de proteína ou óleo aumentados e que têm uma proteína de domínio CCT modificada ou expressão modificada de uma proteína de domínio CCT. Métodos para modificar a expressão de polipeptídeos e polinucleotídeos do domínio CCT incluem edição de genoma para modificar a região reguladora de transcrição ou sequência que codifica o polipeptídeo de domínio CCT e transformação com construtos de DNA recombinante para aumentar ou suprimir a expressão.

Description

EDIÇÃO DE GENOMA PARA AUMENTAR O TEOR DE PROTEÍNA DA SEMENTE REFERÊNCIA CRUZADA A PEDIDOS RELACIONADOS
[0001] Este pedido reivindica o benefício de prioridade do Pedido de Patente número US 62/753,628, depositado em 31 de outubro de 2018, cujo conteúdo inteiro é incorporado a título de referência.
REFERÊNCIA À LISTAGEM DE SEQUÊNCIAS ENVIADA ELETRONICAMENTE
[0002] A cópia oficial da listagem de sequências é enviada eletronicamente por meio de EFS-Web como uma listagem de sequências em formato ASCII com um arquivo intitulado "7835USPSP_SeqList_ST25" criado em 26 de outubro de 2018 e com um tamanho de 70 quilobytes, e é depositada de maneira concomitante com o relatório descritivo. A listagem de sequências contida neste documento formatado em ASCII faz parte do relatório descritivo e é incorporada na sua totalidade neste documento a título de referência.
ANTECEDENTES
[0003] A soja é um importante produto agrícola em muitas partes do mundo e é uma fonte de produtos úteis, como proteína e óleo, para consumo humano e animal. Um produto valioso obtido da soja processada é o farelo de soja, que contém uma alta proporção de proteína e é usado principalmente como componente na alimentação animal. O farelo de soja pode ser processado adicionalmente para produzir isolados de proteína de soja, farinha de soja ou concentrados de soja que podem ser usados em alimentos, colas e como emulsificantes e texturizantes. Plantas de soja que produzem sementes com teor de proteína superior podem contribuir para uma colheita de valor superior.
SUMÁRIO
[0004] São fornecidos métodos para aumentar o teor de proteína na semente de uma planta de soja, introduzindo uma modificação em um gene de domínio CCT em uma planta de soja e cultivando a planta para produzir uma semente, em que o teor de proteína é aumentado na semente, em comparação com uma semente de controle de uma planta de controle que não compreende a modificação. A modificação pode incluir um ou mais de (a) uma deleção de nucleotídeos no cromossomo 20 em uma sequência genômica que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 2, que resulta em uma sequência genômica modificada no cromossomo 20 que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 4 ou 25, tal como (i) uma deleção de pelo menos 312 e menos de 330 nucleotídeos da posição 6003 a 6358 da SEQ ID NO: 9 ou (ii) uma deleção que corresponde à posição 6029 a 6349 da SEQ ID NO: 9 ou posição 6012 a 6332 da SEQ ID NO: 9; (b) uma modificação de uma sequência reguladora de transcrição de uma sequência de nucleotídeos no cromossomo 10 que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 6, tal como uma inserção de um elemento intensificador de promotor, uma alteração de um elemento repressor ou um rearranjo de elementos reguladores, que resulta em um aumento na expressão do polipeptídeo; (c) a deleção da parte (a) e uma segunda modificação de uma sequência reguladora de transcrição da sequência genômica que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 4 ou 25, tal como uma inserção de um elemento intensificador de promotor, uma alteração de um elemento repressor ou um rearranjo de elementos reguladores, que resulta em um aumento na expressão do polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 4 ou 25; (d) uma modificação de um ou mais nucleotídeos no cromossomo 20 em (i) um polinucleotídeo que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 2 ou (ii) uma sequência reguladora de transcrição do polinucleotídeo, tal como (i) uma alteração do polinucleotídeo que resulta em um frameshift da sequência de codificação do polipeptídeo, ou (ii) uma interrupção de um elemento intensificador de promotor, uma inserção de um elemento repressor ou um rearranjo de elementos reguladores, que resulta na supressão de expressão do polipeptídeo e (e) uma modificação de um ou mais nucleotídeos no cromossomo 10 em (i) um polinucleotídeo que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 6 ou (ii) uma sequência reguladora de transcrição do polinucleotídeo, essa modificação que resulta em (A) uma alteração do polinucleotídeo que resulta em um frameshift da sequência de codificação do polipeptídeo ou (B) uma interrupção de um elemento intensificador de promotor, uma inserção de um elemento repressor ou um rearranjo de elementos reguladores, de modo que a modificação resulte na supressão de expressão do polipeptídeo. Os métodos podem incluir, por exemplo, as modificações das partes (a) e (b) ou as modificações das partes (b) e (c).
[0005] Métodos são fornecidos para cruzar uma planta cultivada a partir de semente que compreende o polipeptídeo de domínio CCT modificado, com uma segunda planta diferente e colher a semente da progênie. Em algumas concretizações, a deleção ou modificação é introduzida através de rupturas de DNA direcionadas.
[0006] São fornecidas plantas e sementes com teor de proteína aumentado, as plantas ou sementes contêm uma sequência genômica de domínio CCT modificada, a modificação selecionada de (a) uma deleção de nucleotídeos no cromossomo 20 em uma sequência genômica que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 2, que resulta em uma sequência genômica modificada no cromossomo 20 que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 4 ou 25, tal como (i) uma deleção de pelo menos 312 e menos de 330 nucleotídeos da posição 6003 a 6358 da SEQ ID NO: 9 ou (ii) uma deleção que corresponde à posição 6029 a 6349 da SEQ ID NO: 9 ou posição 6012 a 6332 da SEQ ID NO: 9, em que a planta produz sementes com um teor de proteína aumentado em relação a uma semente de controle que não compreende a deleção e um rendimento que é, por exemplo, pelo menos 80%, 90%, 95%, 100%, 110% ou 120% da variedade de soja 93B83 quando cultivada nas mesmas condições ambientais; (b) uma modificação de uma sequência reguladora de transcrição de uma sequência de nucleotídeos no cromossomo 10 que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 6, tal como uma inserção de um elemento intensificador de promotor, uma alteração de um elemento repressor ou um rearranjo de elementos reguladores, que resulta em um aumento na expressão do polipeptídeo, o que resulta em um aumento na expressão do polipeptídeo, em que a planta produz sementes com teor de proteína aumentado em relação a uma semente de controle que não compreende a modificação; (c) a modificação da etapa (a) e uma segunda modificação de uma sequência reguladora de transcrição da sequência genômica que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 4 ou 25, tal como uma inserção de um elemento intensificador de promotor, uma alteração de um elemento repressor ou um rearranjo de elementos reguladores, sendo que a segunda modificação resulta em um aumento na expressão do polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 4 ou 25, em que a planta produz sementes com teor de proteína aumentado em relação a uma semente de controle que não compreende as modificações; (d) uma modificação de um ou mais nucleotídeos no cromossomo 20 em (i) um polinucleotídeo que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 2 ou (ii) uma sequência reguladora de transcrição do polinucleotídeo, tal como (i) uma alteração do polinucleotídeo que resulta em um frameshift da sequência de codificação do polipeptídeo, ou (ii) uma interrupção de um elemento intensificador de promotor, uma inserção de um elemento repressor ou um rearranjo de elementos reguladores, de modo que a modificação resulte na supressão de expressão do polipeptídeo, em que a planta produz sementes com proteína aumentada em relação a uma semente de controle que não compreende a modificação; ou (e) uma modificação de um ou mais nucleotídeos no cromossomo 10 em (i) um polinucleotídeo que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 6 ou
(ii) uma sequência reguladora de transcrição do polinucleotídeo, sendo que essa modificação resulta em (A) uma alteração do polinucleotídeo que resulta em um frameshift da sequência de codificação do polipeptídeo, ou (B) uma interrupção de um elemento intensificador de promotor , uma inserção de um elemento repressor ou um rearranjo de elementos reguladores, de modo que a modificação resulte na supressão de expressão do polipeptídeo, em que a planta produz sementes com óleo aumentado em relação a uma semente de controle que não compreende a modificação.
[0007] Em algumas concretizações, são fornecidos métodos de cultivo de plantas em que as plantas ou sementes modificadas são cruzadas com uma segunda planta de soja, tal como com outras plantas ou sementes modificadas, para produzir sementes de progênie. São fornecidas sementes de progênie produzidas pelos métodos que compreendem a modificação e têm teor de proteína aumentado em relação a uma semente de progênie de controle que não compreende a modificação.
[0008] Em algumas concretizações, são fornecidos construtos de DNA recombinante que compreendem uma sequência promotora heteróloga, tal como um promotor fracamente expresso ou específico de semente, conectado operacionalmente a um polinucleotídeo que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é de pelo menos 90% ou pelo menos 95 % idêntica à SEQ ID NO: 4 ou 25. São fornecidas plantas e sementes de soja que compreendem teor de proteína aumentado, que compreendem os construtos recombinantes, em que o polipeptídeo é expresso na semente ou semente produzida pela planta cuja semente tem teor de proteína aumentado em comparação com uma semente de controle que não expressa o polipeptídeo.
[0009] Em algumas concretizações, é fornecida uma sequência de RNA-guia que tem como alvo um locus genômico de células vegetais que compreende um polinucleotídeo que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 90% ou pelo menos 95% idêntica à SEQ ID NO: 2 ou 4. São fornecidos construtos de DNA recombinante que expressam o RNA-guia e plantas, sementes e células vegetais que compreendem o RNA-guia e/ou construtos recombinantes, construtos estes que podem ser incorporados de forma estável no genoma.
[0010] Em algumas concretizações, os construtos de DNA e plantas, células vegetais e sementes com os construtos de DNA integrados de forma estável no genoma, compreendem adicionalmente uma sequência de ácido nucleico heteróloga selecionada do grupo que consiste em: um gene repórter, um marcador de seleção, um gene de resistência a doenças, um gene de resistência a herbicidas, um gene de resistência a insetos, um gene envolvido no metabolismo de carboidratos, um gene envolvido no metabolismo de ácidos graxos, um gene envolvido no metabolismo de aminoácidos, um gene envolvido no desenvolvimento de plantas, um gene envolvido na regulação do crescimento de plantas, um gene envolvido em melhoria do rendimento, um gene envolvido em resistência a seca, um gene envolvido em aumento da eficiência da utilização de nutrientes, um gene envolvido em resistência ao frio, um gene envolvido em resistência ao calor e um gene envolvido em resistência a sal em plantas.
BREVE DESCRIÇÃO DOS DESENHOS
[0011] A Figura 1 é um desenho esquemático que mostra o mapa genômico da região de alto teor de proteína no cromossomo 20 e o mapeamento fino com o uso de três linhas de deleção.
[0012] A Figura 2 é um alinhamento de sequência das sequências genômicas parciais para glyma.20g085100 (posições 5948 a 6497 da SEQ ID NO: 9) e seu parálogo glyma.10g134400 (posições 6086 a 6312 da SEQ ID NO: 10) cada um de Glycine max Williams 82, e o parálogo sojasc125-pgfp01000066 de Glycine soja (posições 5951 a 6179 da SEQ ID NO: 11).
[0013] A Figura 3 é um alinhamento de sequência dos polipeptídeos glyma.20g085100 (SEQ ID NO: 2) e seu parálogo glyma.10g134400 (SEQ ID NO: 6), cada um de Glycine max Williams 82, e o parálogo sojasc125-pgfp01000066 de Glycine soja (SEQ ID NO: 8). (A região C-terminal não homóloga de glyma.20g085100 está sublinhada).
[0014] A Figura 4 é um desenho esquemático que representa o alelo e polipeptídeo correspondente de glyma.20g085100 em comparação com o alelo e polipeptídeo correspondente de Glycine soja.
[0015] A Figura 5 é um alinhamento de sequência dos polinucleotídeos que codificam glyma.20g085100 com a inserção de 321 bases removidas e glyma.10g134400 (resíduos não homólogos estão sublinhados).
[0016] A Figura 6 é um gráfico que mostra que a deleção da inserção de 321 pares de base no domínio CCT de glyma.20g085100 aumenta o teor de proteína em sementes de soja elite.
[0017] A Figura 7 é um gráfico que mostra que as mutações de perda de função no aumento de glyma.20g085100 resultam em um aumento no teor de proteína em sementes de soja elite.
BREVE DESCRIÇÃO DAS SEQUÊNCIAS
[0018] Tabela 1: Listagem de sequências usadas neste pedido
SEQ ID Descrição da Sequência NO: Polinucleotídeo que codifica o polipeptídeo de 1 domínio CCT de glyma.20g085100 de Williams 82 Polipeptídeo de domínio CCT de glyma.20g085100 2 Polinucleotídeo glyma.20g085100 que codifica o 3 polipeptídeo de domínio CCT de glyma.20g085100 modificado (inserção removida) Polipeptídeo de domínio CCT de glyma.20g085100 4 modificado previsto (inserção removida) Polinucleotídeo que codifica o polipeptídeo de 5 domínio CCT de glyma.10g134400 Polipeptídeo de domínio CCT de glyma.10g134400 6 Polinucleotídeo que codifica o polipeptídeo 7 sojasc125-pgfp01000066 Polipeptídeo de domínio CCT de sojasc125- 8 pgfp01000066 Polinucleotídeo genômico de glyma.20g085100 9 Polinucleotídeo genômico de glyma.20g085100 10 (inserção removida) Polinucleotídeo genômico de glyma.10g134400 11 Polinucleotídeo genômico de sojasc125- 12 pgfp01000066 Sequência de RNA-guia GM-CCT-CR2 13 Sequência de RNA-guia GM-CCT-CR3 14
Sequência de RNA-guia GM-CCT-CR1 15 Sequência de RNA-guia GM-CCT-CR4 16 Sequência de RNA-guia GM-HP-CR40 17 Sequência de RNA-guia GM-HP-CR42 18 Sequência de RNA-guia GM-HP-CR41 19 Sequência de RNA-guia GM-HP-CR44 20 Sequência de RNA-guia GM-HP-CR43 21 Sequência de RNA-guia GM-HP-CR45 22 Polinucleotídeo ZM-AS2 2X sequência EME repetida 23 (Zea mays modificada) Polinucleotídeo de domínio CCT de glyma.20g085100 (inserção removida) - emendado (spliced) 24 alternativamente Polipeptídeo de domínio CCT de glyma.20g085100 (inserção removida) modificado previsto - 25 emendado (spliced) alternativamente
DESCRIÇÃO DETALHADA
[0019] Composições e métodos relacionados a plantas modificadas que produzem sementes ricas em proteínas ou óleo são fornecidos. São fornecidas plantas que foram modificadas com o uso de técnicas de edição genômica, transformação ou mutagênese para produzir sementes que têm proteína ou óleo aumentado. Plantas adequadas incluem plantas de sementes oleaginosas, tais como palma, canola, girassol e soja, bem como, sem limitação, arroz, algodão, sorgo, trigo, milho, alfafa e cevada. Modificar a expressão de um polipeptídeo de domínio CCT (CONSTANS, CO-like e TOC1) em uma planta, como soja, ou modificar a sequência de codificação do polipeptídeo de domínio CCT, ou homólogo ou parálogo para produzir ou suprimir a expressão de um polipeptídeo de domínio CCT, resulta em uma semente com proteína ou óleo de semente alterado em relação a uma semente comparável que não compreende a modificação. A modificação pode ser introduzida com o uso de tecnologia de edição genômica, transformação ou mutagênese, tal como descrito no presente documento. São fornecidas plantas, como plantas de soja, que expressam o polipeptídeo de domínio CCT modificado e que são robustas, de alto rendimento e produzem sementes contendo proteína aumentada ou óleo aumentado. A menos que especificado de outra forma, a proteína e o óleo e outros componentes são medidos ou ajustados para uma base de umidade de 13% na semente de soja. Quando se refere a polinucleotídeos e polipeptídeos de domínio CCT no presente documento, a referência é feita tanto aos polinucleotídeos que codificam e polipeptídeos que contêm domínios CCT, quanto àqueles que codificariam ou conteriam um domínio CCT, mas por uma modificação de nucleotídeo, tal como uma inserção, que interrompe o domínio CCT.
[0020] São fornecidas sementes de soja (e plantas que produzem as sementes) que compreendem uma modificação e têm um aumento no teor de proteína na semente de pelo menos 0,1, 0,2, 0,3, 0,4, 0,5, 0,6, 0,7, 0,8, 0,9, 1,0, 1,1, 1,2, 1,3, 1,4, 1,5, 1,6, 1,7, 1,8, 1,9, ou 2,0 e inferior a 3,0, 2,9, 2,8, 2,7, 2,6, 2,5, 2,4, 2,3, 2,2, 2,1, 2,0, 1,9, 1,8, 1,7, 1,6, ou 1,5 pontos percentuais em peso em comparação com uma semente de soja não modificada, de controle, nula ou de tipo selvagem (e planta que produz a semente) que não compreende a modificação. São fornecidas sementes de soja com um teor de proteína de pelo menos 30,0%, 30,5%, 31,0%, 31,5%, 32,0%, 32,5%, 33,0%, 33,5%, 34,0%, 34,5%, 35,0%, 35,5%, 36,0%, 36,5%,
37,0%, 37,5%, 38,0%, 38,5%, 39,0%, 39,5%, 40,0%, 40,5%, 41,0%, 41,5% ou 42,0% (pontos percentuais em peso) e inferior a 55%, 54%, 53%, 52%, 51%, 50%, 49%, 48%, 47%, 46%, 45% ou 44% (pontos percentuais em peso).
[0021] São fornecidas sementes de soja (e plantas que produzem as sementes) que compreendem uma modificação e têm um aumento no teor de óleo na semente de pelo menos 0,1, 0,2, 0,3, 0,4, 0,5, 0,6, 0,7, 0,8, 0,9, 1,0, 1,1, 1,2, 1,3, 1,4, 1,5, 1,6, 1,7, 1,8, 1,9, 2,0, 2,1, 2,2, 2,3, 2,4, 2,5, 2,6, 2,7, 2,8, 2,9, 3,0, 3,1, 3,2, 3,3, 3,4, 3,5, 3,6, 3,7, 3,8, 3,9, 4,0, 4,1, 4,2, 4,3, 4,4, 4,5, 4,6, 4,7, 4,8, 4,9, 5,0, 5,1, 5,2, 5,3, 5,4, 5,5, 5,6, 5,7, 5,8, 5,9, ou 6,0 % (pontos percentuais em peso) e inferior a 8,0, 7,9, 7,8, 7,7, 7,6, 7,5, 7,4, 7,3, 7,2, 7,1, 7,0, 6,9, 1,8, 6,7, 6,6, 6,5, 6,4, 6,3, 6,2, 6,1, 6,0, 5,9, 5,8, 5,7, 5,6, 5,5, 5,4, 5,3, 5,2, 5,1 ou 5,0 % (pontos percentuais em peso) em comparação com uma semente de soja não modificada, de controle, nula ou de tipo selvagem (e planta que produz a semente) que não compreende a modificação. São fornecidas sementes de soja com um teor de óleo nas sementes de pelo menos 15%, 16%, 17%, 18%, 19% ou 20% (pontos percentuais em peso) e inferior a cerca de 30%, 29%, 28%, 27%, 26%, 25%, 24%, 23%, 22% ou 21% (pontos percentuais em peso).
[0022] São fornecidas sementes de soja (e plantas que produzem as sementes) que compreende uma modificação com uma diminuição do teor de fibra na semente de pelo menos 0,1, 0,2, 0,3, 0,4, 0,5, 0,6, 0,7, 0,8, 0,9, 1,0, 1,1, 1,2, 1,3, 1,4, 1,5, 1,6, 1,7, 1,8, 1,9, 2,0, 2,1, 2,2, 2,3, 2,4, 2,5, 2,6, 2,7, 2,8, 2,9, 3,0, 3,1, 3,2, 3,3, 3,4, 3,5, 3,6, 3,7, 3,8, 3,9, 4,0, 4 6,0 e inferior a 8,0, 7,9, 7,8, 7,7, 7,6, 7,5,
7,4, 7,3, 7,2, 7,1, 7,0, 6,9, 1,8, 6,7, 6,6, 6,5, 6,4, 6,3, 6,2, 6,1, 6,0, 5,9, 5,8, 5,7, 5,6, 5,5, 5,4, 5,3, 5,2, 5,1 ou 5,0 pontos percentuais em peso em comparação com uma semente de soja não modificada, de controle, nula ou de tipo selvagem (e planta que produz a semente) que não compreende a modificação. São fornecidas sementes de soja com um teor de fibra nas sementes inferior a 8,0, 7,5, 7,0, 6,5, 6,0, 5,9, 5,8, 5,7, 5,6, 5,5, 5,4, 5,3, 5,2, 5,1, 5,0, 4,9, 4,8, 4,7, 4,6, 4,5, 4,4, 4,3, 4,2, 4,1, 4,0, 3,9, 3,8, 3,7, 3,6, 3,5, 3,4, 3,3, 3,2, 3,1 ou 3,0% (pontos percentuais em peso) e pelo menos 1,0, 1,5, 2,0, 2,5 ou 3,0% (pontos percentuais em peso).
[0023] São fornecidas plantas que contêm uma modificação revelada no presente documento e que têm um rendimento de sementes de soja em peso a 13% de umidade que é pelo menos 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 99%, 100%, 101%, 102%, 103%, 104%, 105%, 106%, 107%, 109%, 110%, 111%, 112%, 113%, 114%, 115%, 116%, 117%, 118%, 119%, 120%, 121%, 122%, 123%, 124%, 125%, 126%, 127%, 128%, 129%, 130%, 131%, 132%, 133%, 134% ou 135% e inferior a 250%, 240%, 203%, 220%, 210%, 200%, 195%, 190%, 185%, 180%, 175%, 170%, 165%, 160%, 155%, 150%, 145% ou 140% do rendimento de sementes em peso da variedade de soja 93B83 (Patente nº US 5,792,909), quando cultivadas sob as mesmas condições ambientais. Sementes representativas da variedade de soja 93B83 foram depositadas sob o Nº de Acesso ATCC 209766 em 10 de abril de 1998. Como usado no presente documento, "nas mesmas condições ambientais" significa que as plantas são cultivadas nas proximidades do campo ou em uma estufa sob condições de não estresse adequadas para o crescimento de uma planta de soja até a maturidade, com as plantas sendo expostas ao mesmo ambiente e sementes colhidas de cada planta no estágio de maturidade de crescimento R8.
[0024] A Requerente fez um depósito de pelo menos 2.500 sementes de Variedade de Soja 93B83 com a American Type Culture Collection (ATCC), 10801 University Boulevard, Manassas, Va. 20110, EUA, como Depósito ATCC No. 209766. As sementes foram depositadas na ATCC em 10 de abril de 1998. Este depósito da Variedade de Soja 93B83 será mantido no depositário da ATCC, que é um depositário público, por um período de 30 anos, ou 5 anos após o pedido mais recente, ou pela vida efetiva da patente, o que for mais longo, e será substituído caso se torne inviável durante esse período. Além disso, a Requerente atendeu a todas as exigências de CFR título 37 parágrafos 1.801 a
1.809. Após a aceitação de quaisquer reivindicações no pedido, a Requerente (ou Requerentes) manterá e disponibilizará este depósito ao público de acordo com o Tratado de Budapeste.
[0025] As sementes de soja podem ser processadas de forma eficiente para produzir farelo (farelo rico em proteínas produzido a partir de grãos descascados ou farelo convencional produzido a partir de grãos de soja inteiros) com um alto teor de proteína em comparação com farelo comparável produzido a partir de sementes comparáveis que não contêm a modificação. Em algumas concretizações, é fornecido farelo que tem um teor de proteína que é aumentado em pelo menos 0,5, 1,0, 1,5, 2,0, 2,5, 3,0, 3,5, 4,0, 4,5 ou 5,0% por cento em peso e menos de 12,0, 11,0, 10,0, 9,0, 8,0, 7,0, 6,0 ou 5,0% em peso em comparação com a farelo preparado a partir de uma semente de soja não modificada, de controle, nula ou de tipo selvagem que não compreende a modificação. O farelo pode ser preparado a partir de uma semente de planta que compreende a modificação e pode compreender um polinucleotídeo modificado descrito no presente documento.
[0026] Os polipeptídeos e polinucleotídeos modificados descritos no presente documento incluem ou codificam polipeptídeos que compreendem um domínio CCT (CONSTANS, CO- like e TOC1). O domínio CCT é uma sequência de aminoácidos altamente conservada de cerca de 43 aminoácidos frequentemente encontrados em proteínas de transdução de sinal de luz e proteínas que têm um papel na modulação do tempo de floração, com efeitos pleiotrópicos em características morfológicas e tolerâncias ao estresse em arroz, milho e outras colheitas de cereais (Consultar, por exemplo, Yipu Li e Mingliang Xu, 2017, CCT family genes in cereal crops: A current overview. The Crop Journals 449 a 458). A função da proteína de domínio CCT na soja é desconhecida. A menos que expressamente declarado em contrário, "soja" significa uma planta de soja ou semente de Glycine max. O domínio CCT ocorre nas posições 326 a 370 na SEQ ID NO: 6 (sequência da proteína glyma.10g134400); nas posições 327 a 370 na SEQ ID NO: 4 (sequência de proteína glyma.20g850100 com inserção de 321 pares de base (pb) removida) e nas posições 320 a 336 na SEQ ID NO: 8 (sequência de proteína de sojasc125-pgfp01000066 de Glycine soja.
[0027] Exemplos de polipeptídeos incluem aqueles codificados por dois parálogos de genes encontrados na soja Glycine max: glyma.20g085100 (SEQ ID NO: 1) um polinucleotídeo que codifica um polipeptídeo de domínio CCT interrompido (SEQ ID NO: 2; proteína CCT 85100) localizada no cromossomo 20 de soja e glyma.10g134400 (SEQ ID NO: 5) localizado no cromossomo 10 que codifica um polipeptídeo de domínio CCT (SEQ ID NO: 6). Os parálogos compartilham homologia entre si no N-terminal e com um alelo encontrado na soja selvagem Glycine soja: sojasc125-pgfp01000066 (SEQ ID NO: 7) codificando o polipeptídeo sojasc125-pgfp01000066 (SEQ ID NO: 8). "Glyma.20g085100" é usado no presente documento indistintamente com a proteína, polipeptídeo ou polinucleotídeo "CCT 85100". "Glyma.10g134400" é usado no presente documento indistintamente com a proteína, polipeptídeo ou polinucleotídeo "CCT 134400". "Sojasc125- pgfp01000066" é usado indistintamente no presente documento com a proteína, polipeptídeo ou polinucleotídeo "CCT 1000066". A proteína CCT 85100 é codificada por um nucleotídeo que inclui uma inserção de 321 pares de base não encontrada no nucleotídeo que codifica a proteína CCT 134400 ou o nucleotídeo que codifica a proteína CCT 1000066, resultando na codificação de uma proteína que não contém um domínio CCT.
A inserção ocorre da posição 6029 a 6349 da SEQ ID NO: 9, que corresponde à posição após 352 da SEQ ID NO: 2. No entanto, no local de inserção de 321 pb, há uma duplicação de 17 pares de bases, a inserção também poderia ocorrer nas posições 6012 a 6332 da SEQ ID NO: 9. Podem ser realizadas modificações de sequências que correspondem a qualquer localização.
A inserção de 321 pares de base (pb) causa um frameshift de modo que a sequência de codificação de 4 exon, tal como encontrada na região genômica no cromossomo 10 (SEQ ID NO: 10), se torna uma sequência de codificação de 5 exon no cromossomo 20, e de modo que a região C-terminal da proteína CCT 85100 (da posição 323 a 443 da SEQ ID NO: 2) é uma nova sequência sem o domínio CCT e diferente do C-terminal da proteína CCT 134400 e da proteína CCT 1000066. A Figura 2 mostra o alinhamento desses três polinucleotídeos com a região C-terminal não alinhada sublinhada.
[0028] Em algumas concretizações, a modificação compreende uma modificação no cromossomo 20 da soja para excluir toda ou parte da inserção de 321 pb encontrada na SEQ ID NO: 9 (posições 6029 a 6349 ou 6012 a 6332), para produzir uma sequência de codificação, como mostrado na SEQ ID NO: 3, que codifica uma proteína CCT 85100 modificada mostrada na SEQ ID NO: ou a proteína CCT emendada (spliced) alternativamente mostrada na SEQ ID NO: 25, ou que codifica um polipeptídeo funcional para aumentar a proteína e compartilhar uma porcentagem de identidade com a SEQ ID NO: 4 ou 25, como descrito no presente documento. As sequências de codificação de polinucleotídeo para a SEQ ID NO: 4 e 25 são mostradas como SEQ ID NO: 3 e 24, respectivamente. Em algumas concretizações, a deleção é de 3, 6, 9 ou 12 pares de bases mais longa ou mais curta do que a inserção de 321 pb, que resulta em uma deleção de 309, 312, 315, 318, 321, 324, 327, 330 ou 333 pb ou uma deleção de pelo menos 309, 312, 315, 318, 321, 324, 327, 330 e menos do que 333, 330, 327, 324, 321, 318, 315 ou 312 pb. A sequência contendo a deleção produz um polipeptídeo de domínio CCT funcional que tem um, dois, três ou quatro aminoácidos a menos ou mais na região que corresponde ao sítio de inserção de 321 pb. A deleção pode começar na posição que corresponde a 6003, 6006, 6009, 6012, 6015, 6018 ou 6021 da SEQ ID NO: 9 e terminar na posição que corresponde a 6323, 6326, 6329, 6332, 6335, 6338 ou 6341 da SEQ ID NO: 9. A deleção pode começar na posição que corresponde a 6020, 6023, 6026, 6029, 6032, 6035 ou 6038 da SEQ ID NO: 9 e terminar na posição que corresponde a 6340, 6343, 6346, 6349, 6352, 6355 ou 6358 da SEQ ID NO: 9.
A deleção pode começar na posição que corresponde a 6003, 6006, 6009, 6012, 6015, 6018 ou 6021 6020, 6023, 6026, 6029, 6032, 6035 ou 6038 da SEQ ID NO: 9 e terminar na posição que corresponde a 6323, 6326, 6329, 6332, 6335, 6338, 6341, 6340, 6343, 6346, 6349, 6352, 6355 ou 6358 da SEQ ID NO: 9. As plantas produzem sementes com proteína aumentada, como descrito no presente documento. O genoma pode ser modificado adicionalmente para incluir uma sequência que aumenta a expressão da proteína CCT 85100 modificada como revelado no presente documento.
[0029] Em algumas concretizações, a modificação resulta na supressão do polipeptídeo nativo glyma.20g085100 que não contém um domínio CCT (por exemplo, SEQ ID NO: 2). O genoma é modificado para realizar knock-out, silenciar, reduzir ou suprimir a expressão do polipeptídeo glyma.20g085100 nativo, como pela interrupção da estrutura de leitura através da inserção ou deleção de uma ou mais bases únicas ou sequências curtas ou longas, introduzindo um número suficiente de SNPs para interromper a função ou pela modificação de uma sequência reguladora de transcrição na região reguladora de transcrição para incluir, por exemplo, elementos repressores, elementos de ligação do repressor ou elementos intensificadores do promotor interrompidos para reduzir ou prevenir a expressão do polipeptídeo glyma.20g085100. Em algumas concretizações, o nível de expressão do polinucleotídeo ou polipeptídeo em um tecido ou órgão de interesse, como a semente, endosperma da semente, embrião, folha, raiz ou caule, é inferior a 95, 90, 85, 80, 75, 70, 65, 60, 55, 50, 45, 40, 35, 30, 25, 20, 15, 10, 5, 4, 3, 2, ou 1% do nível de expressão do polinucleotídeo ou polipeptídeo em um controle comparável, tecido ou órgão não modificado ou nulo de interesse. São obtidas plantas que produzem sementes com proteína aumentada, como descrito no presente documento.
[0030] Em algumas concretizações, a modificação compreende uma modificação no cromossomo 10 da soja para aumentar a expressão de uma proteína CCT 134400 ou uma proteína CCT 85100 modificada. O genoma pode ser modificado para inserir um elemento regulador, como um elemento intensificador de promotor ou um elemento para evitar a atividade de um repressor de transcrição, de modo que a expressão da proteína CCT 134400 ou da proteína CCT 85100 modificada seja aumentada. São fornecidas plantas transgênicas que compreendem construtos que contêm um polinucleotídeo que codifica um polipeptídeo CCT 134400 ou uma proteína CCT 85100 modificada conectada operacionalmente a um elemento regulador heterólogo. Heterólogo significa que as sequências são de uma localização, cromossomo ou região cromossômica diferente no genoma do organismo, ou são de espécies diferentes e não são encontradas juntas na natureza. As plantas produzem sementes com proteína aumentada, como descrito no presente documento.
[0031] Em algumas concretizações, a planta de soja inclui adicionalmente uma sequência de ácido nucleico heteróloga selecionada do grupo que consiste em: um gene repórter, um marcador de seleção, um gene de resistência a doenças, um gene de resistência a herbicidas, um gene de resistência a insetos, um gene envolvido no metabolismo de carboidratos, um gene envolvido no metabolismo de ácidos graxos, um gene envolvido no metabolismo de aminoácidos, um gene envolvido no desenvolvimento de plantas, um gene envolvido na regulação do crescimento de plantas, um gene envolvido em melhoria do rendimento, um gene envolvido em resistência a seca, um gene envolvido em aumento da eficiência da utilização de nutrientes, um gene envolvido em resistência ao frio, um gene envolvido em resistência ao calor e um gene envolvido em resistência a sal em plantas.
[0032] São fornecidos polinucleotídeos que têm pelo menos cerca de ou pelo menos 40%, 45%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou identidade de sequência maior em comparação com uma sequência de nucleotídeos de referência, tal como uma sequência de nucleotídeos revelada na listagem de sequência no presente documento, com o uso de um dos programas de alinhamento descritos no presente documento com o uso de parâmetros padrão, bem como substituições, deleções, inserções de nucleotídeos, fragmentos dos mesmos e combinações dos mesmos.
[0033] Um "polinucleotídeo isolado" se refere, de maneira geral, a um polímero de ribonucleotídeos (RNA) ou desoxirribonucleotídeos (DNA) que é de fita simples ou dupla, opcionalmente contendo bases nucleotídicas sintéticas, não naturais ou alteradas, que não está mais em seu ambiente natural e foi colocado em um ambiente diferente pela mão do homem, por exemplo, in vitro. Um polinucleotídeo isolado na forma de DNA pode ser compreendido de um ou mais segmentos de cDNA, DNA genômico ou DNA sintético.
[0034] Uma molécula de ácido nucleico "recombinante" (ou DNA) é usada no presente documento para se referir a uma sequência de ácido nucleico (ou DNA) que está em uma célula hospedeira bacteriana ou vegetal recombinante. Em algumas concretizações, um ácido nucleico "isolado" ou "recombinante" está livre de sequências (de preferência sequências de codificação de proteínas) que flanqueiam naturalmente o ácido nucleico (ou seja, sequências localizadas nas extremidades 5' e 3' do ácido nucleico) no DNA genômico do organismo do qual o ácido nucléico é derivado.
[0035] Os termos “polinucleotídeo”, “sequência polinucleotídica”, “sequência de ácido nucleico”, “fragmento de ácido nucleico” e “fragmento de ácido nucleico isolado” são usados de forma intercambiável no presente documento. Esses termos englobam sequências nucleotídicas e similares. Um polinucleotídeo pode ser um polímero de RNA ou DNA que é de fita simples ou dupla contendo opcionalmente bases nucleotídicas sintéticas, não naturais ou alteradas. Um polinucleotídeo na forma de um polímero de DNA pode ser compreendido de um ou mais segmentos de cDNA, DNA genômico, DNA sintético ou misturas dos mesmos. Os nucleotídeos (normalmente encontrados em sua forma 5’-monofosfato) são denominados por uma designação de letra única conforme segue: “A” para adenilato ou desoxiadenilato (para RNA ou DNA, respectivamente), “C” para citidilato ou desoxicitidilato, “G” para guanilato ou desoxiguanilato, “U” para uridilato, “T” para desoxitimidilato, “R” para purinas (A ou G), “Y” para pirimidinas (C ou T), “K” para G ou T, “H” para A ou C ou T, “I” para inosina e “N” para qualquer nucleotídeo.
[0036] Um elemento ou sequência reguladora de transcrição ou um elemento ou sequência reguladora se refere, de maneira geral, a um elemento regulador de transcrição envolvido na regulação da transcrição de uma molécula de ácido nucleico, tal como um gene ou um gene alvo. O elemento regulador é um ácido nucleico e pode incluir um promotor, um intensificador, um íntron, uma região 5' não traduzida (5'- UTR, também conhecida como uma sequência líder), ou uma 3'-UTR ou uma combinação dos mesmos. Um elemento regulador pode atuar em “cis” ou “trans” e geralmente atua em “cis”, isto é, ativa a expressão de genes localizados na mesma molécula de ácido nucleico, por exemplo, um cromossomo, onde o elemento regulador está localizado. A molécula de ácido nucleico regulada por um elemento regulador não precisa necessariamente codificar um peptídeo ou polipeptídeo funcional, por exemplo, o elemento regulador pode modular a expressão de um RNA curto de interferência ou um RNA antissenso.
[0037] Em algumas concretizações, o polinucleotídeo modificado inclui uma sequência intensificadora de transcrição modificada. Um elemento intensificador é qualquer molécula de ácido nucleico que aumenta a transcrição de uma molécula de ácido nucleico quando funcionalmente ligado a um promotor independentemente da sua posição relativa. Um intensificador pode ser um elemento inato do promotor ou um elemento heterólogo inserido para aumentar a quantidade de atividade de promotor ou especificidade para o tecido de um promotor.
[0038] Vários intensificadores podem ser usados, incluindo íntrons com propriedades de intensificação de expressão gênica em plantas (Publicação do Pedido de Patente Número US 2009/0144863), o íntron da ubiquitina (isto é, o íntron 1 da ubiquitina de milho (consultar, por exemplo, sequência NCBI S94464)), o intensificador ômega ou o intensificador ômega prime (Gallie, et al., (1989) Molecular
Biology of RNA ed. Cech (Liss, New York) 237 a 256 e Gallie, et al., (1987) Gene 60:217 a 25), o intensificador CaMV 35S (consultar, por exemplo, Benfey, et al., (1990) EMBO J. 9:1685 a 96) e os intensificadores da Patente Número US 7,803,992 também podem ser usados, cada um dos quais é incorporado a título de referência. A lista acima de intensificadores de transcrição não é destinada a ser limitante. Qualquer intensificador de transcrição apropriado pode ser usado nas concretizações.
[0039] Um repressor (também algumas vezes denominado no presente documento silenciador, elemento repressor ou elemento de ligação ao repressor) é definido como qualquer molécula de ácido nucleico que inibe a transcrição quando ligada funcionalmente a um promotor, independentemente da posição relativa.
[0040] “Promotor” geralmente se refere a um fragmento de ácido nucleico com capacidade para controlar a transcrição de um outro fragmento de ácido nucleico. Um promotor geralmente inclui uma sequência promotora central (também conhecida como promotora mínima) que inclui uma região reguladora mínima para iniciar a transcrição, isto é um sítio de iniciação da transcrição. Geralmente, um promotor central inclui uma caixa TATA e uma região rica em GC associada a uma caixa CAAT ou uma caixa CCAAT. Esses elementos atuam na ligação da RNA polimerase II ao promotor e ajudam a polimerase a localizar o sítio de iniciação do RNA. Alguns promotores podem não ter uma caixa TATA ou caixa CAAT ou uma caixa CCAAT, mas, em vez disso, podem conter um elemento iniciador para o sítio de iniciação da transcrição. Um promotor central é uma sequência mínima necessária para direcionar a iniciação da transcrição e, em geral, pode não incluir intensificadores ou outras UTRs. Os promotores podem ser derivados em sua totalidade de um gene nativo ou podem ser compostos de diferentes elementos derivados de diferentes promotores encontrados na natureza ou, ainda, podem compreender segmentos de DNA sintéticos. É entendido pelos versados na técnica que diferentes promotores podem direcionar a expressão de um gene em diferentes tecidos ou tipos de célula, ou em diferentes estágios de desenvolvimento ou em resposta a diferentes condições ambientais. Os promotores centrais são frequentemente modificados para produzir promotores artificiais, quiméricos ou híbridos e podem ser adicionalmente usados em combinação com outros elementos reguladores, tais como elementos em cis, UTRs 5’, intensificadores ou íntrons, que são heterólogos a um promotor central ativo ou combinados com seus próprios elementos reguladores parciais ou completos.
[0041] O termo “elemento em cis” geralmente se refere a um elemento regulador da transcrição que afeta ou modula a expressão de um polinucleotídeo apto a ser transcrito operacionalmente ligado, em que o polinucleotídeo apto a ser transcrito está presente na mesma sequência de DNA. Um elemento em cis pode funcionar para ligar fatores de transcrição que são polipeptídeos de atuação em trans que regulam a transcrição.
[0042] A região de terminação pode ser nativa com a região de iniciação da transcrição, pode ser nativa com a sequência de DNA operacionalmente ligada de interesse, pode ser nativa com a planta ou pode ser derivada de outra fonte (ou seja, estranha ou heteróloga ao promotor, à sequência de interesse, à planta ou qualquer combinação dos mesmos).
[0043] As sequências incluem um ou mais nucleotídeos contíguos. "Nucleotídeos contíguos" é usado no presente documento para se referir a resíduos de nucleotídeos que são imediatamente adjacentes uns aos outros.
[0044] Como usado no presente documento, sequência de ácido nucleico, molécula de ácido nucleico ou polinucleotídeo não genômico se refere a uma molécula de ácido nucleico que tem uma ou mais alterações na sequência de ácido nucleico em comparação com uma sequência de ácido nucleico nativa ou genômica. Em algumas concretizações, a mudança para uma molécula de ácido nucleico nativa ou genômica inclui, porém, sem limitação: mudanças na sequência de ácido nucleico devido à degenerescência do código genético; otimização da sequência de ácido nucleico para expressão em plantas; alterações na sequência de ácido nucleico para introduzir pelo menos uma substituição, inserção, deleção e/ou adição de aminoácido em comparação com a sequência nativa ou genômica; deleção de uma ou mais regiões reguladoras a montante ou a jusante associadas à sequência de ácido nucleico genômico; inserção de uma ou mais regiões reguladoras heterólogas a montante ou a jusante; deleção da região 5' e/ou 3' não traduzida associada à sequência de ácido nucleico genômico; inserção de uma região heteróloga 5' e/ou 3' não traduzida e modificação de um sítio de poliadenilação. Em algumas concretizações, a molécula de ácido nucleico não genômico é uma sequência de ácido nucleico sintética.
[0045] São fornecidos polipeptídeos que têm pelo menos cerca de ou pelo menos 40%, 45%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%,
80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou identidade de sequência maior em comparação com polipeptídeos referenciados na listagem de sequência, bem como substituições, deleções, inserções de aminoácidos, fragmentos dos mesmos e combinações dos mesmos. O termo "cerca de" quando usado no presente documento em contexto com identidade de sequência em porcentagem significa +/- 0,5%. Estes valores podem ser apropriadamente ajustados para determinar a homologia correspondente de proteínas considerando a similaridade de aminoácidos e semelhantes.
[0046] Em algumas concretizações, a identidade de sequência é contra a sequência de comprimento total de um polipeptídeo revelado na listagem de sequência. Em algumas concretizações, o polipeptídeo retém atividade ou mostra atividade aumentada ou reduzida
[0047] Como usado aqui, o termo "proteína", "molécula de peptídeo" ou "polipeptídeo" inclui aquelas moléculas que sofrem modificação, incluindo modificações pós-tradução, tais como, mas sem limitação, formação de ligações dissulfeto, glicosilação, fosforilação ou oligomerização.
[0048] Os termos "aminoácido" e "aminoácidos" se referem a todos os L-aminoácidos de ocorrência natural.
[0049] Variantes podem ser preparadas efetuando-se mutações aleatórias ou as variantes podem ser planejadas. No caso de mutantes projetados, há uma alta probabilidade de gerar variantes com atividade semelhante ao polipeptídeo nativo quando a identidade de aminoácidos é mantida em regiões críticas do polipeptídeo que são responsáveis por atividade biológica ou estão envolvidas na determinação de configuração tridimensional que em última análise é responsável pela atividade biológica. Também ocorrerá uma probabilidade elevada de reter a atividade se as substituições forem conservativas. Os aminoácidos podem ser colocados nas seguintes classes: não polares, polares sem carga, básicos e ácidos. É menos provável que substituições conservativas pelas quais um aminoácido de uma classe é substituído por outro aminoácido do mesmo tipo alterem materialmente a atividade biológica da variante. A Tabela 1 proporciona uma listagem de exemplos de aminoácidos pertencentes a cada classe. Tabela 2: Classes de aminoácidos Classe de Exemplos de Aminoácidos Aminoácidos Cadeias Laterais Não Ala (A), Val (V), Leu (L), Ile Polares (I), Pro (P), Met (M), Phe (F), Trp (W) Cadeias Laterais Gly (G), Ser (S), Thr (T), Cys Polares Sem Carga (C), Tyr (Y), Asn (N), Gln (Q) Cadeias Laterais Asp (D), Glu (E) Ácidas Cadeias Laterais Lys (K), Arg (R), His (H) Básicas Cadeias Laterais Com Thr, Val, Ile Ramificação Beta Cadeias Laterais Tyr, Phe, Trp, His Aromáticas
[0050] Alternativamente, alterações podem ser feitas à sequência de proteína de muitas proteínas no terminal amino ou carbóxi sem afetar substancialmente a atividade. Essas podem incluir inserções, deleções ou alterações introduzidas por métodos moleculares modernos, como reação em cadeia da polimerase (PCR), incluindo amplificações de PCR que alteram ou estendem a sequência de codificação da proteína por inclusão de sequências de codificação de aminoácidos nos oligonucleotídeos utilizados na amplificação de PCR. Alternativamente, as sequências de proteínas adicionadas podem incluir sequências de codificação de proteína inteiras, para gerar fusões de proteínas. Tais proteínas de fusão são frequentemente usadas para (1) aumentar a expressão de uma proteína de interesse (2) introduzir um domínio de ligação, atividade enzimática ou epítopo para facilitar a purificação da proteína, a detecção da proteína ou outros usos experimentais (3) direcionar a secreção ou tradução de uma proteína para uma organela subcelular, tal como o espaço periplasmático de bactérias Gram-negativas, mitocôndrias ou cloroplastos de plantas ou o retículo endoplasmático de células eucarióticas, sendo que o último resulta frequentemente em glicosilação da proteína.
[0051] Para determinar a identidade percentual de duas sequências de aminoácidos ou de dois ácidos nucleicos, as sequências são alinhadas para propósitos de comparação ideais. A identidade percentual entre as duas sequências é uma função do número de posições idênticas compartilhadas pelas sequências (isto é, identidade percentual = número de posições idênticas/número total de posições (por exemplo, posições em sobreposição) ×100). Em uma concretização, as duas sequências têm o mesmo comprimento. Em outra concretização, a identidade percentual é calculada através da totalidade da sequência de referência. A identidade percentual entre duas sequências pode ser determinada com o uso de técnicas similares àquelas descritas abaixo, com ou sem permissão de intervalos. Ao calcular a porcentagem de identidade, tipicamente as correspondências exatas são consideradas. Um intervalo (uma posição em um alinhamento em que um resíduo está presente em uma sequência, mas não na outra) é considerado uma posição com resíduos não idênticos.
[0052] A determinação da identidade percentual entre duas sequências pode ser alcançada com o uso de um logaritmo matemático. Um exemplo não limitante de um algoritmo matemático utilizado para a comparação de duas sequências é o algoritmo incorporado nos programas BLASTN e BLASTX. Karlin and Altschul (1990) Proc. Nat'l. Acad. Sci. USA 87:2264, Altschul et al. (1990) J. Mol. Bioi. 215:403, e Karlin and Altschul (1993) Proc. Nat'l. Acad. Sci. USA 90:5873-5877. As pesquisas de nucleotídeos de BLAST podem ser realizadas com o programa BLASTN, pontuação = 100, comprimento de palavra = 12, para obter sequências de nucleotídeos homólogas às moléculas de ácido nucleico reveladas no presente documento. As pesquisas de proteínas de BLAST podem ser realizadas com o programa BLASTX, pontuação = 50, comprimento de palavra = 3, para obter sequências de aminoácidos homólogas aos polipeptídeos revelados no presente documento. Para obter alinhamentos incompletos para propósitos de comparação, Gapped BLAST (em BLAST 2.0) pode ser utilizado conforme descrito em Altschul, et al., (1997) Nucleic Acids Res. 25:3.389. Alternativamente, PSI-Blast pode ser usado para realizar uma busca iterada que detecta relações distantes entre moléculas. Ver Altschul et al. (1997) supra. Ao utilizar os programas BLAST, Gapped BLAST e PSI-Blast, os parâmetros padrão dos respectivos programas
(por exemplo, BLASTX e BLASTN) podem ser usados. O alinhamento também pode ser realizado manualmente por inspeção.
[0053] Outro exemplo não limitante de um algoritmo matemático utilizado para a comparação de sequências é o algoritmo ClustalW (Higgins, et al., (1994) Nucleic Acids Res. 22:4673-4680). ClustalW compara sequências e alinha a totalidade da sequência de DNA ou de aminoácido e, portanto, pode fornecer dados sobre a conservação de sequência de toda a sequência de aminoácidos. O algoritmo ClustalW é usado em diversos pacotes de software de análise de DNA/aminoácidos comercialmente disponíveis, tais como, o módulo ALIGNX do Pacote de Programas Vector NTI (Invitrogen Corporation, Carlsbad, CA). Depois do alinhamento das sequências de aminoácidos com ClustalW, a identidade de aminoácido percentual pode ser avaliada. Um exemplo não limitante de um programa de software útil para a análise de alinhamentos ClustalW é o GENEDOC™. O GENEDOC™ (Karl Nicholas) permite avaliação da similaridade e da identidade de aminoácido (ou DNA) entre múltiplas proteínas. Outro exemplo não limitante de um algoritmo matemático utilizado para a comparação de sequências é o algoritmo de Myers e Miller, (1988) CABIOS 4(1):11-17. Tal algoritmo é incorporado no programa ALIGN (versão 2.0), que é parte do Pacote de Software GCG Wisconsin Genetics, Versão 10 (disponível junto a Accelrys, Inc., San Diego, CA, EUA). Ao utilizar o programa ALIGN para comparar sequências de aminoácidos, uma tabela de resíduo de peso PAM120, uma penalidade de comprimento de vão de 12 e uma penalidade de vão de 4 podem ser usadas. A menos que afirmado em contrário, GAP Versão 10, que usa o algoritmo de Needleman e Wunsch (1970) J. Mol. Biol. 48(3):443-453, será usado para determinar a identidade ou similaridade de sequência usando os parâmetros seguintes: % de identidade e % de similaridade para uma sequência de nucleotídeos com o uso de GAP Peso de 50 e Peso de Comprimento de 3, e a matriz de pontuação nwsgapdna.cmp; % de identidade ou % de similaridade para uma sequência de aminoácidos com o uso de GAP peso de 8 e peso de comprimento de 2, e o programa de pontuação BLOSUM62. Programas equivalentes podem também ser usados. Por "programa equivalente" pretende-se significar qualquer programa de comparação de sequências que, para quaisquer duas sequências em questão, gera um alinhamento tendo correspondências entre resíduos de nucleotídeos idênticos e uma percentagem de identidade de sequência idêntica em comparação com o alinhamento correspondente gerado por GAP Versão 10.
[0054] São fornecidas moléculas de ácido nucleico isoladas ou recombinantes que compreendem sequências de ácido nucleico que codificam polipeptídeos de domínio CCT ou porções biologicamente ativas dos mesmos, bem como moléculas de ácido nucleico suficientes para uso como sondas de hibridização para identificar moléculas de ácido nucleico que codificam proteínas com regiões de homologia de sequência. Como usado no presente documento, o termo "molécula de ácido nucleico" se refere a moléculas de DNA (por exemplo, DNA recombinante, cDNA, DNA genômico, DNA de plastídio, DNA mitocondrial) e moléculas de RNA (por exemplo, mRNA) e análogos do DNA ou RNA gerados com o uso de análogos de nucleotídeo. A molécula de ácido nucleico pode ser de fita única ou de fita dupla, mas preferencialmente é DNA de fita dupla.
[0055] As sequências de nucleotídeos que codificam polipeptídeos de domínio CCT, variantes e truncagens, podem ser sintetizadas e clonadas em vetores de plasmídeo padrão por meios convencionais, ou podem ser obtidas por manipulação de biologia molecular padrão de outros construtos contendo as sequências de nucleotídeos.
[0056] Em algumas concretizações, a molécula de ácido nucleico que codifica um polipeptídeo de domínio CCT é um polinucleotídeo com a sequência apresentada na SEQ ID NO: 1, 3, 5, 7, 9, 10, 11 ou 12 e variantes, fragmentos e complementos dos mesmos. As sequências de ácido nucleico que são complementares a uma sequência de ácido nucleico das concretizações ou que hibridizam com uma sequência das concretizações também são abrangidas. As sequências de ácido nucleico podem ser usadas em construtos de DNA ou cassetes de expressão para transformação e expressão em organismos, incluindo micro-organismos e plantas. As sequências de nucleotídeos ou aminoácidos podem ser sequências sintéticas que foram projetadas para expressão em um organismo, incluindo, porém, sem limitação, um microrganismo ou uma planta.
[0057] Em algumas concretizações, a molécula de ácido nucleico que codifica o polipeptídeo é uma sequência de ácido nucleico não genômica.
[0058] Em algumas concretizações, a molécula de ácido nucleico que codifica um polipeptídeo é um polinucleotídeo não genômico que tem uma sequência de nucleotídeos com pelo menos 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou maior identidade com a sequência de ácido nucleico da SEQ ID NO: 1, 3, 5 ou 7 em que o polipeptídeo codificado é funcional para aumentar a proteína em uma semente de soja.
[0059] Em algumas concretizações, o polinucleotídeo codifica um polipeptídeo que tem, ou o polipeptídeo tem, pelo menos cerca de 40%, 45%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou maior identidade de sequência em comparação com SEQ ID NO: 2, 4, 6 ou 8 e, opcionalmente, tem pelo menos uma substituição, deleção, inserção ou combinação de aminoácidos, portanto, em comparação com a sequência nativa.
[0060] Em algumas concretizações, a molécula de ácido nucleico codifica um polipeptídeo que compreende, ou o polipeptídeo compreende, uma sequência de aminoácidos com pelo menos cerca de 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou maior identidade em todo o comprimento da sequência de aminoácidos da SEQ ID NO: 2, 4, 6 ou 8.
[0061] Em algumas concretizações, o ácido nucleico codifica um polipeptídeo que tem, ou o polipeptídeo tem, pelo menos cerca de 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou maior identidade de sequência em comparação com SEQ ID NO: 2, 4, 6 ou 8. Em algumas concretizações, a identidade de sequência é calculada com o uso do algoritmo ClustalW no módulo ALIGNX® do Vector NTI® Program Suite (Invitrogen Corporation, Carlsbad, Calif.) Com todos os parâmetros padrão. Em algumas concretizações, a identidade de sequência é calculada em todo o comprimento do polipeptídeo com o uso de o algoritmo ClustalW no módulo ALIGNX do Vector NTI Program Suite (Invitrogen Corporation, Carlsbad, Calif.) Com todos os parâmetros padrão.
[0062] As concretizações também abrangem moléculas de ácido nucleico que codificam variantes de polipeptídeos de domínio CCT. "Variantes" do polipeptídeo que codifica sequências de ácido nucleico incluem aquelas sequências que codificam os polipeptídeos revelados no presente documento, mas que diferem conservativamente devido à degenerescência do código genético, bem como aquelas que são suficientemente idênticas como discutido acima. Variantes alélicas de ocorrência natural podem ser identificadas com o uso de técnicas de biologia molecular bem conhecidas, como reação em cadeia de polimerase (PCR) e técnicas de hibridização como apresentadas abaixo. As sequências de ácido nucleico variantes também incluem sequências de ácido nucleico derivadas sinteticamente que foram geradas, por exemplo, com o uso de mutagênese direcionada ao sítio, mas que ainda codificam os polipeptídeos revelados como discutido abaixo.
[0063] São fornecidas sondas de oligonucleotídeos e métodos para detectar os polinucleotídeos descritos no presente documentos. As sondas oligonucleotídicas são sequências de nucleotídeos detectáveis, tal como por um marcador radioativo apropriado ou podem ser fluorescentes como descrito, por exemplo, na Patente nº US 6,268,132. Como é bem conhecido na técnica, se a molécula de sonda e amostra de ácido nucleico hibridarem por formação de ligações fortes de emparelhamentos de bases entre as duas moléculas, pode ser razoavelmente presumido que a sonda e amostra têm homologia de sequência substancial. Preferencialmente, a hibridação é conduzida sob condições estringentes por técnicas bem conhecidas na técnica, como descrito, por exemplo, em Keller e Manak (1993). A detecção da sonda proporciona um meio para determinar, de um modo conhecido, se ocorreu hibridação. Essa análise de sonda fornece um método rápido para identificar genes modificados de polipeptídeos de domínio CCT, genes modificados e métodos que são fornecidos. Os segmentos de nucleotídeos que são usados como sondas podem ser sintetizados com o uso de um sintetizador de DNA e procedimentos padrão. Estas sequências de nucleotídeos também podem ser utilizadas como iniciadores de PCR para amplificar genes.
[0064] Como é bem conhecido dos técnicos em biologia molecular, a similaridade de dois ácidos nucleicos pode ser caracterizada pela sua tendência para hibridarem. São fornecidos ácidos nucleicos que hibridizam com aquelas sequências reveladas no presente documento sob condições rigorosas. Como usados no presente documento, os termos "condições rigorosas" ou "condições de hibridização rigorosas" destinam-se a se referir a condições sob as quais uma sonda ou ácido nucleico hibridizará (anelará) para uma sequência particular em um grau detectavelmente maior do que para outras sequências (por exemplo, pelo menos 2 vezes sobre a referência).
[0065] São fornecidos construtos de nucleotídeo que compreendem as sequências descritas no presente documento. O uso do termo "construtos de nucleotídeos" no presente documento não se destina a limitar as concretizações aos construtos de nucleotídeos que compreendem DNA. Construtos de nucleotídeos, particularmente polinucleotídeos e oligonucleotídeos compostos por ribonucleotídeos e combinações de ribonucleotídeos e desoxirribonucleotídeos podem também ser empregues nos métodos aqui revelados. Os construtos de nucleotídeos, ácidos nucleicos e sequências de nucleotídeos das concretizações abrangem adicionalmente todas as formas complementares de tais construtos, moléculas e sequências. Além disso, os construtos de nucleotídeos, moléculas de nucleotídeos e sequências de nucleotídeos das concretizações abrangem todos os construtos, moléculas e sequências de nucleotídeos que podem ser empregados nos métodos das concretizações para transformar plantas, incluindo, porém, sem limitação, aqueles compreendidos por desoxirribonucleotídeos, ribonucleotídeos e combinações dos mesmos. Tais desoxirribonucleotídeos e ribonucleotídeos incluem tanto moléculas que ocorrem naturalmente como análogos sintéticos. Os construtos de nucleotídeos, ácidos nucleicos e sequências de nucleotídeos das concretizações também abrangem todas as formas de construtos de nucleotídeos incluindo, mas sem limitação, formas de fita única, formas de fita dupla, forquilhas, estruturas de haste e alça e semelhantes.
[0066] São fornecidas plantas, células vegetais, sementes de plantas e núcleos de plantas que são modificados por edição gênica. Em algumas concretizações, a edição gênica pode ser facilitada através da indução de uma ruptura de fita dupla (DSB) ou ruptura de fita simples em uma posição definida no genoma próxima à alteração desejada. DSBs podem ser induzidos com o uso de qualquer agente de indução de DSB disponível, incluindo, porém, sem limitação, TALENs (nucleases efetoras semelhantes a ativadores de transcrição), meganucleases, nucleases de dedo de zinco, sistemas Cas9-gRNA (com base em sistemas CRISPR-Cas bacterianos), sistemas de endonuclease cpf1 guiada e similares. Em algumas concretizações, a introdução de um DSB pode ser combinada com a introdução de um modelo de modificação de polinucleotídeo. Em algumas concretizações, os métodos não usam enzimas ou tecnologia TALENs e as plantas e sementes são produzidas a partir de métodos que não usam enzimas ou tecnologia TALENs.
[0067] Um modelo de modificação de polinucleotídeo pode ser introduzido em uma célula por qualquer método conhecido na técnica, tal como, porém, sem limitação, métodos de introdução transitória, transfecção, eletroporação, microinjeção, entrega mediada por partículas, aplicação tópica, entrega mediada fibras, entrega por meio de peptídeos de penetração na célula ou entrega direta mediada por nanopartículas de sílica mesoporosa (MSN).
[0068] O modelo de modificação polinucleotídica pode ser introduzido em uma célula como uma molécula polinucleotídica de fita simples, uma molécula polinucleotídica de fita dupla ou como parte de um DNA circular (DNA de vetor). O modelo de modificação polinucleotídica pode também ser ligado ao RNA-guia e/ou à endonuclease Cas. DNAs ligados podem permitir a co-localização de DNA-alvo e de modelo, úteis na edição genômica e regulação genômica direcionada, e podem também ser úteis no direcionamento de células pós-mitóticas onde se espera que a função da maquinaria endógena de RH seja altamente diminuída (Mali et al. 2013 Nature Methods Vol. 10: 957 a 963.) O modelo de modificação de polinucleotídeo pode estar presente transitoriamente na célula ou pode ser introduzido através de um replicon viral.
[0069] Um “nucleotídeo modificado” ou “nucleotídeo editado” refere-se a uma sequência nucleotídica de interesse que compreende pelo menos uma alteração em comparação à sua sequência nucleotídica não modificada. Tais “alterações” incluem, por exemplo: (i) substituição de pelo menos um nucleotídeo, (ii) uma deleção de pelo menos um nucleotídeo, (iii) uma inserção de pelo menos um nucleotídeo ou (iv) qualquer combinação de (i) a (iii).
[0070] O termo “modelo de modificação polinucleotídica” inclui um polinucleotídeo que compreende pelo menos uma modificação nucleotídica em comparação à sequência nucleotídica a ser editada. Uma modificação nucleotídica pode ser pelo menos uma substituição, adição ou deleção nucleotídica. Opcionalmente, o modelo polinucleotídico de modificação pode compreender adicionalmente sequências nucleotídicas homólogas que flanqueiam a pelo menos uma modificação nucleotídica, em que as sequências nucleotídicas homólogas de flanqueamento fornecem homologia suficiente com a sequência nucleotídica desejada a ser editada.
[0071] O processo de edição de uma sequência genômica que combina DSB e modelos de modificação compreende em geral: fornecer, a uma célula hospedeira, um agente de indução de DSB, ou um ácido nucleico que codifique um agente de indução de DSB, que reconhece uma sequência-alvo na sequência cromossômica e tem capacidade para induzir uma DSB na sequência genômica, e pelo menos um modelo de modificação polinucleotídica que compreende pelo menos uma alteração nucleotídica em comparação à sequência nucleotídica a ser editada. O modelo de modificação polinucleotídica pode compreender, ainda, sequências nucleotídicas que flanqueiam a pelo menos uma alteração nucleotídica, em que as sequências flanqueadoras são substancialmente homólogas à região cromossômica que flanqueia a DSB.
[0072] A endonuclease pode ser fornecida a uma célula por qualquer método conhecido na técnica, por exemplo, porém, sem limitação, métodos de introdução transiente, transfecção, microinjeção e/ou aplicação tópica ou indiretamente por meio de construtos de recombinação. A endonuclease pode ser fornecida como uma proteína ou como um complexo de polinucleotídeo guiado diretamente a uma célula ou indiretamente por meio de construtos de recombinação. A endonuclease pode ser introduzida em uma célula de maneira transiente ou pode ser incorporada no genoma da célula hospedeira com o uso de qualquer método conhecido na técnica. No caso de um sistema CRISPR-Cas, a absorção da endonuclease e/ou do polinucleotídeo guiado na célula pode ser facilitada com um Peptídeo de Penetração Celular (CPP), como descrito no documento WO2016073433 publicado em 12 de maio de 2016.
[0073] As nucleases efetoras TAL (TALEN) são uma classe de nucleases específicas de sequência que podem ser usadas para fazer rupturas de fita dupla em sequências alvo específicas no genoma de uma planta ou outro organismo. (Miller et al. (2011) Nature Biotechnology 29:143 a 148).
[0074] Endonucleases são enzimas que clivam a ligação de fosfodiéster dentro de uma cadeia polinucleotídica. As endonucleases incluem endonucleases de restrição, que clivam DNA em locais específicos sem danificar as bases, e meganucleases, também conhecidas como endonucleases homing (HEases), que, como endonucleases de restrição, se ligam e cortam em um sítio de reconhecimento específico, no entanto, os sítios de reconhecimento para meganucleases são tipicamente mais longos, cerca de 18 pb ou mais (pedido de patente PCT/US12/30061, depositado em 22 de março de 2012). As meganucleases foram classificadas em quatro famílias com base em motivos de sequência conservada, as famílias são as famílias de LAGLIDADG, GIY-YIG, H-N-H e His-Cys box. Esses motivos participam na coordenação de íons de metal e hidrólise de ligações de fosfodiéster.
[0075] As nucleases de dedo de zinco (ZFNs) são agentes de indução de ruptura de fita dupla, compostos por um domínio de ligação de DNA de dedo de zinco e um domínio de agente de indução de ruptura de fita dupla. A especificidade de sítio de reconhecimento é conferida pelo domínio de dedo de zinco, que compreende, tipicamente, dois, três ou quatro dedos de zinco, por exemplo, que tem uma estrutura C2H2, no entanto, outras estruturas de dedo de zinco são conhecidas e foram modificadas.
[0076] A edição de genoma com o uso de agentes de indução de DSB, tais como complexos Cas9-gRNA, foi descrita, por exemplo, no Pedido de Patente US 2015-0082478 A1, publicado em 19 de março de 2015, WO2015/026886 A1, publicado em 26 de fevereiro de 2015, WO2016007347, publicado em 14 de janeiro de 2016 e WO201625131, publicado em 18 de fevereiro de 2016, todos os quais são incorporados ao presente documento a título de referência.
[0077] O termo "gene Cas" se refere no presente documento a um gene que é tipicamente acoplado, associado ou próximo a, ou na vizinhança dos loci de flanco CRISPR em sistemas bacterianos. Os termos “gene de Cas”, “gene associado a CRISPR (Cas)” são usados de forma intercambiável no presente documento. O termo “endonuclease Cas” no presente documento se refere a uma proteína codificada por um gene de Cas. Uma endonuclease Cas no presente documento, quando em complexo com um componente polinucleotídico adequado, é capaz de reconhecer, ligar e, opcionalmente, cortar ou clivar toda ou parte de uma sequência alvo de DNA específica. Uma endonuclease Cas descrita no presente documento compreende um ou mais domínios de nuclease. As endonucleases Cas da revelação incluem aquelas que têm um domínio de nuclease de HNH ou semelhante a HNH e/ou um domínio de nuclease de RuvC ou semelhante a RuvC. Uma endonuclease Cas da revelação inclui uma proteína Cas9, uma proteína Cpf1, uma proteína C2c1, uma proteína C2c2, uma proteína C2c3, Cas3, Cas 5, Cas7, Cas8, Cas10 ou complexos dessas.
[0078] Conforme usados no presente documento, os termos “complexo de polinucleotídeo-guia/endonuclease Cas”, “sistema de polinucleotídeo-guia/endonuclease Cas”, “ complexo de polinucleotídeo-guia/Cas”, “sistema de polinucleotídeo- guia/Cas”, “sistema de Cas guiado” são usados de forma intercambiável no presente documento e se referem a pelo menos um polinucleotídeo-guia e pelo menos uma endonuclease Cas que têm capacidade para formar um complexo, em que o dito complexo de polinucleotídeo-guia/endonuclease Cas pode direcionar a endonuclease Cas a um sítio-alvo de DNA, que permite que a endonuclease Cas reconheça, se ligue a, e opcionalmente corte ou clive (introduza uma ruptura de fita simples ou dupla) o sítio-alvo de DNA. Um complexo de polinucleotídeo- guia/endonuclease Cas no presente documento pode compreender proteína Cas (ou proteínas Cas) e componente polinucleotídico adequado (ou componentes polinucleotídicos adequados) de qualquer um dos quatro sistemas CRISPR conhecidos (Horvath e Barrangou, 2010, Science 327:167 a 170), tal como um sistema
CRISPR de tipo I, II ou III. Uma endonuclease Cas desenrola o dúplex de DNA na sequência-alvo e, opcionalmente, cliva pelo menos uma fita de DNA, conforme mediado por reconhecimento da sequência-alvo por um polinucleotídeo (tal como, porém, sem limitação, um crRNA ou RNA-guia) que está no complexo com a proteína Cas. Tal reconhecimento e corte de uma sequência-alvo por uma endonuclease Cas ocorre tipicamente se o motivo adjacente ao protoespaçador (PAM) correto estiver localizado na extremidade 3', ou adjacente à mesma, da sequência-alvo de DNA. Alternativamente, uma proteína Cas, no presente documento, pode carecer de atividade de clivagem ou corte de DNA, mas ainda pode se ligar de forma específica a uma sequência-alvo de DNA quando complexada com um componente de RNA adequado. (Consulte, também, o pedido de patente no US 2015-0082478 A1, publicado em 19 de março de 2015 e o documento no US 2015-0059010 A1, publicado em 26 de fevereiro de 2015, ambos estão aqui incorporados em sua totalidade a título de referência).
[0079] Um complexo de polinucleotídeo- guia/endonuclease Cas pode clivar uma ou ambas as fitas de uma sequência-alvo de DNA. Um complexo de polinucleotídeo- guia/endonuclease Cas que pode clivar ambas as fitas de uma sequência alvo de DNA tipicamente compreende uma proteína Cas que tem todos os seus domínios de endonuclease em um estado funcional (por exemplo, domínios de endonuclease de tipo selvagem ou variantes dos mesmos retendo alguma ou toda a atividade em cada domínio da endonuclease). Exemplos não limitantes de nickases Cas9 adequados para uso no presente documento são revelados na Publicação de Pedido de Patente nº
US 2014/0189896 que é incorporada ao presente documento a título de referência.
[0080] Outros sistemas de endonuclease Cas foram descritos nos pedidos de patente PCT PCT/US16/32073, depositado em 12 de maio de 2016 e PCT/US16/32028, depositado em 12 de maio de 2016, ambos os pedidos incorporados no presente documento por referência.
[0081] "Cas9" (anteriormente denominado como Cas5, Csn1 ou Csx12) no presente documento se refere a uma endonuclease Cas de um sistema CRISPR tipo II que forma um complexo com um crNucleotídeo e um tracrNucleotídeo, ou com um único polinucleotídeo guia, para especificamente reconhecer e clivar toda ou parte de uma sequência alvo de DNA. A proteína Cas9 compreende um domínio de nuclease RuvC e um domínio de nuclease HNH (H-N-H), cada um dos quais pode clivar uma única fita de DNA em uma sequência alvo (a ação combinada de ambos os domínios leva à clivagem de fita dupla de DNA, enquanto que a atividade de um domínio leva para um nick). Em geral, o domínio de RuvC compreende os subdomínios I, II e III, em que o domínio I está localizado próximo à terminação N de Cas9 e os subdomínios II e III estão localizados no meio da proteína, flanqueando o domínio HNH (Hsu et al, Cell 157:1.262 a 1.278). Um sistema de CRISPR do tipo II inclui um sistema de clivagem de DNA que utiliza uma endonuclease Cas9 em complexo com pelo menos um componente polinucleotídico. Por exemplo, uma Cas9 pode estar em um complexo com um RNA de CRISPR (crRNA) e um RNA de CRISPR transativador (tracrRNA). Em outro exemplo, uma Cas9 pode estar em um complexo com um RNA-guia único.
[0082] Qualquer endonuclease guiada pode ser usada nos métodos divulgados no presente documento. Tais endonucleases incluem, porém, sem limitação, endonucleases Cas9 e Cpf1. Diversas endonucleases foram descritas até ao momento, as quais podem reconhecer sequências de PAM específicas (consultar, por exemplo – Jinek et al. (2012) Science 337, páginas 816 a 821, pedidos de patente no PCT PCT/US16/32073, depositado em 12 de maio de 2016, e no PCT/US16/32028, depositado em 12 de maio de 2016, e Zetsche B et al. 2015. Cell 163, 1013) e clivar o DNA- alvo em uma posição específica. Entende-se que com base nos métodos e concretizações descritos no presente documento que utilizam um sistema de Cas guiado, um indivíduo pode agora adaptar esses métodos de modo que os mesmos possam utilizar qualquer sistema de endonuclease guiada.
[0083] O polinucleotídeo-guia também pode ser uma molécula única (também chamado de polinucleotídeo-guia único) que compreende uma sequência de crNucleotídeo ligada a uma sequência de tracrNucleotídeo. O polinucleotídeo guia único compreende um primeiro domínio de sequência de nucleotídeos (denominado como domínio de Direcionamento Variável ou domínio VT) que pode hibridizar com uma sequência de nucleotídeos em um DNA alvo e um domínio de reconhecimento de endonuclease Cas (domínio CER), que interage com um polipeptídeo de endonuclease Cas. Por “domínio” entende-se uma extensão contígua de nucleotídeos que pode ser uma sequência de RNA, DNA e/ou combinação de RNA-DNA. O domínio VT e/ou o domínio CER de um polinucleotídeo-guia único pode compreender uma sequência de RNA, uma sequência de DNA ou uma sequência de combinação de RNA-DNA. O polinucleotídeo guia único que é composto por sequências do crNucleotídeo e do tracrNucleotídeo pode ser denominado como "RNA-guia único" (quando composto por um trecho contíguo de nucleotídeos de RNA) ou "DNA-guia único" (quando composto por um trecho contíguo de nucleotídeos de DNA) ou "RNA-DNA-guia único" (quando composto de uma combinação de nucleotídeos de RNA e DNA). O polinucleotídeo guia único pode formar um complexo com uma endonuclease Cas, em que o dito complexo polinucleotídeo guia/endonuclease Cas (também denominado como um sistema polinucleotídeo guia/endonuclease Cas) pode direcionar a endonuclease Cas para um sítio genômico alvo, permitindo que a endonuclease Cas reconheça, ligue e opcionalmente corte ou clive (introduza uma ruptura de fita simples ou dupla) o sítio alvo. (Consultar, também, os pedidos de patente nº US 2015-0082478 A1, publicado em 19 de março de 2015, e nº US 2015-0059010 A1, publicado em 26 de fevereiro de 2015, ambos estão aqui incorporados em sua totalidade a título de referência).
[0084] O termo “domínio de direcionamento variável” ou “domínio VT” é usado de forma intercambiável no presente documento e inclui uma sequência nucleotídica que pode se hibridizar com (ser complementar a) uma fita (sequência nucleotídica) de um sítio-alvo de DNA de fita dupla. Em algumas concretizações, o domínio de direcionamento variável compreende uma extensão contígua de 12 a 30 nucleotídeos. O domínio de direcionamento variável pode ser composto por uma sequência de DNA, uma sequência de RNA, uma sequência de DNA modificada, uma sequência de RNA modificada ou qualquer combinação das mesmas.
[0085] Os termos “RNA-guia único” e “sgRNA” são usados de forma intercambiável no presente documento e se referem a uma fusão sintética de duas moléculas de RNA, um crRNA (RNA de CRISPR) que compreende um domínio de direcionamento variável (ligado a uma sequência tracr correspondente que se hibridiza com um tracrRNA), fundido com um tracrRNA (RNA de CRISPR transativador). O RNA-guia único pode compreender um crRNA ou fragmento de crRNA e um tracrRNA ou fragmento de tracrRNA do sistema CRISPR/Cas do tipo II que podem formar um complexo com uma endonuclease Cas do tipo II, em que o referido complexo de RNA-guia/endonuclease Cas pode direcionar a endonuclease Cas a um sítio-alvo de DNA, possibilitando que a endonuclease Cas reconheça, se ligue a e, opcionalmente, corte ou clive (introduza uma ruptura de fita simples ou dupla) o sítio-alvo de DNA.
[0086] Os termos “complexo de RNA-guia/endonuclease Cas”, “sistema de RNA-guia/endonuclease Cas”, “complexo de RNA-guia/Cas”, “sistema de RNA-guia/Cas”, “complexo de gRNA/Cas”, “sistema de gRNA/Cas”, “endonuclease guiada por RNA”, “RGEN” são usados de forma intercambiável no presente documento e se referem a pelo menos um componente de RNA e pelo menos uma endonuclease Cas que têm capacidade para formar um complexo, em que o referido complexo de RNA- guia/endonuclease Cas pode direcionar a endonuclease Cas a um sítio-alvo de DNA, o que permite que a endonuclease Cas reconheça, se ligue a, e opcionalmente corte ou clive (introduza uma ruptura de fita simples ou dupla) o sítio-alvo de DNA. Um complexo de RNA-guia/endonuclease Cas no presente documento pode compreender proteína (ou proteínas) Cas e componente (ou componentes) de RNA adequado de qualquer um dos quatro sistemas CRISPR conhecidos (Horvath e Barrangou, 2010, Science 327:167 a 170), como um sistema CRISPR tipo I, II ou III. Um complexo de RNA-guia/endonuclease Cas pode compreender uma endonuclease Cas9 do Tipo II e pelo menos um componente de RNA (por exemplo, um crRNA e tracrRNA, ou um gRNA). (Consultar,
também, os pedidos de patente nº US 2015-0082478 A1, publicado em 19 de março de 2015, e nº US 2015-0059010 A1, publicado em 26 de fevereiro de 2015, ambos estão incorporados ao presente documento em sua totalidade a título de referência).
[0087] O polinucleotídeo-guia pode ser introduzido em uma célula de forma transiente, como polinucleotídeo de fita simples ou um polinucleotídeo de fita dupla, com o uso de qualquer método conhecido na técnica, tal como, porém, sem limitação, bombardeamento de partículas, transformação por Agrobacterium ou aplicações tópicas. O polinucleotídeo guia também pode ser introduzido indiretamente em uma célula através da introdução de uma molécula de DNA recombinante (através de métodos tais como, porém, sem limitação, bombardeamento de partículas ou transformação de Agrobacterium) que compreende um fragmento de ácido nucleico heterólogo que codifica um polinucleotídeo guia, operacionalmente ligado a um promotor específico que é capaz de transcrever o RNA-guia na dita célula. O promotor específico pode ser, porém, sem limitação, um promotor de RNA polimerase III, que permite a transcrição de RNA com extremidades 5’ e 3’ não modificadas e precisamente definidas (DiCarlo et al., Nucleic Acids Res. 41: 4.336 a
4.343; Ma et al., Mol. Ther. Nucleic Acids 3:e161), conforme descrito no documento no WO2016025131, publicado em 18 de fevereiro de 2016, incorporado ao presente documento em sua totalidade a título de referência.
[0088] São fornecidas plantas, células vegetais, sementes de plantas e núcleos de plantas que são transformados com as sequências descritas no presente documento. A transformação pode ser estável ou transitória. “Transformação estável”, conforme usado no presente documento, significa que o construto de nucleotídeos introduzido em uma planta integra o genoma da planta e tem capacidade para ser herdado pela progênie da mesma. "Transformação transiente" significa, conforme usado no presente documento, que um polinucleotídeo é introduzido na planta e não se integra no genoma da planta ou um polipeptídeo é introduzido em uma planta. "Planta" se refere, conforme usado no presente documento, a plantas inteiras, órgãos de plantas (por exemplo, folhas, hastes, raízes, etc.), sementes, células de plantas, propágulos, embriões e descendência dos mesmos. As células de planta podem ser diferenciadas ou não diferenciadas (por exemplo, calo, células de cultura em suspensão, protoplastos, células de folha, células de raiz, células de floema e pólen).
[0089] Os métodos de transformação incluem a introdução de um construto de DNA recombinante que compreende um cassete de expressão. São fornecidos construtos que incluem uma ou mais sequências promotoras heterólogas conectadas operacionalmente a um ou mais polinucleotídeos que codificam polipeptídeos revelados no presente documentos e sequências de terminação de transcrição apropriadas e plantas, sementes, células e núcleos contendo o construto de DNA recombinante ou cassete de expressão.
[0090] Os métodos de transformação incluem a introdução de um construto de supressão de DNA ou um construto que resulta na expressão aumentada de um gene alvo, como a codificação do polipeptídeo de domínio CCT. "Construto de supressão de DNA" é um construto de DNA recombinante que, quando transformado ou integrado de forma estável no genoma da planta, resulta no "silenciamento" de um gene alvo na planta. O gene alvo pode ser endógeno ou transgênico para a planta.
"Silenciamento", conforme usado no presente documento em relação ao gene-alvo, se refere geralmente à supressão de níveis de mRNA ou proteína/enzima expressos pelo gene-alvo, e/ou o nível da atividade enzimática ou funcionalidade da proteína. O termo "supressão" inclui abaixar, reduzir, declinar, diminuir, inibir, eliminar e impedir. "Silenciamento" ou "silenciamento de gene" não especifica o mecanismo e é inclusivo, e não limitado a, antissenso, cossupressão, supressão viral, supressão em gancho, supressão de haste-ansa, abordagens com base em Ornai e abordagens com base em RNA pequeno.
[0091] As concretizações se referem adicionalmente a material de propagação de planta de uma planta transformada das concretizações incluindo, porém, sem limitação, sementes, tubérculos, cormo, bulbos, folhas e cortes de raízes e brotos. São fornecidos métodos de cultivo de plantas através do cruzamento de uma planta modificada descrita no presente documento com uma segunda planta diferente. Plantas de progênie, células vegetais, sementes e núcleos vegetais de tais métodos de melhoramento são fornecidos, tais como plantas de progênie F1, células vegetais, sementes e núcleos vegetais.
[0092] A transformação de qualquer espécie de planta pode ser realizada, incluindo, porém, sem limitação, monocotiledôneas e dicotiledôneas. Exemplos de plantas de interesse incluem, porém, sem limitação, milho (Zea mays), Brassica sp. (por exemplo, B. napus, B. rapa, B. juncea), particularmente aquelas espécies de Brassica úteis como fontes de óleo de semente, alfafa (Medicago sativa), arroz (Oryza sativa), centeio (Secale cereale), sorgo (Sorghum bicolor, Sorghum vulgare), milheto (por exemplo, milheto pérola
(Pennisetum glaucum), milheto proso (Panicum miliaceum), milheto rabo de raposa (Setaria italica), milheto dedo (Eleusine coracana)), girassol (Helianthus annuus), cártamo (Carthamus tinctorius), trigo (Triticum aestivum), soja (Glycine max), tabaco (Nicotiana tabacum), batata (Solanum tuberosum), amendoim (Arachis hypogaea), algodão (Gossypium barbadense, Gossypium hirsutum), batata doce (Ipomoea batatus), mandioca (Manihot esculenta), café (Coffea spp.), coco (Cocos nucifera), abacaxi (Ananas comosus), árvores cítricas (Citrus spp.), cacau (Theobroma cacao), chá (Camellia sinensis), banana (Musa spp.), abacate (Persea americana), figo (Ficus casica), goiaba (Psidium guajava), manga (Mangifera indica), azeitona (Olea europaea), mamão (Carica papaya), caju (Anacardium occidentale), macadâmia (Macadamia integrifolia), amêndoa (Prunus amygdalus), beterraba sacarina (Beta vulgaris), cana-de-açúcar (Saccharum spp.), aveia, cevada, vegetais ornamentais e coníferas.
[0093] Plantas de interesse incluem plantas de grãos que fornecem sementes de interesse, plantas com sementes oleaginosas e plantas leguminosas. Sementes de interesse incluem sementes de grão, como milho, trigo, cevada, arroz, sorgo, centeio, milheto, etc. Plantas com semente oleosa incluem algodão, soja, açafrão-bastardo, girassol, Brassica, milho, alfafa, palma, coco, linho, rícino, azeitona, etc. Plantas leguminosas incluem feijões e ervilhas. Os feijões incluem guar, alfarroba, feno-grego, soja, feijões de jardim, feijão-de-corda, feijão-da-china, feijão-de-lima, feijão- fava, lentilhas, grão-de-bico, etc.
[0094] Os métodos compreendem o fornecimento de uma planta ou célula vegetal que expressa um polinucleotídeo que codifica a sequência polipeptídica revelada no presente documento e o cultivo da planta ou de uma semente da mesma em um campo. Em algumas concretizações, a expressão do polipeptídeo modificado resulta em uma planta que produz rendimento ou biomassa aumentada, proteína de semente aumentada, óleo de semente aumentado ou qualquer combinação dos mesmos.
[0095] A invenção acima foi descrita em detalhes a título de ilustração e exemplo para fins de clareza e compreensão. Conforme é prontamente evidente para um versado na técnica, as revelações supracitadas são apenas alguns dos métodos e composições que ilustram as concretizações da invenção supracitada. Ficará evidente para os versados na técnica que variações, mudanças, modificações e alterações podem ser aplicadas às composições e/ou aos métodos descritos no presente documento, sem se afastarem do verdadeiro espírito, conceito e escopo da invenção.
[0096] Todas as publicações, patentes e pedidos de patentes mencionados no relatório descritivo são incorporados a título de referência ao presente documento com o propósito citado, no mesmo grau que teriam se cada um estivesse específica e individualmente indicado como estando incorporado a título de referência ao presente documento.
[0097] Conforme usado no presente documento e nas reivindicações anexas, as formas singulares “um”, “uma”, “o” e “a” incluem referências no plural, a menos que o contexto claramente afirme de outro modo. Portanto, por exemplo, referência a “uma planta” inclui uma pluralidade de tais plantas, referência a “uma célula” inclui uma ou mais células e equivalentes das mesmas conhecidas pelos versados na técnica,
e assim por diante. A não ser que expressamente afirmado o contrário, “ou” é usado como um termo inclusivo. Por exemplo, uma condição A ou B é satisfeita por qualquer um dos seguintes: A é verdadeiro (ou está presente) e B é falso (ou não está presente), A é falso (ou não está presente) e B é verdadeiro (ou está presente) e tanto A como B são verdadeiros (ou estão presentes).
[0098] Os exemplos a seguir ilustram aspectos particulares da revelação e não se destinam de forma alguma a limitar a revelação.
EXEMPLOS
[0099] Exemplo 1. Mapeamento fino de um QTL de soja de alto teor de proteína
[0100] Um QTL de alto teor de proteína importante no cromossomo 20 (região de domínio CCT) detectado por vários estudos de mapeamento (Chung et al 2003 Crop Sci 43:1053 a 1067; Nichols et al 2006 Crop Sci 46:834 a 839; Bolon et al. 2010 BMC Plant Biology 10:41; Hwang et al 2014 BMC genômica 15:1) foi investigado. A região de alto teor de proteína foi mapeada para um intervalo de 2,4 Mb e não pôde ser avançada devido à baixa taxa de recombinação na região. Com o uso da tecnologia CRISPR/cas9, uma série de regiões de deleção sobrepostas foi projetada e linhas são criadas para mapear com precisão a região de alto teor de proteína (Figura 1). Os pares de RNA-guia que direcionam sítios específicos dentro da região de alto teor de proteína foram projetados para criar interrupções sobrepostas na região de QTL de alto teor de proteína e as linhas de soja foram transformadas. Quando entregues à linha de doadores de alto teor de proteína em combinação com Cas9, esses guias produziram e espera-se que produzam exclusões genômicas variando de aproximadamente 700 kb a 1,4 Mbp (Tabela 3).
[0101] Tabela 3. RNA-guia projetado para produzir exclusões na região de domínio CCT do cromossomo 20 Tamanho Designa de ção de Sequênci deleção Nome do Nome do Sequência edição a do esperado Guia 1 Guia 2 do Guia 2 (par Guia 1 aproxima guia) do (pb) GM-HP- GM-HP-
GGGTATTG GM-HP- 1,041,11 CR40 CR42 GGCAGTTTGG
TATGGACC CR40+42 5 (SEQ ID (SEQ ID GATAACCCGA
AGCA NO: 17) NO: 18) GM-HP- GM-HP-
GATGTCAT GM-HP- CR41 CR44 GTGGATCCAG 706,332 GAGAACTA CR41+44 (SEQ ID (SEQ ID TTCACTTACT
CGCA NO: 19) NO: 20) GM-HP- GM-HP-
GGCATAAG GM-HP- 1,401,60 CR43 CR45 GACGCACAAT
GGCCACCG CR43+45 0 (SEQ ID (SEQ ID AACCTGACCC
GTGA NO: 21) NO: 22)
[0102] Plantas T0 com deleção são selecionadas e genotipadas para verificar a ocorrência da deleção esperada. As plantas T0 podem ser editadas em um único ou em ambos os cromossomos, portanto, respectivamente, hemizigóticas ou homozigóticas no locus editado. As análises de fenótipo, como o teor de proteína e óleo nas sementes, são realizadas nas sementes T1 para identificar a sub-região de interesse que pode alterar o teor de proteína da semente. Pelas mesmas técnicas de mapeamento que o mapeamento QTL tradicional com o uso de linhas quase isogênicas, o QTL pode ser mapeado por linhas de deleção sobrepostas criadas por CRISPR/Cas9. A Tabela 4 lista os fenótipos de proteína previstos de linhas de deleção e a posição de QTL. Por exemplo, se ambas as linhas de deleção CR40/CR42 e CR41/Cr44 mostram teor de proteína reduzido, enquanto a linha de deleção CR43/CR45 não mostra nenhuma alteração de proteína, a região de alto teor de proteína será definida para um intervalo entre CR41 e CR42. Uma rodada adicional de RNAs-guia pode ser projetada para restringir ainda mais os genes candidatos na sub-região. Após um gene candidato ser identificado, a função do gene pode ser confirmada por experimentos de edição adicionais, como frameshift knockout (silenciamento) ou interrupção e substituição de segmentos precisos.
[0103] Tabela 4. Mapeamento fino da região de alto teor de proteína no cromossomo 20 com base no fenótipo da proteína das linhas de deleção sobrepostas Deleção Deleção Deleção de de de Localização CR40/CR42 CR41/CR44 CR43/CR45 do qHP20 Teor de proteína nenhuma nenhuma entre CR40 e reduzido da mudança mudança CR41 semente Teor de proteína nenhuma entre CR41 e reduzido reduzido da mudança CR42 semente
Teor de proteína nenhuma nenhuma entre CR42 e reduzido da mudança mudança CR43 semente Teor de proteína nenhuma entre CR43 e reduzido reduzido da mudança CR44 semente Teor de proteína nenhuma nenhuma entre CR44 e reduzido da mudança mudança CR45 semente
[0104] Exemplo 2. Restauração de proteína do domínio CCT para a sequência de Glycine soja selvagem resulta em alto teor de proteína em soja elite.
[0105] A partir da análise da sequência do genoma de linhas de alto teor de proteína e linhas de baixa proteína, como realizada no Exemplo 1, um gene candidato, glyma.20g085100, foi identificado como um gene causador potencial para o fenótipo de alto teor de proteína na região qHP20. Comparado às sequências genômicas de Glycine soja de alto teor de proteína e parálogo de soja glyma.10g134400 encontrado no cromossomo 10, glyma.20g085100 de elite de baixa proteína Williams82 e 93Y21 contém uma inserção de 321 pb no exon 4 (Figura 3). Essa inserção foi identificada como a mutação causadora potencial da perda do fenótipo de alto teor de proteína na soja elite. A inserção de 321 pb foi encontrada em todas as linhas de baixa proteína de elite, mas não nas linhas de alto teor de proteína Danbaekkong e Glycine soja. Glyma.20g085100 codifica uma proteína de domínio CCT-
(Constans, Co-like e TOC1). O fragmento de inserção de 321 pb ocorre dentro do domínio CCT e gera uma nova estrutura de leitura aberta que produz uma sequência C-terminal de 88 aminoácidos diferente no polipeptídeo glyma.20g085100 em comparação com os polipeptídeos codificados pelos parálogos Glycine soja e glyma.10g134400 (Figura 3; a região C-terminal não idêntica de glyma.20g085100 está sublinhada). A interrupção do domínio CCT dentro da proteína pode ser responsável pelo baixo teor de proteína na soja elite. A Figura 4 é um esquema que mostra a localização da inserção e as diferenças na sequência de aminoácidos entre os parálogos Glycine soja e glyma.20g085100.
[0106] Para aplicações de modificação genética do genoma, o sistema de CRISPR/Cas do tipo II requer minimamente a proteína Cas9 e uma molécula duplexada de crRNA/tracrRNA ou uma molécula sinteticamente fundida de crRNA e tracrRNA (RNA- guia) para reconhecimento e clivagem de sítio-alvo de DNA (Gasiunas et al. (2012) Proc. Natl. Acad. Sci. EUA 109: E2579- 86, Jinek et al. (2012) Science 337:816 a 821, Mali et al. (2013) Science 339:823 a 826, e Cong et al. (2013) Science 339:819 a 823). É descrito no presente documento um sistema de RNA-guia/endonuclease Cas que tem como base o sistema CRISPR/Cas tipo II e consiste em uma endonuclease Cas e um RNA-guia (ou crRNA e tracrRNA duplexados) que, juntos, podem formar um complexo que reconhece um sítio genômico alvo em uma planta e introduz uma ruptura de fita dupla no dito sítio alvo.
[0107] Para usar o sistema de RNA-guia/endonuclease Cas na soja, o gene Cas9 de M1 GAS de Streptococcus pyogenes (SF370) foi otimizado por códon de soja por técnicas padrão conhecidas na arte. Para facilitar a localização nuclear da proteína Cas9 em células de soja, o sinal de localização nuclear de terminal amino monopartido do Vírus símio 40 (SV40) (MAPKKKRKV) e o sinal de localização nuclear de terminal carboxila endonuclease de borda de T-DNA VirD2 bipartido de Agrobacterium tumefaciens (KRPRDRHDGELGGRKRAR) foram incorporados nos terminais amino e carboxila da estrutura de leitura aberta Cas9, respectivamente. O gene Cas9 otimizado para soja foi ligado operacionalmente a um promotor constitutivo de soja, como o promotor constitutivo forte de soja GM-EF1A2 (pedido de patente US 20090133159) ou promotor regulado por técnicas de biologia molecular padrão.
[0108] O segundo componente de um sistema de RNA- guia/endonuclease Cas funcional para aplicações de engenharia de genoma é um duplex das moléculas de crRNA e tracrRNA ou uma fusão sintética das moléculas de crRNA e tracrRNA, um RNA- guia. Para conferir a expressão de RNA-guia eficiente (ou expressão do crRNA e tracrRNA duplexada) em soja, são usados o promotor de polimerase III de U6 e o terminador de polimerase III de U6 de soja.
[0109] Os promotores da polimerase III do RNA U6 da planta foram clonados e caracterizados a partir de espécies como Arabidopsis e Medicago truncatula (Waibel e Filipowicz, NAR 18:3451 a 3458 (1990); Li et al., J. Integrat. Plant Biol. 49:222 a 229 (2007); Kim e Nam, Plant Mol. Biol. Rep. 31:581 a 593 (2013); Wang et al., RNA 14:903 a 913 (2008)). Os genes do RNA nuclear pequeno U6 da soja (snRNA) foram identificados através da pesquisa da sequência genômica da variedade Williams82 de soja pública com o uso da sequência de codificação do gene U6 da Arabidopsis. A sequência de DNA genômico de aproximadamente 0,5 kb a montante do primeiro nucleotídeo G de um gene U6 foi selecionada para ser usada como um promotor de RNA polimerase III, por exemplo, promotor GM-U6-13.1 ou promotor GM-U6-9.1, para expressar RNA-guia para direcionar nuclease Cas9 para o sítio genômico designado. A sequência codificante de RNA-guia teve 76 pb de comprimento e compreendeu um domínio de direcionamento variável de 20 pb a partir de um sítio-alvo genômico de soja escolhido na extremidade 5’ e um vestígio de 4 ou mais resíduos T como um terminador de transcrição na extremidade 3’. O primeiro nucleotídeo do domínio de direcionamento variável de 20 pb foi um resíduo G a ser usado por RNA polimerase III para a transcrição. Outros promotores de genes U6 homólogos de soja foram similarmente clonados e usados para expressão de RNA pequeno.
[0110] Uma vez que a endonuclease Cas9 e o RNA-guia precisam formar um complexo de proteína/RNA para mediar a clivagem de fita dupla de DNA específico do sítio, a endonuclease Cas9 e o RNA-guia são expressos nas mesmas células. Para melhorar sua co-expressão e presença, a endonuclease Cas9 e os cassetes de expressão de RNA-guia são ligados em um único construto de DNA.
[0111] Para validar a inserção como a mutação causal para baixa proteína, um par de RNA-guia GM-CCT-CR2 e CR3 foi projetado para deletar a inserção em soja elite (Tabela 5).
[0112] Tabela 5 - Exemplo de RNA-guia projetado para produzir modificações nas regiões de domínio CCT dos cromossomos 10 e 20 da soja Designa Tamanho Sequênci Nome do Nome do ção de de a do Guia 1 Sequênc Guia 2 edição deleção Guia 2
(par esperado ia do guia) aproxima Guia 1 do (pb) GM-CCT- GM-CCT-
GTGCCGC GTATGCTT GM-CCT- CR2 (SEQ CR3 (SEQ 321 AAAATTA GCCGCAAA CR2+3 ID NO: ID NO:
GAGAGA ACTT 12) 13)
[0113] O promotor de RNA nuclear pequeno U6 de soja, promotor GM-U6-13.1 ou GM-U6-9.1 foi usado para expressar RNAs- guia para direcionar a nuclease Cas9 para sítios genômicos alvo designados. Um cassete de expressão de endonuclease Cas9 otimizado para códons de soja e cassetes de expressão de RNA- guia foram ligados no plasmídeo (RV029969 ou RV029968). Por exemplo, o construto RV029969, que contém os cassetes de expressão de gRNA GM-CCT-CR2 e GM-CCT-CR3 e o cassete de expressão Cas9, foi produzido com o objetivo de direcionar a região de inserção de 321 pb para restaurar a função da proteína do domínio CCT. O segundo construto RV029968, que contém o cassete de expressão de gRNA GM-CCT-CR1 e o cassete de expressão Cas9, foi feito com o objetivo de realizar knockout ou silenciar o gene CCT glyma.20g085100 em linhas de elite e de alto teor de proteína. Na linha de elite, o silenciamento do glyma.20g085100 nativo restaurou o fenótipo de alto teor de proteína. A introdução desse gRNA GM-CCT-CR1 com CAS9 em uma linha de alto teor de proteína que não contém a inserção de 321 pb evitou o teor de proteína elevado nas sementes. Um terceiro construto RV030124, que contém o cassete de expressão de gRNA GM-CCT-CR4 e o cassete de expressão Cas9, será produzido com o objetivo de realizar knockout ou silenciar o gene glyma.10g134400 nas linhas tanto de elite quanto de alto teor de proteína. Espera-se que a introdução desse gRNA GM-CCT-CR4 com CAS9 na linha de elite e alto teor de proteína altere (aumente ou diminua) o teor de proteína e óleo nas sementes. Os construtos foram transformados na cepa Ochrobactrum haywardense H1-8 para transformação de soja.
[0114] A transformação do eixo embrionário de soja mediada por Ochrobactrum foi produzida essencialmente como descrito na publicação do pedido de patente US 2018/0216123. Sementes secas maduras de soja cultivar 93Y21 foram desinfetadas com o uso de cloro gasoso e embebidas em meio semissólido contendo 5g/l de sacarose e 6 g/l de ágar em temperatura ambiente no escuro. Após uma incubação durante a noite, as sementes foram embebidas em água destilada por mais 3 a 4 horas à temperatura ambiente no escuro. Os eixos embrionários intactos foram isolados do cotilédone com o uso de uma lâmina de bisturi em água destilada estéril. Os explantes do eixo embrionário foram transferidos para a placa profunda com 15 ml de Ochrobactrum haywardense H1-8 contendo adicionalmente um vetor auxiliar PHP85634 (RV005393) com o vetor binário RV029968 ou RV029969 com suspensão em OD600=0,5 em meio de infecção contendo acetosiringona 200 µM. As placas foram vedadas com parafilme ("Parafilm M" VWR no de cat. 52858), então, sonicadas (Sonicador-VWR modelo 50T) por 30 segundos. Após a sonicação, os explantes do eixo embrionário foram transferidos para uma única camada de papel de filtro estéril autoclavado (VWR no 415/no de Catálogo 28320-020). As placas foram vedadas com fixa de Microporos (No de catálogo 1530-0, 3M, St. Paul, MN)) e incubadas sob luz fraca (5 a 10 µE/m2/s, lâmpadas fluorescentes brancas frias) por 16 h a 21 °C por 3 dias.
[0115] Após o co-cultivo, os explantes do eixo embrionário foram cultivados em meio de indução de brotos solidificado com ágar a 0,7% na ausência de seleção. A base do explante (ou seja, radical da raiz do eixo embrionário) foi embutida no meio. A indução de brotos foi realizada em uma Incubadora Biológica Percival a 26 °C com fotoperíodo de 18 horas e intensidade de luz de 40 a 70 µE/m2/s. 6 a 7 semanas após a transformação, brotos alongados (>1 a 2 cm) foram isolados e transferidos para meio de enraizamento contendo agente de seleção. As plântulas transgênicas foram transferidas para vasos de solo e cultivadas em estufas.
[0116] O DNA genômico foi extraído de amostras de folhas e analisado por PCR regular. Os iniciadores de PCR foram projetados para amplificar a região genômica de interesse. As bandas de PCR foram clonadas no vetor pCR2.1 com o uso de um kit de clonagem TOPO-TA (Invitrogen) e múltiplos clones foram sequenciados para verificar as alterações na sequência do sítio alvo como os resultados de NHEJ. As variantes de interrupção de 321 pares de base pelo par GM-CCT-CR2/GM-CCT-CR3 foram identificadas, bem como as variantes de frameshift silenciadas pelo GM-CCT-CR1 e GM-CCT-CR4. A triagem de sementes a partir de eventos editados é realizada com o uso de análise de infravermelho próximo de semente única não destrutiva (SS-NIR) para avaliar o teor de proteína e outros componentes da semente, como óleo e umidade, como descrito no Exemplo 2. Sementes contendo as modificações e com alto teor de proteína foram identificadas e selecionadas para uso posterior.
[0117] Três variantes editadas com deleção de 315 pb, 319 pb ou 345 pb foram obtidas na linha de soja elite 93Y21. Embora as deleções não tenham sido uma deleção perfeita de 321 pb, uma porção das sementes de segregação T1 das variantes 29A a 319D, 51A a 315D e 52A a 345D mostraram fenótipos de alto teor de proteína em comparação com as sementes de tipo selvagem, validando que a inserção de 321 pb causou baixa proteína na elite 93Y21 (Figura 6). Os resultados demonstram que a modificação da região de 321 pb aumenta o teor de proteína da semente na soja elite.
[0118] Exemplo 3: Geração de plantas com alto teor de proteína ou alto teor de óleo através da supressão de sequências de codificação nativas fornece sementes com alto teor de proteína ou alto teor de óleo
[0119] Para produzir plantas produtoras de sementes com composição de óleo e proteína modificada, foi realizada a modificação genética das sequências nativas em linhagens de soja elite. Um único RNA-guia GM-CCT CR1 foi projetado para direcionar o exon 2 do glyma.20g085100 para realizar knockout ou silenciar a função do gene no cromossomo 20 (Tabela 6). De forma semelhante, um único RNA-guia GM-CCT CR4 foi projetado para direcionar o exon 2 do glyma.10g134400 para realizar knockout ou silenciar a função do gene glyma.10g134400 (Tabela 6). Os cassetes de expressão e transformação de guia foram realizados de acordo com o Exemplo 2.
[0120] Tabela 6 - Exemplos de RNA-guia projetados para produzir modificações nas regiões de domínio CCT dos cromossomos 10 e 20 da soja Nome do Guia 1 Sequência do Guia 1 GM-CCT-CR1 (SEQ ID NO:
GGCACCTGTGGCTGAGCTGA 14) GM-CCT-CR4 (SEQ ID NO:
GAGTGTCAAAGAGGATGGAC 15)
[0121] A introdução do RNA-guia (gRNA) GM-CCT CR1 com CAS9 criou uma mutação de frameshift no gene glyma.20g085100. Duas variantes de frameshift foram obtidas. A variante 1.8A continha uma deleção de 7 pb no sítio de corte Gm-CCT-CR1 em ambos os alelos. As sementes T1 tiveram homozigoto corrigido e mostraram um teor de proteína de semente aumentado em comparação com as sementes de tipo selvagem (Figura 7). A variante 1.14A continha uma deleção de 19 pb no sítio de corte Gm-CCT-CR1 em um alelo. As sementes T1 estavam segregando para a mutação. Em comparação com as sementes do tipo selvagem, uma porção das sementes da variante 1.14A T1 eram ricas em proteínas, como mostrado na Figura 7. Os resultados mostram que as mutações de frameshift em glyma.20g085100 aumentaram o teor de proteína da semente na soja elite. Outras mutações que causam redução da função do gene também devem aumentar o teor de proteína da semente.
[0122] Espera-se que a introdução do RNA GM-CCT CR4 realize knockout, silencie ou suprime a expressão da sequência glyma.10g134400 no cromossomo 10. Foram selecionadas as plantas que realizaram knockout, silenciaram ou suprimiram a expressão do polipeptídeo glyma.10g134400 e que apresentaram teor de óleo aumentado nas sementes. Em algumas plantas, o teor de proteína foi reduzido.
[0123] Exemplo 4. Otimização da expressão da proteína do domínio CCT para minimizar o efeito pleiotrópico nas características agronômicas
[0124] Os padrões de expressão do gene glyma.20g085100 e de seu parálogo glyma.10g134400 foram medidos em tecidos de soja em desenvolvimento e em culturas em suspensão. Foi constatado que Glyma.20g085100 é expresso fracamente em sementes, flores e folhas em desenvolvimento (Tabela 6).
[0125] Tabela 6: Expressão de Glyma.20g085100, seu parálogo glyma.10g134400 e dois homólogos glyma20g200400 e glyma.10g190300 Tecido/Célula Glyma. Glyma. 10g134400 20g085100 Razão entre Razão entre RNA/RNA RNA/RNA total (PPM) total (PPM) (cultura de células) 0 0 (cotilédone) soy_cotyledons soy_embryogenic_suspension_culture 50,36 17,22 (embrião) soy_somatic_embryos_germination 6,05 2,25 (embrião) soy_somatic_embryos_dry_down 1,32 0 (embrião) 0,37 0,57 (embrião) soy_somatic_embryos_maturation soy_somatic_embryos_maturation_SHAM 0,76 1,26 (flor) soy_flower 58,78 32,47 (flor) soy_flower_cluster 15,52 7,64 (folha) soy_leaf_flowering 1,91 54,12 (folha) soy_leaf_first_trifolate 9,81 5,03 (meristema) soy_shoot_apical_meristem0,22 2,07 (pecíolo) soy_leaflet_petiole 10,23 7,11 (pecíolo) soy_main_petiole 10,48 5,88 (vagem) soy_pods_1cm 20,2 12,18 (vagem) soy_pods_2cm 9,43 5,31 (raiz) soy_root_seedling 1,44 0,67 (raiz) soy_root_tips_seedling 0 0,62 (semente) soy_seed_50_DAF 40,17 9,24 (semente) soy_seed_30_DAF 31,58 7,01 (semente) soy_seed_15_DAF 4,52 1,37
(semente) soy_seed_50DAF 114,7 18,71 (caule) soy_stem 4,01 1,01
[0126] Para maximizar o fenótipo de alto teor de proteína, ao mesmo tempo em que minimizando os efeitos pleiotrópicos, um polinucleotídeo que codifica uma versão modificada de glyma.20g085100 com a inserção removida (SEQ ID NO: 4) e/ou um polinucleotídeo que codifica glyma.10g134400 (SEQ ID NO: 6) são expressos transgenicamente na semente sob um promotor específico de semente. O glyma.20g085100 modificado (sem inserção) ou glyma.10g134400 são, cada um, operacionalmente conectados a um promotor específico de semente que expressa fracamente, tal como o promotor Gm-ALB de soja (promotor de albumina 2S, Glyma13g36400, no de Acesso NCBI gb AAB71140.1) ou promotor Gm-GA20OX (GA20 oxidase, glyma07g08950, Lu et al). Um terminador, como o terminador nativo ou terminador MYB2 de soja (fator de transcrição relacionado a MYB21, glyma.19g061600) é conectado operacionalmente a jusante das sequências de codificação. Os vetores, contendo cassetes de expressão, como mostrado na Tabela 7, são transformados em soja elite 93Y21 através da transformação à base de Ochro, como descrito no Exemplo 2. A transformação pode ser realizada tanto por inserção removida de glyma.20g085100 quanto glyma.10g134400 juntos, ou cada sequência separadamente. Quando direcionados juntos, os cassetes de inserção removida de glyma.20g085100 e glyma.10g134400 podem estar nos mesmos construtos ou em construtos diferentes.
[0127] Tabela 7: Construtos/cassetes de expressão para expressão transgênica
Promotor Gene Terminador Promotor Gm-ALB Inserção removida de Terminador Gm- Glyma.20g085100 MYB2 Promotor Gm-ALB Inserção removida de Term Glyma.20g085100 Glyma.20g085100 Promotor Gm- Inserção removida de Terminador Gm- GA20OX Glyma.20g085100 MYB2 Promotor Gm- Inserção removida de Term GA20OX Glyma.20g085100 Glyma.20g085100 Promotor Gm-ALB Glyma.10g134400 Terminador Gm- MYB2 Promotor Gm-ALB Glyma.10g134400 Term Glyma.10g134400 Promotor Gm- Glyma.10g134400 Terminador Gm- GA20OX MYB2 Promotor Gm- Glyma.10g134400 Term GA20OX Glyma.10g134400
[0128] O teor de óleo e proteína de semente transgênica é determinado por espectroscopia SS-NIR e FT-NIR como descrito anteriormente (Roesler et al Plant Physiol. 2016 878 a 893). Resumidamente, sementes homozigóticas T2 e segregados nulos são medidos em um espectrômetro Bruker Multi-Purpose Analyzer FT-NIR equipado com um conjunto de copo rotativo de 54 mm de diâmetro. Tamanhos de amostra de aproximadamente 100 sementes (20 g) são usados para a análise. O peso de cada amostra (com uma precisão de 0,01 g) é registrado antes da varredura. Os espectros refletidos são capturados para cada amostra para uma resolução de número de onda de 8 cm−1 (1,5 μm) na faixa de comprimento de onda entre 833 e 2.778 nm, com o instrumento no modo de macro refletância. O copo é rotacionado sobre a fonte e o detector enquanto 64 varreduras espectrais completas são coletadas. A rotação do copo é interrompida e os grãos de soja são vertidos em uma bandeja de alumínio e, em seguida, devolvidos ao copo antes de varredura pela segunda vez. Cerca de três ciclos de varredura completa (com mistura completa da amostra entre cada varredura) são usados. Os espectros capturados são analisados e os modelos são usados para prever o teor de umidade, teor de óleo, teor de proteína e teor de ácido oleico com o uso do pacote de software Bruker OPUS 7.0. Os métodos químicos de referência usados para a calibração de umidade, óleo e proteína têm como base métodos oficiais AOCS (Ac 2-41 [umidade], Ac 3-44 (mod) [gordura/óleo bruto] e Ba 4e-93 [proteína bruta]). A química de referência utilizada para as calibrações de ácido oleico utiliza a análise cromatográfica gasosa de ésteres metílicos de ácidos graxos de extratos de óleo derivados de amostras de soja, após captura espectral.
[0129] Testes de campo são realizados para medir o impacto da expressão específica da semente nas características agronômicas e na produtividade. Um projeto experimental de campo aninhado é adotado para avaliar o desempenho da característica da semente, em que blocos positivos e negativos são aninhados em cada evento respectivo e isolinhas positivas e negativas são aninhadas aleatoriamente dentro de cada bloco positivo e negativo, respectivamente. As características registradas incluem o teor de óleo, proteína e ácido oleico. As médias dos mínimos quadrados para positivo e nulo em cada evento são calculadas com o uso de um método de análise de modelo misto através do pacote de software de máxima verossimilhança residual ASReml (Gilmour et al., 2009). Os eventos e classes de características positivas e nulas são tratados como efeitos fixos, e as isolinhas foram ajustadas como efeitos aleatórios. A variação espacial da estrutura de correlação autorregressiva (AR) de primeira ordem para linhas e correlação autorregressiva para colunas (AR1 × AR1) é incorporada na análise. As diferenças médias de característica versus nula foram determinadas com base na abordagem lsd de Fisher a um nível de significância de P < 0,05. Espera-se que plantas e sementes de alto rendimento, alto teor proteína e alto teor de óleo sejam obtidas expressando um ou ambos dentre (i) o glyma.20g085100 com o polipeptídeo removido por inserção e (ii) o polipeptídeo glyma.10g134400.
[0130] Exemplo 5: Aumento de teor de proteína de semente através de edição do promotor glyma.10g134400 ou do promotor glyma.20g085100
[0131] A inserção de 321 pares de base é removida do gene glyma.20g085100 de elite de acordo com o Exemplo 2. O gene resultante codifica uma proteína que mostra 91,5% de identificação com seu parálogo glyma.10g134400 (Figura 5). Para aumentar a expressão de glyma.10g134400 ou glyma.20g085100 com a inserção removida, um EME (elemento modulador de expressão) é inserido ou editado na região de promotor cerca de 20 pb a montante da caixa TATA de glyma.10g134400 ou glyma.20g085100. O EME (elemento modulador de expressão) é um fragmento curto de DNA de cerca de 16 a 50 pb que pode aumentar a expressão do gene alvo quando inserido no promotor de gene alvo (Pedido Internacional No: PCT/2018/044498; Pedido Provisório nº US 62/558,619). Inserção do 2X Zm-AS2 (SEQ ID NO: 23), espera-se que um EME que compreende uma sequência repetida de milho na região promotora de soja produza um aumento de 2 a 5 vezes na expressão do gene. O promotor modificado de glyma.20g085100 ou glyma.10g134400 com 2X Zm-AS2 (SEQ ID NO: 23) pode ser clonado em um vetor para conduzir a expressão da proteína de fluorescência ZsGreen1. O vetor que compreende a sequência promotora modificada contendo a sequência EME e o marcador fluorescente é introduzido em protoplastos por transfecção mediada por PEG. O 2X ZM-AS2 pode ser avaliado em protoplastos quanto à atividade de modulação da expressão do promotor glyma.20g085100 ou glyma.10g134400 com o uso da proteína de fluorescência verde como um gene repórter. O nível de fluorescência no protoplasto pode ser medido como um indicador da força do promotor. Os construtos 2X Zm-AS2 EME que mostram expressão elevada são testados adicionalmente em plantas transgênicas de soja estáveis ou testados editando-se a sequência genômica para incluir o EME na região reguladora de transcrição próxima à caixa TATA, como descrito nos Exemplos 2 e 3.
[0132] A deleção de elementos repressores na região promotora por CRISPR/Cas9 também pode aumentar a expressão de gene. Os elementos repressores na região do promotor podem ser identificados com o uso do promotor ou ferramentas de análise de sequência com base em motivo, como o MEME Suite financiado pelo NIH e encontrado online em meme-suite.org (Universidade de Queensland, Austrália, Universidade de Washington, EUA e UC San Diego, EUA) ou The Plant Promoter Analysis Navigator "plantPAN2.0" encontrado online em plantpan2.itps.ncku.edu.tw/index.html (Institute of Tropical Plant Sciences, National Cheng Kung University, Taiwan). Os elementos repressores são deletados ou suprimidos com o uso de métodos revelados no presente documento.
[0133] Exemplo 6. Identificação de mutantes do gene principal CCT a partir de populações mutagenizadas
[0134] Populações de soja mutagenizadas podem ser geradas por irradiação de raios gama, irradiação de nêutrons rápida ou tratamento químico com EMS (metanossulfonato de etila) ou ENU (N-etil-N-nitrosoureia). O tratamento de sementes de soja com EMS 60 mM pode induzir 5.000 a 10.000 mutações em uma planta M2. Cada planta M2 pode ser sequenciada por sequenciamento do genoma completo. Em comparação com o genoma de referência de tipo selvagem, todas as mutações em uma planta M2 podem ser detectadas e mapeadas para o genoma. Através do sequenciamento de cerca de 2.000 a 5.000 linhas M2, é possível identificar uma mutação em um gene de interesse no genoma da soja. Uma linha M2 contendo uma mutação em glyma.20g850100 ou glyma.10g134400 é identificada e é retrocruzada com soja de tipo selvagem para limpar outras mutações não relacionadas ao gene do domínio CCT. Os mutantes com alto teor de proteína na semente podem ser cruzados com outros mutantes com alto teor de proteína para gerar mutantes duplos que aumentarão o teor de proteína na semente mais do que o aumento de qualquer um dos mutantes únicos.

Claims (37)

REIVINDICAÇÕES
1. Método para aumentar o teor de proteína na semente de uma planta de soja caracterizado pelo fato de que compreende a introdução de uma modificação em um gene de domínio CCT em uma planta de soja, em que a modificação é selecionada dentre: a. uma modificação que compreende uma deleção de nucleotídeos no cromossomo 20 em uma sequência genômica que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 2, sendo que a deleção resulta em uma sequência genômica modificada no cromossomo 20 que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 4; b. uma modificação de uma sequência reguladora de transcrição de uma sequência de nucleotídeos no cromossomo 10 que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 6, sendo que a modificação resulta em um aumento na expressão do polipeptídeo; c. a modificação da parte (a) e uma segunda modificação de uma sequência reguladora de transcrição da sequência genômica que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 4, sendo que a segunda modificação resulta em um aumento na expressão do polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 4;
d. uma modificação de um ou mais nucleotídeos no cromossomo 20 em (i) um polinucleotídeo que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 2 ou (ii) uma sequência reguladora de transcrição do polinucleotídeo, sendo que a modificação resulta na supressão da expressão do polipeptídeo; ou e. uma modificação de um ou mais nucleotídeos no cromossomo 10 em (i) um polinucleotídeo que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 6 ou (ii) uma sequência reguladora de transcrição do polinucleotídeo, sendo que a modificação resulta na supressão da expressão do polipeptídeo; e cultivar a planta para produzir uma semente, em que o teor de proteína é aumentado na semente, em comparação com uma semente de controle de uma planta de controle que não compreende a modificação.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende adicionalmente cruzar uma planta que compreende o polipeptídeo de domínio CCT modificado cultivado a partir da semente com uma segunda planta diferente e colher a semente da progênie.
3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a modificação compreende (i) “a” e “b” ou (ii) “b” e “c”.
4. Método, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que a modificação compreende a deleção da parte (a), e em que a deleção compreende uma deleção de pelo menos 312 e menos de 330 nucleotídeos da posição 6003 a 6358 da SEQ ID NO: 9.
5. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que a deleção compreende uma deleção que corresponde à posição 6029 a 6349 da SEQ ID NO: 9 ou posição 6012 a 6332 da SEQ ID NO: 9.
6. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a modificação compreende a modificação da parte (b), e em que a modificação compreende uma inserção de um elemento intensificador de promotor, uma alteração de um elemento repressor ou um rearranjo de elementos reguladores.
7. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a modificação compreende a deleção e modificação da parte (c), e em que a modificação compreende uma inserção de um elemento intensificador de promotor, uma alteração de um elemento repressor ou um rearranjo de elementos reguladores.
8. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a modificação compreende a modificação da parte (d) e em que a modificação compreende (i) uma alteração do polinucleotídeo que resulta em um frameshift da sequência de codificação do polipeptídeo, ou (ii) uma interrupção de um elemento intensificador de promotor, uma inserção de um elemento repressor ou um rearranjo de elementos reguladores.
9. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a modificação compreende a modificação da parte (e) e em que a modificação compreende
(i) uma alteração do polinucleotídeo que resulta em um frameshift da sequência de codificação do polipeptídeo, ou (ii) uma interrupção de um elemento intensificador de promotor, uma inserção de um elemento repressor ou um rearranjo de elementos reguladores.
10. Método, de acordo com qualquer uma das reivindicações 1 a 9, caracterizado pelo fato de que a exclusão ou modificação é introduzida através de rupturas de DNA direcionadas.
11. Planta com teor de proteína aumentado caracterizada pelo fato de que compreende uma sequência genômica de domínio CCT modificada, em que a modificação é selecionada dentre: a. uma modificação que compreende uma deleção de nucleotídeos no cromossomo 20 em uma sequência genômica que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 2, sendo que a deleção resulta em uma sequência genômica modificada no cromossomo 20 que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 4, em que a planta produz sementes com um teor de proteína aumentado em relação a uma semente de controle que não compreende a deleção e um rendimento que é de pelo menos 80% da variedade de soja 93B83 quando cultivada nas mesmas condições ambientais; b. uma modificação de uma sequência reguladora de transcrição de uma sequência de nucleotídeos no cromossomo 10 que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 6,
sendo que a modificação resulta em um aumento na expressão do polipeptídeo, em que a planta produz sementes com teor de proteína aumentado em relação a uma semente de controle que não compreende a modificação; c. a modificação da etapa (a) e uma segunda modificação de uma sequência reguladora de transcrição da sequência genômica que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 4, sendo que a segunda modificação resulta em um aumento na expressão do polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 4, em que a planta produz sementes com teor de proteína aumentado em relação a uma semente de controle que não compreende as modificações; d. uma modificação de um ou mais nucleotídeos no cromossomo 20 em (i) um polinucleotídeo que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 2 ou (ii) uma sequência reguladora de transcrição do polinucleotídeo, sendo que a modificação resulta na supressão da expressão do polipeptídeo, em que a planta produz sementes com proteína aumentada em relação a uma semente de controle que não compreende a modificação; ou e. uma modificação de um ou mais nucleotídeos no cromossomo 10 em (i) um polinucleotídeo que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 95% idêntica à SEQ ID NO: 6 ou (ii) uma sequência reguladora de transcrição do polinucleotídeo, sendo que a modificação resulta na supressão da expressão do polipeptídeo, em que a planta produz sementes com óleo aumentado em relação a uma semente de controle que não compreende a modificação.
12. Planta, de acordo com a reivindicação 11, caracterizada pelo fato de que a modificação compreende a deleção da parte (a), e em que a planta produz sementes com um rendimento que é de pelo menos 95% da variedade de soja 93B83 quando cultivada nas mesmas condições ambientais.
13. Planta, de acordo com a reivindicação 11, caracterizada pelo fato de que a modificação compreende a deleção da parte (a), e em que a deleção compreende uma deleção de pelo menos 312 e menos de 330 nucleotídeos da posição 6003 a 6358 da SEQ ID NO: 9.
14. Planta, de acordo com a reivindicação 11, caracterizada pelo fato de que a modificação compreende a deleção da parte (a) e em que a deleção compreende uma deleção que corresponde à posição 6029 a 6349 da SEQ ID NO: 9 ou posição 6012 a 6332 da SEQ ID NO: 9.
15. Planta, de acordo com a reivindicação 11, caracterizada pelo fato de que compreende a modificação da parte (b) e em que a planta produz sementes com teor de proteína aumentado em relação a uma semente de controle que não compreende a modificação.
16. Planta, de acordo com a reivindicação 15, caracterizada pelo fato de que a modificação compreende uma inserção de um elemento intensificador de promotor, uma alteração de um elemento repressor ou um rearranjo de elementos reguladores.
17. Planta, de acordo com a reivindicação 11, caracterizada pelo fato de que a planta compreende as modificações da parte (c) e em que a planta produz sementes com teor de proteína aumentado em relação a uma semente de controle que não compreende a modificação.
18. Planta, de acordo com a reivindicação 17, caracterizada pelo fato de que a deleção compreende uma deleção de pelo menos 312 e menos de 330 nucleotídeos da posição 6003 a 6358 da SEQ ID NO: 9.
19. Planta, de acordo com a reivindicação 17 ou 18, caracterizada pelo fato de que a segunda modificação compreende uma inserção de um elemento intensificador de promotor, uma alteração de um elemento repressor ou um rearranjo de elementos reguladores.
20. Planta, de acordo com a reivindicação 11, caracterizada pelo fato de que a planta compreende as modificações da parte (d) e em que a planta produz sementes com proteína aumentada em relação a uma semente de controle que não compreende a modificação.
21. Planta, de acordo com a reivindicação 11, caracterizada pelo fato de que compreende as modificações da parte (e) e em que a planta produz sementes com óleo aumentado em relação a uma semente de controle que não compreende a modificação.
22. Planta, de acordo com a reivindicação 20 ou 21, caracterizada pelo fato de que a modificação compreende (i) uma alteração do polinucleotídeo que resulta em um frameshift da sequência de codificação do polipeptídeo ou (ii) uma interrupção de um elemento intensificador do promotor, uma inserção de um elemento repressor ou um rearranjo de elementos regulatórios.
23. Semente produzida pela planta conforme definida em qualquer uma das reivindicações 11 a 20 caracterizada pelo fato de que a semente compreende a modificação e tem um teor de proteína aumentado em relação a uma semente de controle que não compreende a modificação.
24. Semente produzida pela planta conforme definida na reivindicação 21, caracterizada pelo fato de que a semente compreende a modificação e tem um teor de óleo aumentado em relação a uma semente de controle que não compreende a modificação.
25. Método de cultivo de plantas caracterizado pelo fato de que o método compreende o cruzamento da planta conforme definida em qualquer uma das reivindicações 11 a 21, com uma segunda planta de soja para produzir semente de progênie.
26. Semente de progênie produzida pelo método conforme definido na reivindicação 25 caracterizada pelo fato de que a semente de progênie compreende a modificação e tem um teor de proteína aumentado em relação a uma semente de progênie de controle que não compreende a modificação.
27. Construto de DNA recombinante caracterizado pelo fato de que compreende uma sequência promotora heteróloga conectada operacionalmente a um polinucleotídeo que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 90% idêntica à SEQ ID NO: 4.
28. Planta de soja que produz uma semente que compreende um teor de proteína aumentado caracterizada pelo fato de que compreende o construto recombinante conforme definido na reivindicação 27, em que o polipeptídeo é expresso na semente e a semente tem um teor de proteína aumentado em comparação com uma semente de controle que não expressa o polipeptídeo.
29. Semente produzida pela planta conforme definida na reivindicação 28caracterizada pelo fato de que a semente compreende o construto recombinante e tem um teor de proteína aumentado em comparação com uma semente de controle que não expressa o polipeptídeo.
30. Planta ou semente conforme definida na reivindicação 28 ou 29 caracterizada pelo fato de que o promotor é um promotor específico de semente fracamente expresso.
31. Sequência de RNA-guia caracterizada pelo fato de que tem como alvo um locus genômico de uma célula vegetal, em que o locus genômico compreende um polinucleotídeo que codifica um polipeptídeo que compreende uma sequência de aminoácidos que é pelo menos 90% idêntica à SEQ ID NO: 2 ou
4.
32. Construto de DNA recombinante caracterizado pelo fato de que expressa o RNA-guia conforme definido na reivindicação 31.
33. Célula de planta de soja caracterizada pelo fato de que compreende o RNA-guia conforme definido na reivindicação 31.
34. Célula de planta de soja caracterizada pelo fato de que compreende o construto de DNA recombinante conforme definido na reivindicação 32.
35. Planta de soja caracterizada pelo fato de que tem incorporado de forma estável em seu genoma o construto de DNA recombinante conforme definido na reivindicação 32.
36. Semente de soja produzida pela planta conforme definida na reivindicação 35 caracterizada pelo fato de que a semente tem incorporado de forma estável em seu genoma o construto de DNA recombinante.
37. Planta, de acordo com a reivindicação 35, caracterizada pelo fato de que compreende adicionalmente uma sequência de ácidos nucleicos heteróloga selecionada a partir do grupo que consiste em: um gene repórter, um marcador de seleção, um gene de resistência a doenças, um gene de resistência a herbicidas, um gene de resistência a insetos, um gene envolvido no metabolismo de carboidratos, um gene envolvido no metabolismo de ácidos graxos, um gene envolvido no metabolismo de aminoácidos, um gene envolvido no desenvolvimento de plantas, um gene envolvido na regulação do crescimento de plantas, um gene envolvido em melhoria do rendimento, um gene envolvido em resistência a seca, um gene envolvido em aumento da eficiência da utilização de nutrientes, um gene envolvido em resistência ao frio, um gene envolvido em resistência ao calor e um gene envolvido em resistência a sal em plantas.
BR112021008330-8A 2018-10-31 2019-10-30 edição de genoma para aumentar o teor de proteína da semente BR112021008330A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862753628P 2018-10-31 2018-10-31
US62/753,628 2018-10-31
PCT/US2019/058747 WO2020092491A1 (en) 2018-10-31 2019-10-30 Genome editing to increase seed protein content

Publications (1)

Publication Number Publication Date
BR112021008330A2 true BR112021008330A2 (pt) 2021-08-03

Family

ID=70463505

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112021008330-8A BR112021008330A2 (pt) 2018-10-31 2019-10-30 edição de genoma para aumentar o teor de proteína da semente

Country Status (5)

Country Link
US (1) US20220119827A1 (pt)
EP (1) EP3874040A4 (pt)
BR (1) BR112021008330A2 (pt)
CA (1) CA3114913A1 (pt)
WO (1) WO2020092491A1 (pt)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112481259B (zh) * 2020-11-24 2022-09-16 南昌大学 两种甘薯U6基因启动子IbU6的克隆与应用
WO2023183895A2 (en) * 2022-03-23 2023-09-28 Donald Danforth Plant Science Center Use of cct-domain proteins to improve agronomic traits of plants
WO2024023764A1 (en) * 2022-07-27 2024-02-01 Benson Hill, Inc. Increasing gene expression for increased protein content in plants
WO2024023763A1 (en) * 2022-07-27 2024-02-01 Benson Hill, Inc. Decreasing gene expression for increased protein content in plants
WO2024076897A2 (en) * 2022-10-03 2024-04-11 Pioneer Hi-Bred International, Inc. Methods for producing high protein soybeans

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8697857B2 (en) 2007-11-20 2014-04-15 E. I. Du Pont De Nemours And Company Soybean EF1A2 promoter and its use in constitutive expression of transgenic genes in plants
WO2015095186A2 (en) * 2013-12-16 2015-06-25 Koch Biological Solutions, Llc Nitrogen use efficiency in plants
JP6785235B2 (ja) * 2015-02-18 2020-11-18 アイオワ・ステイト・ユニバーシティ・リサーチ・ファウンデイション・インコーポレイテッドIowa State University Research Foundation, Inc. 高いタンパク質含有量及びストレスに対する抵抗性のためのnf−yc4プロモーター中の転写リプレッサー結合部位の修飾
US20220030788A1 (en) * 2018-10-16 2022-02-03 Pioneer Hi-Bred International, Inc. Genome edited fine mapping and causal gene identification

Also Published As

Publication number Publication date
EP3874040A1 (en) 2021-09-08
CA3114913A1 (en) 2020-05-07
WO2020092491A1 (en) 2020-05-07
EP3874040A4 (en) 2022-08-31
US20220119827A1 (en) 2022-04-21

Similar Documents

Publication Publication Date Title
CN106164272B (zh) 修饰的植物
BR112021008330A2 (pt) edição de genoma para aumentar o teor de proteína da semente
BR112019020375A2 (pt) métodos de modulações, de aumento da expressão, de expressão de uma sequência, de modificação da expressão, de geração de uma população e de identificação, construção de dna, célula vegetal, plantas, semente e polinucleotídeo isolado
WO2019204373A1 (en) Mads box proteins and improving agronomic characteristics in plants
US11371049B2 (en) Abiotic stress tolerant plants and polynucleotides to improve abiotic stress and methods
US20210403933A1 (en) Soybean gene and use for modifying seed composition
US11365424B2 (en) Abiotic stress tolerant plants and polynucleotides to improve abiotic stress and methods
WO2020023258A1 (en) Methods and compositions to increase yield through modifications of fea3 genomic locus and associated ligands
CN106062192B (zh) 玉米细胞质雄性不育(cms)s型恢复基因rf3
CN111989403A (zh) Mads盒蛋白以及在植物中改善农艺特征
KR102516522B1 (ko) 반수체 식물을 유도하는 pPLAⅡη 유전자 및 이의 용도
US20230024164A1 (en) Compositions and genome editing methods for improving grain yield in plants
WO2018228348A1 (en) Methods to improve plant agronomic trait using bcs1l gene and guide rna/cas endonuclease systems
WO2020232660A1 (en) Abiotic stress tolerant plants and methods
US11286496B1 (en) Modified genes to increase seed protein content
US20230220409A1 (en) Alteration of seed composition in plants
WO2021016906A1 (en) Abiotic stress tolerant plants and methods
US11976288B2 (en) Abiotic stress tolerant plants and methods
US20210155949A1 (en) Improving agronomic characteristics in maize by modification of endogenous mads box transcription factors
EP3975701A1 (en) Methods and compositions for generating dominant short stature alleles using genome editing
WO2020232661A1 (en) Abiotic stress tolerant plants and methods