BR112020014168A2 - Proteína, ácido nucleico isolado, gene recombinante, vetor, célula hospedeira, planta, parte de planta ou semente de trigo, métodos para produzir, produto de trigo, farinha, farelo integral, amido, grânulos de amido ou farelo de trigo e métodos para identificar e/ou selecionar uma planta de trigo - Google Patents

Proteína, ácido nucleico isolado, gene recombinante, vetor, célula hospedeira, planta, parte de planta ou semente de trigo, métodos para produzir, produto de trigo, farinha, farelo integral, amido, grânulos de amido ou farelo de trigo e métodos para identificar e/ou selecionar uma planta de trigo Download PDF

Info

Publication number
BR112020014168A2
BR112020014168A2 BR112020014168-2A BR112020014168A BR112020014168A2 BR 112020014168 A2 BR112020014168 A2 BR 112020014168A2 BR 112020014168 A BR112020014168 A BR 112020014168A BR 112020014168 A2 BR112020014168 A2 BR 112020014168A2
Authority
BR
Brazil
Prior art keywords
wheat
seq
plant
sequence
protein
Prior art date
Application number
BR112020014168-2A
Other languages
English (en)
Inventor
Mark Davey
Lukas WITTERN
Keith Gardner
Alex Arundell Webb
Colin Robert Cavanagh
Ruvini ARIYADASA
William BOVILL
Jose Barrero Sanchez
Klara VERBYLA
Andrew SPRIGGS
Matthew Hannah
Xi Wang
Original Assignee
Basf Se
Commonwealth Scientific And Industrial Research Organisation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Basf Se, Commonwealth Scientific And Industrial Research Organisation filed Critical Basf Se
Publication of BR112020014168A2 publication Critical patent/BR112020014168A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8262Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield involving plant development
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/10Seeds
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/46Gramineae or Poaceae, e.g. ryegrass, rice, wheat or maize
    • A01H6/4678Triticum sp. [wheat]
    • AHUMAN NECESSITIES
    • A21BAKING; EDIBLE DOUGHS
    • A21DTREATMENT, e.g. PRESERVATION, OF FLOUR OR DOUGH, e.g. BY ADDITION OF MATERIALS; BAKING; BAKERY PRODUCTS; PRESERVATION THEREOF
    • A21D13/00Finished or partly finished bakery products
    • A21D13/02Products made from whole meal; Products containing bran or rough-ground grain
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23LFOODS, FOODSTUFFS, OR NON-ALCOHOLIC BEVERAGES, NOT COVERED BY SUBCLASSES A21D OR A23B-A23J; THEIR PREPARATION OR TREATMENT, e.g. COOKING, MODIFICATION OF NUTRITIVE QUALITIES, PHYSICAL TREATMENT; PRESERVATION OF FOODS OR FOODSTUFFS, IN GENERAL
    • A23L7/00Cereal-derived products; Malt products; Preparation or treatment thereof
    • A23L7/10Cereal-derived products
    • A23L7/117Flakes or other shapes of ready-to-eat type; Semi-finished or partly-finished products therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8262Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield involving plant development
    • C12N15/827Flower development or morphology, e.g. flowering promoting factor [FPF]
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23VINDEXING SCHEME RELATING TO FOODS, FOODSTUFFS OR NON-ALCOHOLIC BEVERAGES AND LACTIC OR PROPIONIC ACID BACTERIA USED IN FOODSTUFFS OR FOOD PREPARATION
    • A23V2002/00Food compositions, function of food ingredients or processes for food or foodstuffs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Abstract

a presente invenção está relacionada ao campo agrícola. em particular, a invenção provê uma proteína, um ácido nucleico, um gene recombinante, plantas compreendendo o gene recombinante e métodos para alterar o número de espiguetas por espiga em uma planta de trigo.

Description

“PROTEÍNA, ÁCIDO NUCLEICO ISOLADO, GENE RECOMBINANTE, VETOR, CÉLULA HOSPEDEIRA, PLANTA, PARTE DE PLANTA OU SEMENTE DE TRIGO, MÉTODOS PARA PRODUZIR, PRODUTO DE TRIGO, FARINHA, FARELO INTEGRAL, AMIDO, GRÂNULOS DE AMIDO OU FARELO DE TRIGO E MÉTODOS PARA IDENTIFICAR E/OU SELECIONAR UMA PLANTA DE TRIGO” CAMPO DA INVENÇÃO
[001] A presente invenção diz respeito ao campo da otimização de plantas por métodos de biologia molecular, tecnologia de marcadores e tecnologia de genes. São fornecidos meios técnicos, como moléculas de ácido nucleico, vetores e métodos, e usos dos mesmos para produzir e identificar plantas de trigo não transgênicas e transgênicas com fenótipos alterados do “número total de espiguetas por espiga” (abreviado como “SPS” no presente documento).
ANTECEDENTES DA INVENÇÃO
[002] A produção de grãos no trigo é determinada predominantemente por três componentes de produção, incluindo espigas produtivas ou espigas por unidade de área, número de grãos por espiga e peso dos grãos. Um dos principais fatores que contribuiu para a melhora da produção do trigo é o aumento de grãos por espiga ou o aumento de grãos por espiga e número de espigas por unidade de área. O número total de grãos pode ser ainda mais influenciado por características como perfilhos produtivos por planta, número de espiguetas por espiga, número de floretes viáveis por espiguetas. Ganhos em qualquer um dos componentes ou características de produção podem teoricamente aumentar o potencial de produção do trigo. Entretanto, como estes podem competir por assimilados durante o estágio de crescimento da espiga, podem ocorrer efeitos de compensação, e o aumento de uma das características ou componentes não leva necessariamente a um aumento no rendimento total de grãos.
[003] A genética que determina a arquitetura da inflorescência do trigo permanece em grande parte desconhecida. Até agora, apenas o gene de sensibilidade ao fotoperíodo Ppd-1 mostrou afetar o número de espiguetas [Shaw, L.M., et al., PLoS One, 2013. 8 (11): p. e79459]. Isso representa uma grande fonte de potencial genético inexplorado para contribuir com os esforços para atingir o aumento de 70% da produção agrícola necessário em 2050 para alimentar uma crescente população mundial [Nações Unidas, F.a.A.O.o.t.U. How to Feed the World in 2050. em Roma: High-Level Expert Forum. 2009]. À inflorescência do trigo (comumente chamada espiga, orelha ou cabeça) é composta por espiguetas presas nos nós da raque. Cada uma das espiguetas, por sua vez, é composta de duas glumas e diversos floretes, das quais geralmente duas a quatro formam um grão após a fertilização. O número final de espiguetas é determinado pela formação de uma espigueta terminal. Isso ocorre quando os últimos primórdios iniciados, em vez de se tornarem primórdios de espiguetas, se desenvolvem em primórdios da gluma e floretes [Kirby, E.J.M. e M. Appleyard, F.G.H. Lupton, Editor. 1987, Springer Holanda: Dordrecht. p. 287-311].
[004] O desenvolvimento de populações de mapeamento permanentes em trigo nos últimos anos, acompanhada pela construção de mapas de marcador genômico amplo com base em uma grande quantidade de marcadores moleculares, abriu a possibilidade de identificar, analisar e utilizar o QTL para características agronômicas, incluindo número de espiguetas por espiga.
[005] Tian et a/. (2015 Genetic analyses of wheat and molecular marker-assisted breeding; volume 1 Science Press Bejing) resumem informações de QTL relacionadas à morfologia da espiga e (na página 167, Tabela 1.37) especificamente para o número de espiguetas. Os QTLs são identificados no cromossomo 2D, 2DS, 3AS, 3B, 3DL, 4AL, 4DS, 5A, 5B, 5D, 7A, TAL e 7D.
[006] Jantasuriyarat et al. (2004, Theor. Appl Genet. 108: 261- 273) relataram dois QTL usando linhagens endogâmicas recombinantes da população de mapeamento do International Triticeae Mapping Initiative que foram associados ao número de espiguetas no cromossomo 7A, entre outros QTLs. Um QTL como delimitado pelos marcadores Xfba69 - XksuH9 (182, 7- 213,4 cM - marcador de pico 196,3 cM - locus mais próximo Xmwg 938) ou como delimitado pelos marcadores Xfba350 - XÍbb18 - 188.5.3-201.3 cM - marcador de pico 196.3 cM - locus mais próximo Xmwg938) foi significativo em dois locais em dois anos, enquanto outro foi significativo em um ano em apenas um local (marcadores Xfbg354 - Xfba350 - 160,1-174,9 cM - marcador de pico 164,9 cM - locus mais próximo Xfba69). O número de espiguetas foi aumentado pelos alelos Opata 85 em todos os casos.
[007] Ma et al. (2007, Mol. Gen. Genomics 277: 31-42) relataram dois QTL para número de espiguetas por pico no cromossomo 7A em uma população de “linhagens endogâmicas recombinantes' (“RILS”) desenvolvidas por descendência de uma única semente a partir de um cruzamento entre Nanda2419 e Wangshuibai, ou em uma população F2 imortalizada gerada por intercasalamento aleatoriamente permutado destas RILs. Na população RILs, o intervalo QTL foi delineado pelos marcadores Xbarc154-Xwmc83e, enquanto na população IF2, o QTL foi delineado pelos marcadores Xwmec83-Xwmec17. Os alelos da Wangshuibai contribuíram para mais espiguetas por espiga.
[008] Xu et al. (2014, Theor. Appl. Genet. 127: 59-72) relataram a identificação de um QTL para SPS no cromossomo 7A em uma população de RlLs a partir de um cruzamento entre Xiaoyan 54 e Jing 411) identificado pelos marcadores Xgwm276-Xbarc192-Xbarc253. O parental Jing 411 contribuiu com o alelo favorável.
[009] Zhai et al. (2016 Frontiers in Plant Science, Volume 7, artigo 1617) referiram à região no cromossomo 7A identificado por Xu et al. 2014, e indicaram que a região deve estar localizada entre o intervalo 123,50- 137,50 cM.
[010] Saarah Noriko Kuzay et al. (PO848 International Plant and Animal Genome XXV, 14 a 18 de janeiro de 2017 em San Diego) se referiu em um resumo de pôster à identificação de um QTL para SPS no braço longo do cromossomo 7AL usando estudos de associação de genoma amplo. À validação deste QTL na população biparental BerkutxRC875 permitiu mapeamento genético preciso para uma região de 2 Mb do cromossomo 7AL. Em média, as linhas que carregam o alelo Berkut para SPS tiveram 2,4 mais espiguetas por espiga em comparação com linhagens que carregam o alelo RAC875 para a região do pico do QTL. Eles também relatam o desenvolvimento de uma grande população de alta densidade de duas famílias heterozigotas para mapear com precisão e eventualmente clonar o gene subjacente a este QTL.
[011] Zhang et al (2015, Scientific Reports DOI 10: 1038/srep12211) relatam que um suposto ortólogo MOCT1 do trigo (MOC1 significa MONCULM1 em arroz) pode estar envolvido no desenvolvimento das espiguetas do trigo. O TaMoc1-A foi mapeado para uma região flanqueada por WMC488 (4,7 CM) e P2071-180 (11,6CM) no cromossomo 7A em uma população de haploides duplicados a partir de um cruzamento entre Hanxuan e Lumai 14. O haplótipo TaMoc1-7A HapH foi associado a um aumento modesto no número de espiguetas por espiga em 10 ambientes ao longo de 3 anos e 2 locais. Entretanto, esse ortólogo TaMOC1 não é o gene subjacente ao QTL descrito na presente invenção para SPS no cromossomo 7A. Após o alinhamento de TaMOC1-7A ao genoma de referência NRgene-HiC de trigo Chinese Spring (abreviado no presente como “CS”), o TaMOC1-7A mapeou
557.480.502 pb (pares de bases) no cromossomo 7A, a uma distância superior a 100 Mb do QTL 7A descrito e analisado na presente invenção para SPS e, portanto, parece ser diferente. Conforme indicado abaixo, os marcadores esquerdo e direito identificam o intervalo QTL no mapa da população de mapeamento MAGIC em 671.146.796 e 674.103.435 respectivamente, enquanto os marcadores identificam o intervalo QTL em um mapa de estudo GWAS nas posições 674.203.435 e 674.203.741 no cromossomo 7A do trigo (posições referem-se à sequência genômica de referência NRgene-HiC Chinese Spring).
[012] Portanto, permanece a necessidade de dissecção genética adicional do QTL do SPS localizado nos cromossomos 7 do trigo, particularmente no 7A, para identificar o(s) gene(s) subjacente(s), a fim de facilitar a otimização do número de espiguetas por espiga, na tentativa de alcançar o potencial máximo de rendimento do trigo.
DESCRIÇÃO RESUMIDA DA INVENÇÃO
[013] Em um aspecto, a invenção provê uma proteína envolvida na determinação do número de espiguetas por espiga em trigo que é ortóloga à proteína “Aberrant panicle organization 1” (Apo1) de arroz. Esta proteína compreende uma sequência de aminoácidos selecionada a partir do grupo que consiste em a) uma sequência de aminoácidos de SEQ ID NO: 3, 15 ou 17 ou uma variante funcional da mesma; e b) uma sequência de aminoácidos possuindo pelo menos 85% de identidade de sequência com a sequência de aminoácidos de SEQ ID NO: 3, 15 ou 17, ou uma variante funcional da mesma.
[014] Outro objetivo da presente invenção é fornecer um ácido nucleico isolado que codifica a proteína de acordo com a invenção, que pode compreender uma sequência nucleotídica selecionada a partir do grupo que consiste em a) uma sequência de ácido nucleico de SEQ ID NO: 1 ou SEQ ID NO: 2; b) uma sequência de ácido nucleico com pelo menos 80% de identidade com a sequência de ácido nucleico de SEQ ID NO: 1 ou SEQ ID NO: 2; c) um ácido nucleico com uma sequência complementar ao ácido nucleico de a) ou b). O ácido nucleico de acordo com a invenção pode estar localizado dentro de um intervalo no cromossomo 7A do trigo compreendendo a sequência de nucleotídeos compreendida entre o nucleotídeo na posição 674081462 na sequência genômica de referência NRgene-HIiC Chinese Spring e o nucleotídeo na posição 674082918 na sequência genômica de referência NRgene-HiC Chinese Spring e flanqueado por marcadores de SEQ ID NO: 10 e SEQ ID NO: 11 ou flanqueado por marcadores de SEQ ID NO: 12 e SEQ ID NO: 13 ou SEQ ID NO: 14, ou flanqueado pelos marcadores de SEQ ID NO: 23 e SEQ ID NO: 24, ou podem estar localizados dentro de um intervalo no cromossomo 7B do trigo flanqueado pelos marcadores de SEQ ID NO: 26 e 27. Em um exemplo de realização, um ácido nucleico isolado que codifica a proteína de acordo com a invenção, pode compreender uma sequência nucleotídica selecionada a partir do grupo que consiste em: a) uma sequência de ácido nucleico de SEQ ID NO: 1, 2, 6, 7, 15, 16, 20, 21, 28 ou 30; b) uma sequência de ácido nucleico com pelo menos 80% de identidade com a sequência de ácido nucleico de SEQ ID NO: 1, 2, 6, 7, 15, 16, 20, 21, 28 ou 30; c) um ácido nucleico com uma sequência complementar ao ácido nucleico de a) ou b). Em um exemplo de realização, um ácido nucleico isolado que codifica a proteína de acordo com a invenção pode compreender uma sequência nucleotídica selecionada a partir do grupo que consiste em a) uma sequência de ácido nucleico de SEQ ID NO: 1, 2, 6, 7 ou 28, b) uma sequência de ácido nucleico com pelo menos 80% de identidade com a sequência de ácido nucleico de SEQ ID NO: 1, 2, 6, 7 ou 28, c) um ácido nucleico com uma sequência complementar ao ácido nucleico de a) ou b). Em um exemplo de realização, qualquer uma dessas sequências de ácido nucleico é um ácido nucleico isolado ou artificial.
[015] A presente invenção provê ainda um gene recombinante compreendendo um promotor que pode ser expresso por planta operacionalmente ligado a uma sequência de ácido nucleico que codifica a proteína de acordo com a invenção e, opcionalmente, uma sequência terminadora da transcrição e poliadenilação, preferencialmente uma região de término da transcrição e poliadenilação funcional em plantas. Em outro exemplo de realização, o promotor expressável em planta pode ser selecionado a partir de um promotor constitutivo, um promotor induzível ou um promotor tecido-específico. O promotor que pode ser expresso em planta pode ser um promotor CaMV35S, um promotor da Ubiquitina ou o promotor nativo do gene APOT1 de acordo com a invenção, recuperado a partir de uma variedade de trigo com um número relativamente alto de espiguetas por espiga.
[016] Em outro aspecto, a invenção provê uma planta de trigo, parte de planta ou semente que consiste em células vegetais de trigo compreendendo o gene recombinante descrito na presente invenção.
[017] Em exemplos de realização alternativos, são fornecidos métodos para produzir plantas de trigo com número alterado de espiguetas por espiga ou para alterar o número de espiguetas por espiga de uma planta de trigo, em que ambos os métodos compreendem a etapa de alterar a abundância da proteína de acordo com a invenção dentro da planta de trigo. Em exemplo de realização, a abundância da proteína é aumentada e o número de espiguetas por espiga é aumentado em comparação com o número de espiguetas por espiga da planta de trigo na qual a abundância da proteína não está alterada, particularmente na planta de trigo que possui um número (relativo) inicial baixo de espiguetas por espiga. A abundância da proteína da invenção pode ser aumentada ao fornecer à referida planta de trigo: a) um gene recombinante de acordo com a invenção; ou b) um gene heterólogo que codifica a proteína de acordo com a invenção, em que o gene heterólogo é mais altamente expresso do que o gene endógeno correspondente. O gene heterólogo pode compreender a sequência nucleotídica de SEQ ID NO: 4, 5,9, 19 ou SEQ ID NO: 22 ou uma sequência nucleotídica possuindo pelo menos 90% de identidade de sequencia com qualquer uma dessas sequências. Em um exemplo de realização, o gene heterólogo pode compreender a sequência nucleotídica de SEQ ID NO: 4, 5, 9, 19 ou uma sequência nucleotídica possuindo pelo menos 90% de identidade sequencial com qualquer uma dessas sequências, em que a referida sequência é caracterizada por um deleção de cerca de 115 nucleotídeos (como 100-130 nucleotídeos ou 115 nucleotídeos) em uma posição de cerca de 500 nucleotídeos a montante do códon de início ATG (correspondente ao códon de início na sequência de referência de SEQ ID NO: 1).
[018] Ainda em outro exemplo de realização, a abundância da proteína é diminuída e o número de espiguetas por espiga é diminuída em comparação com o número de espiguetas por espiga da planta de trigo quando a abundância da proteína não é alterada, em que particularmente a planta de trigo possui um número inicial alto (relativo) de espiguetas por espiga. À abundância da proteína de acordo com a invenção pode ser diminuída ao fornecer à referida planta de trigo: a) um gene heterólogo que codifica a proteína de acordo com a invenção, em que o promotor do referido gene heterólogo tem uma atividade promotora mais baixa do que o promotor do gene endógeno, ou b) um alelo mutante do endógeno que codifica a proteína de acordo com a invenção. O gene heterólogo pode compreender a sequência de nucleotídeos de SEQ ID NO: 9 ou uma sequência de nucleotídeos possuindo pelo menos 90% de identidade de sequência com a mesma, e de preferência não compreende a sequência de nucleotídeos de posição 4399 à posição 4513 da SEQ ID NO: 5, ou uma sequência nucleotídica possuindo pelo menos 90% de identidade de sequência com a mesma. O gene heterólogo pode compreender também a sequência de nucleotídeos de SEQ ID NO: 19 ou uma sequência de nucleotídeos possuindo pelo menos 90% de identidade de sequência com a mesma, e de preferência carece da sequência de nucleotídeos da posição 7816 à posição 7930 da SEQ ID NO: 19, ou uma sequência nucleotídica possuindo pelo menos 90% de identidade de sequência com a mesma. O alelo mutante pode ser um alelo nocauteado. O alelo mutante também pode ser um alelo mutante de substituição ou alelo mutante de deleção ou inserção preferencialmente com atividade mais baixa.
[019] Em outro exemplo de realização, nos métodos descritos acima, a etapa de fornecer compreende o fornecimento por transformação, cruzamento, retrocruzamento, introgressão, edição do genoma ou mutagênese.
[020] Exemplos de realização adicionais divulgam métodos para identificar e/ou selecionar uma planta de trigo compreendendo um alelo de um gene que contribui positiva ou negativamente para o número de espiguetas por espiga, compreendendo respectivamente a etapa de identificação da presença ou ausência, respectivamente, no genoma da planta de trigo de um ácido nucleico com os nucleotídeos da posição 4399 até a posição 4513 da SEQ ID NO: 5, ou de uma sequência de nucleotídeos possuindo pelo menos 90% de identidade de sequência com a mesma ou um ácido nucleico possuindo a sequência de nucleotídeos da posição 7816 até a posição 7930 da SEQ ID NO: 19, ou de uma sequência nucleotídica com pelo menos 90% de identidade de sequência com a mesma.
BREVE DESCRIÇÃO DAS FIGURAS
[021] Figura 1: Nível de expressão de RNA de APO1 em diferentes variedades de trigo de primavera (Spring - MAGIC Founders) e HIFs contrastantes com e sem o alelo que contribui para o SPS. TS: Espiguetas terminais, DR: duplo anel. Baxter, Chara, Westonia e Yitpi são as plantas parentais pais da população MAGIC de quatro linhagens. Fam1 A 1,
Fam1 B 1, Fam2 B 1, Fam2 C 1, Fam2 H 1, Fam3 E 1, Fam3 | 1, Fam4 A, Fam4 G, Fam5 C 1 e Fam5 F 1 são onze HIFs analisadas. As linhagens com um número alto de espiguetas por espiga são marcadas com um asterisco.
[022] Figura 2: A. Distribuição de fenótipos médios de todas as linhagens a partir da população de trigo de inverno 2014 fenotipadas para o total de número de espiguetas por espiga (SPS) e indicação de SPS para as variedades fundadoras de trigo. B. Resumo da variação nos fenótipos SPS e herdabilidades associadas.
[023] Figura 3: mapeamento fino de QTsn.jbl-7. a) Modelo QTL Mpwgaim; b) alinhamento do mapa genético MAGIC; c) mapa físico IVGSCv1 com modelos de genes MEGAP anotados; d) polimorfismos de sequência entre Robigus e Claire/Chinese Spring em um APO1 ortólogo.
[024] Figura 4: Relações sintênicas do QTL QTsn.jjbl-7A com o QTL QTsn.jbl-7B e o OTL gPBNG6 de arroz.
[025] Figura 5: a) Expressão do transcrito TaAPO1-7A em relação aos genes housekeeping TaRP15 [Shaw, L.M., A.S. Turner, e D.A. Laurie, Plant J, 2012. 71(1): p. 71-84] Ta2291 [Paolacci, A.R., et al, BMC Molecular Biology, 2009. 10(1): p. 11] e normalizou a expressão de TaAPO1-7A em Brompton. b) Regressão da expressão de TaAPO1-7A no BLUP do número total de espiguetas para as linhagens MAGIC Founder no ensaio de campo de
2014. Todas as variedades foram amostradas no estágio GS32, exceto Soissons, que estava em GS34 devido ao florescimento acelerado causado pelo alelo Ppd-D1. As razões para a baixa expressão de TaAPO1-7A em Soissons são, portanto, provavelmente diferentes daquelas ligadas à variação de sequência observada em Robigus e Brompton.
DESCRIÇÃO DETALHADA DA INVENÇÃO
[026] A presente invenção baseia-se no entendimento de que o ortólogo de trigo do arroz Apo1 está envolvido na determinação do número de espiguetas por espiga nas variedades de trigo, incluindo as variedades de trigo de primavera e de inverno.
[027] Em um aspecto, a invenção provê uma proteína envolvida na determinação do número de espiguetas por espiga em trigo que é ortóloga à proteína “Aberrant panicle organization 1” (Apo1) de arroz. Esta proteína compreende uma sequência de aminoácidos selecionada do grupo que consiste em a) uma sequência de aminoácidos de SEQ ID NO: 3, 15 ou 17 ou um fragmento funcional da mesma; e b) uma sequência de aminoácidos possuindo pelo menos 85% de identidade de sequência com a sequência de aminoácidos de SEQ ID NO: 3, 15 ou 17, ou uma variante funcional da mesma.
[028] O numero de espiguetas por espiga é controlada tanto em termos genéticos como ambientais. Diferentes variedades de trigo têm um número médio de espiguetas por espiga diferente em um determinado ambiente. O número observado de espiguetas por espiga em um colmo primário varia entre cerca de 17 e cerca de 40 de pendente da linhagem de trigo observada. As variedades de trigo de primavera, em geral, têm menor número de espiguetas por espiga (18-24), enquanto as variedades de trigo de inverno geralmente apresentam maior número de espiguetas por espiga. Onde as linhagens de trigo contêm um alelo de contribuição positiva do QTL de SPS, o número de espiguetas é aumentado em pelo menos 1, mas às vezes 2 ou 3 quando comparado a uma linhagem semelhante sem o alelo de contribuição positiva, independentemente da composição genética restante ou do ambiente.
[029] O termo “proteína” usado de forma intercambiável com o termo “polipeptídeo”, conforme usado na presente invenção, descreve um grupo de moléculas consistindo em mais de 30 aminoácidos, enquanto o termo “peptídeo” descreve moléculas consistindo em até 30 aminoácidos. Proteínas e peptídeos podem formar ainda dímeros, trímeros e oligômeros superiores, isto é, consistindo em mais de uma molécula (poli)peptídica. As moléculas de proteína ou peptídeo que formam tais dímeros, trímeros etc. podem ser idênticas ou não idênticas. As estruturas correspondentes de ordem superior são, consequentemente, denominadas homo- ou heterodímeros, homo- ou heterotrímeros etc. Os termos “proteína” e “peptídeo” também se referem a proteínas ou peptídeos naturalmente modificados nos quais a modificação é efetuada, por exemplo, por glicosilação, acetilação, fosforilação e similares. Tais modificações são bem conhecidas no estado da técnica.
[030] Ikeda et al. 2005 (Developmental Biology, 282: 349-360) identificaram o gene ABERRANT PANICLE ORGANIZATION 1 (APO1) como um regulador floral chave em arroz. A perda de função de APO1 levou à conversão precoce de meristemas de inflorescência em meristemas de espiguetas, resultando em um número reduzido de espiguetas (lkeda et al. 2005, lkeda et a/. 2007, Plant Journal 51, 1030-1040). A mutação de ganho de função no APO1 levou a uma conversão tardia dos meristemas de inflorescência em meristemas de espiguetas, resultando em um número aumentado de espiguetas (lkeda et al. 2007, lkeda Kawakatsu et al. 2009, Plant physiol. 150: 736-747). O gene APO1 também foi identificado por Terao et al. 2010 (Theor Appl Genet, 120:875-893) como o gene responsável pelo locus de característica quantitativa, controlando positivamente o número de ramos primários do raque, o número de grãos por panículo e o rendimento de grãos por planta de arroz.
[031] Um “gene ortólogo ao APO1” como usado na presente invenção é um gene que é encontrado em uma espécie diferente, mas evoluiu de um gene ancestral comum por especiação e manteve a mesma função. O APOT1 codifica uma proteína F-box (caixa F), e os genes ortólogos conhecidos incluem um gene da Arabidopsis chamado UNUSUAL FLORAL ORGANS (UFO) e um gene da petúnia chamado DOUBLE TOP (DOT), que também demonstraram controlar o tempo da transição para a floração e a arquitetura da inflorescência.
[032] A SEQ ID NO: 3 representa a sequência de aminoácidos do gene APO1 da variedade de trigo Chinese Spring (CS). As variedades Baxter e Westonia produzem uma proteína APO1 possuindo uma sequência de aminoácidos idêntica à de SEQ ID NO: 3. A SEQ ID NO: 8 representa a sequência de aminoácidos do gene APO1 da variedade de trigo Chara. À variedade Yitpi produz uma proteína APO1 possuindo uma sequência de aminoácidos idêntica àquela de SEQ ID NO: 8. Uma proteína APO1 com a sequência de aminoácidos de SEQ ID NO: 8 é uma variante funcional da proteína APO1 com a sequência de aminoácidos de SEQ ID NO: 3. A variedade Claire produz uma proteína APO1 possuindo uma sequência de aminoácidos idêntica àquela de SEQ ID NO: 3. As variedades Robigus, Cadenza e Paragon produzem uma proteína APO1 com uma sequência de aminoácidos de SEQ ID NO: 3, onde a Fenilalanina na posição 47 é substituída por uma cisteína e o ácido aspártico na posição 384 é substituído por uma asparagina. Uma proteína APO1 com a sequência de aminoácidos de SEQ ID NO: 3, em que a Fenilalanina na posição 47 é substituída por uma Cisteína e o ácido aspártico na posição 384 é substituído por uma Asparagina, é uma variante funcional da proteína APO1 com a sequência de aminoácidos de SEQ ID NO: 3. A SEQ ID NO: 29 representa a sequência de aminoácidos do gene APOT1 no cromossomo 7A da variedade de trigo Chinese Spring de acordo com um modelo de gene alternativo e carece dos 27 aminoácidos N-terminais da SEQ ID NO: 3. A SEQ ID NO: 17 representa a sequência de aminoácidos do gene APO1 no cromossomo 7B das variedades de trigo Chinese Spring e Claire. Em Robigus, a proteína é caracterizada pelas substituições H47R e A173S. A SEQ ID NO: 31 representa a sequência de aminoácidos do gene APOT1 no cromossomo 7B da variedade de trigo Chinese Spring de acordo com um modelo de gene alternativo e carece dos 71 aminoácidos N-terminais da SEQ ID NO: 17. A SEQ ID NO: 3 compartilha 89% de identidade de sequência com a SEQ ID NO: 17. A SEQ ID NOs: 29 e 31 compartilham 98% de identidade de sequência.
[033] São adequadas para a presente invenção as proteínas APO1 que compreendem uma sequência de aminoácidos possuindo pelo menos 85% ou pelo menos 90% ou pelo menos 95% ou pelo menos 98% ou pelo menos 99% de identidade de sequência ou são idênticas à proteína descrita no presente documento, e também são denominadas de variantes. O termo “variante” em relação às sequências de aminoácidos de SEQ ID NO: 3 ou SEQ ID NO: 8 da invenção pretende significar sequências substancialmente semelhantes. Em um exemplo de realização, uma variante da proteína da invenção é uma proteína artificial conforme definida, ou é uma proteína variante que não inclui nenhuma proteína de ocorrência natural.
[034] Conforme utilizado na presente invenção, o termo “porcentagem de identidade de sequência” refere-se à porcentagem de aminoácidos idênticos entre dois segmentos de uma janela de sequências de aminoácidos idealmente alinhadas ou à porcentagem de nucleotídeos idênticos entre dois segmentos de uma janela de sequências de nucleotídeos idealmente alinhadas. O alinhamento ótimo de sequências para alinhar uma janela de comparação é bem conhecido pelos técnicos hábeis no assunto e pode ser realizada por ferramentas, tais como o algoritmo de homologia local de Smith e Waterman, o algoritmo de alinhamento de homologia de Needleman e Wunsch, o método de pesquisa por similaridade de Pearson e Lipman (1988), e preferencialmente por implementações computadorizadas destes algoritmos, tais como GAP, BESTFIT, FASTA, e TFASTA disponíveis como parte do pacote de programas para computador GCG (marca registrada), pacote Wisconsin (marca registrada da Accelrys Inc., San Diego, Califórnia). Uma
“fração de identidade” para segmentos alinhados de uma sequência teste e uma sequência de referência é o número de componentes idênticos que são partilhados pelas duas sequências alinhadas, dividido pelo número total de componentes no segmento da sequência de referência, ou seja, toda a sequência de referência ou uma parte menor definida da sequência de referência. “Porcentagem de identidade” é representada como a fração de identidade vezes 100. A comparação de uma ou mais sequências de aminoácidos ou de DNA pode ser com uma sequência de aminoácidos ou de DNA completa ou uma porção dela, ou com uma sequência de aminoácidos ou DNA mais longa. A identidade da sequência é calculada com base na sequência mais curta de nucleotídeo ou aminoácido.
[035] Além disso, é claro que variantes das proteínas APO1 do trigo, nas quais um ou mais resíduos de aminoácidos foram deletados, substituídos ou inseridos, também podem ser usadas com o mesmo efeito nos métodos de acordo com a invenção, desde que o domínio F-box (SEQ ID NO: 3 da posição de aminoácido 33 para a posição de aminoácido 77 (conforme definido no banco de dados Pfam) não seja afetado pela deleção, substituição ou inserção de aminoácido.
[036] Exemplos de substituições são substituições conservadoras, ou seja, substituições de um aminoácido por outro com propriedades físico-químicas semelhantes. Sabe-se que essas substituições não afetam a estrutura de uma proteína. Tais substituições são obtidas substituindo um aminoácido por outro aminoácido pertencente ao mesmo grupo da seguinte forma: Grupo 1: Cisteína (C); Grupo 2: Fenilalanina (F), Triptofano (W) e Tirosina (Y); Grupo 3: Histidina (H), Lisina K) e Arginina (R); Grupo 4: Ácido aspártico (D), Ácido glutâmico (E), Asparagina (N)
e Glutamina (Q); Grupo 5: Isoleucina (I), Leucina (L), Metionina (M) e Valina (V); Grupo 6: Alanina (A), Glicina (G), Prolina (P), Serina (S) e Treonina (T).
[037] Outro objeto da presente invenção é fornecer um ácido nucleico, incluindo um ácido nucleico isolado ou artificial, que codifica a proteína de acordo com a invenção, que pode compreender uma sequência nucleotídica selecionada de a) uma sequência de ácido nucleico de qualquer uma das SEQ ID NO: 1, 2, 6, 7 ou 28; b) uma sequência de ácido nucleico com pelo menos 80% de identidade com a sequência de ácido nucleico de SEQ ID NO: 1, 2, 6, 7 ou 28; e c) um ácido nucleico com uma sequência nucleotídica complementar ao ácido nucleico de a) ou b). O ácido nucleico de acordo com a invenção pode estar localizado dentro de um intervalo no cromossomo 7A do trigo compreendendo a sequência de nucleotídeos incluída entre o nucleotídeo na posição 674.081.462 e o nucleotídeo na posição 674.082.918 do genoma de referência do trigo Chinese Spring (NRgene-HiC) e flanqueado por marcadores de SEQ ID NO: 10 e SEQ ID NO: 11 ou flanqueado por marcadores de SEQ ID NO: 12 e SEQ ID NO: 13 ou SEQ ID NO: 14, ou flanqueado pelos marcadores de SEQ ID NO: 23 e SEQ ID NO: 24, ou podem estar localizados dentro de um intervalo no cromossomo 7B do trigo flanqueado pelos marcadores de SEQ ID NO: 26 e 27.
[038] Um “ácido nucleico isolado”, usado de forma intercambiável com “DNA isolado”, tal como utilizado na presente invenção, refere-se a um ácido nucleico que não ocorre no seu contexto genômico natural, independentemente do seu comprimento e sequência. O DNA isolado pode, por exemplo, se referir ao DNA fisicamente separado do contexto genômico, como um fragmento de DNA genômico. O DNA isolado também pode ser um DNA produzido artificialmente, tal como um DNA quimicamente sintetizado, ou um DNA produzido por meio de reações de amplificação, como a reação em cadeia da polimerase (PCR) bem conhecida na técnica.
O DNA isolado pode se referir ainda ao DNA presente em um contexto de DNA no qual não ocorre naturalmente.
Por exemplo, DNA isolado pode se referir a um pedaço de DNA presente em um plasmídeo.
Além disso, o DNA isolado pode se referir a um pedaço de DNA presente em outro contexto cromossômico que não o contexto no qual ele ocorre naturalmente, tal como, por exemplo, em outra posição no genoma que não a posição natural, no genoma de outra espécie que não a espécie na qual ele ocorre naturalmente ou em um cromossomo artificial. “DNA artificial”, ou “ácido nucleico artificial”, tal como utilizado na presente invenção é um DNA ou ácido nucleico que difere de um DNA ou ácido nucleico de ocorrência natural (seja em relação à sequência ou qualquer outra forma, por exemplo, possuindo uma ou mais deleções nucleotídicas internas (excluindo deleções em ambas as extremidades) que não ocorrem na natureza, ou substituições ou inserções nucleotídicas que não ocorrem na natureza, tendo uma sequência nucleotídica diferente em comparação à sequência de ocorrência natural, estando ligadas a um marcador ou molécula à qual o DNA ou o ácido nucleico não está ligado na natureza (tal como uma ligação a um promotor heterólogo ou artificial ou a uma região 3' não traduzida (3-UTR)) etc). Da mesma forma, uma “proteína artificial” da invenção é uma proteína que difere de uma proteína que ocorre naturalmente (na sequência ou de qualquer outra maneira, por exemplo, possuindo uma ou mais deleções de aminoácidos (em um exemplo de realização, essas deleções são deleções internas de aminoácidos (não uma deleção em cada extremidade da proteína)) não ocorrendo na natureza, ou substituições ou inserções de aminoácidos que não ocorrem naturalmente na proteína, possuindo uma sequência de aminoácido diferente em comparação com a sequência de ocorrência natural, sendo ligada a um marcador ou molécula à qual a proteína não está ligada na natureza etc.). A sequência de um DNA ou ácido nucleico artificial foi alterada pelo homem em comparação com a forma de ocorrência natural, tal como por mutagênese (química ou outro tipo), recombinação, genoma orientado ou edição de bases utilizando nucleases sequência- específicas, e similares.
[039] São adequados para a invenção os ácidos nucleicos que codificam uma proteína APO1 de trigo, que compreende uma sequência nucleotídica que possui pelo menos 40%, pelo menos 50% ou pelo menos 60% ou pelo menos 70% ou pelo menos 80% ou pelo menos pelo menos 85%, ou pelo menos 90%, ou pelo menos 95%, ou pelo menos 98% de identidade de sequência com a sequência do gene aqui descrito, e tais sequências também são referidas como variantes. O termo “variante” com relação a qualquer uma das sequências nucleotídicas de SEQ ID NOs: 1, 2, 6, 7, ou 28 da invenção destina-se a significar sequências nucleotídicas substancialmente semelhantes que codificam sequências de aminoácidos substancialmente semelhantes a qualquer uma das sequências de aminoácidos de SEQ ID NO: 3, 8 ou 29. O termo “variante” com relação a qualquer uma das sequências nucleotídicas de SEQ ID NOs: 15, 20, 21 ou 30 da invenção significa sequências nucleotídicas substancialmente semelhantes que codificam sequências de aminoácidos substancialmente semelhantes a qualquer uma das sequências de aminoácidos de SEQ ID NO: 17 ou 31. O termo “variante” com relação a sequência nucleotídica de SEQ ID NO: 16 da invenção significa sequências nucleotídicas substancialmente semelhantes que codificam sequências de aminoácidos substancialmente semelhantes a sequência de aminoácidos de SEQ ID NO: 18. As variantes alélicas de ocorrência natural podem ser identificadas com o uso de técnicas bem conhecidas na área da biologia molecular, como, por exemplo, a reação em cadeia da polimerase (PCR), tal como descrita na presente invenção. As sequências nucleotídicas variantes também incluem sequências nucleotídicas derivadas sinteticamente, tal como àquelas geradas, por exemplo, usando a mutagênese sítio-dirigida em qualquer uma das SEQ ID NOs: 1, 2, 6, 7, 15, 16, 20, 21, 28 ou 30. Geralmente, as sequências de nucleotídeos variantes da invenção terão pelo menos 40%, 50%, 60%, to 70%, por exemplo, preferencialmente 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, a 79%, geralmente pelo menos 80%, por exemplo, 81% a 84%, pelo menos 85%, por exemplo, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, a 98% e 99% de identidade de sequência de nucleotídeos com qualquer uma das sequências de SEQ ID NOs: 1, 2,6,7,15, 16, 20, 21, 28 ou 30. Os derivados das moléculas de DNA divulgadas na presente invenção podem incluir, mas não estão limitados a, deleções de sequência, mutações pontuais ou múltiplas, alterações em um determinado sítio de restrição enzimática, adição de elementos funcionais ou outros meios de modificação molecular. As técnicas para obter esses derivados são bem conhecidas no estado da técnica (veja, por exemplo, J.F. Sambrook, D.W. Russell e N. Irwin (2000) Molecular Cloning: A Laboratory Manual, 3º edição; Volumes 1, 2 e 3. Cold Spring Harbor Laboratory Press). Os especialistas no assunto estão familiarizados com os materiais de recursos padrão que descrevem condições e procedimentos específicos para a construção, manipulação e isolamento de macromoléculas (por exemplo, moléculas de DNA, plasmídeos etc.), bem como a geração de organismos recombinantes e a triagem e isolamento de moléculas de DNA. Em um exemplo de realização, uma variante do DNA ou ácido nucleico da invenção é um DNA ou ácido nucleico artificial, ou é um DNA ou ácido nucleico variante que não inclui nenhum DNA ou ácido nucleico que ocorra naturalmente.
[040] A SEQ ID NO: 1 representa a sequência nucleotídica do DNA codificante de APO1 a partir da variedade Chinese Spring de trigo. A SEQ ID NO: 2 representa o DNA genômico correspondente da APO1 da variedade
Chinese Spring.
A SEQ ID NO: 28 representa a sequência nucleotídica do DNA codificante da APO 1 no cromossomo 7A da variedade de trigo Chinese Spring de acordo com um modelo genético alternativo.
As variedades Baxter e Westonia compreendem um gene APO1 com uma sequência nucleotídica idêntica à SEQ ID NO: 1 como a sequência nucleotídica do DNA codificante, e uma sequência nucleotídica idêntica à SEQ ID NO: 2 para o DNA genômico correspondente da APO1. A SEQ ID NO: 6 representa a sequência nucleotídica do DNA codificante de APO1 a partir da variedade Chara de trigo.
A SEQ ID NO: 7 representa o DNA genômico correspondente da APO1 da variedade Chara.
A variedade Yíitpi compreende um gene APO1 com uma sequência nucleotídica idêntica à SEQ ID NO: 6 como sequência nucleotídica do DNA codificante e uma sequência nucleotídica idêntica à SEQ ID NO: 7. A variedade Claire compreende um gene APO71 possuindo como sequência nucleotídica do DNA codificante e DNA genômico correspondente de APO1, uma sequência idêntica à da SEQ ID NO: 1 e SEQ ID NO: 2, respectivamente.
As variedades Robigus, Cadenza e Paragon compreendem um gene APO71 possuindo como sequência nucleotídica do DNA codificante a sequência nucleotídica de SEQ ID NO: 1, em que a timina na posição 140 é substituída por uma guanina, a guanina na posição 1150 é substituída por uma Alanina, e possuindo como sequência nucleotídica do DNA genômico a sequência nucleotídica de SEQ ID NO: 2, em que a timina na posição 140 é substituída por uma guanina, a guanina na posição 1284 é substituída por uma alanina.
A SEQ ID NO: 20 representa a sequência nucleotídica do DNA codificante de APO1 a partir da variedade de trigo Chinese Spring no cromossomo 7B.
A SEQ ID NO: 30 representa a sequência nucleotídica do DNA codificante da APO 1 no cromossomo 7B da variedade de trigo Chinese Spring de acordo com um modelo genético alternativo.
A SEQ ID NO: 21 representa o DNA genômico correspondente da APO1-7B da variedade Chinese Spring.
Ao examinar os principais SNPs e indels conservados no alelo APO1 do Robigus (2 SNPs na sequência codificante (alteração de 2 aminoácidos) e 1 SNP no íntron) relacionados ao fenótipo SPS, a variedade Brompton teve os mesmos SNPs e indels que a Robigus.
[041] O gene-SPS1 ou alelo Apo1i da invenção (como em Robigus ou Yitpi, por exemplo) possui as seguintes diferenças principais na sequência de Apo1 da variedade Chinese Spring de referência, diferenças essas que são características para todos os alelos SPS de Apo1 testados em diferentes populações de trigo de primavera ou inverno. Essas diferenças de características em relação à sequência Apo1-7A da Chinese Spring de referência são selecionadas a partir do grupo de: a) uma deleção de 115 pba cerca de 500 nt a montante do códon de início ATG, 2 SNPs missense (em que um SNP missense é uma única alteração nucleotídica resultando em uma códon que codifica um aminoácido diferente) na sequência codificante, uma deleção de cerca de 5-7,5kb a cerca de 7,5kb a montante do códon de início, os SNPs e indels presentes no promotor de cerca de 5kb (como os SNPs e indels mostrados na Tabela 2 abaixo, para Yitpi/Chara) e um SNP no íntron, b) uma deleção de 115 pb a cerca de 500 nt a montante do códon de início ATG, 2 SNPs missense na sequência codificante, uma exclusão de cerca de 5-7,5kb a cerca de 7,5kp a montante do início códon, os SNPs e indels presentes no promotor de cerca de 5kb (como os SNPs e indels mostrados na Tabela 2 abaixo, para Yitpi/Chara), c) uma deleção de 115 pb a cerca de 500 nt a montante do códon de início ATG, 2 SNPs missense na sequência codificante, uma deleção de cerca de 5-7,5kb a cerca de 7,5kp a montante do código de início, d) uma deleção de 115 pb a cerca de 500 nt a montante do códon de início ATG, 2 SNPs missense na sequência codificante ou e) uma deleção de 115 pb a cerca de 500 nt a montante do códon de inicialização ATG. Estas diferenças conservadas nas linhagens testadas SPS pode contribuir para o fenótipo SPS observado. Certamente, algumas outras pequenas diferenças (como SNPs/indels) podem ocorrer entre os alelos SPS-Apo1 em diferentes origens de plantas de trigo, mas não é acreditado que elas sejam biologicamente significativas.
[042] Um ácido nucleico compreendendo uma sequência de nucleotídeos com pelo menos 80% de identidade de sequência com a SEQ ID NO: 1 ou SEQ ID NO: 2 pode, portanto, ser um ácido nucleico compreendendo uma sequência de nucleotídeos com pelo menos 80%, ou pelo menos 85%, ou pelo menos 90% ou pelo menos 95% ou pelo menos 98% ou pelo menos 99% ou 100% de identidade de sequência com a SEQ ID NO: 1 ou SEQ ID NO: 2, respectivamente. A sequência nucleotídica de SEQ ID NO: 6 tem pelo menos 99% de identidade de sequência com a sequência nucleotídica de SEQ ID NO:
1. A sequência nucleotídica de SEQ ID NO: 7 tem pelo menos 99% de identidade de sequência com a sequência nucleotídica de SEQ ID NO: 2.
[043] A presente invenção fornece ainda um gene recombinante compreendendo um promotor que pode ser expresso por planta, incluindo um promotor expressável de planta heterólogo ou artificial, operacionalmente ligado a uma sequência de ácido nucleico Apo1 que codifica uma proteína APO1 de acordo com a invenção e, opcionalmente, uma sequência terminadora da transcrição e poliadenilação, preferencialmente uma região de término da transcrição e poliadenilação funcional em plantas. Em um exemplo de realização, o promotor expressável em planta pode ser um promotor constitutivo, um promotor induzível ou um promotor tecido-específico. O promotor expressável em planta pode ser o promotor CaMV35S, o promotor da Ubiquitina ou o promotor nativo do gene APO1 de acordo com a invenção, recuperado a partir de uma variedade de trigo com um número de espiguetas por espiga relativamente alto. Ainda em outro exemplo de realização a ácido nucleico Apo1 é selecionado a partir de a) uma sequência de ácido nucleico de
SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 6, SEQ ID NO: 7 ou SEQ ID NO: 28; ou b) uma sequência de ácido nucleico com pelo menos 80% de identidade de sequência com a sequência de ácido nucleico de SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 6, SEQ ID NO: 7 ou SEQ ID NO: 28, ou c) um ácido nucleico possuindo uma sequência complementar ao ácido nucleico de a) ou b), tal como um ácido nucleico artificial.
[044] Conforme utilizado na presente invenção, um “gene recombinante" é um gene artificial construído pela ligação operacional de fragmentos de genes não relacionados ou outras sequências de ácidos nucleicos. Em outras palavras, “gene recombinante” denota um gene que normalmente não é encontrado em uma espécie vegetal ou se refere a qualquer gene no qual o promotor ou uma ou mais regiões reguladoras do gene diferentes não estejam associados na natureza com uma parte ou todo o ácido nucleico transcrito, isto é, é heterólogo em relação ao ácido nucleico transcrito. Mais particularmente, um gene recombinante é um gene artificial, ou seja, que ocorrem de forma não natural, o gene produzido por ligação operacional de um promotor expressável em planta com uma sequência de ácido nucleico que codifica uma proteína APO1.
[045] Conforme utilizado na presente invenção, “promotor expressável em planta” significa uma região da sequência de DNA que é essencial para o início da transcrição em uma célula vegetal. Isso inclui qualquer promotor de origem vegetal, mas também qualquer promotor de origem não vegetal capaz de direcionar a transcrição em uma célula vegetal, ou seja, certos promotores de origem viral ou bacteriana, como o CaMV35S, o promotor do vírus do trevo subterrâneo nº 4 ou no 7 (WOS9606932) ou promotores de genes T-DNA e similares.
[046] Exemplos de promotores constitutivos incluem promotores de origem bacteriana, como os promotores de octopina sintase (OCS) e nopalina sintetase (NOS) de Agrobacterium, mas também promotores de origem viral, como o transcrito 358 do vírus do mosaico da couve-flor (CaMV) (Hapster et al/., 1988, Mol. Gen. Genet. 212: 182-190) ou genes do 198 RNA (Odell et al, 1985, Nature. 6;313(6005):810-2; Patente US 5.352.605; documento WO 84/02913; Benfey et al. 1989, EMBO J. 8:2195-2202), o promotor aprimorado 2x35S (Kay et al., 1987, Science 236:1299—1302; Datla et al. (1993), Plant Sci 94:139—149) promotores do vírus do mosaico da veia da mandioca (CsSVMV; documento WO 97/48819, Patente US 7.053.205), 2XxCsVMV (WO2004/053135) promotor do circovírus (AU 689 311), promotor do badnavírus baciliforme de cana (ScBV) (Samac et a/., 2004, Transgenic Res. 13(4):349-61), promotor do vírus do mosaico da figueira (FMV) (Sanger et al., 1990, Plant Mol Biol. 14(3):433-43), promotor do vírus do trevo subterrâneo nº4 ou nº7 (WO 96/06932) e o prmotor 35S aprimorado descrito nas Patentes US
5.164.316, US 5.196.525, US 5.322.938, US 5.359.142 e US 5.424.200. Entre os promotores de origem vegetal, serão mencionados os promotores do promotor da subunidade pequena ribulose-biscarboxilase/oxigenase (Rubisco) (US 4.962.028; WO99/25842) de zea mays e girassol, o promotor da histona H4 de Arabidopsis thaliana (Chabouté et al/., 1987), promotor da actina 1 de arroz (Act-1, Patente US 5.641.876), os promotores de histonas, conforme descrito nos documentos EP O 507 698 A1, o promotor da álcool desidrogenase 1 (Adh1) de Zea mays (a partir do site http://www .patentlens.net/daisy/promoters/242.html))). Também o pequeno promotor de subunidade da Chrysanthemum pode ser usado se esse uso for combinado com o uso do respectivo terminador (Outchkourov et al., Planta, 216:1003-1012, 2003). Particularmente mencionados são os promotores de ubiquitina (Holtorf et a/, 1995, Plant Mol Biol 29:637-649, US 5.510.474), do milho, arroz e cana de açúcar, tais como as descritas por Christensen e Quail (1996, Transgenic Research Vol 5 3 edição, págs 213-218).
[047] Exemplos de promotores induzíveis incluem promotores regulados pela aplicação de compostos químicos, incluindo promotores regulados por álcool (consulte, por exemplo, EP 637339), promotores regulados por tetraciclina (consulte, por exemplo, a Patente US 5.464.758), promotores regulados por esteroides (consulte, por exemplo, as Patentes US
5.512.483; US 6.063.985; US 6.784.340; US 6.379.945; documento WOO01/62780), promotores regulados por metal (consulte, por exemplo, a Patente US 4.601.978).
[048] Exemplos de promotores tecido-específicos incluem promotores específicos de meristema, como o promotor OSH1 de arroz (Sato et al. (1996) Proc. Natl. Acad. Sci. USA 93:8117-8122) promotor da metaloteína de arroz (BAD87835.1) promotores WAK1 e WAK2 (Wagner & Kohorn (2001) Plant Cell 13(2): 303-318, promotor específico do tecido de espiga D5 de cevada (US 6.291.666), promotor Lem2 específico do lemma/palea da cevada (Abebe et al. (2005) Planta, 221, 170-183), promotor Pvrn1 específico da inflorescência precoce da cevada (Alonse Peral et al. 2011, PLoS ONE 6(12) e29456), promotor Pcrs4/PrA2 específico da inflorescência precoce da cevada (Koppolu et al. 2013, Proc. Natl. Acad. Sci USA, 110(32) 13198-13203), promotor pkn1 específico do meristema com o íntron Act1 do arroz (Zhang et al., 1998, Planta 204: 542-549, Postma-Haarsma et al. 2002, Plant Molecular Biology 48: 423-441) promotor específico de SAMl/inflorescência de Dendrobium sp., Pdomads1 (Yu et al. 2002).
[049] A frase “operacionalmente ligada” refere-se ao arranjo espacial funcional de duas ou mais regiões de ácido nucleico ou sequências de ácido nucleico. Por exemplo, uma região promotora pode ser posicionada em relação a uma sequência de ácido nucleico, de modo que a transcrição de uma sequência de ácido nucleico seja direcionada pela região promotora. Assim, uma região promotora está “operacionalmente ligada” à sequência de ácidos nucleicos. “Funcionalmente ligado” é um termo equivalente.
[050] O termo “heterólogo” refere-se à relação entre duas ou mais sequências de ácidos nucleicos ou proteína que são derivadas de diferentes fontes. Por exemplo, um promotor é heterólogo em relação a uma sequência de ácido nucleico operacionalmente ligada, tal como uma sequência codificante, se essa combinação normalmente não for encontrada na natureza. Além disso, uma sequência específica pode ser “heteróloga” em relação a uma célula ou organismo na qual está inserida (ou seja, não ocorre naturalmente nessa célula ou organismo específico). Por exemplo, o gene recombinante divulgado na presente invenção é um ácido nucleico heterólogo.
[051] A modulação da expressão do gene APO1 de trigo, incluindo o aumento da expressão do mesmo, conduzindo a um nível modulado de proteína APO1, incluindo um aumento da proteína APO1, também podem ser conseguida proporcionando a planta (de trigo) com fatores de transcrição que, por exemplo, reconhecem (especificamente) a região promotora do APO1 e promovem a transcrição, tal como efetores TAL, dCas, dCpf1 etc. acoplados a intensificadores (enhancers) da transcrição (consulte, por exemplo, Moore et al. 2014 ACS Synth Biol. 3 (10) 708-716; Qi et al. (2013) Cell 152 (5) 1173-118, Liu et al. 2017 Nature Communications 8; Artigo Número 2095).
[052] Conforme utilizado na presente invenção, o termo “compreendendo” deve ser interpretado como especificando a presença de recursos, números inteiros, etapas ou componentes declarados, conforme referido, mas não impede a presença ou adição de um ou mais recursos, números inteiros, etapas ou componentes, ou grupos dos mesmos. Assim, por exemplo, um ácido nucleico ou proteína compreendendo uma sequência de nucleotídeos ou aminoácidos, pode compreender mais nucleotídeos ou aminoácidos do que aqueles efetivamente citados, ou seja, o ácido nucleico ou proteína está incorporado em um ácido nucleico ou proteína maior. Um gene recombinante compreendendo uma região de DNA que é funcional ou estruturalmente definida pode compreender regiões adicionais de DNA etc. Entretanto, no contexto da presente divulgação, o termo “compreendendo” também inclui “consistindo em”.
[053] Os genes recombinantes aqui descritos compreendem opcionalmente uma região de DNA envolvida no término da transcrição e poliadenilação. Uma variedade de regiões de DNA envolvidas no término da transcrição e poliadenilação funcional em plantas são conhecidas no estado da técnica e os especialistas na técnica estarão cientes das sequências terminadoras e de poliadenilação que podem ser adequadas para a realização dos métodos descritos na presente invenção. A região de poliadenilação pode ser derivada de um gene natural, de uma variedade de outros genes vegetais, ou de genes T-DNA ou mesmo de genomas virais de plantas. A sequência da extremidade 3' a ser adicionada pode ser derivada, por exemplo, do gene da nopalina sintase ou octopina sintase ou, alternativamente, a partir de outro gene vegetal, ou a partir de qualquer outro gene de eucariotos.
[054] As frases “DNA”, “sequência de DNA”, “sequência de ácido nucleico”, “molécula de ácido nucleico” “sequência de nucleotídeo”, “sequência nucleotídica' e “ácido nucleico” referem-se a uma estrutura física que compreende um arranjo ordenado de nucleotídeos. A sequência de DNA ou sequência nucleotídica pode estar contida dentro de uma molécula nucleotídica maior, vetor ou semelhante. Além disso, o arranjo ordenado de ácidos nucleicos nessas sequências pode ser representado na forma de uma listagem de sequências, figura, tabela, meio eletrônico ou semelhante.
[055] Em outro aspecto, a invenção provê uma planta de trigo, parte de planta ou semente que consiste em células vegetais de trigo compreendendo o gene recombinante descrito na presente invenção.
[056] “Trigo” ou “planta de trigo”, conforme usado na presente invenção, pode ser qualquer variedade útil para o cultivo de trigo. Exemplos de trigo incluem, mas não se limitam a, Triticum aestivum, Triticum aethiopicum, Triticum compactum, Triticum dicoccoides, Triticum dicoccum, Triticum durum, Triticum monococcum, Triticum spelta, Triticum turgidum. O “trigo” abrange ainda as variedades de trigo da primavera (spring wheat) e de inverno (winter wheat), sendo as variedades de trigo de inverno definidas pela necessidade de vernalização para florescer, enquanto as variedades de trigo da primavera não exigem dessa vernalização para florescer.
[057] A expressão “partes da planta” utilizada na presente invenção indica partes da planta, que podem ser células, tecidos ou órgãos, como sementes, partes cortadas, como raízes, folhas, flores, pólen, fibras etc.
[058] Sempre que é feita referência a uma “planta” ou “plantas” de acordo com a invenção, entende-se que também as partes da planta (células, tecidos ou órgãos, vagens, sementes, partes cortadas, como raízes, folhas, flores, pólen, etc..), a descendência das plantas que mantêm as características distintivas das plantas parentais, como sementes obtidas por abandono ou cruzamento, por exemplo, sementes híbridas (obtidas através do cruzamento de duas linhagens parentais consanguíneas), plantas híbridas e partes de plantas delas derivadas estão abrangidas no presente documento, exceto quando indicado de outra forma.
[059] Em alguns exemplos de realização, as células vegetais da invenção, bem como as células vegetais geradas de acordo com os métodos da invenção, podem ser células não propagantes.
[060] As plantas obtidas de acordo com a invenção podem ser utilizadas em um esquema de melhoramento ou propagação convencional para produzir mais plantas com as mesmas características e/ou introduzir a mesma característica em outras variedades da mesma espécie ou de espécies relacionadas, ou em plantas hibridas. As plantas obtidas podem ser adicionalmente usadas para criar material de propagação. As plantas de acordo com a invenção podem ser adicionalmente utilizadas para produzir gametas, sementes (incluindo sementes trituradas e bolos de sementes), óleo de sementes, fibras, fios, embriões zigóticos ou somáticos, progênies ou plantas híbridas obtidas pelos métodos da invenção. As sementes obtidas a partir das plantas de acordo com a invenção também são abrangidas pela invenção.
[061] “Criar material de propagação”, conforme utilizado na presente invenção, refere-se a qualquer meio conhecido no estado da técnica para produzir outras plantas, partes de plantas ou sementes e inclui, entre outros, os métodos de reprodução vegetativa (por exemplo, alporquia ou mergulhia simples, divisão, enxertia (broto), micropropagação, estolões ou calos rastejantes (runners), órgãos de armazenamento como bulbos, colmos, tubérculos e rizomas, enraizamento de uma estaca (striking) ou escalonamento duplo (twin-scaling)), reprodução sexual (cruzando com outra planta) e reprodução assexuada (por exemplo, apomixia, hibridação somática).
[062] Em alguns exemplos de realização, são fornecidos métodos para produzir plantas de trigo com número alterado de espiguetas por espiga ou para alterar o número de espiguetas por espiga de uma planta de trigo, em que ambos os métodos compreendem a etapa de alterar a abundância da proteína de acordo com a invenção dentro da planta de trigo. Em outro exemplo de realização, a abundância da proteína é aumentada e o número de espiguetas por espiga é aumentado em comparação com o número de espiguetas por espiga da planta de trigo em que a abundância da proteína não está alterada, particularmente quando a planta de trigo possui um número inicial baixo de espiguetas por espiga. A abundância da proteína da invenção pode ser aumentada fornecendo a referida planta de trigo, com a) um gene recombinante ou modificado de acordo com a invenção, ou b) um gene heterólogo que codifica a proteína de acordo com a invenção, em que o gene heterólogo é mais altamente expresso do que o gene endógeno correspondente ou c) como descrito em outra parte neste pedido através do uso de efetores de transcrição recombinantes. O gene heterólogo pode compreender a sequência nucleotídica de SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 9 ou SEQ ID NO: 19, ou uma sequência nucleotídica possuindo pelo menos 90% de identidade de sequência.
[063] Em um exemplo de realização, a abundância da proteína APO1-7A é aumentada ou a abundância da proteína APO1-7A e da proteína APO1-7B é aumentada ou a abundância da proteína APO1-7A e da proteína APO1-7D é aumentada, ou a abundância das proteínas APO1-7A, APO1-7B e APO1-7D é aumentada.
[064] Ainda em outro exemplo de realização, a abundância da proteína é diminuída e o número de espiguetas por espiga é diminuída em comparação com o número de espiguetas por espiga da planta de trigo quando a abundância da proteína não é alterada, onde particularmente a planta de trigo possui um número inicial alto de espiguetas por espiga. A abundância da proteína de acordo com a invenção pode estar diminuída pelo fornecimento da planta de trigo, com a) um gene heterólogo que codifica a proteína de acordo com a invenção, em que o referido gene heterólogo é expresso em um nível menor que o gene endógeno correspondente, o promotor do referido gene heterólogo tem uma atividade promotora mais baixa do que o promotor do gene endógeno, ou b) um alelo mutante do gene endógeno que codifica a proteína de acordo com a invenção. O gene heterólogo pode compreender a sequência nucleotídica de SEQ ID NO: 9 ou uma sequência nucleotídica com pelo menos 90% de identidade de sequência e, de preferência, é desprovida da sequência nucleotídica da posição 4399 até a posição 4513 de SEQ ID NO: 4 ou SEQ ID NO: 5, ou é desprovido da sequência nucleotídica da posição 7816 até a posição 7930 na SEQ ID NO: 19, ou uma sequência nucleotídica possuindo pelo menos 90% de identidade de sequência com a mesma. O alelo mutante pode ser um alelo nocaute ou um alelo de substituição com atividade mais baixa que o alelo tipo selvagem. Em um exemplo de realização, a abundância da proteína APO1-7A está diminuída ou a abundância da proteína APO1-7A e da proteína APO1-7B está diminuída ou a abundância da proteína APO1-7A e da proteína APO1-7D está diminuída, ou a abundância das proteínas APO1- 7A, APO1-7B e APO1-7D está diminuída.
[065] Uma planta de trigo com um baixo número inicial de espiguetas por espiga significa uma planta de trigo de uma variedade que possui um número médio de espiguetas por espiga menor do que cerca de 23, menor do que cerca de 22, menor do que cerca de 21, menor do que cerca de 20, menor do que cerca de 19 ou menor do que cerca de 18 espiguetas por espiga. A referida variedade pode ter um número médio de espiguetas por espiga entre cerca de 17 e cerca de 23, entre cerca de 17 e cerca de 22, entre cerca de 17 e cerca de 21, entre cerca de 17 e cerca de 20, entre cerca de 17 e cerca de 20, entre cerca de 17 e cerca de 19, entre cerca de 17 e cerca de 18, entre cerca de 18 e cerca de 23, entre cerca de 18 e cerca de 22, entre cerca de 18 e cerca de 21, entre cerca de 18 e cerca de 20, entre cerca de 18 e cerca de 20, entre cerca de 18 e cerca de 19, entre cerca de 19 e cerca de 23, entre cerca de 19 e cerca de 22, entre cerca de 19 e cerca de 21, entre cerca de 19 e cerca de 20, entre cerca de 20 e cerca de 23, entre cerca de 20 e cerca de 22, entre cerca de 20 e cerca de 21, entre cerca de 21 e cerca de 21, entre cerca de 21 e cerca de 23, entre cerca de 21 e cerca de 22, entre 22 e 23 espiguetas por espiga.
[066] Uma planta de trigo com um número inicial alto de espiguetas por espiga significa uma planta de trigo de uma variedade que possui um número médio de espiguetas por espiga de pelo menos cerca de 23,
pelo menos cerca de 24, pelo menos cerca de 25 ou pelo menos cerca de 26, pelo menos cerca de 27, pelo menos cerca de 28 ou pelo menos cerca de 29 ou pelo menos cerca de 30 espiguetas por espiga. A referida variedade pode ter um número médio de espiguetas por espiga entre cerca de 23 e cerca de 30, entre cerca de 24 e cerca de 30, entre cerca de 25 e cerca de 30, entre cerca de 26 e cerca de 30, entre cerca de 27 e cerca de 30, entre cerca de 28 e cerca de 30, entre cerca de 29 e cerca de 30, entre cerca de 23 e cerca de 29, entre cerca de 24 e cerca de 29, entre cerca de 25 e cerca de 29, entre cerca de 26 e cerca de 29, entre cerca de 27 e cerca de 29, entre cerca de 28 e cerca de 29, entre cerca de 23 e cerca de 28, entre cerca de 24 e cerca de 28, entre cerca de 25 e cerca de 28, entre cerca de 26 e cerca de 28, entre cerca de 27 e cerca de 28, entre cerca de 23 e cerca de 27, entre cerca de 24 e cerca de 27, entre cerca de 25 e cerca de 27, entre cerca de 26 e cerca de 27, entre cerca de 23 e cerca de 26, entre cerca de 24 e cerca de 26, entre cerca de 25 e cerca de 26, entre cerca de 23 e cerca de 25, entre cerca de 24 e cerca de 25, ou entre cerca de 23 e cerca de 24 espiguetas por espiga.
[067] “Alterar o número de espiguetas por espiga”, tal como utilizado na presente invenção, significa aumentar significativamente ou diminuir significativamente o número médio de espiguetas por espiga da planta de trigo.
[068] Um aumento no número de espiguetas por espiga refere- se a um aumento de pelo menos cerca de 1, pelo menos cerca de 2, pelo menos cerca de 3, pelo menos cerca de 5 espiguetas por espiga, em comparação com o número de espiguetas por espiga da planta de trigo, particularmente uma planta de trigo com um baixo número inicial de espiguetas por espiga.
[069] Uma diminuição do número de espiguetas por espiga refere-se a uma diminuição de pelo menos cerca de três, pelo menos duas, ou pelo menos uma espigueta por espiga em comparação com o número de espiguetas por espiga da planta do trigo, em particular em uma planta de trigo que possui um alto número inicial de espiguetas por espiga.
[070] “Alterar a abundância da proteína”, conforme utilizado na presente invenção, significa aumentar (significativamente) ou diminuir (significativamente) a abundância da proteína descrita na presente invenção.
[071] Um aumento refere-se a um aumento de pelo menos 10%, pelo menos 20%, pelo menos 30%, pelo menos 40%, 50%, pelo menos 60%, pelo menos 70%, pelo menos 80%, pelo menos 90%, em pelo menos 100% em comparação com a quantidade de proteína produzida pela célula vegetal de trigo, particularmente de uma planta de trigo com baixo número inicial de espiguetas por espiga.
[072] Uma diminuição refere-se a uma diminuição de pelo menos 10%, pelo menos 20%, pelo menos 25 %, pelo menos 3 0%, pelo menos 35%, pelo menos 40%, pelo menos 45% ou pelo menos 50% em comparação com a quantidade de proteína produzida pela célula vegetal de trigo, particularmente de uma planta de trigo com alto número inicial de espiguetas por espiga.
[073] Em um exemplo de realização, a diminuição da expressão e/ou atividade do gene e/ou proteína APO1 pode ser pela redução da quantidade de proteína APO1 produzida funcional. Essa redução pode ser uma diminuição de pelo menos 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% ou 100% (isto é, nenhuma proteína APO1 funcional é produzida pela célula) em comparação com a quantidade de proteína APO1 funcional produzida por uma célula com níveis e atividade de expressão de APO1 tipo selvagem. A referida diminuição na expressão e/ou atividade pode ser uma diminuição constitutiva na quantidade de proteína APO1 funcional produzida. A referida diminuição também pode ser uma diminuição temporal/induzível na quantidade de proteína APO1 funcional produzida.
[074] A expressão e/ou atividade diminuída do gene APO1 da invenção também podem ser alcançadas usando uma molécula de RNA que resulta na expressão e/ou atividade diminuídas do gene APO1. Uma molécula de RNA que resulta em uma expressão e/ou atividade diminuída de um gene APOT1 e/ou proteína APO1 pode ser um RNA que codifica uma proteína que inibe a expressão e/ou atividade da referida proteína APO1. Além disso, a referida molécula de RNA que resulta em uma expressão e/ou atividade diminuída de um gene APOT1 e/ou proteína de APO1 também pode ser uma molécula de RNA que inibe a expressão de um gene que é um ativador da expressão e/ou atividade da referida proteína APO1. A referida molécula de RNA que inibe a expressão e/ou atividade de um gene APO1 e/ou proteína APO1 também pode ser uma molécula de RNA que inibe diretamente a expressão e/ou atividade de um gene APO1 e/ou proteína APO1, como um RNA que medeia o silenciamento de referido gene APO1.
[075] A expressão e/ou atividade do gene e/ou da proteína APOT1 pode ser convenientemente reduzida ou eliminada por silenciamento transcricional ou pós-transcricional da expressão de genes APO1 endógenos. Para isso, uma molécula de RNA de silenciamento pode ser introduzida nas células vegetais visando os genes codificantes de APO1 endógena. Conforme utilizado na presente invenção, “RNA de silenciamento” ou “molécula de RNA de silenciamento” refere-se a qualquer molécula de RNA, que após a introdução em uma célula vegetal, reduz a expressão de um gene alvo.
[076] O RNA de silenciamento também pode ser moléculas artificiais de micro-RNA, conforme descrito, por exemplo, nos documentos WOZ2005/052170, WOZ2005/047505 ou US 2005/0144667 ou ta-siRNAs, conforme descrito nos documentos WO2006/074400 (todos os documentos são incorporados ao presente por referência). Em alguns exemplos de realização, o ácido nucleico expresso pelo gene quimérico da invenção é RNA catalítico ou possui atividade de ribozima específica para a sequência alvo. Assim, o polinucleotídeo causa a degradação do RNA mensageiro endógeno transcrito a partir do gene/sequência alvo, resultando em expressão reduzida da proteína presente na planta. Em um exemplo de realização, o ácido nucleico expresso pelo gene quimérico da invenção codifica uma proteína dedo de zinco que se liga ao gene que codifica a referida proteína, resultando em expressão reduzida do gene alvo. Em exemplos de realização específicos, a proteína dedo de zinco se liga a uma região reguladora do referido gene. Em outros exemplos de realização, a proteína dedo de zinco se liga a um RNA mensageiro que codifica a referida proteína, impedindo assim sua tradução.
[077] Em exemplos de realização alternativos, a diminuição da expressão e/ou atividade de um gene e/ou proteína APO1 pode ser alcançada pela inibição da expressão da referida proteína APO1 presente na planta. À inibição da expressão do referido gene e/ou proteína APO1 pode ser induzida no momento desejado usando um spray (aplicação sistêmica) com ácidos nucleicos inibidores, como moléculas de RNA ou DNA que funcionam no silenciamento de genes mediado por RNA, tal como, por exemplo, descrito no documento WO2011/112570 (incorporado ao presente pela referência).
[078] Em um exemplo de realização da invenção, um aumento de rendimento pode ser obtido quando plantas de trigo com um número menor de espiguetas por espiga (a forma alélica SPS de APO1-7A), são cultivadas em determinados ambientes, mas as mesmas plantas quando cultivadas em outro ambiente, podem mostrar um aumento de rendimento ao ter um número maior de espiguetas por espiga (a forma alélica SPS+ de APO1). Embora os efeitos do rendimento possam ser revertidos em diferentes ambientes de cultivo, os efeitos do SPS são consistentes entre os ambientes. Tais mudanças de classificação entre os ambientes (para o rendimento neste caso) são chamadas de interação Genótipo por Ambiente (GxE) e são uma restrição importante ao ganho genético nas culturas. Ao identificar o gene subjacente, é possível explorar o alelo apropriado para cada ambiente-alvo.
[079] A SEQ ID NO: 4 representa a sequência nucleotídica de cerca de 5 kb do DNA 5' não codificante a montante de APO1 a partir da variedade Westonia de trigo. A SEQ ID NO: 5 representa a sequência nucleotídica de cerca de 5 kb do DNA 5' não codificante a montante de APO1 a partir da variedade Baxter de trigo. A SEQ ID NO: 4 e SEQ ID NO: 5 são variantes funcionais e compartilham 99% de identidade de sequência. A SEQ ID NO: 9 representa a sequência nucleotídica do DNA 5'-não codificante correspondente a montante de APO1 a partir da variedade Chara de trigo. À variedade Yitoi compreende um DNA 5' -não codificante correspondente a montante de APO1 tendo uma sequência nucleotídica idêntica à SEQ ID NO: 9. A SEQ ID NO: 19 representa a sequência nucleotídica do DNA 5º não codificante de 5kb a montante de APO1 da variedade de trigo Chinese Spring no cromossomo 7A. A variedade Robigus compreende um DNA 5' não codificante correspondente a montante de APO1, que possui uma sequência nucleotídica de SEQ ID NO: 19, com uma deleção de nucleotídeos a partir da posição 7816 até a 7930 da SEQ ID NO: 19 e uma inserção de cerca de 5-7,7 Kb nucleotídeos na posição do nucleotídeo 901 na SEQ ID NO: 19 (mais especificamente, entre a posição do nucleotídeo 900 e a posição do nucleotídeo 901 da SEQ ID NO: 19 - consulte o primeiro misc feature da SEQ ID NO: 19). Além disso, a variante Robigus tem os mesmos SNPs e indels que as variedades Yitpi/Chara na Tabela 2, enquanto a variedade Claire tem os mesmos SNPs e indel/s que a variedade Westonia na Tabela 2.
[080] Um ácido nucleico compreendendo uma sequência de nucleotídeos com pelo menos 90% de identidade de sequência com a SEQ ID NO: 4, 5, 9 ou 19 pode, portanto, ser um ácido nucleico compreendendo uma sequência de nucleotídeos com pelo menos 90% ou pelo menos 95%, ou pelo menos 98%, ou pelo menos 99% ou 100% de identidade de sequência com a SEQ ID NO: 4, 5, 9 ou 19, respectivamente. Uma sequência de nucleotídeos com 100% de identidade de sequência com a SEQ ID NO: 4, 5 ou 9 também é referida como uma sequência de nucleotídeos idêntica à SEQ ID NO: 4, 50u9, respectivamente. A sequência nucleotídica de SEQ ID NO: 9 tem 97% de identidade de sequência com a sequência nucleotídica de SEQ ID NO: 4 ou 5, mas não compreende a sequência nucleotídica da posição 4399 até a posição 4513 da SEQ ID NO: 5 ou a sequência nucleotídica da posição 4401 até a posição 4516 da SEQ ID NO: 4.
[081] Em outro exemplo de realização, nos métodos descritos acima, a “etapa de fornecer” pode compreender o fornecimento por transformação, cruzamento, retrocruzamento, introgressão, edição do genoma ou mutagênese.
[082] O termo “fornecimento” pode se referir à introdução de uma molécula de DNA exógena em uma célula vegetal por transformação, opcionalmente seguida pela regeneração de uma planta a partir da célula vegetal transformada. O termo também pode se referir à introdução da molécula de DNA recombinante pelo cruzamento de uma planta transgênica compreendendo a molécula de DNA recombinante com outra planta e selecionando plantas descendentes que herdaram a molécula de DNA recombinante ou o transgene. Em outro significado alternativo o termo “fornecer/fornecimento” refere-se à introdução da molécula de DNA recombinante por técnicas como a fusão de protoplastos, opcionalmente seguida pela regeneração de uma planta a partir dos protoplastos fundidos.
[083] Ficará claro que os métodos de transformação utilizados são de menor relevância para a presente invenção. A transformação de plantas agora é uma técnica de rotina. Vantajosamente, qualquer um dentre os diversos métodos de transformação pode ser usado para introduzir o ácido nucleico/gene de interesse em uma célula ancestral adequada. Os métodos de transformação incluem a utilização de lipossomos, eletroporação, produtos químicos que aumentem a captação de DNA livre, injeção de DNA diretamente na (célula da) planta, tal como por microinjeção, bombardeamento com arma de partículas, transformação usando vírus ou pólen e microprojeção. Os métodos podem ser selecionados a partir do método de cálcio/polietileno-glicol por protoplastos (Krens, et al, (1982) Nature 296, 72-74;. Negrutiu et al. (1987) Plant Mol Biol 8: 363-373); eletroporação de protoplastos (Shillito et a/. (1985) Bio/Technol 3: 1099-1102); microinjeção em material vegetal (Crossway et al, (1986). Mol. Gen Genet 202: 179-185);, bombardeamento de partículas revestidas com DNA ou RNA (Klein et a/, (1987.) Nature 327: 70) infecção com vírus (não integrativo) e similares.
[084] Os métodos para transformar plantas de trigo também são bem conhecidos no estado da técnica. Diferentes sistemas de transformação podem ser estabelecidos para vários cereais: a eletroporação de tecido, a transformação de protoplastos e a transferência de DNA por bombardeio de partículas em tecidos e células regeneráveis (para uma visão geral, consulte Jane, Euphytica 85 (1995), 35-44). A transformação do trigo foi descrita várias vezes na literatura (para uma visão geral, consulte Maheshwari, Critical Reviews in Plant Science 14 (2) (1995), 149-178, Nehra et al., Plant J. 5 (1994), 285-297). Um método eficiente de transformação mediada por Agrobacterium foi descrito por Ishida et al. 2015 Agrobacterium protocols: Volume 1, Methods in Molecular Biology, vol. 1223: 189-198.
[085] O termo “mutagênese”, conforme utilizado na presente invenção, refere-se ao processo no qual as células vegetais (por exemplo, uma pluralidade de sementes de trigo ou outras partes) são submetidas a uma técnica que induz mutações no DNA das células, como contato com um agente mutagênico, tal como uma substância química (como etilmetilsulfonato (EMS),
etilnitrosoureia (ENU) etc.) ou radiação ionizante (nêutrons (como na mutagênese rápida de nêutrons etc.), raios-alfa, ralios-gama (como aqueles fornecidos por uma fonte de cobalto 60), raios-X, radiação UV, etc), mutagênese por inserção de T-DNA (Azpiroz-Leehan et al. (1997) Trends Genet 13: 152-156), mutagênese por transposon (McKenzie et al. (2002) Theor Appl Genet 105: 23-33) ou mutagênese da cultura de tecidos (indução de variações somacionais) ou uma combinação de dois ou mais dos mesmos.
Assim, a mutagênese desejada de um ou mais alelos de APO1 pode ser realizada pelo uso de um dos métodos acima.
Embora as mutações criadas por irradiação sejam frequentemente grandes deleções ou outras lesões graves, como translocações ou rearranjos complexos, as mutações criadas por mutagênicos químicos geralmente são lesões mais discretas, tal como mutações pontuais.
Por exemplo, o EMS alquila bases de guanina, o que resulta em um pareamento incorreto de bases (mispairing): uma guanina alquilada será pareada com uma base de timina, resultando principalmente em transições G/C para A/T.
Após a mutagênese, as plantas de trigo são regeneradas a partir das células tratadas utilizando técnicas conhecidas.
Por exemplo, as sementes de trigo resultantes podem ser plantadas de acordo com procedimentos de cultivo convencionais e após a formação de sementes de autopolinização nas plantas.
As sementes adicionais que são formadas como resultado de tal autopolinização no presente, ou em uma geração subsequente, podem ser colhidas e rastreadas quanto à presença de alelos Apo1 mutantes.
Várias técnicas são conhecidas para rastrear alelos mutantes específicos, por exemplo, Deleteagene* (Delete-a-gene; Li et al., 2001, Plant J 27: 235-242) usa ensaios de reação em cadeia da polimerase (PCR) para rastrear mutantes de deleção gerados por mutagênese rápida de nêutrons, TILLING (lesões locais direcionadas induzidas nos genomas; McCallum et al. 2000, Nat Biotechnol 18:455-457) identifica mutações pontuais induzidas por EMS, etc.
[086] O termo “direcionamento gênico” ou “direcionamento de genes” refere-se à modificação direcionada de genes que usa mecanismos como recombinação homóloga, reparo de pareamento incorreto (mismatch) ou mutagênese sítio-dirigida. O método pode ser usado para substituir, inserir e deletar sequências endógenas ou sequências presentes ou previamente introduzidas nas células vegetais. Métodos para direcionamento de genes podem ser encontrados, por exemplo, no documento WO 2006/105946 ou WO2009/002150. O direcionamento de genes pode ser usado para criar alelos mutantes ou artificiais de apo?.
[087] O direcionamento de genes também pode ser usado para criar novos haplótipos ou blocos de haplótipos. Por exemplo, os blocos de haplótipos que compreendem um gene APO71 no cromossomo 7A, que podem ser benéficos para o potencial de rendimento de várias maneiras, mas compreendem a deleção e/ou inserção a montante associada a baixos números de SPS, podem ser modificados por meio de direcionamento de genes para substituir a deleção e/ou inserção a montante.
[088] “Tipo selvagem” (também escrito como o acrônimo WT do inglês wild type), tal como usado na presente invenção, refere-se a uma forma típica de uma planta ou um gene, como ocorre mais comumente na natureza. Uma “planta tipo selvagem” refere-se a uma planta com o fenótipo mais comum dessa planta na população natural. Um “alelo do tipo selvagem” refere-se a um alelo de um gene necessário para produzir o fenótipo tipo selvagem. Por outro lado, uma “planta mutante” refere-se a uma planta com um fenótipo raro diferente dessa planta produzida por intervenção humana, por exemplo, por mutagênese, e um “alelo mutante” refere-se a um alelo de um gene necessário para produzir o fenótipo mutante.
[089] “Mutante”, conforme usado no presente documento, refere- se a uma forma de uma planta ou gene que é diferente de tal planta ou gene na população natural e que é produzido por intervenção humana, por exemplo, por mutagênese, e um “alelo mutante” refere-se a um alelo que não é encontrado nas plantas na população natural ou na população reprodutora, mas produzido por intervenção humana, como mutagênese ou direcionamento de genes.
[090] Conforme usado na presente invenção, o termo “alelo tipo selvagem” (por exemplo, alelo APO1 tipo selvagem), significa um alelo encontrado nas plantas que ocorre naturalmente, particularmente em plantas de trigo, que codifica uma proteína funcional (por exemplo, uma proteína APO1 funcional). Por outro lado, o termo “alelo mutante” (por exemplo, alelo apo1 mutante), conforme utilizado na presente invenção, refere-se a um alelo que não codifica uma proteína funcional, ou seja, um alelo apo1 que codifica uma proteína APO1 não funcional, que, conforme usado aqui, refere-se a uma proteína APO1 que não possui atividade biológica ou uma atividade biológica significativamente reduzida em comparação com a proteína APO1 funcional tipo selvagem correspondente, ou que não codifica absolutamente nenhuma proteína APO1.
[091] Um alelo mutante “nocaute completo” ou “nulo”, conforme utilizado na presente invenção, refere-se a um alelo mutante que codifica uma proteína que não possui atividade biológica em comparação com a proteína funcional tipo selvagem correspondente ou não codifica nenhuma proteína. Esse “alelo mutante nocaute completo” é, por exemplo, um alelo tipo selvagem, que compreende uma ou mais mutações em sua sequência de ácidos nucleicos, por exemplo, uma ou mais mutações sem sentido (non-sense) ou de sentido incorreto (missense). Em particular, esse alelo apo1 mutante completo é um alelo APO1 tipo selvagem, que compreende uma mutação que resulta preferencialmente na produção de uma proteína APO1 que carece de pelo menos um domínio funcional, como domínio F-box, ou carece de pelo menos um aminoácido crítico para sua função, de modo que a atividade biológica da proteína APO1 seja completamente abolida, ou pelo qual a(s) mutação(ões) resulte preferencialmente na ausência de produção da proteína APO1.
[092] Um alelo mutante “nocaute parcial”, tal como usado na presente invenção, refere-se a um alelo mutante que codifica uma proteína com atividade biológica significativamente reduzida em comparação com a proteína funcional tipo selvagem correspondente. Esse “alelo mutante nocaute parcial” é, por exemplo, um alelo tipo selvagem, que compreende uma ou mais mutações em sua sequência de ácidos nucleicos, por exemplo, uma ou mais mutações de sentido incorreto (missense). Em particular, esse alelo mutante nocaute parcial é um alelo tipo selvagem, que compreende uma mutação que resulta preferencialmente na produção de uma proteína em que pelo menos um aminoácido conservado e/ou funcional é substituído por outro aminoácido, de modo que a atividade biológica é significativamente reduzida, mas não completamente abolida.
[093] O nível de expressão de um gene pode ser determinado pelos especialistas na técnica, por exemplo, utilizando a análise da acumulação de RNA produzida a partir do ácido nucleico. O acúmulo de RNA, ou níveis de RNA, tal como o mMRNA, podem ser medidos em um único momento ou em vários momentos, em um único tecido ou em vários tecidos, e dessa forma, o aumento em vezes pode ser um aumento médio ou um valor extrapolado derivado dos valores medidos experimentalmente. O nível de expressão pode ser determinado por técnicas como RT-qPCR ou usando microarranjos baseados em hibridação. O nível de expressão também pode ser estimado pelo sequenciamento shotgun do transcriptoma completo, usando o sequenciamento de próxima geração para revelar a presença e quantidade de RNA, que pode ser selecionado para RNA poliadenilado ou depletado de RNA ribossômico.
[094] Em determinados exemplos de realização, a etapa de modificar um gene Apo1 endógeno pode compreender a realização de modificações nucleotídicas em um gene Apo1 endógeno, a fim de aumentar ou diminuir o SPS em uma planta.
[095] Em determinados exemplos de realização das plantas ou métodos, tal como ensinado na presente invenção, o gene Apo1f endógeno pode ser modificado por edição do genoma. Em determinados exemplos de realização, a edição do genoma pode ser realizada com uma ou mais nucleases manipuladas selecionadas a partir do grupo que consiste em nucleases guiadas por RNA, meganucleases, nucleases dedo de zinco (ZFNs) e nucleases efetoras baseadas em ativador de transcrição (TALEN).
[096] Em determinados exemplos de realização, a etapa de fornecer à planta pode compreender: o fornecimento de uma planta tipo selvagem; e modificar um gene Apo1 endógeno na planta pela edição do genoma para obter uma planta compreendendo um ácido nucleico tal como definido na presente invenção.
[097] O termo “edição do genoma” ou “edição do genoma com nucleases manipuladas” geralmente se refere a um tipo de engenharia genética em que o DNA é inserido, deletado ou substituído no genoma de um organismo vivo usando nucleases (manipuladas). As nucleases criam quebras sítio- específicas, tal como quebras de fita dupla (DSBs) nos sítios desejados no genoma.
[098] Em determinados exemplos de realização, o gene Apo1 endógeno pode ser modificado através da criação de quebras sítio-específicas, tal como quebras de fita dupla (DSBs), em um ou mais locais desejados no genoma. As quebras de fita dupla induzidas podem ser reparadas através de junção de extremidade não homóloga (NHEJ) ou reparo dirigido por homologia (HDR).
[099] Em determinados exemplos de realização, o gene Apo1 endógeno pode ser modificado por um método para edição do genoma, ou seja, um método para modificar o genoma, preferencialmente o genoma nuclear, de uma célula vegetal em um sítio pré-selecionado, cujo método compreende as etapas de:
- indução de uma quebra de DNA de fita dupla (DSB) no genoma da referida célula em um sítio de clivagem em (ou próximo a) um sítio de reconhecimento para uma enzima indutora de quebra de DNA de fita dupla (DSBI), expressando na referida célula uma enzima DSBI que reconhece o referido sítio de reconhecimento e induzindo a referida DSB no referido sítio de clivagem;
- —introdução na referida célula de uma molécula de ácido nucleico de reparo compreendendo uma região flanqueadora a montante com homologia com a região de DNA a montante do referido sítio pré-selecionado e/ou uma região flanqueadora com DNA a jusante com homologia com a região de DNA a jusante do referido sítio pré-selecionado para permitir recombinação homóloga entre a referida região ou regiões flanqueadoras e a referida região ou regiões de DNA que flanqueiam o referido sítio pré-selecionado; e
- —seleção de uma célula em que a referida molécula de ácido nucleico de reparo foi usada como um molde para fazer uma modificação do referido genoma no referido sítio pré- selecionado,
em que a referida modificação é selecionada a partir de uma substituição de pelo menos um nucleotídeo, uma deleção de pelo menos um nucleotídeo, uma inserção de pelo menos um nucleotídeo ou qualquer combinação dos mesmos.
[100] Conforme utilizado na presente invenção, uma “enzima indutora de quebra do DNA de fita dupla" é uma enzima capaz de induzir a ruptura em um DNA de fita dupla em uma sequência nucleotídica particular, chamada de “sítio de reconhecimento”.
[101] Endonucleases de clivagem rara são enzimas DSBI que possuem um sítio de reconhecimento de cerca de 14 a 70 nucleotídeos consecutivos e, portanto, têm uma frequência muito baixa de clivagem, mesmo em genomas maiores, como a maioria dos genomas vegetais. As endonucleases de homing, também chamadas de meganucleases, constituem uma família dessas endonucleases de clivagem rara. Elas podem ser codificadas por íntrons, genes independentes ou sequências intervenientes, e apresentam propriedades estruturais e funcionais impressionantes que as diferenciam das enzimas de restrição mais clássicas, geralmente dos sistemas de modificação - restrição tipo Il bacterianos. Os seus sítios de reconhecimento têm uma assimetria geral que contrasta com a simetria díade característica da maioria dos sítios de reconhecimento de enzimas de restrição. Demonstrou-se que várias endonucleases de homing codificadas por íntrons ou inteínas promovem o homing de seus respectivos elementos genéticos em sítios alélicos, sem íntrons ou sem inteína. Ao fazer uma quebra de fita dupla sítio- específica nos alelos sem íntrons ou sem inteína, essas nucleases criam extremidades recombinogênicas, que se envolvem em um processo de conversão de genes que duplica a sequência codificante e leva à inserção de um Ííntron ou uma sequência interveniente no nível do DNA.
[102] Uma lista de outras meganucleases de clivagem raras e seus respectivos sítios de reconhecimento é fornecida na Tabela | do documento WO 03/004659 (páginas 17 a 20) (incorporado ao presente por referência). Estas incluem: /-Sce 1, I-Chu 1, I-Dmo |, I-Cre 1, -Csm 1, PI-Fli 1, Pt- Mtu 1, I-Ceu 1, I-Sce 1I, I-Sce Ill, HO, PI-Civ 1, PI-Ctr 1, Pl-Aae 1, PI-BSU |, PI-
Dhal, PI-Dra 1, Pl-Mav 1, PI-Mch 1, PI-Mfu 1, PI-MfI 1, Pl-Mga 1, Pl-Mgo 1, PI-Min |, PI-Mka 1, PI-Mle 1, Pl-Mma 1, PI-Msh 1, PIl-Msm 1, PI-Mth 1, PI-Mtu 1, Pl-Mxe |, PI- Npu 1, PI-Pfu 1, PI-Rma 1, PI-Spb 1, PI-Ssp 1, Pl-Fac 1, PI-Mja 1, PI-Pho 1, Pl-Tag 1, Pl-Thy 1, PIl-Tko | ou PI-Tsp |.
[103] Além disso, estão disponíveis métodos para projetar endonucleases de clivagem rara sob medida que reconhecem basicamente qualquer sequência nucleotídica alvo de escolha. Resumidamente, as enzimas de restrição quiméricas podem ser preparadas usando híbridos entre um domínio dedo de zinco projetado para reconhecer uma sequência nucleotídica específica e o domínio de clivagem de DNA não específico de uma enzima de restrição natural, como Fokl. Tais métodos foram descritos, por exemplo, nos documentos WO 03/080809, WOS94/18313 ou WOS95/09233 e em Isalan et al., 2001, Nature Biotechnology 19, 656- 660; Liu et a/. 1997, Proc. Natl. Acad. Sci. USA, 94, 5525-5530).
[104] As meganucleases feitas sob medida podem ser produzidas por seleção de uma biblioteca de variantes, isto é descrito do documento WO 2004/067736. As meganucleases feitas sob medida com especificidade de sequência alterada e afinidade de ligação ao DNA também podem ser obtidas através de desenvolvimento racional, tal como descrito no documento WO 2007/047859.
[105] Outro exemplo de endonucleases desenhadas por encomenda inclui as nucleases TALE (TALENs), que são baseadas em Nucleases Efetoras Semelhantes a Ativadores de Transcrição (TALEs) a partir da bactéria do gênero Xanthomonas fundido com o domínio catalítico de uma nuclease (por exemplo, FOKI). A especificidade de ligação ao DNA dessas TALEs é definida por birresíduos variáveis repetitivos (RVDs) de unidades de repetição de 34/35 aminoácidos dispostas em tandem, de modo que um RVD reconhece especificamente um nucleotídeo no DNA alvo. As unidades de repetição podem ser montadas para reconhecer basicamente quaisquer sequências alvo e fundidas a um domínio catalítico de uma nuclease para criar endonucleases sequência-específicas (consulte, por exemplo, Boch et al., 2009, Science, 326: p1509-1512; Moscou e Bogdanove, 2009, Science, 326: p1501; Christian et al, 2010, Genetics, 186: p757-761; e documentos WO10/079430, WO11/072246, WO2011/154393, WO11/146121, WO2012/001527, WO2012/093833, WO2012/104729, WO2012/138927, WO2012/138939). O documento WO2012/138927 descreve ainda TALENs monoméricas (compactas) e TALENs com vários domínios catalíticos e combinações dos mesmos.
[106] Outro sistema de endonuclease personalizável foi descrito; o chamado sistema de Repetições Palindrômicas Curtas Agrupadas e Regularmente Interpassadas (CRISPR)/Cas, que emprega uma molécula de RNA especial (crºRNA) que confere especificidade de sequência para orientar a clivagem de uma endonuclease guiada por RNA associada. Tais endonucleases de clivagem rara desenvolvidas de maneira personalizada também são referidas como endonucleases de clivagem rara de ocorrência não natural.
[107] Uma nuclease guiada por RNA ou endonuclease guiada por RNA (RGEN), como utilizado na presente invenção, é um polipeptídeo modificador de DNA guiado por RNA com atividade de (endo)nuclease.
[108] As RGENs são normalmente derivadas dos sistemas Repetições Palindrômicas Curtas Agrupadas e Regularmente Interpassadas (CRISPR), que são uma classe difundida de sistemas bacterianos para defesa contra ácidos nucleicos estranhos. Os sistemas CRISPR são encontrados em uma ampla variedade de organismos eubacterianos e archaeais. Os sistemas CRISPR incluem subtipos do tipo |, Il, Ill e V (consulte, por exemplo, os documentos WO2007025097; WO2013098244; WO2014022702;
WO2014093479; WO2015155686; EP3009511; US2016208243). Os sistemas CRISPR/Cas tipo Il tipo selvagem utilizam uma nuclease guiada por RNA, por exemplo, Cas9, em complexo com RNA guia e ativador para reconhecer e clivar o ácido nucleico estranho (Jinek et a/., 2012, Science, 337 (6096): 816- 21).
[109] Os homólogos de Cas9 são encontrados em uma ampla variedade de eubactérias, incluindo, entre outras, as bactérias dos seguintes grupos taxonômicos: Actinobacteria, Aquificae, Bacteroidetes-Chlorobi, Chlamydiae-Verrucomicrobia, Chliroflexi, Cyanobacteria, Firmicutes, Proteobacteria, Spirochaetes e Thermotogae. Uma proteína Cas9 exemplar é a proteína Cas9 de Streptococcus pyogenes. Outras proteínas Cas9, homólogas e variantes das mesmas e métodos para uso na edição do genoma estão descritos, por exemplo, em Chylinksi, et a/., 2013, RNA Biol., 10 (5): 7126-737; Makarova et al., 2011, Nat. Rev. Microbiol., 9 (6): 467-477; Hou, et al., 2013, Proc Natl Acad Sci USA, 110 (39): 15644-9; Sampson et al., 2013, Nature, 497 (7448): 254-7; Jinek et al., 2012, supra, WO2013142578; WO2013176772; WO2014065596; WO2014089290; WOZ2014093709; WO2014093622; WO2014093655; —“WO2014093701; WOZ2Z014093712; WOZ2014093635; WO2014093595; —“WO2014093694; WOZ2Z014093661; WOZ2014093718; WO2014093709; WOZ2014099750; WOZ2014113493; WO2014190181; WO2015006294; WOZ2015071474; WO2015077318; WO2015089406; WOZ2015103153; WO201621973; WOZ201633298; WOZ201649258, todos incorporados ao presente por referência.
[110] Outras nucleases guiadas por RNA incluem, por exemplo, Cpf1 e homólogos e variantes das mesmas (como, por exemplo, descrito em Zetsche et al., 2015, Cell, Volume 163, Edição 3, 759-771; EP3009511; US2016208243; Kleinstiver et a/l., 2016, Nat Biotechnol., 34 (8): 869-74; Gao et al., 2016, Cell Res., 6 (8): 901-13; Hur et a/., 2016, Nat Biotechnol., 34 (8): 807;
Kim et a/l., 2016, Nat Biotechnol., 34 (8): 863-8.; Yamano et al., 2016, Cell, 165 (4): 949-62), e também C2c1 e C2c3 (Shmakov et al., 2015, Mol Cell., 60 (3): 385-97), todos incorporados ai presente por referência.
[111] As nucleases guiadas por RNA adicionais podem incluir proteínas do tipo Argonaut, por exemplo, conforme descrito no documento WO2015157534.
[112] Nucleases guiadas por RNA adicionais e outros polipeptídeos são descritos no documento WO2013088446.
[113] Em um exemplo de realização, a RGEN também pode ser uma enzima de corte (nicking) guiada por RNA (nickase), ou um par de enzimas de corte guiadas por RNA, em cada uma introduz uma quebra em apenas uma fita do DNA de fita dupla no sítio ou próximo ao sítio pré- selecionado. De um par de nickases, a enzima uma introduz uma quebra em uma fita do DNA no sítio ou perto do sítio pré-selecionado, enquanto a outra enzima introduz uma quebra na outra fita do DNA no sítio ou perto do sítio pré- selecionado. As duas quebras de fita simples podem ser introduzidas na mesma posição de nucleotídeo em ambas as fitas, resultando em uma quebra de DNA de fita dupla com ponta cega (blunt), mas as duas quebras de fita única também podem ser introduzidas em posições de nucleotídeo diferentes em cada fita, resultando em uma saliência 5' ou 3' no sítio da quebra (“extremidade coesiva (sticky end)" ou “corte escalonado”). Os mutantes de corte (nicking) e suas utilizações são, por exemplo, descritos nos documentos acima e especificamente nos documentos WO2014191518, WO2014204725 e WO201628682. Além disso, um único nicking mutante, que introduz uma quebra em apenas uma das duas cadeias do DNA (ou seja, uma quebra de DNA em fita única), pode aprimorar o reparo dirigido por homologia (HDR) com um polinucleotídeo doador (Richardson et al. 2016, Nature Biotechnology 34, 339-344; US62/262, 189).
[114] Como alternativa a uma nuclease ou nickase, também podem ser utilizadas variantes de nuclease deficientes (também conhecidas como “mortas” ou cataliticamente inativas) das nucleases descritas acima, como dCas9, para aumentar a inserção direcionada de um polinucleotídeo doador, como por exemplo, descrito em Richardson et al. 2016, Nature Biotechnology 34, 339-344; US62/262.189). Tais variantes não têm a capacidade de clivar ou cortar o DNA, mas são capazes de serem direcionadas e se ligarem ao DNA (consulte, por exemplo, WO2013176772, EP3009511). Acredita-se que essas nucleases “mortas” induzem o deslocamento da fita ligando-se a uma das duas fitas (“derretimento do DNA”), aumentando assim a recombinação com o polinucleotídeo doador, permitindo que o polinucleotídeo doador seja pareado com a outra fita de DNA “livre”,
[115] Mutantes de corte (nick) foram descritos de várias RGENs e envolvem uma ou mais mutações em um domínio catalítico, como os domínios HNH e RuvC (por exemplo, Cas9) do domínio semelhante a RuvC (RuvC-like) (por exemplo, Cpf1). Por exemplo, a SpCas9 pode ser convertida em uma nickase pela mutação de D1I0A no RuvC e 863A no domínio da nuclease HNH converte SpCas9 em uma nickase de DNA, enquanto a inativação de ambos os domínios da nuclease resulta em uma proteína cataliticamente inativa (Jinek et a/., 2012, supra, Gasiunas et al., 2012, Proc. Natl. Acad. Sci. USA 109, E2579-E2586). Em Cpf1, verificou-se que a mutação D917A e a E1006A inativaram completamente a atividade de clivagem de DNA do FnCpfl, enquanto D1255A reduziu significativamente a atividade nucleolítica (Zetsche et al., 2015, supra). Os resíduos correspondentes de outras variantes de RGEN (por exemplo, Cas9 ou Cpfi) podem ser determinados pelo alinhamento ideal.
[116] O sítio de clivagem de uma enzima DSBI refere-se à localização exata no DNA onde a quebra de DNA de fita dupla é induzida. O sítio de clivagem pode ou não estar compreendido (sobreposto) ao sítio de reconhecimento da enzima DSBI e, portanto, é dito que o sítio de clivagem de uma enzima DSB! está localizado no sítio de reconhecimento ou próximo a ele. O sítio de reconhecimento de uma enzima DSBJI, também conhecido como sítio de ligação, é a sequência nucleotídica que é (especificamente) reconhecida pela enzima DSBI e determina sua especificidade de ligação. Por exemplo, um monômero TALEN ou ZNF possui um sítio de reconhecimento que é determinado por suas repetições RVD ou ZF, respectivamente, enquanto o sítio de clivagem é determinado pelo domínio da nuclease (por exemplo, FOKI) e geralmente está localizado fora do sítio de reconhecimento. No caso de TALENs ou ZFNs diméricos, o sítio de clivagem está localizado entre os dois sítios de reconhecimento/ligação dos respectivos monômeros, essa região de DNA interveniente em que ocorre a clivagem é referida como região espaçadora. Por outro lado, para as meganucleases, a clivagem do DNA é realizada dentro de sua região de ligação específica e, portanto, o sítio de ligação e o sítio de clivagem se sobrepõem.
[117] Um técnico hábil no assunto seria capaz de escolher uma enzima DSBI que reconhece um determinado sítio de reconhecimento e induzir uma DSB em um sítio de clivagem no sítio ou nas proximidades do sítio pré- selecionado ou projetar tal enzima DSBI. Alternativamente, um sítio de reconhecimento de enzima DSBI pode ser introduzido no genoma alvo usando qualquer método de transformação convencional ou cruzamento com um organismo que tenha um sítio de reconhecimento de enzima DSBI em seu genoma, e qualquer DNA desejado pode ser posteriormente introduzido no sítio ou nas proximidades do sítio de clivagem dessa enzima DSBI.
[118] Como usado aqui, uma “molécula de ácido nucleico de reparo” é uma molécula de DNA de fita simples ou dupla ou molécula de RNA que é usada como molde para modificação do DNA genômico no sítio pré-
selecionado nas proximidades ou no sítio de clivagem. Conforme utilizado na presente invenção, “usar como molde para modificação do DNA genômico” significa que a molécula de ácido nucleico de reparo é copiada ou integrada no sítio pré-selecionado por recombinação homóloga entre a(s) região(ões) flanqueadoras e a(s) região(ões) de homologia correspondente(s) no genoma alvo que flanqueia o sítio pré-selecionado, opcionalmente em combinação com a junção de extremidades não homóloga (NHEJ) em uma das duas extremidades da molécula de ácido nucleico de reparo (por exemplo, no caso de haver apenas uma região flanqueadora). A integração por recombinação homóloga permitirá a junção precisa da molécula de ácido nucleico de reparo ao genoma alvo até o nível nucleotídico, enquanto a NHEJ pode resultar em pequenas inserções/deleções na junção entre a molécula de ácido nucleico de reparo e o DNA genômico.
[119] Conforme utilizado na presente invenção, “uma modificação do genoma”, significa que o genoma foi alterado por pelo menos um nucleotídeo (em um exemplo de realização, tal alteração não ocorre em uma planta tipo selvagem/não modificada). Isso pode ocorrer pela substituição de pelo menos um nucleotídeo e/ou pela deleção de pelo menos um nucleotídeo e/ou pela inserção de pelo menos um nucleotídeo, desde que resulte em uma alteração total de pelo menos um nucleotídeo em comparação com a sequência de nucleotídeos do sítio genômico alvo pré-selecionado antes da modificação, permitindo assim a identificação da modificação, por exemplo, por técnicas como sequenciamento ou análise PCR e similares, das quais o perito estará ciente.
[120] Exemplos de realização adicionais divulgam métodos para identificar e/ou selecionar uma planta de trigo compreendendo um alelo de um gene que contribui positiva ou negativamente para o número de espiguetas por espiga, compreendendo respectivamente a etapa de identificação da presença ou ausência, respectivamente, no genoma da planta de trigo de um ácido nucleico com os nucleotídeos da posição 4399 até a posição 4513 da SEQ ID NO: 5, ou de um ácido nucleico com os nucleotídeos da posição 7816 até posição 7930 na SEQ ID NO: 19, ou de uma sequência de nucleotídeos com pelo menos 90% de identidade de sequência com a mesma.
[121] As plantas de trigo da presente invenção podem ser cultivadas ou colhidas para grãos, principalmente para uso como alimento para consumo humano ou como ração animal, ou para fermentação ou produção de matéria-prima industrial, como produção de etanol, entre outros usos. Alternativamente, as plantas de trigo podem ser usadas diretamente como ração. A planta da presente invenção é preferencialmente útil para a produção de alimentos e, em particular, para a produção comercial de alimentos. Essa produção de alimentos pode incluir a fabricação de farinha, massa, sêmola ou outros produtos a partir do grão que possa ser um ingrediente na produção comercial de alimentos. A invenção também fornece farinha, farinha ou outros produtos produzidos a partir do grão. Estes podem não ser processados ou processados, por exemplo, por fracionamento ou branqueamento.
[122] A presente invenção também fornece produtos produzidos a partir de plantas ou grãos/sementes da presente invenção, como um produto alimentício, que pode ser um ingrediente alimentar. Exemplos de produtos alimentícios incluem farinha, amido, pães fermentados ou sem fermento, massas, macarrão, forragem animal, cereais matinais, salgadinhos, bolos, malte, doces e alimentos que contenham molhos à base de farinha. O produto alimentício pode ser um bagel, biscoito, bolinho, pão, croissant, bolinho de massa (dumpling), muffin inglês, muffin, pão pita, pão rápido, produto de massa refrigerada/congelada, massa, feijão assado, burrito, chili, taco, tamale, tortilha, torta de panela, cereal pronto para comer, refeição pronta para comer, recheio, refeição para micro-ondas, bolo tipo brownie, bolo, cheesecake, bolo de café,
biscoito tipo cookie, sobremesa, confeitos, rocambole doce, torrão doce, massa de torta, recheio de torta, comida para bebê, mistura para assar, massa, massa para panificação, mistura, mistura para molhos, extensor de carne, substituto de carne, mistura de tempero, mistura de sopa, molho, roux, molho para salada, sopa, creme azedo, pasta, macarrão, macarrão ramen, macarrão chow mein, macarrão lo mein, inclusão de sorvete, barra de sorvete, casquinha (cone) de sorvete, sanduíche de sorvete, biscoito tipo cracker, crouton, rosquinha, rolinho de ovo, lanche extrudado, barra de frutas e grãos, lanche para micro-ondas, barra nutricional, panqueca, produto de padaria pré-cozido, pretzel, pudim, produto à base de granola, salgadinho tipo chip, salgadinho, mistura de salgadinhos, waffle, massa de pizza, ração animal ou ração animal de animal doméstico. O produto alimentício pode ser preparado misturando o grão, farinha, farinha integral ou farelo do referido grão, com outro ingrediente. Outro produto é a ração para a alimentação animal, como grãos colhidos, feno, palha ou silagem. As plantas da invenção podem ser usadas diretamente como ração animal, por exemplo, quando cultivadas no campo.
[123] Em um exemplo de realização, a invenção provê um método de produção de farinha de trigo, farelo integral, amido, grânulos ou farelo de amido, cujo método compreende a obtenção do grão da planta da invenção e o processamento do grão para produzir os grânulos de farinha, trigo integral, amido, amido ou farelo, bem como a farinha de trigo, farinha de trigo integral, amido, grânulos de amido ou farelo produzidos por esse método ou compreendendo a molécula de ácido nucleico Apo1 da invenção e/ou o polipeptídeo APO1 da invenção.
[124] Também é fornecido um método de produção de um produto alimentício, compreendendo misturar os grãos das plantas da invenção ou farinha de trigo acima, farinha de trigo integral, amido, grânulos de amido ou farelo com pelo menos outro ingrediente alimentar para produzir o produto alimentício. Também é fornecido um método de produção de amido, cujo método compreende a obtenção do grão das plantas da invenção e o processamento do grão para produzir o amido, bem como um método de produção de etanol, cujo método compreendendo a fermentação do referido amido, produzindo assim o etanol.
[125] É fornecido ainda um método de alimentar um animal, compreendendo fornecer ao animal, a planta de trigo da invenção, o grão de trigo da invenção, a célula de trigo da invenção ou um produto alimentício compreendendo a farinha de trigo, farinha de trigo integral, amido, grânulos de amido ou farelo acima.
[126] Também é fornecido é um produto alimentício compreendendo a planta de trigo da invenção ou uma parte dela, o grão de trigo da invenção, célula de trigo da invenção, molécula de ácido nucleico da invenção, polipeptídeo da invenção, ou um ingrediente que é a farinha de trigo, farinha de trigo integral, amido, grânulos de amido ou farelo acima, tal como o referido produto alimentício, em que o produto alimentício é pão fermentado ou sem fermento, macarrão, noodle, cereal matinal, lanche, bolo, confeito ou molhos à base de farinha.
[127] São fornecidas sementes vegetais da invenção, compreendendo o alelo Apo1 da invenção, bem como produtos de trigo produzidos a partir dessas sementes, em que o referido produto de trigo compreende o alelo Apof. Esses produtos de trigo podem ser ou podem compreender farelo, sementes trituradas, farinha, flocos, etc. Particularmente, esse produto de trigo compreende um ácido nucleico que produz um amplicon diagnóstico ou específico para o alelo Apo1 da invenção.
[128] Também é fornecido um método para alterar o número de espiguetas por espiga de uma planta de trigo, compreendendo a etapa de alterar a abundância da proteína APO1 da invenção dentro da referida planta de trigo, particularmente esse método, em que a abundância da referida proteína é aumentada e o número de espiguetas por espiga é aumentado em comparação com o número de espiguetas por espiga da referida planta de trigo quando a abundância da referida proteína não é alterada.
[129] O método de acordo com o parágrafo acima, em que a abundância da referida proteína é diminuída e o número de espiguetas por espiga é diminuído em comparação com o número de espiguetas por espiga da referida planta de trigo quando a abundância da referida proteína não é alterada, tal como no referido método em que a abundância da referida proteína é aumentada pelo fornecimento à referida planta de trigo: a. do gene recombinante da invenção; ou b. de um gene heterólogo que codifica a proteína APO1 da invenção, em que o referido gene heterólogo é mais expresso do que o gene endógeno correspondente, por exemplo, quando o referido gene heterólogo compreende a sequência nucleotídica de SEQ ID NO: 4 ou SEQ ID NO: 5 ou uma sequência nucleotídica possuindo pelo menos 90% de identidade de sequência com esta.
[130] Também é fornecido o método dos 2 parágrafos acima, em que a abundância da referida proteína é reduzida pelo fornecimento à referida planta de trigo de: a. um gene heterólogo que codifica a proteína APO1 de acordo com a invenção, em que o referido gene heterólogo é expresso em um nível mais baixo que o gene endógeno, ou b. um alelo mutante do gene endógeno que codifica a proteína APO1 de acordo com a invenção.
[131] O método do parágrafo acima, em que o promotor do referido gene heterólogo compreende a sequência nucleotídica de SEQ ID NO:
9 ou uma sequência nucleotídica com pelo menos 90% de identidade de sequência com a mesma, e não compreende a sequência nucleotídica da posição do nucleotídeo 4399 até a posição do nucleotídeo 4513 da SEQ ID NO: 5, nem uma sequência nucleotídica possuindo pelo menos 90% de identidade de sequência com a mesma, por exemplo, em que o referido alelo mutante é um alelo nocauteado.
[132] O método de acordo com os parágrafos acima, em que a etapa de fornecimento compreende o fornecimento por transformação, cruzamento, retrocruzamento, introgressão, edição do genoma ou mutagênese.
[133] As células vegetais transformadas e as plantas obtidas pelos métodos descritos na presente invenção podem ser adicionalmente utilizadas em procedimentos de melhoramento bem conhecidos no estado da técnica, como cruzamento, autofecundação e retrocruzamento. Os programas de melhoramento podem envolver o cruzamento para gerar uma geração F1 (primeira filial), seguida por várias gerações de autofecundação (gerações F2, F3, etc). O programa de melhoramento também pode envolver etapas de retrocruzamento (BC), na qual a progênie é retrocedida para uma das linhas parentais, denominada parental recorrente.
[134] Entretanto, em determinadas jurisdições, as plantas de acordo com a invenção que foram obtidas exclusivamente por processos essencialmente biológicos podem ter a patenteabilidade excluída, em que um processo para a produção de plantas é considerado essencialmente biológico se ele consistir inteiramente em fenômenos naturais, tal como cruzamento ou seleção. As plantas de acordo com a invenção também abrangem plantas não obtidas exclusivamente por processos essencialmente biológicos.
[135] A listagem de sequências contida no arquivo nomeado “BCS18-2001-WO1 ST25.txt”, que possui 87 kilobytes, contém 31 sequências, da SEQ ID NO: 1 até a SEQ ID NO: 31, e é depositada com a presente invenção por envio eletrônico e incorporada ao presente pela referência.
[136] Na descrição e nos exemplos, é feita referência às seguintes sequências: - —“SEQIDNO: 1: sequência nucleotídica do DNA codificante de Apo1-7A a partir da variedade Chinese Spring, Westonia ou Baxter, - “SEQIDNO: 2: sequência nucleotídica do DNA genômico de Apo1-7A a partir da variedade Chinese Spring, Westonia ou Baxter, - —“SEQIDNO:3: sequência de aminoácidos da proteína APO1- 7A a partir da variedade Chinese Spring, Westonia ou Baxter, - SEQID NO: 4 sequência nucleotídica da sequência 5' a montante de Apo1-7A a partir da variedade Westonia; - SEQID NO: 5: sequência nucleotídica da sequência 5' a montante de Apo1-7A a partir da variedade Baxter, - “SEQIDNO:6&: sequência nucleotídica do DNA codificante de Apo1-7A a partir da variedade Chara ou Yitpi; - SEQIDNO:7: sequência nucleotídica do DNA genômico de Apo1-7A a partir da variedade Chara ou Yitpi; - —“SEQIDNO: 8: sequência de aminoácidos da proteína APO1- 7A a partir da variedade Chara ou Yitpi; - SEQID NO: 9: sequência nucleotídica da sequência 5' a montante de Apo1-7A a partir da variedade Chara ou Yitpi; - SEQ ID NO: 10: sequência nucleotídica do marcador molecular wsnp Ku c19943 29512612; - SEQ ID NO: 11: sequência nucleotídica do marcador molecular Excalibur c95707 285; - SEQ ID NO: 12: sequência nucleotídica do marcador molecular mMTRIO0073530;
- SEQ ID NO: 13: sequência nucleotídica do marcador molecular mTRIO0055675;
- SEQ ID NO: 14: sequência nucleotídica do marcador molecular mTRIO0055678;
- SEQID NO: 15: sequência nucleotídica do homólogo 7B da sequência codificante do gene APO1 (Chinese Spring);
- “SEQID NO: 16: sequência nucleotídica do homólogo 7D da sequência codificante do gene APO1 (Chinese Spring);
- SEQ ID NO: 17: sequência de aminoácidos da proteína APO1-7B (Chinese Spring);
- SEQ ID NO: 18: sequência de aminoácidos da proteína APO1-7D (Chinese Spring);
- SEQID NO: 19: sequência nucleotídica da sequência 5' a montante de Apo1-7A a partir da variedade Chinese Spring;
- SEQ ID NO: 20: 1242 sequência nucleotídica do DNA codificante de Apo1-7B a partir da variedade Chinese Spring;
- “SEQIDNO: 21: sequência nucleotídica do DNA genômico de Apo1-7B a partir da variedade Chinese Spring;
- SEQID NO: 22: sequência nucleotídica da sequência 5' a montante de Apo1-7B a partir da variedade Chinese Spring;
- SEQ ID NO: 23: sequência nucleotídica do marcador CAP7 c2350 105;
- SEQ ID NO: 24: sequência nucleotídica do marcador wsnp Ku rep c104159 90704469;
- SEQ ID NO: 25: sequência nucleotídica do marcador BS00021657 51;
- SEQ ID NO: 26: sequência nucleotídica do marcador
BSO00066288 51; - SEQ ID NO: 27: sequência nucleotídica do marcador BS00039502 51; - SEQID NO: 28: sequência nucleotídica do DNA codificante de Apo1-7A a partir da variedade Chinese Spring (versão mais curta); - SEQ ID NO: 29: sequência de aminoácidos da proteína APO1-7A a partir da variedade Chinese Spring (versão mais curta); - SEQID NO: 30: sequência nucleotídica do DNA codificante de Apo1-7B a partir da variedade Chinese Spring (versão mais curta); - SEQ ID NO: 31: sequência de aminoácidos da proteína APO1-7B a partir da variedade Chinese Spring (versão mais curta).
EXEMPLOS
[137] Salvo quando indicado de outra forma nos Exemplos, todas as técnicas de DNA recombinante são realizadas de acordo com protocolos padrão, tal como descrito em Sambrook e Russell (2001) Molecular Cloning: A Laboratory Manual, Terceira Edição, Cold Spring Harbor Laboratory Press, NY, nos Volumes 1 e 2 de Ausubel et a/. (1994) Current Protocols in Molecular Biology, Current Protocols, USA e nos Volumes | e Il de Brown (1998) Molecular Biology LabFax, Segunda Edição, Academic Press (Reino Unido). Os materiais e métodos-padrão para o trabalho molecular em plantas estão descritos em Plant Molecular Biology Labfax (1993) R.D.D. Croy, publicado juntamente por BIOS Scientific Publications Ltd (Reino Unido) e Blackwell Scientific Publications (Reino Unido). Os materiais e métodos padrão para as reações em cadeia da polimerase também podem ser encontrados em
Dieffenbach e Dveksler (1995), PCR Primer: A laboratory manual, Cold Spring Harbor Laboratory Press, NY; e particularmente em McPherson et al. (2000), PCR - Basics: From background to bench, 1º ed., Springer Verlag, Alemanha. Os procedimentos padrão para análise de Polimorfismo de Comprimento de Fragmento Amplificado (AFLP) são descritos em Vos et al. (1995, NAR 23:4407-4414) e no pedido de patente publicado EP 534858.
[138] Os exemplos mostram os resultados obtidos usando 2 populações diferentes de trigo, uma baseada na análise de um grupo de plantas de trigo de primavera (spring) (seção A abaixo) e outra baseada na análise de um grupo de plantas de trigo de inverno (winter) (seção B abaixo), mostrando que os fenótipos SPS (SPS" ou SPS*) associados ao tipo de alelo APO1 presente é aplicável a todas as populações/genótipos de trigo.
A. ANÁLISE DE APOT1 Em LINHAGENS DE TRIGO DA PRIMAVERA. EXEMPLO 1 MAPEAMENTO DE UM QTL No CROMOSSOMO 7 A QUE CONTROLA O NÚMERO DE
ESPIGUETAS POR ESPIGA
[139] Uma população de trigo de primavera MAGIC de quatro linhagem (Huang et al. 2012 Plant Biotechnology Journal 10: 826-839) foi fenotipada pela contagem do número de espiguetas por espiga nas diferentes linhagens de plantas.
[140] Usando um mapa genético de vários SNP, a análise QTL foi realizada para testar o efeito da variação no número de espiguetas por espiga em todos os marcadores. Associações significativas de marcadores- características são distinguidas por valores - p transformados por /og maiores que 3. Dessa forma, um intervalo de marcadores significativamente associados foi delineado, incluindo marcadores flanqueadores (SEQ ID NO: 10 e SEQ ID NO: 11). Um intervalo de marcadores significativamente associados foi delineado usando os seguintes critérios: limiar de significância em 2,5, queda de significância em 1,5 e queda de significância entre picos em 2. Isso delimitou o intervalo para 2,1 cM para 7A pelos marcadores flanqueadores esquerdo e direito.
[141] As Famílias Heterogêneas Endogâmicas (HIFs)contrastando com a presença do 7A SPS QTL (Fam1 A 1, Fam1 B 1, Fam2 B 1, Fam2 C 1, Fam2 H 1, Fam3 E 1, Fam3 | 1, Fam4 A, Fam4 G, Fam5 C 1eFam5 F 1) foram geradas e foram subsequentemente utilizadas para o mapeamento fino e a análise de expressão abaixo do QTL 7A.
[142] As HIFs com presença contrastante dos alelos alto e baixo contribuintes para o 7A SPS QTL foram fenotipadas como descrito acima. Ensaios SNP adicionais foram desenvolvidos para aumentar a densidade do marcador no intervalo QTL. O /ocus SPS pode ser adicionalmente delimitado para uma região de cerca de 2,1 cM no 7A (de 58,7 para 60,8 cM ao mesmo tempo no cromossomo 7A) delimitado por marcadores flanqueadores (SEQ ID NO: 12 e SEQ ID NO: 13 ou SEQ ID NO: 14).
[143] A sequência de marcadores do mapeamento fino foi usada na pesquisa BLAST para contigs e andaimes (scaffolds) da sequência genômica da variedade Chinese Spring. Critérios rigorosos BLAST e de análise foram aplicados para posicionar os SNPs na sequência parcial do genoma, como > 98% de identidade de sequência, comprimento de alinhamento > 158 pb, acerto na sequência 7A, e critérios adicionais para a saliência (overhang) não alinhada. Os scaffolds foram usados para o mapa fino (e mapas genéticos adicionais). 16 genes anotados com no intervalo definido pelo mapeamento fino, foram submetidos a análise de expressão como descrito no Exemplo 2.
EXEMPLO 2 ANÁLISE DE EXPRESSÃO E IDENTIFICAÇÃO DE APO1
[144] A análise da expressão foi realizada utilizando o sequenciamento shotgun do transcriptoma completo de amostras de RNA preparadas a partir das famílias HIF contrastantes, essencialmente como descrito por Wang et al. (2009) Nature Review Genetics 10, 57-63. A expressão foi quantificada contando o número normalizado de leituras mapeadas para o intervalo QTL definido no Exemplo 1.
[145] O nível de expressão dos 16 genes anotados no intervalo definido pelo mapeamento fino foi quantificado nos diferentes pais da população de mapeamento, bem como em 11 HIFs. Destes, apenas um candidato, o ortólogo do arroz APO71, é expresso de forma significativamente maior (com uma média de aumento de 1,8 vezes) nas linhagens que exibem o fenótipo de alto número de espiguetas por espiga (abreviado no presente pedido como (fenótipo) SPS*) em comparação com linhagens com um número baixo de espiguetas por espiga (abreviado no presente pedido como (fenótipo) SPS-. Esse gene foi consequentemente identificado como o gene subjacente ao QTL do número de espiguetas por espiga no cromossomo 7A.
[146] A Figura 1 mostra os resultados detalhados do nível de expressão pela análise de transcrição RNAseq do gene APO?1 nos genótipos de trigo de primavera analisados. As linhagens contrastantes têm uma diferença mínima de 1,5 vezes até 2,75 vezes na abundância de transcrição de APOT. As plantas parentais Chara e Yitpi têm um baixo número de espiguetas por espiga e um baixo nível de expressão de APO71, enquanto as plantas parentais Westonia e Baxter têm um alto número de espiguetas por espiga e um nível de expressão de APO1 mais alto (1,6 a 2,6 vezes maior). Da mesma forma, as linhagens HIFs com um número baixo de espiguetas por espiga têm um baixo nível de expressão de APO7, enquanto as linhagens HIFs com um número alto de espiguetas por espiga têm um nível de expressão de APO1 mais alto.
[147] A sequência do gene APO1 foi obtida a partir da lihhagem de referência Chinese Spring, bem como das quatro variedades parentais
MAGIC. O APO1 é muito bem conservado com mais de 99% de identidade de sequência entre a sequência do alelo a partir das variedades com baixo número de espiguetas por espiga e entre a sequência do alelo das variedades com alto número de espiguetas por espiga. A Tabela 1 mostra os três polimorfismos de nucleotídeo único encontrados entre as sequências codificantes de APO1 analisadas. As sequências de aminoácidos correspondentes também compartilham 99% de identidade de sequência. O SNP na posição 140 nas SEQ ID NOs: 2 ou 7 resulta na sequência proteica da Yíitpi e Chara (SEQ ID NO: 8) que tem uma cisteína na posição 47, enquanto que as sequências proteicas da Baxter, Westonia e Chinese Spring (SEQ ID NO: 3) tem uma fenilalanina na posição 47. O SNP na posição 842 da SEQ ID NO: 2 ou 7 não resulta em qualquer diferença na sequência de aminoácidos, uma vez que ele se encontra em um íntron. O SNP na posição 1284 nas SEQ ID NOs: 2 ou 7 resulta na sequência proteica da Yitoi e Chara (SEQ ID NO: 8) que tem uma aspargina na posição 384, enquanto que as sequências proteicas da Baxter, Westonia e Chinese Spring (SEQ ID NO: 3) tem um ácido aspártico na posição 384. Não se espera ou se prevê que estas diferenças nas sequências proteicas dos genótipos de alto ou baixo número de espiguetas por espiga alterem significativamente a função da proteína APO1. TABELA 1 PoLIMORFISMOS DE NuUCLEOTÍDEO Único (SNPs) IDENTIFICADOS ENTRE As
SEQUÊNCIAS DO GENE APOT DAS VARIEDADES COM BAIXO NÚMERO DE ESPIGUETAS POR ESPIGA (YITPI E CHARA) E AS VARIEDADES COM ALTO NÚMERO DE ESPIGUETAS POR ESPIGA (BAXTER E WESTONIA). * refere-se a um SNP em uma sequência intrônica.
[148] A sequência nucleotídica de cerca de 5 kb a montante do gene APO1 também foi obtida e comparada a partir das quatro variedades parentais.
A Tabela 2 lista polimorfismos de nucleotídeo único e as inserções/deleções encontradas entre as sequências dos genótipos de baixo número de espiguetas por espiga e as sequências dos genótipos com alto número de espiguetas por espiga.
Surpreendentemente, as sequências dos genótipos das variedades com um número baixo de espiguetas por espiga carecem de cerca de 115 pb em comparação com as sequências dos genótipos a partir das variedades com um número elevado de espiguetas por espiga de cerca de 500 pb a montante do sítio de início da tradução (correspondente ao sítio de início da tradução na sequência de referência de SEQ ID NO: 1). 1). É esperado que essa exclusão (deleção) explique o nível de expressão mais baixo medido nessas linhagens.
TABELA 2 PoLIMORFISMOS DE NUCLEOTÍDEO Único (SNP's) E INSERÇÓES/DELEÇÕES (I/NDELS) IDENTIFICADOS ENTRE AS SEQUÊNCIAS À MONTANTE DE CERCA DE 5 KB DE APO1 DAS VARIEDADES COM BAIXO NÚMERO DE ESPIGUETAS POR ESPIGA (YITPI E CHARA) E AS VARIEDADES COM ALTO NÚMERO DE ESPIGUETAS POR ESPIGA (BAXTER E WESTONIA). Posição Posição SEQ | Posição SEQ SEQID Yitpi / Chara Baxter / Westonia ID NO: 4 IDNO:5 Tipo NO: 9 652 | sn 1639 1652 1639 | sw 2008 ro | nd |
[ER (mens cce [RSS os | SEQID Yitpi / Chara Baxter / Westonia ID NO: 4 ID NO: 5 Tipo NO: 9 [206 TIE E mer | [206 E E nar | Es as ss na | o ee A | e
GCATCCCAACATCGT
GCCCCTACCTCGCC - TCCGGCTAGGTCATT Indel
CCAAGCCCTAGTCG CCGACGTCGCAACC CTGTCTCATGCTCGG CGGCTATCTAATT
[149] Os SNPs e indels identificados entre os genótipos de alto e baixo número de espiguetas por espiga também podem ser usados como marcadores para determinar qual alelo do gene APO1 é composto por qualquer genótipo de trigo em particular.
[150] O crescimento de 2 linhagens NIL de trigo de primavera (NILs) contrastando no locus APO1-7A em diferentes ambientes mostrou que o alelo APO1-7A que causa um número reduzido de espiguetas por espiga (SPS* ), estava associado a um aumento significativo do rendimento em ensaios de campo (entre 3 e 6 replicatas para cada linha em teste) quando cultivadas na Austrália, em comparação com as NlLs contrastantes que possuíam o alelo APOT1-7A que causa um aumento no número de espiguetas por espiga (SPS*) nas mesmas origens genéticas (cultivadas nos mesmos ensaios). Essa associação foi revertida quando as mesmas NlILs foram cultivadas em testes de campo na França (entre 3 e 6 repetições para cada linha em teste), onde as linhagens com o alelo APO1 que causam aumento no número de espiguetas por espiga (SPS*) mostraram um aumento significativo no rendimento, em comparação com as linhagens irmãs com o alelo APO1 SPS" nos mesmos fundos genéticos (cultivadas nos mesmos ensaios). Embora os efeitos do rendimento foram revertidos, os efeitos de cada um dos 2 alelos APO1-7A para o fenótipo SPS foram consistentes entre os ambientes. EXEMPLO 3 VALIDAÇÃO DE APO1 Como GENE DETERMINANTE DO NÚMERO DE ESPIGUETAS
POR ESPIGA EM PLANTAS DE TRIGO POSSUINDO BAIXO NÚMERO INICIAL DE ESPIGUETAS POR ESPIGA (ABORDAGEM GM)
[151] Usando técnicas de DNA recombinante padrão, as seguintes regiões de DNA foram operacionalmente ligadas: a. uma região promotora CaMV35S (P35S); b. uma região de DNA que codifica TaAPO1; c. uma região de DNA representando a sequência 3' - não traduzida do terminador OCS.
[152] O gene recombinante foi introduzido em um vetor T-DNA que contém um cassete marcador selecionável para resultar no vetor T-DNA 'P358S::APO1'.
[153] Usando técnicas de DNA recombinante padrão, as seguintes regiões de DNA foram operacionalmente ligadas: a. uma região promotora da Ubiquitina (PUbi); b. uma região de DNA que codifica TaAPO1; c. uma região de DNA representando a sequência 3' - não traduzida do terminador OCS.
[154] O gene recombinante foi introduzido em um vetor T-DNA que contém um cassete marcador selecionável para resultar no vetor T-DNA “PUbi::APOT1”.
[155] Usando técnicas de DNA recombinante padrão, as seguintes regiões de DNA foram operacionalmente ligadas: a. aregião promotora de cerca de 5kb de APO1 da variedade de trigo Westonia (SEQ ID NO: 4); b. uma região de DNA que codifica TaAPO1; c. uma região de DNA representando a sequência 3' - não traduzida do terminador OCS.
[156] O gene recombinante foi introduzido em um vetor T-DNA que contém um cassete marcador selecionável para resultar no vetor T-DNA “Papo1::APO1'.
[157] Os três vetores de T-DNA foram introduzidos no Agrobacterium compreendendo plasmídeos Ti auxiliares utilizando técnicas padrão e são utilizados na transformação do trigo essencialmente como descrito em Ishida et al. 2015 Agrobacterium protocols: Volume 1, Methods in Molecular Biology, vol. 1223 : 189-198. As variedades Chara ou Yitpi são diretamente transformadas, ou qualquer outra variedade é transformada e, em seguida, são utilizadas como doador para introduzir o gene recombinante na variedade Chara ou Yitpi por cruzamento e seleção. A variedade de trigo Fielder é usada como controle para a eficiência da transformação. Os transformantes da variedade Fielder também são fenotipados para avaliar o efeito da superexpressão do gene APO71 sobre as espiguetas por espiga. Os transformantes Fielder podem ser utilizados para introgressão do gene recombinante em Chara ou Yipti.
[158] Eventos independentes são obtidos de cada transformação e são fenotipados de acordo com o método descrito no Exemplo 1.
EXEMPLO 4 IDENTIFICAÇÃO DE HomóLoGos DE APOT Em TRIGO
[159] Utilizando a sequência nucleotídica do gene codificante de APO1 localizado no cromossomo 7A, podem ser detectadas sequências nucleotídicas homólogas que estão localizadas no cromossomo 7B e 7D, respectivamente, nos genomas de referência do trigo Chinese Spring. As sequências nucleotídicas para as regiões codificantes desses genes estão incluídas nas entradas da listagem de sequência de SEQ ID NO: 15 (7B Apo1) e 16 (7D Apo1), respectivamente. As sequências de aminoácidos estão incluídas nas entradas da listagem de sequência SEQ ID NO: 17 (7B Apo1l) e SEQ ID NO: 18 (7D Apo1). De acordo com um modelo de gene mais curto para 7B Apo1l, a sequência nucleotídica corresponde à SEQ ID NO: 15 do nucleotídeo 130 ao nucleotídeo 1452 e a sequência de aminoácidos corresponde à SEQ ID NO: 17 do aminoácido 45 ao aminoácido 483.
[160] As respectivas identidades de sequência das sequências nucleotídicas codificantes estão representadas na Tabela 3, enquanto as das sequências de aminoácidos das proteínas codificadas são encontradas na Tabela 4.
TABELA 3 % DE IDENTIDADE DE SEQUÊNCIA ENTRE GENES HomóLOGOS DE APoT7. E ass EE asa (SEQID NO: 1) | (SEQID NO: 15) | art do nt. 130) | (SEQ ID NO: 16)
FPESTINCENN
Apo1 7B curto CJ eS5, dE a STS at eedtBno 9 | an o e sr a e (SEQID NO: 15a 97 91 100 partir do nt 130) LeedtBNSÇ | o ss e TABELA 4 % DE IDENTIDADE DE SEQUÊNCIA ENTRE PROTEÍNAS APO1 CODIFICADAS PELOS GENES HoMOLÓGOS. Apo1 7B curto Apo1 7D
FPETPINIDDD sda | ee Apo1 7B curto ER co | = |») | partir do aa 45) B. ANÁLISE DE APOT EM LINHAGENS DE TRIGO DE INVERNO. EXEMPLO 1 MAPEAMENTO APROXIMADO DE UM QTL No CROMOSSOMO 7A QUE CONTROLA O
NÚMERO DE ESPIGUETAS POR ESPIGA
[161] Fenotipagem:
[162] Um estudo completamente replicado de 784 linhagens MAGIC F7 da população de trigo de inverno MAGIC de Mackay et al. (2014, G3-Genes Genomes Genetics, 4 (9): 1603-1610) e suas oito linhagens fundadoras foram cultivadas durante a temporada de campo 2013/2014. Dez espigas de trigo representativas foram coletadas em 1000 dos 1600 lotes no campo e secas à temperatura ambiente. A coleta foi realizada em um desenho parcialmente replicado com 200 RlLls e as linhagens parentais MAGIC coletadas em duplicatas. As espigas de trigo foram avaliadas quanto à característica morfológica do número total de espiguetas por espiga (abreviado como “SPS”).
[163] Em 2014/2015, um viveiro de 1091 linhagens MAGIC Fg e as linhagens fundadoras foram selecionadas para as mesmas características de espiga, usando uma amostra de seis espigas de trigo representativas por lote.
[164] O programa Asreml-R 3.0 (Gilmour et al. 1997, Journal of Agricultural Biological and Environmental Statistics Vol. 2 (3), 269-293) foi usado para minimizar ou remover efeitos espaciais nos dados do fenótipo devido à variação do campo. Enquanto o pacote de análise mpwgaim QTL permite um ajuste de um estágio de QTLs, os outros pacotes de análise QTL usados nesta pesquisa exigiram o cálculo prévio de traço BLUPS (Melhores previsões lineares não tendenciosas).
[165] O número total de espiguetas variou entre 18 e 30 espiguetas por espiga nas RlILs. As linhagens parentais MAGIC podem ser amplamente divididas em um grupo de fenótipo alto e baixo, com Soissons, Robigus e Brompton tendo um número reduzido de espiguetas em comparação com as cinco linhagens parentais do MAGIC (Figura 2). O fenótipo médio da Soissons é ainda mais baixo que das variedades Robigus e Brompton e apenas 2,6 espiguetas a mais que o fenótipo mínimo registrado nas Rils (linhagens endogâmicas recombinantes). O número total de espiguetas reduzido na variedade Soissons está relacionado ao fato de que, diferentemente das outras variedades, possui o alelo Ppd-D1 insensível ao fotoperíodo, que confere floração anterior e número de espiguetas reduzido (González et al, 2005, Euphytica 146 (3): 253-269). As outras sete linhagens parentais MAGIC não carregam esse alelo e, portanto, a base para o número reduzido de espiguetas em Robigus e Brompton não estava relacionada ao alelo Ppd-D1.
[166] Mapeamento genético:
[167] As análises de QTL foram conduzidas usando três metodologias diferentes: (i) usando regressão simples de médias com escores de marcador, enquanto contabiliza a estrutura em funil de cruzamento MAGIC (Mackay et al. 2014) usando o pacote R do Asreml-R (Gilmour, 1997), (ii) análise de rede bayesiana usando o pacote R do bnlearn (Scutari et al., 2014, Genetics, 198 (1): 129-137)) e (iii) mapeamento de intervalo médio de todo o genoma usando o pacote R de mpwgaim (Verbyla et a/l., 2014, G3, 4 (9): 1569- 1584)..
[168] Foram utilizados genótipos de marcadores e seus respectivos agrupamentos cromossômicos a partir de Gardner et al., 2016 (2016, Plant Biotechnol J, 14 (6):1406-1417).
[169] Todos os três métodos identificaram um QTL principal no cromossomo 7A entre 257,05 cM e 257,21 cM no MAGICmapv14.4, doravante denominado QTsn.jbl-7A (Tabela 5).
TABELA5
RESUMO DE QTLS SIGNIFICATIVOS IDENTIFICADOS PARA O NÚMERO TOTAL DE ESPIGUETAS (SPS) USANDO REGRESSÃO [17], ANÁLISE DE REDE BAYESIANA [23] ou MAPEAMENTO DE INTERVALO EM GENOMA AMPLO [22].
[170] O marcador de pico na análise de regressão é o marcador com o valor p mais baixo ou conjunto mais baixo. Marcadores significativos podem se estender para longe do marcador de pico mostrado. Mpwgaim relata valores de p < 0,0005 como 0. Valores q da regressão de O São < 2,2E-16. Abreviações: Cromossomo (chr) e centiMorgan (cM).
Método eee cador esq. & oM Ao ratsão dam Broa oM o
Método coa cador esq. & oM Reoressão adam Direta oM dao ' Bnieam STbag aa PTOS A 2 mpwaei |BS00066288 51 g Pao 1,00E-03 gsapossso e 1,9
[171] Informações de marcador CAP7 c2350 105 (https://triticeaetoolbox.org/wheat/view.php?table=markers&name=CAP7 c235 0 105) TAGTAAGCTCTTCAACGAGGATGGATGTTGTGTAATTTGGACAAGTGCGA|[ C/ITIGTATGTCACATCTTTTTTTTAATGATCCTAATCTATGATCGAAGTTCOGTT (SEQ ID NO: 23).
wsnp Ku rep c104159 90704469 https://triticeaetoolbox.org/wheat//view.php?table=markers&name =IWA7409
TGCCGGCCTGCAAGCCGATCCTTACTCCAAARTGGGTTGTCTCGGTGTTTT TCCTTGTCGGCGTCGTCTTTGTCCCAGTTGGTGTCGTTTCGCTACTAGCI[C/ T]gcacaagatgttgttagagatcattgatceggtatgatcatgcatgtgteccacctaacatgactgataacaaget tgcgtacatccagaatgagactatac (SEQ ID NO: 24).
- Marcador BS00021657 51 https://triticeaetoolbox.org/wheat//view.php?table=markers&name =BS00021657 51
TCCACAAGAAAAGAGCAAGACACTCCGGCCGTTGTAGAGCTGATGGTGCG [C/-TIGGTGATTTCACCATAGACATGGTAGACGGCGCCCGTCCTCGTGGCAT CAT (SEQ ID NO: 25).
- Marcador BS00066288 51 https://triticeaetoolbox.org/wheat///view.php?table=markers&name =BS00066288 51
GGCACGTACTCCCTTTCAGGACCCGACGAACAACGGCAATTCAGGTAAAT[ A/GJCATACATCACGTACTCTTACATACTTCAATCTTGTAAATCCATAATATAT (SEQ ID NO: 26).
- Marcador BS00039502 51 https://triticeaetoolbox.org/wheat//view.php?table=markers&name =BS00039502 51
ATCCCAGGGGGCGAGATTCAGAGCTTCTCGGCCATCCTGCGCAGCAGCG CIA/GJGCCCoTAGTGGCTCCTCGGTCGGGTTCTTGGTGAGCCATGCCTGC GCGGC (SEQ ID NO: 27).
[172] QTsn.jbl-7A explica uma notável variação genética de 35% no SPS na população MAGIC em um -log1o (p) de 62,64 usando mpwgaim. Os fenótipos de espiguetas coletados no viveiro MAGIC em 2015 confirmaram a presença do QTL com um -logio(p) de 37,82 para o SPS usando mpwgaim (Tabela 6).
TABELA 6
RESULTADOS DO QTL PWGAIM PARA O NÚMERO TOTAL DE ESPIGUETAS DO VIVEIRO MAGIC DE 2015.ABREVIAÇÕES: LOGP É -LOG10(P),% VAR É A PORCENTAGEM DE VARIAÇÃO GENÉTICA EXPLICADA. CROMOSSO MARCADOR Dist. MARCADOR Dist. Pro % & MO ESQUERDO (cM) DIREITO (cM) b var O 7A CAP7 c2350 105 257,05 BSO00021657 51 257,21 O 192 E
[173] Os haplótipos da Brompton e Robigus causam uma redução relativa do SPS das progênies em mais de 1,5 espiguetas em 2014 e 2015 (Tabela 7).
TABELA7 RESUMO DO QTL DO NÚMERO TOTAL DE ESPIGUETAS POR ESPIGA PARA QTSN.JBL- 7A.
[174] Dados dos testes em campo do 2014 NIAB MAGIC utilizados. Efeitos do haplótipo parental estimados em RIL BLUPSs a partir da análise mpwgaim. Abreviações: LOGP é —logio(p). 2 e O são códigos de alelo para os respectivos marcadores exibidos. Fund Efeitos Probabilidade LOGPdo %var. LO CAP7 c23wsnp Ku rep c104 ador fundador Fundador Fundador explicada GP 50 105 159 90704469 ny 0,634 0,083 1,08 35 & 2(6S) O (AA) ton -1,607 o 5,31 O (AA) 2(GG) Claire — 0,566 0,102 0,99 2(GG) O (AA) Hera 0,559 0,065 1,19 2(GG) O (AA) Rialto — 0,242 0,273 0,56 2(GG) O (AA) Robia 1,766 o 6,14 O (AA) 2(GG) SN 001 0,489 0,31 2(GG O (AA) Xi-19/ 1,007 0,005 2,31 2(GG) O (AA)
[175] O intervalo de mapeamento genético de 0,16 cM corresponde a um comprimento físico previsto de cerca de 2,3Mb e os marcadores flanqueadores CAP7 c2350 105 (SEQ ID NO: 23) e wsnp Ku rep c104159 90704469 (SEQ ID NO: 24). O número total de espiguetas aumentado se cossegregou mais estreitamente com o marcador wsnp Ku rep c104159 90704469.
[176] Além do QTsnjbl-7A, a análise QTL com mpwgaim confirmou outro QTL em 7B (QTsn.jbl-7B) para o número total de espiguetas em 2014 (LOGP 3,07) entre os marcadores flanqueadores BS00066288 51 (144,34 cM; SEQ ID NO: 26) e BS00039502 51 (144,50 cM; SEQ ID NO: 27), que definem um intervalo de 5Mb diretamente homólogo ao QTL de 7A (consulte a Tabela 8).
TABELA 8 REeEsuMO DO QTL DO NÚMERO TOTAL DE ESPIGUETAS POR ESPIGA PARA QTSN.JBL- 7B.
[177] Dados dos testes em campo do 2014 MAGIC utilizados.
Efeitos do haplótipo parental estimados em RIL BLUPs a partir da análise mpwgaim. Abreviações: LOGP é —log1io(p). 2 e O são códigos de alelo para os respectivos marcadores exibidos. Funda Efeitos — Probabilidade LOGPdo —%var — Lo B3990395 ESaao6s? dor fundador Fundador Fundador explicada GP “— - mo los 0a ae as 3 onmnoommo o -0,198 0,12 0,92 O(TT) O(TT) Claire /0,283 0,048 1,32 2(CC) O(TT) Here -0,043 0,395 04 O(TT) O(TT) Rialto -0,052 0,365 0,44 O(TT) 2(CC) Robigu -0,12 0,214 0,67 O(TT) 2(CC) Soisso 9,187 0,11 0,96 O(TT) O(TT) Xi19 0,289 0,044 1,36 2(CC) O(TT) EXEMPLO 2 IDENTIFICAÇÃO DO GENE CANDIDATO APO1
[178] 25 genes candidatos no QTsn.jbl-7A
[179] Dentro deste intervalo de 2,3 Mb, 25 genes foram anotados. A identificação ortóloga revelou sete genes com ortólogos e funções bem anotados: g109255 (AtFTT/AtDTX35), 9109235 (AtRAN1), g109240 (AtCHLI), 9109250 (AtAAH), 9109253 (AtSYP132), g 109256 (AtALIS4) e 9109251 (AtUFO). O AtUFO é o ortólogo do APO1 de arroz (ABERRANT PANICLE ORGANIZATION 1). Outros dez genes tiveram anotações redundantes como proteínas F-box relacionadas com At5g07610. Cada um continha um domínio F-box e exibia uma considerável conservação de sequência de DNA de até 72,5% entre si.
[180] A análise de sintenia de QTsn.jbl-7A revela APO1 como um gene candidato
[181] Além do QTsnjbl-rA (Tabela 8), a análise QTL com mpwgaim confirmou outro QTL em 7B (QTsn.jbl-7B) para o número total de espiguetas em 2014 (LOGP 3,07) entre os marcadores flanqueadores
BSO00066288 51 (144,34 cM) e BSOO039502 51 (144,50 cM), que definem um intervalo de 5Mb diretamente homólogo ao QTL de 7A.
[182] Dentro do intervalo de 5Mb do QTL em 7B (QTsn.jbl-7B), foram identificados 39 genes, dos quais 15 eram homólogos de 7A (Figura 4). Dos genes homólogos, nenhum possui uma mutação deletéria identificável da sequência codificante, como previsto com o PROVEAN, o que poderia explicar ambos QTLs.
[183] QTsnjbl-7A e QTsn.jbl-7B são sintênicos ao cromossomo 6 do arroz, que contém quatro ortólogos posicionalmente conservados, chr7A.9109235 (AtRAN1), g109250 (AtAAH), 9109251 (APO1/AtUFO) e 9109256 (AtALIS4).
[184] Polimorfismos de sequência de TaAPO1-7A segregam juntamente com QTsn.jbl-7A
[185] TaAPO1-7A tem dois grandes indels a montante do sítio de início da transcrição previsto na Robigus em comparação com Claire e Chinese Spring: uma deleção de 115 pb a 565 pb a montante e uma inserção de cerca de 5-7,5 Kb (7343 pb, mas 4970 pb, excluindo N/X-runs, o tamanho varia com base na qualidade da sequência de referência usada) a cerca de 7 Kb (7565 pb a montante do sítio de início da transcrição, e 7513 pb a montante do códon de início por referência à sequência de SEQ ID NO: 1 (sequência de ref. CS)) a montante do sítio de início da transcrição (TSS, do inglês transcription start site). À deleção de 115 pb também está presente nas variedades de trigo Cadenza e Paragon, segregando junto com BAOO0589872 no arranjo de reprodutores para genotipagem em trigo de 35k (35k Breeders array). A inserção longa em Robigus, Cadenza e Paragon, de cerca de 7 Kb a montante do TSS, é mais difícil de caracterizar devido a algumas chamadas de base ausentes nas montagens TGAC de Robigus, Cadenza e Paragon, mas uma inserção grande semelhante (> 5Kb) também está presente nas variedades Yitpi e Chara. O promotor da Claire carrega uma caixa CArG (CC(A/T);SGG) 2346 pb a montante, que está ausente na Robigus. A inserção de cerca de 5-7,5 kb também carrega uma caixa de CArG (CArG-box) (Figura 3). Além disso, a variante Robigus tem os mesmos SNPs e indels que as variedades YiptiChara na Tabela 2, enquanto a variedade Claire tem os mesmos SNP'ss e indels que a variedade Westonia na Tabela 2.
[186] Ao comparar a sequência nucleotídica de cerca de 5 kb a montante do gene APO1 em outras linhagens de trigo, as variações mostradas na Tabela 2 também foram encontradas em Robigus, Claire, Cadenza, Paragon e Fielder. Claire tem os mesmos SNP's e alelos indel que a variedade Westonia, e a variedade Fielder tem os mesmos SNPs e alelos indel que a variedade Baxter. Robigus, Cadenza e Paragon têm os mesmos alelos SNP e indel que Yitpil/Chara. Isso confirma que as sequências dos genótipos das variedades de trigo de inverno com um número baixo de espiguetas por espiga carecem de cerca de 115 pb em comparação com as sequências dos genótipos a partir das variedades de trigo de inverno com um número elevado de espiguetas por espiga de cerca de 500 pb a montante do sítio de início da tradução (pelo sítio de início da tradução na sequência de referência de SEQ ID NO: 1). É esperado que essa deleção do promotor explique o nível de expressão mais baixo medido nessas linhagens. À inserção de cerca de 5-7,5 a montante identificada nas variedades Robigus, Cadenza e Paragon (7565 pb a montante do TSS) também é comum na Yítoi e Chara.
[187] As alterações de aminoácidos (F20C, D357N) associadas aos SNPs em TaAPO1-7A na Robigus são previstas pelo PROVEAN como não deletérias.
EXEMPLO 3 EXPRESSÃO DE TAAPO1-7A CORRELACIONADA COM O NÚMERO TOTAL DE
ESPIGUETAS
[188] Três replicatas de amostras de espiga inteira foram coletadas a partir de dissecções de perfilhos do NIAB MAGIC Nursery 2017 em estágio de crescimento gS32 (Zadoks et al., 1974, Weed Research, 14 (6): 415-421) para as variedades parentais do MAGIC; Alchemy, Brompton, Claire, Hereward, Rialto Robigus e Xi-19. Na data da coleta, Soissons havia avançado para estágio gS34. Após a dissecção, as espigas foram imediatamente congeladas em nitrogênio líquido.
Os iniciadores (primers) foram projetados usando o plug-in Primer3 (Koressaar et al., 2007, Bioinformatics, 23 (10): 1289- 1291) no programa Geneious.
As amostras foram homogeneizadas duas vezes enquanto congeladas com esferas de aço inoxidável de 5 mm no TissueLyser ll (QIAGEN, Reino Unido) a 20Hz por dois minutos.
O RNA foi extraído usando o kit de extração RNeasy Micro (QIAGEN, Reino Unido) e a digestão do DNA foi realizada na coluna usando o conjunto de DNase livre de RNase (QIAGEN, Reino Unido). O RNA foi eluído usando água livre de RNase/DNase e a concentração determinada usando o espectrofotômetro NanoDrop 71000 (Thermo Scientific, Reino Unido). Uma segunda digestão de DNA foi realizada usando ezDNase (Invitrogen, Reino Unido), seguida de síntese de cDNA a partir de 500 ng de RNA usando o kit de síntese de cDNA, SuperScript IV Vilo Master Mix (Invitrogen, Reino Unido). A RT-qPCR foi realizada usando o Kit Rotor-Gene SYBR Green PCR em um instrumento para PCR em tempo real Rotor-Gene Q equipado com um Rotor-Disc 100 (QIAGEN, Reino Unido). Todas as reações foram realizadas como duplicatas técnicas em 10 ul de volume final de reação, para a solução de betaína APO1 (Sigma-Aldrich) foi adicionada a uma concentração final de 1M para superar o alto teor de GC nos amplicons.
As eficiências de amplificação dos pares de iniciadores foram determinadas através da realização de uma diluição seriada de oito pontos de amostras de cDNA.
Para confirmar a especificidade das reações de RT-qPCR, as curvas de fusão para cada reação foram verificadas quanto à presença de apenas um único pico.
A especificidade dos ensaios foi confirmada contra o
DNA nulo tetrassômico -genômico obtido da Seedstor.ac.uk (WPGS1289-PG-1, WPGS1296-PG-1, WPGS1301-PG-1). Os níveis de expressão de APO1 foram calculados em relação à expressão dos genes housekeeping para controle interno TaRP15 (Shaw et al., 2012, Plant J, 71 (1): 71-84) e Ta2291 (Paolacci et al., 2009, BMC Molecular Biology, 10 (1): 11) usando as eficiências de amplificação calculadas para cada ensaio.
[189] A expressão de TaAPO1 na variedade Xi-19 foi considerada a mais alta entre todas as variedades fundadoras do MAGIC. O haplótipo Xi-19 também está associado de forma estatisticamente significativa a um efeito fundador positivo no QTsn.jbl-7A em 2014 (Tabela 8).
[190] A Figura 5 mostra os resultados do nível de expressão de APOT1 nos genótipos estudados. As linhagens contrastantes Brompton e Xi-19 têm uma diferença de até 3,8 vezes na abundância de transcritos de APOT1.

Claims (30)

REIVINDICAÇÕES
1. PROTEÍNA envolvida na determinação do número de espiguetas por espiga em trigo caracterizada por ser ortóloga à “Aberrant panicle organization 1” (Apo1) de arroz.
2. PROTEÍNA, de acordo com a reivindicação 1, caracterizada por compreender uma sequência de aminoácidos selecionada a partir de: a. uma sequência de aminoácidos de SEQ ID NO: 3, 8 ou 29 ou uma variante funcional da mesma, ou b. uma sequência de aminoácidos possuindo pelo menos 85% de identidade de sequência com a sequência de aminoácido de SEQ ID NO: 3, 8 ou 29, ou uma variante funcional da mesma.
3. ÁCIDO NUCLEICO ISOLADO, caracterizado por codificar a proteína de acordo com a reivindicação 1 ou 2.
4, ÁCIDO NUCLEICO ISOLADO, de acordo com a reivindicação 3, caracterizado por compreender uma sequência nucleotídica selecionada a partir de: a. uma sequência nucleotídica de qualquer uma das SEQ ID NO: 1 ou SEQ ID NO: 2,2, b. uma sequência nucleotídica com pelo menos 80% de identidade de sequência com a sequência de ácido nucleico de qualquer uma das SEQ ID NO: 1 ou SEQ ID NO: 2; c. a sequência nucleotídica de SEQ ID NO: 6, 7 ou 28; d. um ácido nucleico com uma sequência complementar a qualquer um dos ácidos nucleicos de a) ou b).
5. ÁCIDO NUCLEICO, de acordo com as reivindicações 3 ou 4, caracterizado por se localizar dentro de um intervalo no cromossomo 7A do trigo, compreendendo a sequência nucleotídica compreendida entre o nucleotídeo na posição 674.081.462 e o nucleotídeo na posição 674.082.918 da sequência genômica de referência da variedade Chinese Spring.
6. GENE RECOMBINANTE, caracterizado por compreender um promotor expressável em planta, tal como um promotor expressável por planta heteróloga, operacionalmente ligado a uma sequência de ácido nucleico que codifica a proteína da reivindicação 1 ou 2 e, opcionalmente, uma sequência de término da transcrição e poliadenilação, de preferência uma região de término da transcrição e poliadenilação funcional em plantas.
7. GENE RECOMBINANTE, de acordo com a reivindicação 6, caracterizado pelo referido ácido nucleico ser selecionado dentre: a. uma sequência de ácido nucleico com uma sequência de nucleotídeos de qualquer uma das SEQ ID NO: 1, 2 ou SEQ ID NO: 28, b. uma sequência de ácido nucleico com pelo menos 80% de identidade de sequência com a sequência de ácido nucleico de qualquer uma das SEQ ID NO: 1, 2 ou SEQ ID NO: 2 8; ou c. um ácido nucleico com uma sequência complementar a qualquer um dos ácidos nucleicos de a) ou b).
8. GENE RECOMBINANTE, de acordo com a reivindicação 6 ou 7, caracterizado pelo referido promotor expressável em planta ser selecionado a partir do grupo que consiste em promotor constitutivo, promotor induzível, promotor tecido-especiífico.
9. GENE RECOMBINANTE, de acordo com qualquer uma das reivindicações de 6 a 8, caracterizado pelo referido promotor expressável em planta ser um promotor CaMV35S ou um promotor da Ubiquitina.
10. VETOR, caracterizado por compreender o gene recombinante de qualquer uma das reivindicações de 6 a 9.
11. — CÉLULA HOSPEDEIRA, caracterizada por compreender o gene recombinante de qualquer uma das reivindicações de 6 a 9 ou o vetor da reivindicação 10.
12. CÉLULA HOSPEDEIRA, de acordo com a reivindicação 11, caracterizada por ser uma bactéria ou célula de planta de trigo.
13. — PLANTA, PARTE DE PLANTA OU SEMENTE DE TRIGO, caracterizada por consistir das células vegetais de acordo com a reivindicação
12.
14. MÉTODO PARA PRODUZIR uma planta de trigo com número alterado de espiguetas por espiga, caracterizado por compreender a etapa de alterar a abundância da proteína de acordo com a reivindicação 1 ou 2 dentro da referida planta de trigo.
15. MÉTODO, de acordo com a reivindicação 14, caracterizado pela abundância da referida proteína ser aumentada e o número de espiguetas por espiga ser aumentado em comparação com o número de espiguetas por espiga da referida planta de trigo onde a abundância da referida proteína não é alterada.
16. MÉTODO, de acordo com a reivindicação — 14, caracterizado pela abundância da referida proteína ser diminuída e o número de espiguetas por espiga ser diminuído em comparação com o número de espiguetas por espiga da referida planta de trigo onde a abundância da referida proteína não é alterada.
17. MÉTODO, de acordo com a reivindicação 14 ou 15, caracterizado pela abundância da referida proteína ser aumentada pelo fornecimento à referida planta de trigo de: a. o gene recombinante de acordo com qualquer uma das reivindicações 6 a 9, ou b. um gene heterólogo que codifica a proteína de acordo com a reivindicação 1 ou 2, em que o referido gene heterólogo é expresso em um nível maior do que o gene endógeno correspondente.
18. MÉTODO, de acordo com a reivindicação — 17, caracterizado pelo referido gene heterólogo compreender em cerca de 500 pb a montante do início da tradução, uma sequência nucleotídica com os nucleotídeos da posição 4399 à posição 4513 da SEQ ID NO: 5 ou uma sequência nucleotídica que possui pelo menos 90% de identidade de sequência com a mesma.
19. MÉTODO, de acordo com a reivindicação 14 ou 16, caracterizado pela abundância da referida proteína ser diminuída pelo fornecimento à referida planta de trigo de: a. um gene heterólogo que codifica a proteína de acordo com a reivindicação 1 ou 2, em que o referido gene heterólogo é expresso em um nível menor do que o gene endógeno, ou b. um alelo mutante do gene endógeno que codifica a proteína de acordo com a reivindicação 1 ou 2.
20. MÉTODO, de acordo com a reivindicação — 19, caracterizado pelo referido gene heterólogo ser expresso em um nível inferior devido à ausência da sequência nucleotídica da posição nucleotídica 4399 até a posição nucleotídica 4513 da SEQ ID NO: 5.
21. MÉTODO, de acordo com a reivindicação 19, caracterizado pelo referido alelo mutante ser um alelo nocauteado (knock out).
22. MÉTODO, de acordo com qualquer uma das reivindicações de 17 a 21, caracterizado pela referida etapa de fornecimento compreender o fornecimento por transformação, cruzamento, retrocruzamento, introgressão, edição do genoma ou mutagênese.
23. — PRODUTO DE TRIGO produzido a partir da semente da reivindicação 13, caracterizado pelo referido produto de trigo compreender ou ser farelo, sementes trituradas, farinha ou flocos.
24. PRODUTO DE TRIGO, de acordo com a reivindicação 23, caracterizado por compreender um ácido nucleico artificial que produz um amplicon diagnóstico ou ser específico para a sequência nucleotídica de qualquer uma das SEQ ID NOs: 1, 2, 6, 7 ou 28 ou uma sequência que é pelo menos 80% idêntica a qualquer uma dessas sequências.
25. — MÉTODO PARA PRODUZIR o produto de trigo, de acordo com a reivindicação 23, caracterizado por compreende a obtenção de sementes compreendendo um ácido nucleico artificial derivado da sequência nucleotídica de qualquer uma das SEQ ID NOs: 1, 2, 6, 7 ou 28 ou uma sequência que é pelo menos 80% idêntica com qualquer uma dessas sequências, e produzir o referido produto de trigo a partir das sementes.
26. MÉTODO PARA PRODUZIR farinha, farelo integral, amido, grânulos de amido ou farelo de trigo, caracterizado por compreender a obtenção da semente de acordo com a reivindicação 13 compreendendo um ácido nucleico Apo1 artificial e processando a semente para produzir farinha, farelo integral, amido, grânulos de amido ou farelo de trigo.
27. — FARINHA, FARELO INTEGRAL, AMIDO, GRÂNULOS DE AMIDO OU FARELO DE TRIGO, caracterizados por serem produzidos pelo método de acordo com a reivindicação 26, ou compreenderem um ácido nucleico artificial derivado da sequência de nucleotídeos de qualquer uma das SEQ ID NOs: 1, 2, 6, 7, ou 28 ou uma sequência que é pelo menos 80% idêntica a qualquer uma dessas sequências.
28. MÉTODO PARA PRODUZIR um produto alimentício, caracterizado por compreender a mistura da semente de acordo com a reivindicação 13 ou a farinha, farinha integral, amido, grânulos de amido ou farelo de trigo de acordo com a reivindicação 27 com pelo menos outro ingrediente alimentar para produzir o produto alimentício.
29. — MÉTODO PARA IDENTIFICAR E/OU SELECIONAR UMA PLANTA DE TRIGO que compreende um alelo de um gene que contribui positivamente com o número de espiguetas por espiga, caracterizado pelo método compreender a etapa de identificar no genoma da referida planta de trigo a presença de um ácido nucleico com a sequência nucleotídica de SEQ ID NO: 5 a partir da posição nucleotídica 4399 até a posição nucleotídica 4513, ou uma sequência nucleotídica que possui pelo menos 90% de identidade de sequência com a mesma.
30. — MÉTODO PARA IDENTIFICAR E/OU SELECIONAR UMA PLANTA DE TRIGO que compreende um alelo de um gene que contribui negativamente com o número de espiguetas por espiga, caracterizado pelo método compreender a etapa de identificar no genoma da referida planta de trigo a ausência de um ácido nucleico com a sequência nucleotídica de SEQ ID NO: 5 a partir da posição nucleotídica 4399 até a posição nucleotídica 4513.
BR112020014168-2A 2018-01-12 2019-01-11 Proteína, ácido nucleico isolado, gene recombinante, vetor, célula hospedeira, planta, parte de planta ou semente de trigo, métodos para produzir, produto de trigo, farinha, farelo integral, amido, grânulos de amido ou farelo de trigo e métodos para identificar e/ou selecionar uma planta de trigo BR112020014168A2 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP18151436 2018-01-12
EP18151432.4 2018-01-12
EP18151436.5 2018-01-12
EP18151432 2018-01-12
PCT/EP2019/050711 WO2019138083A1 (en) 2018-01-12 2019-01-11 Gene underlying the number of spikelets per spike qtl in wheat on chromosome 7a

Publications (1)

Publication Number Publication Date
BR112020014168A2 true BR112020014168A2 (pt) 2020-12-08

Family

ID=65023906

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020014168-2A BR112020014168A2 (pt) 2018-01-12 2019-01-11 Proteína, ácido nucleico isolado, gene recombinante, vetor, célula hospedeira, planta, parte de planta ou semente de trigo, métodos para produzir, produto de trigo, farinha, farelo integral, amido, grânulos de amido ou farelo de trigo e métodos para identificar e/ou selecionar uma planta de trigo

Country Status (8)

Country Link
US (1) US20200362366A1 (pt)
EP (1) EP3737690A1 (pt)
CN (1) CN111566121A (pt)
AU (1) AU2019207409B2 (pt)
BR (1) BR112020014168A2 (pt)
CA (1) CA3086620A1 (pt)
MX (1) MX2020007466A (pt)
WO (1) WO2019138083A1 (pt)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11866719B1 (en) * 2018-06-04 2024-01-09 Inari Agriculture Technology, Inc. Heterologous integration of regulatory elements to alter gene expression in wheat cells and wheat plants
CN111118191B (zh) * 2019-09-30 2022-04-22 山西农业大学 小麦穗顶部小穗结实性主效qtl的kasp分子标记及其应用
CN112779350A (zh) * 2021-02-07 2021-05-11 四川农业大学 与小麦小穗粒数QTLQGns.sicau-2D紧密连锁的分子标记及其应用
CN114410817B (zh) * 2022-01-10 2022-11-01 河北师范大学 小麦每穗小穗数性状相关snp位点及其应用
CN115044697B (zh) * 2022-05-31 2023-03-21 江苏省农业科学院 与小麦籽粒don毒素积累相关的分子标记及其引物与应用
CN116769961B (zh) * 2023-07-28 2024-01-26 四川农业大学 利用多-筛-混-定四步法开发的小麦每穗小穗数qtl连锁分子标记及应用

Family Cites Families (86)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4601978A (en) 1982-11-24 1986-07-22 The Regents Of The University Of California Mammalian metallothionein promoter system
US5352605A (en) 1983-01-17 1994-10-04 Monsanto Company Chimeric genes for transforming plant cells using viral promoters
DE3484215D1 (de) 1983-01-17 1991-04-11 Monsanto Co Chimaerische gene geeignet zur expression in pflanzenzellen.
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
US5359142A (en) 1987-01-13 1994-10-25 Monsanto Company Method for enhanced expression of a protein
US5196525A (en) 1987-01-13 1993-03-23 University Of British Columbia DNA construct for enhancing the efficiency of transcription
US5164316A (en) 1987-01-13 1992-11-17 The University Of British Columbia DNA construct for enhancing the efficiency of transcription
US5322938A (en) 1987-01-13 1994-06-21 Monsanto Company DNA sequence for enhancing the efficiency of transcription
ES2060765T3 (es) 1988-05-17 1994-12-01 Lubrizol Genetics Inc Sistema promotor de ubiquitina en plantas.
US5641876A (en) 1990-01-05 1997-06-24 Cornell Research Foundation, Inc. Rice actin gene and promoter
FR2673642B1 (fr) 1991-03-05 1994-08-12 Rhone Poulenc Agrochimie Gene chimere comprenant un promoteur capable de conferer a une plante une tolerance accrue au glyphosate.
AU672760B2 (en) 1991-09-24 1996-10-17 Keygene N.V. Selective restriction fragment amplification: a general method for DNA fingerprinting
US5436150A (en) 1992-04-03 1995-07-25 The Johns Hopkins University Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease
ATE207962T1 (de) 1992-04-13 2001-11-15 Syngenta Ltd Dna-konstruktionen und diese enthaltende pflanzen
JPH08510375A (ja) 1993-02-12 1996-11-05 ザ・ジョンズ−ホプキンス・ユニバーシティー フラボバクテリウム・オケアノコイテス(foki)制限エンドヌクレアーゼの機能ドメイン
US5512483A (en) 1993-05-21 1996-04-30 Mcgill University Expression vectors responsive to steroid hormones
US5464758A (en) 1993-06-14 1995-11-07 Gossen; Manfred Tight control of gene expression in eucaryotic cells by tetracycline-responsive promoters
AU689311B2 (en) 1994-08-30 1998-03-26 Commonwealth Scientific And Industrial Research Organisation Plant transcription regulators from circovirus
NZ291734A (en) 1994-08-30 1997-09-22 Commw Scient Ind Res Org Plant transcription regulators from circovirus; isolated nucleic acid molecules and transgenic plants
PL323587A1 (en) 1995-05-26 1998-04-14 Zeneca Ltd Gene changing-over system including edisone receptor
ES2397323T3 (es) 1996-06-20 2013-03-06 The Scripps Research Institute Promotores del virus del mosaico de las nervaduras de la mandioca y sus usos
FR2771104B1 (fr) 1997-11-17 2000-12-08 Rhone Poulenc Agrochimie Gene chimere ayant un promoteur lumiere dependant conferant la tolerance aux inhibiteurs del'hppd
US6063985A (en) 1998-01-28 2000-05-16 The Rockefeller University Chemical inducible promotor used to obtain transgenic plants with a silent marker
US6784340B1 (en) 1998-01-28 2004-08-31 The Rockefeller University Chemical inducible promoter used to obtain transgenic plants with a silent marker
EP1259537A4 (en) 2000-02-24 2004-05-12 Salk Inst For Biological Studi GENE EXPRESSION SYSTEM BASED ON CHIMERAL RECEPTORS
US6291666B1 (en) 2000-05-12 2001-09-18 The United States Of America As Represented By The Secretary Of Agriculture Spike tissue-specific promoter
DE10131786A1 (de) 2001-07-04 2003-01-16 Sungene Gmbh & Co Kgaa Rekombinationssysteme und Verfahren zum Entfernen von Nukleinsäuresequenzen aus dem Genom eukaryotischer Organismen
NZ514547A (en) 2001-09-28 2004-10-29 Duncan Stanley Plastid alph-amylase protein and nucleic acids encoding same and methods for altering the starch content of a plant
EP1504092B2 (en) 2002-03-21 2014-06-25 Sangamo BioSciences, Inc. Methods and compositions for using zinc finger endonucleases to enhance homologous recombination
FR2848571A1 (fr) 2002-12-12 2004-06-18 Bayer Cropscience Sa Cassette d'expression codant pour une hydroxy-phenyl pyruvate dioxygenase et plantes contenant un tel gene tolerantes aux herbicides
JP2006518372A (ja) 2003-01-28 2006-08-10 セレクティス 脊椎動物の体組織においてエクスビボかつイントトで相同的組換えを誘発するためのメガヌクレアーゼの使用およびその応用
US8106180B2 (en) 2003-08-07 2012-01-31 Whitehead Institute For Biomedical Research Methods and products for expression of micro RNAs
WO2005035769A2 (en) 2003-10-09 2005-04-21 E. I. Du Pont De Nemours And Company Gene silencing by using micro-rna molecules
JP2005278499A (ja) * 2004-03-30 2005-10-13 Japan Science & Technology Agency 植物の茎頂分裂組織の転換の時間的制御に関わる新規遺伝子、及びその利用
CA2593238C (en) 2005-01-07 2014-11-18 State Of Oregon Acting By And Through The State Board Of Higher Education On Behalf Of Oregon State University Method to trigger rna interference
CA2603177C (en) 2005-04-04 2016-01-26 Bayer Bioscience N.V. Methods and means for removal of a selected dna sequence
DK2341149T3 (en) 2005-08-26 2017-02-27 Dupont Nutrition Biosci Aps Use of CRISPR-associated genes (Cas)
EP3795682A3 (en) 2005-10-18 2021-06-16 Precision Biosciences Rationally designed meganucleases with altered sequence specificity and dna-binding affinity
US20100223691A1 (en) 2007-06-22 2010-09-02 Keygene N.V. Targeted nucleotide exchange with improved modified oligonucleotides
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
KR102110725B1 (ko) 2009-12-10 2020-05-13 리전츠 오브 더 유니버스티 오브 미네소타 Tal 이펙터-매개된 dna 변형
CA2790211C (en) 2010-03-08 2020-06-09 Monsanto Technology Llc Methods and compositions for delivering polynucleotides into plants
EP2392208B1 (en) 2010-06-07 2016-05-04 Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Fusion proteins comprising a DNA-binding domain of a Tal effector protein and a non-specific cleavage domain of a restriction nuclease and their use
CA2802822A1 (en) 2010-06-15 2012-01-05 Cellectis Method for improving cleavage of dna by endonuclease sensitive to methylation
WO2012093833A2 (en) 2011-01-03 2012-07-12 Toolgen Incorporation Genome engineering via designed tal effector nucleases
US9315788B2 (en) 2011-04-05 2016-04-19 Cellectis, S.A. Method for the generation of compact TALE-nucleases and uses thereof
CN104080462B (zh) 2011-12-16 2019-08-09 塔尔盖特基因生物技术有限公司 用于修饰预定的靶核酸序列的组合物和方法
GB201122458D0 (en) 2011-12-30 2012-02-08 Univ Wageningen Modified cascade ribonucleoproteins and uses thereof
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
PE20190844A1 (es) 2012-05-25 2019-06-17 Emmanuelle Charpentier Modulacion de transcripcion con arn de direccion a adn generico
JP6293660B2 (ja) * 2012-07-06 2018-03-14 国立研究開発法人農業・食品産業技術総合研究機構 着粒数が増加したコムギ及びその生産方法、並びにコムギの着粒数を増加させるための薬剤
WO2014022702A2 (en) 2012-08-03 2014-02-06 The Regents Of The University Of California Methods and compositions for controlling gene expression by rna processing
KR101656237B1 (ko) 2012-10-23 2016-09-12 주식회사 툴젠 표적 DNA에 특이적인 가이드 RNA 및 Cas 단백질을 암호화하는 핵산 또는 Cas 단백질을 포함하는, 표적 DNA를 절단하기 위한 조성물 및 이의 용도
SG10202107423UA (en) 2012-12-06 2021-08-30 Sigma Aldrich Co Llc Crispr-based genome modification and regulation
WO2014093479A1 (en) 2012-12-11 2014-06-19 Montana State University Crispr (clustered regularly interspaced short palindromic repeats) rna-guided control of gene regulation
US8993233B2 (en) 2012-12-12 2015-03-31 The Broad Institute Inc. Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains
EP2848690B1 (en) 2012-12-12 2020-08-19 The Broad Institute, Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
EP3252160B1 (en) 2012-12-12 2020-10-28 The Broad Institute, Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
SG10201801969TA (en) 2012-12-12 2018-04-27 Broad Inst Inc Engineering and Optimization of Improved Systems, Methods and Enzyme Compositions for Sequence Manipulation
ES2701749T3 (es) 2012-12-12 2019-02-25 Broad Inst Inc Métodos, modelos, sistemas y aparatos para identificar secuencias diana para enzimas Cas o sistemas CRISPR-Cas para secuencias diana y transmitir resultados de los mismos
EP2931899A1 (en) 2012-12-12 2015-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
US20140310830A1 (en) 2012-12-12 2014-10-16 Feng Zhang CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes
ES2883590T3 (es) 2012-12-12 2021-12-09 Broad Inst Inc Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas
US20140242664A1 (en) 2012-12-12 2014-08-28 The Broad Institute, Inc. Engineering of systems, methods and optimized guide compositions for sequence manipulation
SG11201504621RA (en) 2012-12-17 2015-07-30 Harvard College Rna-guided human genome engineering
AU2014207618A1 (en) 2013-01-16 2015-08-06 Emory University Cas9-nucleic acid complexes and uses related thereto
WO2014190181A1 (en) 2013-05-22 2014-11-27 Northwestern University Rna-directed dna cleavage and gene editing by cas9 enzyme from neisseria meningitidis
EP3004349B1 (en) 2013-05-29 2018-03-28 Cellectis S.A. A method for producing precise dna cleavage using cas9 nickase activity
CA2915837A1 (en) 2013-06-17 2014-12-24 The Broad Institute, Inc. Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation
CN110819658B (zh) 2013-07-10 2024-03-22 哈佛大学校长及研究员协会 用于RNA向导的基因调节和编辑的正交Cas9蛋白
CA2930877A1 (en) 2013-11-18 2015-05-21 Crispr Therapeutics Ag Crispr-cas system materials and methods
US9074199B1 (en) 2013-11-19 2015-07-07 President And Fellows Of Harvard College Mutant Cas9 proteins
US11053481B2 (en) 2013-12-12 2021-07-06 President And Fellows Of Harvard College Fusions of Cas9 domains and nucleic acid-editing domains
WO2015103153A1 (en) 2013-12-31 2015-07-09 The Regents Of The University Of California Cas9 crystals and methods of use thereof
US11439712B2 (en) 2014-04-08 2022-09-13 North Carolina State University Methods and compositions for RNA-directed repression of transcription using CRISPR-associated genes
US10253311B2 (en) 2014-04-10 2019-04-09 The Regents Of The University Of California Methods and compositions for using argonaute to modify a single stranded target nucleic acid
CN106922154B (zh) 2014-08-06 2022-01-07 基因工具股份有限公司 使用空肠弯曲杆菌crispr/cas系统衍生的rna引导的工程化核酸酶的基因编辑
ES2780904T3 (es) 2014-08-17 2020-08-27 Broad Inst Inc Edición genómica usando nickasas Cas9
EP3186375A4 (en) 2014-08-28 2019-03-13 North Carolina State University NEW CAS9 PROTEINS AND GUIDING ELEMENTS FOR DNA TARGETING AND THE GENOME EDITION
WO2016049258A2 (en) 2014-09-25 2016-03-31 The Broad Institute Inc. Functional screening with optimized functional crispr-cas systems
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
CN105525008A (zh) * 2016-01-27 2016-04-27 四川农业大学 小麦小穗数qtl连锁的ssr分子标记及其应用
CN106086034B (zh) * 2016-06-18 2019-07-26 南京农业大学 一个小麦穗型发育调控基因wbh1及其分子标记和应用
CN106509611A (zh) * 2016-11-07 2017-03-22 青州荣美尔生物科技有限公司 一种全麦粉的制作方法
CN106866806B (zh) * 2017-03-15 2019-08-30 中国科学院遗传与发育生物学研究所 蛋白质TaVRS1-2B及其编码基因与应用

Also Published As

Publication number Publication date
AU2019207409B2 (en) 2023-02-23
AU2019207409A1 (en) 2020-07-09
MX2020007466A (es) 2020-11-12
WO2019138083A1 (en) 2019-07-18
EP3737690A1 (en) 2020-11-18
US20200362366A1 (en) 2020-11-19
CN111566121A (zh) 2020-08-21
CA3086620A1 (en) 2019-07-18

Similar Documents

Publication Publication Date Title
AU2019207409B2 (en) Gene underlying the number of spikelets per spike qtl in wheat on chromosome 7a
CN106164272B (zh) 修饰的植物
WO2018119225A1 (en) Genome editing-based crop engineering and production of brachytic plants
US10988775B2 (en) Wheat plants resistant to powdery mildew
US20230357788A1 (en) Enhanced disease resistance of crops by downregulation of repressor genes
CN109068605B (zh) 单性结实植物及其产生方法
BR112020016016A2 (pt) Composições e métodos para aprimorar rendimentos de cultura através do empilhamento de traços
Kumar et al. From evolution to revolution: accelerating crop domestication through genome editing
US20220195445A1 (en) Methods and compositions for generating dominant short stature alleles using genome editing
JP2018518983A (ja) 5−エノールピルビルシキメート−3ホスフェートシンターゼの変化に起因するグリホサート抵抗性を有するコムギ
Zia et al. Use of Genome Editing to Characterize Gene Function of SlIAA9 in Plant Growth, Development and Fruit Quality in Tomato
Gimenez Regulation of (1, 3; 1, 4)-β-glucan Synthesis in Barley (Hordeum Vulgare L.).
CA3229024A1 (en) Wheat with reduced susceptibility to late-maturity alpha-amylase
UA119742C2 (uk) РОСЛИНА ПШЕНИЦІ З НОВИМИ АЛЕЛЯМИ Rht-B1
EP3975701A1 (en) Methods and compositions for generating dominant short stature alleles using genome editing
Echeverry-Solarte Uncovering the genetic basis and characters association of wheat spike-related, agronomic and quality traits
BR112015003716B1 (pt) Processo para a produção de recipientes para grãos de trigo, molécula de ácido nucleico que codifica um polipeptídeo rht-b1, polipeptídeo rht-b1, molécula de ácido nucleico, método para produção de farinha de trigo, farinha integral ou farelo, farinha de trigo, farinha integral ou farelo e método para introdução de um alelo rht-b1 mutante em uma planta de trigo sem o dito alelo

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]