BR112020019198A2 - method for identifying an r gene in a plant, method for obtaining a disease-resistant plant, modified plant having increased disease resistance, method for introducing an allelic variant of a nlr01 gene, recombinant dna construct, transgenic plant cell and plant transgenic - Google Patents

method for identifying an r gene in a plant, method for obtaining a disease-resistant plant, modified plant having increased disease resistance, method for introducing an allelic variant of a nlr01 gene, recombinant dna construct, transgenic plant cell and plant transgenic Download PDF

Info

Publication number
BR112020019198A2
BR112020019198A2 BR112020019198-1A BR112020019198A BR112020019198A2 BR 112020019198 A2 BR112020019198 A2 BR 112020019198A2 BR 112020019198 A BR112020019198 A BR 112020019198A BR 112020019198 A2 BR112020019198 A2 BR 112020019198A2
Authority
BR
Brazil
Prior art keywords
plant
gene
fact
sequence
disease
Prior art date
Application number
BR112020019198-1A
Other languages
Portuguese (pt)
Inventor
Jennifer S. Jaqueth
Bailin Li
Girma M. Tabor
Shawn THATCHER
Original Assignee
Pioneer Hi-Bred International, Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Hi-Bred International, Inc. filed Critical Pioneer Hi-Bred International, Inc.
Publication of BR112020019198A2 publication Critical patent/BR112020019198A2/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Abstract

As composições e métodos se relacionam com melhoramento de plantas e métodos de identificação e seleção de genes de resistência a doença. São proporcionados métodos para identificar novos genes que codificam proteínas proporcionando resistência de plantas a várias doenças e seus usos. Estes genes resistentes a doenças são úteis na produção de plantas resistentes através de melhoramento, modificação transgênica, ou edição do genoma.The compositions and methods relate to plant breeding and methods of identification and selection of disease resistance genes. Methods are provided to identify new genes that encode proteins providing plant resistance to various diseases and their uses. These disease-resistant genes are useful in producing resistant plants through breeding, transgenic modification, or genome editing.

Description

"MÉTODO PARA IDENTIFICAR UM GENE R EM UMA PLANTA, MÉTODO PARA OBTER UMA PLANTA RESISTENTE A DOENÇAS, PLANTA MODIFICADA TENDO RESISTÊNCIA AUMENTADA A UMA DOENÇA, MÉTODO PARA INTRODUZIR UMA VARIANTE ALÉLICA DE UM GENE NLR01, CONSTRUTO DE DNA RECOMBINANTE, CÉLULA DE PLANTA TRANSGÊNICA E PLANTA TRANSGÊNICA""METHOD FOR IDENTIFYING AN R GENE IN A PLANT, METHOD FOR OBTAINING A DISEASE-RESISTANT PLANT, MODIFIED PLANT HAVING INCREASED RESISTANCE TO A DISEASE, METHOD FOR INTRODUCING AN ALLELIC VARIANT OF A NLR01 GENE, CONSTRUCTING A DNA CONSTRUCTOR, A CONSTRUCTIVE OF DNA, TRANSGENIC PLANT "

CAMPOFIELD

[0001] O domínio se relaciona com o melhoramento de plantas, métodos de identificação e seleção de genes de resistência a doenças, e métodos e composições compreendendo genes de resistência a doenças. São proporcionados métodos para identificar novos genes que codificam proteínas proporcionando resistência de plantas a várias doenças e seus usos. Estes genes resistentes a doenças são úteis na produção de plantas resistentes através de melhoramento, modificação transgênica, ou edição do genoma.[0001] The domain relates to plant breeding, methods of identification and selection of disease resistance genes, and methods and compositions comprising disease resistance genes. Methods are provided to identify new genes that encode proteins providing plant resistance to various diseases and their uses. These disease-resistant genes are useful in producing resistant plants through breeding, transgenic modification, or genome editing.

REFERÊNCIA CRUZADA A PEDIDOS RELACIONADOSCROSS REFERENCE TO RELATED REQUESTS

[0002] Este pedido reivindica o benefício do Pedido Provisório U.S. No. 62/646,972 depositado em 23 de março, 2018 que é aqui incorporado a título de referência na sua totalidade.[0002] This application claims the benefit of U.S. Provisional Application No. 62 / 646,972 filed on March 23, 2018 which is hereby incorporated by reference in its entirety.

REFERÊNCIA A UMA LISTAGEM DE SEQUÊNCIAS SUBMETIDA COMO UM FICHEIRO DE TEXTO VIA EFS-WEBREFERENCE TO A SEQUENCE LISTING SUBMITTED AS A TEXT FILE VIA EFS-WEB

[0003] A cópia oficial da listagem de sequências é submetida simultaneamente ao relatório descritivo como um ficheiro de texto através de EFS-Web, de acordo com o Código do Padrão[0003] The official copy of the sequence listing is submitted simultaneously to the specification as a text file via EFS-Web, in accordance with the Standard Code

Americano para Intercâmbio de Informações (ASCII), com um nome de ficheiro 7766_Seq_List.txt, data de criação de 8 de março de 2019 e um tamanho de 29 Kb. A listagem de sequências depositada através de EFS-Web é parte do relatório descritivo e é, dessa forma, incorporada em sua totalidade a título de referência ao presente documento.American for Information Exchange (ASCII), with a file name 7766_Seq_List.txt, created on March 8, 2019 and a size of 29 Kb. The sequence listing deposited through EFS-Web is part of the specification and is, therefore, incorporated in its entirety as a reference to this document.

ANTECEDENTESBACKGROUND

[0004] Muito trabalho tem sido desenvolvido sobre os mecanismos de resistência a doenças em plantas. Alguns mecanismos de resistência têm natureza específica não patogênica, ou a denominada "resistência não hospedeira". Estes podem se basear na estrutura de paredes celulares ou mecanismos protetores similares. No entanto, não obstante plantas não terem um sistema imune com anticorpos em circulação e os outros atributos de um sistema imune de mamífero, têm outros mecanismos para proteção especificamente contra patógenos. Os mais importantes e mais bem estudados destes são os genes de resistência a doenças de plantas, ou "genes R". Um dos muitos artigos de revisão sobre este mecanismo de resistência e os genes R pode ser encontrado em Bekhadir et al., (2004), Current Opinion in Plant Biology 7:391-399. Há 5 classes reconhecidas de genes R: proteínas intracelulares com um sítio de ligação a nucleotídeos (NBS ou NB-ARC) e uma repetição rica em leucina (LRR); proteínas transmembrana com um domínio LRR extracelular (TM-LRR); LRR transmembrana e extracelular com um domínio citoplasmático de cinase (TM-CK-LRR); proteína ancorada a sinal de membrana com um domínio citoplasmático em super-hélice (MSAP-CC); e cinases associadas a membrana ou parede com um sítio de miristilação N-terminal (MAK-N ou WAK) (Ver, por exemplo: Cohn, et al., (2001), Immunology, 13:55-62; Dangl, et al. (2001), Nature, 411:826-833). Há uma necessidade continuada de plantas resistentes a doenças e métodos para encontrar genes resistentes a doenças, em consequência, é necessário um método mais rápido de identificação de genes de resistência a doenças com maior rendimento.[0004] Much work has been done on the mechanisms of disease resistance in plants. Some resistance mechanisms have a specific non-pathogenic nature, or the so-called "non-host resistance". These can be based on the structure of cell walls or similar protective mechanisms. However, although plants do not have an immune system with circulating antibodies and the other attributes of a mammalian immune system, they do have other mechanisms for protecting specifically against pathogens. The most important and best studied of these are plant disease resistance genes, or "R genes". One of the many review articles on this resistance mechanism and the R genes can be found in Bekhadir et al., (2004), Current Opinion in Plant Biology 7: 391-399. There are 5 recognized classes of R genes: intracellular proteins with a nucleotide binding site (NBS or NB-ARC) and a leucine-rich repeat (LRR); transmembrane proteins with an extracellular LRR domain (TM-LRR); Transmembrane and extracellular LRR with a cytoplasmic kinase domain (TM-CK-LRR); protein anchored to membrane signal with a super helix cytoplasmic domain (MSAP-CC); and membrane or wall-associated kinases with an N-terminal myristylation site (MAK-N or WAK) (See, for example: Cohn, et al., (2001), Immunology, 13: 55-62; Dangl, et al (2001), Nature, 411: 826-833). There is a continuing need for disease-resistant plants and methods for finding disease-resistant genes, so a faster method of identifying disease-resistant genes with higher yield is needed.

SUMÁRIOSUMMARY

[0005] Composições e métodos úteis na identificação e seleção de genes de resistência a doenças de plantas, ou "genes R," são proporcionados aqui. As composições e métodos são úteis na seleção de plantas resistentes, criando plantas resistentes transgênicas, e/ou criando plantas com genoma editado resistentes. Plantas que têm resistência recém-conferida ou aprimorada a várias doenças de plantas em comparação com plantas de controle também são fornecidas no presente documento.[0005] Compositions and methods useful in the identification and selection of plant disease resistance genes, or "R genes," are provided here. The compositions and methods are useful in selecting resistant plants, creating resistant transgenic plants, and / or creating plants with resistant edited genomes. Plants that have newly conferred or enhanced resistance to various plant diseases compared to control plants are also provided in this document.

[0006] Em uma modalidade, métodos para identificar e/ou selecionar genes R são apresentados. Em algumas modalidades, os métodos compreendem a) obter uma linhagem de milho resistente a doenças; b) efetuar um "pull down" baseado em sondas a partir da linhagem resistente usando uma pluralidade de sondas, em que cada sonda é gerada a partir de pelo menos um genoma sequenciado e visa genes R; c) sequenciar a sequência capturada; d) montar leituras capturadas pela pluralidade de sondas; e) selecionar quanto a domínios de genes R conservados desejados ou remover sequências que não são domínios de genes R conservados; f) aplicar uma abordagem de agrupamento a domínios de genes R selecionados; g) selecionar novos genes R putativos; e h) introduzir o gene R ou alelo do gene R ou haplótipo do gene R selecionado na planta através de transformação, edição do genoma, ou melhoramento da planta.[0006] In one embodiment, methods for identifying and / or selecting R genes are presented. In some embodiments, the methods comprise a) obtaining a disease-resistant maize line; b) perform a "pull down" based on probes from the resistant strain using a plurality of probes, in which each probe is generated from at least one sequenced genome and targets R genes; c) sequence the captured sequence; d) mount readings captured by the plurality of probes; e) select for desired conserved R gene domains or remove sequences that are not conserved R gene domains; f) apply a clustering approach to selected R gene domains; g) selecting new putative R genes; and h) introducing the R gene or allele of the selected R gene or haplotype of the selected R gene into the plant through transformation, genome editing, or plant improvement.

[0007] Em algumas modalidades, um método para identificar um gene de resistência a doenças em uma planta compreende a) obter uma planta ou linhagem de planta exibindo resistência a doenças; b) efetuar um "pull down" baseado em sondas a partir da planta ou linhagem de planta exibindo resistência a doenças usando uma pluralidade de sondas, em que cada sonda é gerada a partir de pelo menos um genoma sequenciado e visa genes R; c) sequenciar a sequência capturada; d) montar as leituras do sequenciamento a partir da pluralidade de sondas; e) aplicar uma abordagem de agrupamento a domínios de genes R conservados a partir da sequência montada; e f) selecionar novos genes R. Em modalidades adicionais, a seleção de novos genes R putativos compreende adicionalmente comparar a localização genômica com a região QTL conhecida ou região de melhoramento direto. Em outra modalidade, o método compreende adicionalmente transformar uma planta com o novo gene R putativo. Em uma modalidade, o método compreende adicionalmente editar o genoma de uma planta não resistente, em que a edição compreende introduzir o gene R ou alelo do gene R selecionado na planta não resistente. Em outra modalidade, o método compreende adicionalmente cruzar a planta resistente com uma segunda planta, em que a progênie tem resistência aumentada a doenças em comparação com a segunda planta paterna. Em algumas modalidades, a segunda planta paterna pode ser germoplasma de elite.[0007] In some embodiments, a method for identifying a disease resistance gene in a plant comprises a) obtaining a plant or plant lineage exhibiting disease resistance; b) perform a "pull down" based on probes from the plant or plant line showing disease resistance using a plurality of probes, in which each probe is generated from at least one sequenced genome and targets R genes; c) sequence the captured sequence; d) assemble the sequencing readings from the plurality of probes; e) apply a clustering approach to conserved R gene domains from the assembled sequence; and f) selecting new R genes. In additional modalities, the selection of new putative R genes additionally comprises comparing the genomic location with the known QTL region or direct breeding region. In another embodiment, the method further comprises transforming a plant with the new putative R gene. In one embodiment, the method additionally comprises editing the genome of a non-resistant plant, where editing comprises introducing the R gene or allele of the selected R gene into the non-resistant plant. In another embodiment, the method additionally comprises crossing the resistant plant with a second plant, in which the progeny has increased resistance to disease compared to the second paternal plant. In some embodiments, the second paternal plant may be an elite germplasm.

[0008] Uma planta resistente pode ser cruzada com uma segunda planta para obter uma planta da progênie que tem o alelo do gene resistente. A resistência a doenças pode ser recém- conferida ou aprimorada em relação a uma planta de controle que não tem o alelo favorável. O alelo do gene R pode ser adicionalmente refinado para um intervalo cromossômico definido por e incluindo marcadores definidos. A etapa de análise pode ser realizada isolando ácidos nucleicos e detectando um ou mais alelos marcadores ligados a e associados ao alelo do gene R.[0008] A resistant plant can be crossed with a second plant to obtain a progeny plant that has the resistant gene allele. Disease resistance can be newly conferred or improved over a control plant that does not have a favorable allele. The R gene allele can be further refined to a chromosomal range defined by and including defined markers. The analysis step can be performed by isolating nucleic acids and detecting one or more marker alleles linked to and associated with the R gene allele.

[0009] Em outra modalidade, métodos de introgressão de um gene R em uma planta são apresentados aqui. Nestes métodos, uma população de plantas é rastreada com um ou mais marcadores para determinar se quaisquer das plantas têm um alelo do gene R associado a resistência, e pelo menos uma planta que tem o alelo do gene R associado a resistência é selecionada da população.[0009] In another embodiment, methods of introgression of an R gene in a plant are presented here. In these methods, a plant population is screened with one or more markers to determine if any of the plants have a resistance-associated R gene allele, and at least one plant that has resistance-associated R gene allele is selected from the population.

[0010] Em algumas modalidades, a introgressão de genes R a partir de linhagens resistentes até suscetíveis pode ser alcançada por abordagens de introgressão de traços auxiliada por marcadores, transgênicas, ou de edição do genoma.[0010] In some modalities, introgression of R genes from resistant to susceptible strains can be achieved by marker-assisted, transgenic, or genome editing approaches to trait introgression.

[0011] Em algumas modalidades, as composições e métodos se relacionam com uma planta modificada tendo resistência aumentada a uma doença, em que o alelo causador da resistência aumentada a doenças é um novo gene R, e em que o novo gene R se agrupa com uma pluralidade de genes R em um QTL conhecido de uma planta tendo resistência à doença.[0011] In some embodiments, the compositions and methods relate to a modified plant having increased resistance to a disease, in which the allele causing the increased resistance to diseases is a new R gene, and in which the new R gene groups with a plurality of R genes in a known QTL of a plant having disease resistance.

[0012] Os métodos incorporados pela presente revelação se relacionam com 1) um método para transformar uma célula hospedeira, incluindo uma célula de planta, compreendendo transformar a célula hospedeira com o polinucleotídeo de uma modalidade da presente revelação, 2) um método para produzir uma planta, compreendendo transformar uma célula de planta com o construto de DNA recombinante de uma modalidade da presente revelação e regenerar uma planta a partir da célula de planta transformada, e 3) métodos para conferir ou intensificar a resistência a doenças, compreendendo transformar uma planta com o construto de DNA recombinante revelado aqui.[0012] The methods incorporated by the present disclosure relate to 1) a method for transforming a host cell, including a plant cell, comprising transforming the host cell with the polynucleotide of one embodiment of the present disclosure, 2) a method for producing a plant, comprising transforming a plant cell with the recombinant DNA construct of one embodiment of the present disclosure and regenerating a plant from the transformed plant cell, and 3) methods for conferring or enhancing disease resistance, comprising transforming a plant with the recombinant DNA construct revealed here.

[0013] Também são incorporados métodos para alterar o nível de expressão de uma proteína capaz de conferir resistência a doenças em uma planta ou célula de planta, compreendendo (a) transformar uma célula de planta com um construto de DNA recombinante revelado aqui e (b) cultivar a célula de planta transformada sob condições que são adequadas para a expressão do construto de DNA recombinante, em que a expressão do construto de DNA recombinante resulta na produção de níveis alterados de uma proteína capaz de conferir resistência a doenças no hospedeiro transformado.[0013] Methods are also incorporated to alter the expression level of a protein capable of conferring disease resistance in a plant or plant cell, comprising (a) transforming a plant cell with a recombinant DNA construct disclosed here and (b ) cultivating the transformed plant cell under conditions that are suitable for the expression of the recombinant DNA construct, in which the expression of the recombinant DNA construct results in the production of altered levels of a protein capable of conferring disease resistance in the transformed host.

[0014] Plantas identificadas e/ou selecionadas com o uso de qualquer um dos métodos apresentados acima também são fornecidas.[0014] Plants identified and / or selected using any of the methods presented above are also provided.

[0015] Modalidades incluem um polinucleotídeo isolado compreendendo uma sequência de nucleotídeos codificando um polipeptídeo NLR01 capaz de conferir resistência a SCR, em que o polipeptídeo NLR01 tem uma sequência de aminoácidos com pelo menos 50%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 95% de identidade, pelo menos 96% de identidade,[0015] Modalities include an isolated polynucleotide comprising a nucleotide sequence encoding an NLR01 polypeptide capable of conferring resistance to SCR, wherein the NLR01 polypeptide has an amino acid sequence of at least 50%, at least 75%, at least 80%, at least 85%, at least 90%, at least 95% identity, at least 96% identity,

pelo menos 97% de identidade, pelo menos 98% de identidade, ou pelo menos 99% de identidade em comparação com a SEQ ID NO: 2. Em outra modalidade, um polinucleotídeo isolado compreende uma sequência de nucleotídeos codificando um polipeptídeo NLR01 capaz de conferir resistência a SCR, em que o polipeptídeo NLR01 tem uma sequência de aminoácidos com pelo menos 50%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, e pelo menos 95% de identidade, em comparação com a SEQ ID NO: 2.at least 97% identity, at least 98% identity, or at least 99% identity compared to SEQ ID NO: 2. In another embodiment, an isolated polynucleotide comprises a nucleotide sequence encoding an NLR01 polypeptide capable of conferring SCR resistance, where the NLR01 polypeptide has an amino acid sequence of at least 50%, at least 75%, at least 80%, at least 85%, at least 90%, and at least 95% identity, compared with SEQ ID NO: 2.

[0016] Modalidades adicionais da presente revelação incluem um vetor compreendendo um polinucleotídeo da revelação, tal como a SEQ ID NO: 1, ou um construto de DNA recombinante compreendendo um polinucleotídeo revelado aqui operativamente ligado a pelo menos uma sequência reguladora. Também são incorporadas uma célula de planta, bem como uma planta, cada uma compreendendo o construto de DNA recombinante de uma modalidade revelada aqui, e uma semente compreendendo o construto de DNA recombinante.[0016] Additional embodiments of the present disclosure include a vector comprising a polynucleotide of the disclosure, such as SEQ ID NO: 1, or a recombinant DNA construct comprising a polynucleotide disclosed herein operably linked to at least one regulatory sequence. Also incorporated are a plant cell, as well as a plant, each comprising the recombinant DNA construct of a modality disclosed herein, and a seed comprising the recombinant DNA construct.

[0017] Em algumas modalidades, as composições e métodos se relacionam com uma planta modificada tendo resistência aumentada a uma doença, em que o alelo causador da resistência aumentada a doenças compreende uma sequência de nucleotídeos codificando um gene de resistência NLR01, em que o gene de resistência NLR01 tem pelo menos 50%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, e pelo menos 95% de identidade, pelo menos 96% de identidade, pelo menos 97% de identidade, pelo menos 98% de identidade, ou pelo menos 99% de identidade com a sequência apresentada na SEQ ID NO: 2.[0017] In some embodiments, the compositions and methods relate to a modified plant having increased resistance to a disease, in which the allele causing increased disease resistance comprises a nucleotide sequence encoding an NLR01 resistance gene, in which the gene of resistance NLR01 has at least 50%, at least 75%, at least 80%, at least 85%, at least 90%, and at least 95% identity, at least 96% identity, at least 97% identity , at least 98% identity, or at least 99% identity with the sequence shown in SEQ ID NO: 2.

DESCRIÇÃO DOS DESENHOSDESCRIPTION OF THE DRAWINGS

[0018] A FIG. 1 mostra um fluxograma do processo global para modalidades da identificação de genes R.[0018] FIG. 1 shows a flowchart of the global process for modalities for the identification of R genes.

[0019] A FIG. 2 mostra sequências de domínios conservados de genomas sequenciados extraídos e agrupados com sequências de localização genômica desconhecida para ancorar as novas sequências a posições prováveis. O processo funcionou mesmo na elevada variação presença-ausência (PAV) quando um gene duplicou e divergiu quanto ao genótipo de interesse.[0019] FIG. 2 shows sequences of conserved domains of sequenced genomes extracted and grouped with sequences of unknown genomic location to anchor the new sequences to probable positions. The process worked even in the high presence-absence variation (PAV) when a gene duplicated and diverged regarding the genotype of interest.

DESCRIÇÃO DETALHADADETAILED DESCRIPTION

[0020] Conforme usado no presente documento, as formas singulares “um”, “uma”, e "o" e “a” incluem referentes no plural a menos que o contexto determine claramente de outro modo. Desse modo, por exemplo, a referência a "uma célula" inclui uma pluralidade de tais células e referência "à proteína" inclui referência a uma ou mais proteínas e equivalentes das mesmas e assim por diante. Todos os termos técnicos e científicos usados no presente documento têm o mesmo significado que o comumente entendido por uma pessoa de habilidade comum na técnica à qual esta divulgação pertence, a menos que claramente indicado de outro modo.[0020] As used in this document, the singular forms "one", "one", and "o" and "a" include referents in the plural unless the context clearly determines otherwise. Thus, for example, reference to "a cell" includes a plurality of such cells and reference to "protein" includes reference to one or more proteins and equivalents thereof, and so on. All technical and scientific terms used in this document have the same meaning as is commonly understood by a person of ordinary skill in the technique to which this disclosure belongs, unless clearly indicated otherwise.

[0021] O grupo NBS-LRR ("NLR") de genes R é a maior classe de genes R descoberta até à data. Em Arabidopsis thaliana, é previsto que mais de 150 estejam presentes no genoma (Meyers, et al., (2003), Plant Cell, 15:809-834; Monosi, et al., (2004), Theoretical and Applied Genetics, 109:1434-1447), ao passo que em arroz foram previstos aproximadamente 500 genes NLR (Monosi,[0021] The NBS-LRR ("NLR") group of R genes is the largest class of R genes discovered to date. In Arabidopsis thaliana, more than 150 are expected to be present in the genome (Meyers, et al., (2003), Plant Cell, 15: 809-834; Monosi, et al., (2004), Theoretical and Applied Genetics, 109 : 1434-1447), whereas in rice approximately 500 NLR genes (Monosi,

(2004) supra). A classe NBS-LRR de genes R é compreendida por duas subclasses. Os genes NLR da classe 1 contêm um domínio do tipo TIR-Toll/Interleucina-1 no seu terminal N'; que até à data só havia sido encontrado em dicotiledôneas (Meyers, (2003) supra; Monosi, (2004) supra). A segunda classe de NBS-LRR contém um domínio em super-hélice ou um domínio (nt) no seu terminal N (Bai, et al. (2002) Genome Research, 12:1871-1884; Monosi, (2004) supra; Pan, et al., (2000), Journal of Molecular Evolution, 50:203-213). NBS-LRR da classe 2 foram encontrados em espécies dicotiledôneas e monocotiledôneas (Bai, (2002) supra; Meyers, (2003) supra; Monosi, (2004) supra; Pan, (2000) supra).(2004) supra). The NBS-LRR class of R genes is comprised of two subclasses. Class 1 NLR genes contain a TIR-Toll / Interleukin-1 type domain at their N 'terminal; that to date it has only been found in dicots (Meyers, (2003) supra; Monosi, (2004) supra). The second class of NBS-LRR contains a super helix domain or a domain (nt) at its N terminal (Bai, et al. (2002) Genome Research, 12: 1871-1884; Monosi, (2004) supra; Pan , et al., (2000), Journal of Molecular Evolution, 50: 203-213). Class 2 NBS-LRR were found in dicotyledon and monocotyledonous species (Bai, (2002) supra; Meyers, (2003) supra; Monosi, (2004) supra; Pan, (2000) supra).

[0022] O domínio NBS do gene aparenta desempenhar um papel na sinalização em mecanismos de defesa das plantas (van der Biezen, et al., (1998), Current Biology: CB, 8:R226-R227). A região LRR aparenta ser a região que interage com os produtos AVR patogênicos (Michelmore, et al., (1998), Genome Res., 8:1113-1130; Meyers, (2003) supra). Esta região LRR, em comparação com o domínio NB-ARC (NBS), está sob uma pressão de seleção muito maior para diversificar (Michelmore, (1998) supra; Meyers, (2003) supra; Palomino, et al., (2002), Genome Research, 12:1305-1315). Os domínios LRR também estão presentes em outros contextos; estes motivos com 20-29 resíduos estão presentes em séries em tandem em algumas proteínas com funções diversificadas, tais como interações hormônio – receptor, inibição enzimática, adesão celular e tráfego celular. Alguns estudos recentes revelaram o envolvimento de proteínas LRR no desenvolvimento inicial de mamíferos,[0022] The NBS domain of the gene appears to play a role in signaling in plant defense mechanisms (van der Biezen, et al., (1998), Current Biology: CB, 8: R226-R227). The LRR region appears to be the region that interacts with pathogenic AVR products (Michelmore, et al., (1998), Genome Res., 8: 1113-1130; Meyers, (2003) supra). This LRR region, compared to the NB-ARC domain (NBS), is under much greater selection pressure to diversify (Michelmore, (1998) supra; Meyers, (2003) supra; Palomino, et al., (2002) , Genome Research, 12: 1305-1315). LRR domains are also present in other contexts; these motifs with 20-29 residues are present in tandem series in some proteins with diversified functions, such as hormone - receptor interactions, enzyme inhibition, cell adhesion and cell traffic. Some recent studies have revealed the involvement of LRR proteins in the early development of mammals,

desenvolvimento neural, polarização celular, regulação da expressão genética e sinalização da apoptose.neural development, cell polarization, regulation of gene expression and apoptosis signaling.

[0023] O gene de resistência das modalidades da presente revelação codifica um novo gene R. Os genes R mais numerosos correspondem ao tipo NBS-LRR. Também tem havido muitos genes R do tipo WAK identificados. Não obstante terem sido descritos muitos genes NBS-LRR, podem diferir muito na sua resposta a diferentes patógenos e ação exata.[0023] The resistance gene of the modalities of the present disclosure encodes a new R gene. The most numerous R genes correspond to the NBS-LRR type. There have also been many WAK-type R genes identified. Although many NBS-LRR genes have been described, they can differ greatly in their response to different pathogens and exact action.

[0024] A clonagem posicional (ou clonagem à base de mapa) tem sido o principal método na identificação de genes causais responsáveis por variações na resistência a doenças. Nesta abordagem, uma linhagem de resistência é cruzada com uma linhagem suscetível para gerar uma população de mapeamento segregando resistência e suscetibilidade. O mapeamento de ligação é efetuado com dados de genotipagem e fenotipagem para detectar QTL (Locos de Traços Quantitativos) de doença. Um QTL importante de doença é "mendelizado" através de retrocruzamento com os progenitores suscetíveis e validado. Um QTL validado é então mapeado de modo fino em um pequeno intervalo com uma grande população de segregação (tipicamente com mais de 3000 indivíduos). Sequências abrangendo o intervalo de QTL são obtidas da linhagem de resistência via identificação/sequenciamento clones BAC ou sequenciamento do genoma. A sequência do genoma é anotada, genes candidatos são identificados e testados em plantas transgênicas. O gene candidato conferindo resistência em plantas transgênicas é o gene causal subjacente ao QTL de doença.[0024] Positional cloning (or map-based cloning) has been the main method in identifying causal genes responsible for variations in disease resistance. In this approach, a resistance strain is crossed with a susceptible strain to generate a mapping population segregating resistance and susceptibility. Linkage mapping is done with genotyping and phenotyping data to detect QTL (Quantitative Trait Locations) of disease. An important QTL of disease is "mendelized" through backcross with the susceptible parents and validated. A validated QTL is then thinly mapped over a small range with a large population of segregation (typically more than 3000 individuals). Sequences spanning the QTL range are obtained from the resistance lineage via identification / sequencing BAC clones or sequencing the genome. The genome sequence is noted, candidate genes are identified and tested on transgenic plants. The candidate gene conferring resistance in transgenic plants is the causal gene underlying the disease QTL.

[0025] Como usado aqui, "resistente a doença" ou "ter resistência a uma doença" se relaciona com uma planta exibindo aumento de resistência a uma doença em comparação com uma planta de controle. A resistência a doença pode se manifestar em lesões em menos quantidade e/ou menores, saúde intensificada da planta, rendimento acrescido, massa radicular aumentada, vigor aumentado da planta, menos ou nenhuma descoloração, crescimento aumentado, área necrótica reduzida, ou definhamento reduzido.[0025] As used here, "disease resistant" or "having resistance to a disease" relates to a plant exhibiting increased resistance to a disease compared to a control plant. Resistance to disease can manifest itself in lesser and / or lesser lesions, enhanced plant health, increased yield, increased root mass, increased plant vigor, less or no discoloration, increased growth, reduced necrotic area, or reduced withering.

[0026] Doenças afetando plantas de milho plantas incluem, mas sem limitação, crestamento e podridão do caule bacterianos; mancha foliar bacteriana; listra bacteriana; mancha de chocolate; murcha e queima bacterianas de Goss; mancha de Holcus; bainha foliar púrpura; podridão da semente-queima de plântulas; murcha bacteriana; enfezamento do milho; crestamento de antracnose; podridão do caule de antracnose; podridão da espiga e do grão por Aspergillus; mancha foliar e da bainha em bandas; murcha do milho; podridão negra do grão; borde blanco; mancha marrom; mancha negra; podridão do caule; podridão do grão por Cephalosporium; podridão de carvão; podridão da espiga por Corticium; mancha foliar por Curvularia; mancha foliar por Didymella; podridão da espiga e podridão do caule por Diplodia; podridão da espiga por Diplodia; podridão da semente; queima da plântula do milho; mancha foliar ou estria foliar por Diplodia; míldios penugentos; míldio penugento de listra marrom; míldio penugento de pendão louco; míldio penugento da espiga verde; míldio penugento por Graminicola; míldio penugento de Java; míldio penugento Filipino; míldio penugento do sorgo; míldio penugento espontâneo; míldio penugento da cana-de-açúcar; podridão seca da espiga; cravagem-do-centeio; dente-de-cavalo; acama do milho; podridão da espiga e do caule por Fusarium; queima por Fusarium; podridão da raiz das plântulas; podridão da espiga e do caule por Gibberella; podridão cinzenta da espiga; mancha foliar cinzenta; mancha foliar por Cercospora; podridão da raiz por Helminthosporium; podridão da espiga por Hormodendrum; podridão por Cladosporium; mancha foliar por Hyalothyridium; murcha tardia; helmintosporiose; brusone branca; podridão coroa do caule; listra do milho; helmintosporiose; podridão da espiga por Helminthosporium; podridão da espiga por Penicillium; olho azul do milho; bolor azul; podridão do caule e podridão da raiz por Phaeocytostroma; mancha foliar por Phaeosphaeria; podridão da espiga por Physalospora; podridão da espiga por Botryosphaeria; podridão do caule e podridão da raiz por Pyrenochaeta; podridão da raiz por Pythium; podridão do caule por Pythium; mancha avermelhada do grão; podridão da espiga por Rhizoctonia; podridão do esclerócio; podridão da raiz e podridão do caule por Rhizoctonia; mancha foliar por Rostratum; ferrugem do milho comum; ferrugem polissora do sul; ferrugem do milho tropical; podridão da espiga por Sclerotium; queima do sul; mancha foliar por Selenophoma; podridão da bainha; podridão-do-colo; bolor da silagem; fuligem comum; fuligem falsa; carvão do pendão; crestamento e podridão do caule do milho do sul; mancha foliar do sul; mancha de piche; podridão da espiga e podridão da raiz por Trichoderma; podridão branca da espiga, podridão da raiz e do caule; crestamento amarelo; mancha foliar zonada; estriado do trigo americano (mosaico estriado do trigo); mosaico listrado da cevada; nanismo amarelo da cevada; mosaico Brome; mosqueado clorótico de cereais; necrose letal (doença da necrose letal do milho); mosaico do pepino; mosaico do sorgo-bravo; enfezamento vermelho do milho; nanismo clorótico do milho; mosqueado clorótico do milho; mosaico do nanismo do milho; pinta foliar do milho; mancha anelar pelúcida do milho; raiado fino do milho; folha vermelha e listra vermelha do milho; listra vermelha do milho; mosqueado anelar do milho; nanismo rugoso do milho; enfezamento estéril do milho; estria do milho; listra do milho; aborto do pendão do milho; enação das nervuras do milho; orelha do wallaby do milho; folha branca do milho; mosaico das linhas brancas do milho; folha vermelha de milhete; e mosaico de cereais do norte.[0026] Diseases affecting corn plants include, but are not limited to, bacterial blight and stem rot; bacterial leaf spot; bacterial stripe; chocolate stain; bacterial wilt and burning of Goss; Holcus stain; purple leaf sheath; seedling-burning rot; bacterial wilt; corn stale; anthracnose blight; anthracnose stem rot; ear and grain rot by Aspergillus; leaf and hem stain in bands; corn wilt; black rot of the grain; white edge; brown spot; black spot; stem rot; grain rot by Cephalosporium; coal rot; Corticium ear rot; leaf spot by Curvularia; leaf spot by Didymella; ear rot and stem rot by Diplodia; ear rot by Diplodia; seed rot; burning of the corn seedling; leaf spot or leaf streak by Diplodia; downy mildew; brown streaky downy mildew; downy downy mildew with crazy tassel; downy downy mildew of the green ear; downy mildew by Graminicola; downy mildew of Java; Filipino downy mildew; sorghum downy mildew; spontaneous downy mildew; downy mildew from sugar cane; dry ear rot; rye ergot; horse tooth; corn bed; spike and stem rot by Fusarium; burning by Fusarium; seedling root rot; ear and stem rot by Gibberella; gray ear rot; gray leaf spot; leaf spot by Cercospora; root rot by Helminthosporium; ear rot by Hormodendrum; rot by Cladosporium; leaf spot by Hyalothyridium; late wilting; helminthsporiosis; white blast; crown stem rot; corn stripe; helminthsporiosis; ear rot by Helminthosporium; ear rot by Penicillium; blue eye of the corn; blue mold; stem rot and root rot from Phaeocytostroma; leaf spot by Phaeosphaeria; ear rot by Physalospora; ear rot by Botryosphaeria; stem rot and Pyrenochaeta root rot; root rot by Pythium; Pythium stem rot; reddish spot of the grain; Rhizoctonia ear rot; sclerotia rot; root rot and stem rot by Rhizoctonia; leaf spot by Rostratum; common corn rust; southern polishing rust; rust of tropical corn; ear rot by Sclerotium; burning from the south; leaf spot by Selenophoma; sheath rot; colon rot; silage mold; common soot; false soot; tassel coal; crusting and rotting of the southern corn stem; southern leaf spot; tar stain; ear rot and root rot by Trichoderma; white ear rot, root and stem rot; yellow blight; zoned leaf spot; streaked American wheat (striated wheat mosaic); striped barley mosaic; barley yellow dwarf; Brome mosaic; chlorotic speckled cereal; lethal necrosis (lethal corn necrosis disease); mosaic of the cucumber; mosaic of wild sorghum; red corn stalking; chlorotic dwarfism of corn; chlorotic mottled corn; mosaic of corn stunting; leaf spot of corn; pellucid ring spot of corn; thin streaked corn; red leaf and red stripe of corn; red corn stripe; mottled corn ring; rugged dwarfism of corn; sterile corn stale; corn streak; corn stripe; abortion of corn tassel; enation of the corn veins; ear of corn wallaby; white corn leaf; mosaic of the white lines of the corn; red millet leaf; and mosaic of northern cereals.

[0027] Doenças afetando plantas de arroz incluem, mas sem limitação, queima bacteriana; estria bacteriana da folha do milho; podridão do pé; podridão do grão; podridão marrom da bainha; brusone; mancha marrom; podridão coroa da bainha; míldio penugento; acama; fuligem falsa; fuligem do grão; fuligem da folha; escaldadura foliar; mancha foliar marrom estreita; podridão da raiz; queima da plântula; queima da bainha; podridão da bainha; mancha da bainha; mancha foliar por Alternaria; e podridão da haste.[0027] Diseases affecting rice plants include, but are not limited to, bacterial burning; bacterial streak of the corn leaf; foot rot; grain rot; brown rot of the sheath; blast; brown spot; crown rot of the sheath; downy mildew; the bed; false soot; soot from the grain; soot on the leaf; leaf scald; narrow brown leaf spot; root rot; burning the seedling; scabbard burning; sheath rot; sheath stain; leaf spot by Alternaria; and stem rot.

[0028] Doenças afetando plantas de soja incluem, mas sem limitação, mancha foliar por Alternaria; antracnose; crestamento negro; podridão negra da raiz; mancha marrom; podridão marrom da haste; podridão de carvão; crestamento por Choanephora; míldio penugento; queima por Drechslera; cercosporiose; mancha foliar por Leptosphaerulina; podridão da raiz por Mycoleptodiscus; podridão da haste por Neocosmospora; podridão da semente por Phomopsis; podridão da raiz e da haste por Phytophthora; mancha foliar por Phyllosticta; podridão da raiz por Phymatotrichum; queima da vagem e haste; oídio; mancha púrpura da semente; mancha foliar por Pyrenochaeta; podridão por Pythium; podridão coroa vermelha; mancha foliar por Dactuliophora; queima das partes aéreas por Rhizoctonia; podridão da raiz e da haste por Rhizoctonia; ferrugem; sarna; podridão da haste por Sclerotinia; queima por Sclerotium; cancro da haste; crestamento por Stemphylium; síndrome de morte súbita; mancha alvo; mancha de levedura; nematódeo lanceolado; nematódeo formador de lesões; nematódeo em forma de alfinete; nematódeo reniforme; nematódeo anelado; nematódeo das galhas radiculares; nematódeo de bainha; nematódeo formador de cistos; nematódeo espiralado; nematódeo de estilete das raízes; nematódeo de encurtamento e engrossamento da raiz; nematódeo do enfezamento; mosaico da alfafa; mosqueado do feijoeiro; mosaico amarelo do feijoeiro; queima do broto brasileira; mosqueado clorótico; mosaico amarelo; mosqueado do amendoim; listra do amendoim; enfezamento do amendoim; mosqueado clorótico; encarquilhamento foliar; nanismo; enfezamento grave; e mancha anelar do tabaco ou queima do broto.[0028] Diseases affecting soybean plants include, but are not limited to, leaf spot by Alternaria; anthracnose; black blight; black root rot; brown spot; brown stem rot; coal rot; Choanephora blight; downy mildew; burning by Drechslera; cercosporiosis; leaf spot by Leptosphaerulina; root rot by Mycoleptodiscus; stem rot by Neocosmospora; seed rot by Phomopsis; root and stem rot by Phytophthora; leaf spot by Phyllosticta; root rot by Phymatotrichum; burning the pod and stem; powdery mildew; purple seed spot; leaf spot by Pyrenochaeta; Pythium rot; red crown rot; leaf spot by Dactuliophora; burning of aerial parts by Rhizoctonia; root and stem rot by Rhizoctonia; rust; scabies; stem rot due to Sclerotinia; burning by Sclerotium; stem cancer; cresting by Stemphylium; sudden death syndrome; target spot; yeast stain; lanceolated nematode; lesion-forming nematode; pin-shaped nematode; reniform nematode; ringed nematode; root gall nematode; sheath nematode; cyst-forming nematode; spiral nematode; root stylus nematode; root shortening and thickening nematode; stunt nematode; mosaic of alfalfa; speckled bean; yellow bean mosaic; burning of the Brazilian sprout; chlorotic mottled; yellow mosaic; peanut speckled; peanut stripe; peanut stale; chlorotic mottled; leaf shriveling; dwarfism; severe stunting; and annular tobacco stain or bud burning.

[0029] Doenças afetando plantas de canola incluem, mas sem limitação, podridão negra bacteriana; mancha foliar bacteriana; podridão da vagem bacteriana; podridão mole bacteriana; sarna; galha da coroa; mancha negra por Alternaria; antracnose; canela- negra; podridão-mole negra; podridão negra da raiz; podridão da raiz de anelamento marrom ("brown girdling root rot"); mancha foliar por Cercospora; hérnia das crucíferas; míldio penugento; murcha por Fusarium; bolor cinzento; podridão da cabeça; mancha foliar; mancha foliar clara; podridão da vagem; oídio; mancha anelar; podridão da raiz; podridão da haste por Sclerotinia; podridão da semente, tombamento de mudas; fuligem das galhas radiculares; queima do sul; murcha por Verticillium; queima branca; mancha foliar branca; blister branco; amarelos; vírus do encarquilhamento; vírus do mosaico; vírus de amarelos.[0029] Diseases affecting canola plants include, but are not limited to, bacterial black rot; bacterial leaf spot; bacterial pod rot; bacterial soft rot; scabies; crown gall; black spot by Alternaria; anthracnose; black cinnamon; black soft rot; black root rot; brown girdling root rot leaf spot by Cercospora; hernia of the crucifers; downy mildew; Fusarium wilt; gray mold; rot of the head; leaf spot; light leaf spot; pod rot; powdery mildew; ring spot; root rot; stem rot due to Sclerotinia; seed rot, seedling tipping; soot from root galls; burning from the south; wilt by Verticillium; white burning; white leaf spot; white blister; yellow; shrinking virus; mosaic virus; yellow viruses.

[0030] Doenças afetando plantas de girassol incluem, mas sem limitação, clorose apical; mancha foliar bacteriana; murcha bacteriana; galha da coroa; podridão do caule e podridão da cabeça por Erwinia; crestamento por Alternaria, mancha da haste e podridão da cabeça; podridão da cabeça por Botrytis; podridão de carvão; míldio penugento; podridão do caule por Fusarium; murcha por Fusarium; mancha foliar e da haste por Myrothecium; amarelos por Phialophora; haste negra por Phoma; cancro marrom da haste por Phomopsis; podridão da raiz por Phymatotrichum; podridão da haste por Phytophthora; oídio; queima de plântula e podridão da raiz por Pythium; queima de plântula por Rhizoctonia; podridão da cabeça por Rhizopus; ferrugem do girassol; pecíolo basal e podridão da raiz por Sclerotium; mancha foliar por Septoria; murcha por Verticillium; ferrugem branca; ferrugem amarela; nematódeo em forma de adaga; em forma de alfinete; formador de lesões; reniforme; das galhas radiculares; e mosqueado clorótico.[0030] Diseases affecting sunflower plants include, but are not limited to, apical chlorosis; bacterial leaf spot; bacterial wilt; crown gall; stem rot and head rot by Erwinia; crusting by Alternaria, staining of the stem and rotting of the head; rot of the head by Botrytis; coal rot; downy mildew; stem rot by Fusarium; Fusarium wilt; leaf and stem spot by Myrothecium; yellow by Phialophora; black rod by Phoma; brown stem cancer by Phomopsis; root rot by Phymatotrichum; stem rot by Phytophthora; powdery mildew; burning of seedling and root rot by Pythium; seedling burning by Rhizoctonia; Rhizopus head rot; sunflower rust; basal petiole and root rot by Sclerotium; leaf spot by Septoria; wilt by Verticillium; white rust; yellow rust; dagger-shaped nematode; pin-shaped; lesion builder; reniform; root galls; and chlorotic mottled.

[0031] Doenças afetando plantas de sorgo incluem, mas sem limitação, mancha foliar bacteriana; estria bacteriana da folha do milho; listra foliar bacteriana; murcha por Acremonium; antracnose; podridão de carvão; míldio penugento de pendão louco; tombamento de mudas e podridão da semente; cravagem-do-centeio; queima da cabeça por Fusarium, podridão da raiz e do caule; bolor de armazenamento de grãos; Mancha foliar cinzenta; mancha foliar tardia; crestamento; doença de milo; mancha foliar oval; Pokkah boeng; podridão da raiz por Pythium; mancha foliar rugosa; ferrugem; queima de plântula e podridão da semente; fuligem, núcleo coberto; fuligem, cabeça; fuligem, grão solto; listra fuliginosa; míldio penugento; mancha de piche; mancha alvo foliar; e mancha foliar zonada e queima da bainha.[0031] Diseases affecting sorghum plants include, but are not limited to, bacterial leaf spot; bacterial streak of the corn leaf; bacterial leaf stripe; wilted by Acremonium; anthracnose; coal rot; downy downy mildew with crazy tassel; tipping of seedlings and seed rot; rye ergot; burning of the head by Fusarium, root and stem rot; grain storage mold; Gray leaf spot; late leaf spot; crusting; milo disease; oval leaf spot; Pokkah boeng; root rot by Pythium; rough leaf spot; rust; seedling burning and seed rot; soot, covered core; soot, head; soot, loose grain; sooty stripe; downy mildew; tar stain; leaf target spot; and zoned leaf spot and scabbard burning.

[0032] Uma planta tendo resistência a doenças pode ter 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, ou 100% de resistência aumentada a uma doença em comparação com uma planta de controle. Em algumas modalidades, uma planta pode ter 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, ou 100% de saúde da planta aumentada na presença de uma doença em comparação com uma planta de controle.[0032] A plant having disease resistance can have 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, or 100% increased resistance to a disease compared to a control plant. In some embodiments, a plant can have 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, or 100% of increased plant health in the presence of a disease compared to a control plant.

[0033] Como usado aqui, o termo "agrupamento" ou "abordagem de agrupamento" significa reunião e agrupamento de sequências de um modo agnóstico quanto à localização usando um algoritmo de união de vizinhos mais próximos, agrupamento hierárquico tal como o método de Ward, um método de probabilidade máxima, ou qualquer outro algoritmo ou método de agrupamento.[0033] As used here, the term "grouping" or "grouping approach" means assembling and grouping sequences in an agnostic way as to location using an algorithm for joining closer neighbors, hierarchical grouping such as Ward's method, a maximum probability method, or any other grouping algorithm or method.

[0034] O termo “cruzado” ou “cruzar” refere-se a um cruzamento sexuado e que envolveu a fusão de dois gâmetas haploides por meio de polinização para produzir progênie diploide (por exemplo, células, sementes ou plantas). O termo abrange tanto a polinização de uma planta por outra quanto o autocruzamento (ou autopolinização, por exemplo, quando o pólen e o óvulo são da mesma planta).[0034] The term "crossover" or "crossover" refers to a sexual crossover that involved the fusion of two haploid gametes through pollination to produce diploid progeny (for example, cells, seeds or plants). The term covers both the pollination of one plant by another and the self-cross (or self-pollination, for example, when the pollen and the egg are from the same plant).

[0035] Uma “linhagem de elite" é qualquer linhagem resultante de melhoramento e seleção quanto a desempenho agronômico superior.[0035] An "elite line" is any line resulting from breeding and selection for superior agronomic performance.

[0036] Uma "cepa exótica", uma "linhagem tropical" ou um “germoplasma exótico" é uma cepa derivada de uma planta que não pertence a uma linhagem ou cepa de elite disponível de germoplasma. No contexto de um cruzamento entre duas plantas ou estirpes de germoplasma, um germoplasma exótico não está intimamente relacionado por descendência com o germoplasma de elite com o qual é cruzado. Muito vulgarmente, o germoplasma exótico não é derivado de qualquer linhagem de elite conhecida, mas em vez disso é selecionado para introduzir novos elementos genéticos (tipicamente novos alelos) em um programa de melhoramento.[0036] An "exotic strain", a "tropical strain" or an "exotic germplasm" is a strain derived from a plant that does not belong to an elite strain or strain of available germplasm. In the context of a cross between two plants or strains of germplasm, an exotic germplasm is not closely related by descent to the elite germplasm it is crossed with. Very commonly, the exotic germplasm is not derived from any known elite lineage, but is instead selected to introduce new elements (typically new alleles) in a breeding program.

[0037] Um "alelo favorável” é o alelo em um loco particular (um marcador, um QTL, um gene, etc.) que confere, ou contribui para, um fenótipo agronomicamente desejável, por exemplo, resistência a doenças, e que permite a identificação de plantas com tal fenótipo agronomicamente desejável. Um alelo favorável de um marcador é um alelo marcador que segrega com o fenótipo favorável.[0037] A "favorable allele" is the allele at a particular locus (a marker, a QTL, a gene, etc.) that confers, or contributes to, an agronomically desirable phenotype, for example, disease resistance, and that allows the identification of plants with such an agronomically desirable phenotype. A favorable allele of a marker is a marker allele that secretes with the favorable phenotype.

[0038] "Marcadores genéticos" são ácidos nucleicos que são polimórficos em uma população e cujos alelos podem ser detectados e distinguidos por um ou mais métodos analíticos, por exemplo, RFLP, AFLP, isozima, SNP, SSR e semelhantes. O termo também se refere a sequências de ácidos nucleicos complementares às sequências genômicas, como ácidos nucleicos usados como sondas. Os marcadores correspondentes a polimorfismos genéticos entre membros de uma população podem ser detectados por métodos bem estabelecidos na técnica. Os mesmos incluem, por exemplo, métodos de amplificação específicos para sequências com base em PCR, detecção de polimorfismos de comprimento de fragmentos de restrição (RFLP), detecção de marcadores de isozimas, detecção de polimorfismos de polinucleotídeos por hibridação específica para alelos (ASH), detecção de sequências variáveis amplificadas do genoma da planta, detecção de replicação de sequências autossustentada, detecção de repetições de sequências simples (SSRs), detecção de polimorfismos de nucleotídeo simples (SNPs) ou detecção de polimorfismos de comprimento de fragmentos amplificados (AFLPs). Também são conhecidos métodos bem estabelecidos para a detecção de caudas de sequências expressas (ESTs) e marcadores SSR derivados de sequências EST e DNA polimórfico amplificado ao acaso (RAPD).[0038] "Genetic markers" are nucleic acids that are polymorphic in a population and whose alleles can be detected and distinguished by one or more analytical methods, for example, RFLP, AFLP, isozyme, SNP, SSR and the like. The term also refers to nucleic acid sequences complementary to genomic sequences, such as nucleic acids used as probes. The markers corresponding to genetic polymorphisms between members of a population can be detected by methods well established in the art. They include, for example, specific amplification methods for PCR-based sequences, detection of restriction fragment length polymorphisms (RFLP), detection of isozyme markers, detection of allele-specific hybridization (ASH) polynucleotide polymorphisms , detection of amplified variable sequences from the plant genome, detection of self-sustained sequence replication, detection of simple sequence repetitions (SSRs), detection of single nucleotide polymorphisms (SNPs) or detection of amplified fragment length polymorphisms (AFLPs). Well-established methods for detecting tails of expressed sequences (ESTs) and SSR markers derived from EST sequences and random amplified polymorphic DNA (RAPD) are also known.

[0039] "Germoplasma" se refere ao material genético de ou proveniente de um indivíduo (por exemplo, uma planta), um grupo de indivíduos (por exemplo, uma linhagem, variedade ou família de planta) ou um clone derivado de uma linhagem, variedade, espécie ou cultura, ou mais geralmente, todos os indivíduos dentro de uma espécie ou para diversas espécies (por exemplo, coleção de germoplasma de maís ou coleção de germoplasma andino). O germoplasma pode ser parte de um organismo ou célula, ou pode ser separado do organismo ou célula. Em geral, o germoplasma fornece material genético com uma constituição molecular específica que fornece uma base física para algumas ou todas as qualidades hereditárias de um organismo ou cultura celular. Conforme usado no presente documento, germoplasma inclui células, semente ou tecidos a partir dos quais as plantas novas podem ser cultivadas, ou partes de planta, como folhas, hastes, pólen ou células, que podem ser cultivados em uma planta total.[0039] "Germplasm" refers to the genetic material of or from an individual (eg, a plant), a group of individuals (eg, a lineage, variety or plant family) or a clone derived from a lineage, variety, species or culture, or more generally, all individuals within a species or for several species (for example, collection of more germplasm or collection of Andean germplasm). The germplasm can be part of an organism or cell, or it can be separated from the organism or cell. In general, germplasm provides genetic material with a specific molecular constitution that provides a physical basis for some or all of the inherited qualities of an organism or cell culture. As used herein, germplasm includes cells, seeds or tissues from which young plants can be grown, or plant parts, such as leaves, stems, pollen or cells, which can be grown on a total plant.

[0040] Um “haplótipo” é o genótipo de um indivíduo em uma pluralidade de locos genéticos, ou seja, uma combinação de alelos. Tipicamente, os locos genéticos descritos por um haplótipo estão ligados física e geneticamente, ou seja, no mesmo segmento cromossômico.[0040] A "haplotype" is the genotype of an individual in a plurality of genetic loci, that is, a combination of alleles. Typically, the genetic loci described by a haplotype are physically and genetically linked, that is, in the same chromosomal segment.

[0041] O termo “heterogeneidade" é usado para indicar que indivíduos dentro do grupo diferem no genótipo em um ou mais locos específicos.[0041] The term "heterogeneity" is used to indicate that individuals within the group differ in the genotype at one or more specific loci.

[0042] A resposta heterótica de material, ou "heterose", pode ser definida por desempenho que excede a média dos parentes (ou parente superior) quando cruzado com outros grupos dissimilares ou não relacionados.[0042] The heterotic material response, or "heterosis", can be defined by performance that exceeds the average of the relatives (or superior relative) when crossed with other dissimilar or unrelated groups.

[0043] Um "grupo heterótico" compreende um conjunto de genótipos que têm desempenho satisfatório quando cruzados com genótipos de um grupo heterótico diferente (Hallauer et al. (1998) Corn breeding, páginas 463 a 564. Em G.F. Sprague e J.W. Dudley (ed.) Corn and corn improvement). As linhagens congênitas são classificadas em grupos heteróticos e são adicionalmente subdivididas em famílias dentro de um grupo heterótico, com base em diversos critérios como descendência, associações com base em marcador molecular e desempenho em combinações híbridas (Smith et al. (1990) Theor. Appl. Gen. 80:833 a 840). Os dois grupos heteróticos mais amplamente usados nos Estados Unidos são denominados "Iowa Stiff Stalk Synthetic" (também denominado no presente documento como "colmo rígido") e "Lancaster" ou "Lancaster Sure Crop" (algumas vezes denominado como NSS, ou Colmo não Rígido).[0043] A "heterotic group" comprises a set of genotypes that perform satisfactorily when crossed with genotypes from a different heterotic group (Hallauer et al. (1998) Corn breeding, pages 463 to 564. In GF Sprague and JW Dudley (ed .) Corn and corn improvement). Congenital strains are classified into heterotic groups and are further subdivided into families within a heterotic group, based on several criteria such as offspring, associations based on molecular marker and performance in hybrid combinations (Smith et al. (1990) Theor. Appl Gen. 80: 833 to 840). The two most widely used heterotic groups in the United States are called "Iowa Stiff Stalk Synthetic" (also referred to herein as "stiff stem") and "Lancaster" or "Lancaster Sure Crop" (sometimes referred to as NSS, or Colmo not Hard).

[0044] Alguns grupos heteróticos possuem os traços necessários para ser um parente feminino, e outros, traços para um parente masculino. Por exemplo, em maís, os resultados de rendimento de congênitos públicos liberados a partir de uma população chamada BSSS (população Iowa Stiff Stalk Synthetic) resultou nesses congênitos e seus derivados se tornando o grupamento feminino no Cinturão do Milho central. Os congênitos BSSS foram cruzados com outros congênitos, por exemplo, SD 105 e Maiz Amargo, e esse grupo geral de materiais se tornou conhecido como Stiff Stalk Synthetics (SSS) mesmo que nem todos os congênitos sejam derivados da população BSSS original (Mikel e Dudley (2006) Crop Sci: 46:1193 a 1205). Por padrão, todos os outros congênitos que se combinam bem com os congênitos SSS foram atribuídos ao grupamento masculino, o qual pela ausência de um nome mais satisfatório foi designado NSS, isto é, Colmo Não Rígido. Esse grupo inclui diversos grupos heteróticos principais como Lancaster Surecrop, Iodent e Leaming Corn.[0044] Some heterotic groups have the traits necessary to be a female relative, and others, traits for a male relative. For example, in more countries, the results of public congenital income released from a population called BSSS (Iowa Stiff Stalk Synthetic population) resulted in these congenitals and their derivatives becoming the female group in the central Corn Belt. Congenital BSSS were crossed with other congenitals, for example, SD 105 and Maiz Amargo, and this general group of materials became known as Stiff Stalk Synthetics (SSS) even though not all congenitals are derived from the original BSSS population (Mikel and Dudley (2006) Crop Sci: 46: 1193 to 1205). By default, all other congenitals that combine well with the congenital SSS were assigned to the male group, which for the absence of a more satisfactory name was designated NSS, that is, Non-Rigid Colmo. This group includes several major heterotic groups such as Lancaster Surecrop, Iodent and Leaming Corn.

[0045] O termo "homogeneidade" indica que membros de um grupo têm o mesmo genótipo em um ou mais locos específicos.[0045] The term "homogeneity" indicates that members of a group have the same genotype at one or more specific loci.

[0046] O termo “híbrido” refere-se à progênie obtida entre o cruzamento de pelo menos dois genitores geneticamente dissimilares.[0046] The term “hybrid” refers to the progeny obtained by crossing at least two genetically dissimilar parents.

[0047] O termo “consanguíneo” refere-se a uma linhagem que foi gerada para homogeneidade genética.[0047] The term "consanguineous" refers to a strain that was generated for genetic homogeneity.

[0048] O termo “indel” refere-se a uma inserção ou deleção, em que uma linhagem pode ser dita como tendo um nucleotídeo ou fragmento de DNA inserido em relação a uma segunda linhagem, ou a segunda linhagem pode ser dita como tendo um nucleotídeo ou fragmento de DNA deletado em relação à primeira linhagem.[0048] The term "indel" refers to an insertion or deletion, in which a lineage can be said to have a nucleotide or DNA fragment inserted in relation to a second lineage, or the second lineage can be said to have a nucleotide or DNA fragment deleted in relation to the first lineage.

[0049] O termo “introgressão” refere-se à transmissão de um alelo desejado de um loco genético de um fundo genético para outro. Por exemplo, a introgressão de um alelo desejado em um loco específico pode ser transmitida a pelo menos uma progênie por meio de um cruzamento sexuado entre dois genitores da mesma espécie, em que pelo menos um dos genitores tem o alelo desejado no seu genoma. Alternativamente, por exemplo, a transmissão de um alelo pode ocorrer por meio de recombinação entre dois genomas doadores, por exemplo, em um protoplasto fundido, em que pelo menos um dos protoplastos doadores tem o alelo desejado no seu genoma. O alelo desejado pode ser, por exemplo, detectado por um marcador que está associado a um fenótipo, em um QTL, um transgene ou similar. Em todo caso, a prole compreendendo o alelo desejado pode ser submetida a retrocruzamento repetido com uma linhagem que tem um fundo genético desejado e selecionada em termos do alelo desejado, de modo que o alelo se torne fixo em um fundo genético selecionado.[0049] The term "introgression" refers to the transmission of a desired allele from one genetic locus from one genetic background to another. For example, the introgression of a desired allele at a specific locus can be transmitted to at least one progeny through a sexual cross between two parents of the same species, where at least one parent has the desired allele in its genome. Alternatively, for example, the transmission of an allele can occur through recombination between two donor genomes, for example, in a fused protoplasty, in which at least one of the donor protoplasts has the desired allele in its genome. The desired allele can be, for example, detected by a marker that is associated with a phenotype, in a QTL, a transgene or the like. In any case, the offspring comprising the desired allele can be subjected to repeated backcrossing with a lineage that has a desired genetic background and is selected in terms of the desired allele, so that the allele becomes fixed in a selected genetic background.

[0050] O processo de “introgressão” é frequentemente chamado de “retrocruzamento” quando o processo é repetido duas ou mais vezes.[0050] The process of "introgression" is often called "backcross" when the process is repeated two or more times.

[0051] Uma “linhagem” ou “estirpe” é um grupo de indivíduos de ascendência idêntica que são geralmente consanguíneos, até certo grau, e que geralmente são homozigotos e homogêneos na maioria dos locos (isogênicos ou quase isogênicos). Uma “sublinhagem” refere-se a um subconjunto consanguíneo de descendentes que são geneticamente distintos de outros subconjuntos similarmente consanguíneos descendentes do mesmo genitor.[0051] A "lineage" or "strain" is a group of individuals of identical ancestry who are generally consanguineous, to some degree, and who are generally homozygous and homogeneous in most loci (isogenic or almost isogenic). An "underline" refers to an inbred subset of descendants that are genetically distinct from other similarly inbred subsets descended from the same parent.

[0052] Como usado no presente documento, o termo “ligação” é usado para descrever o grau em que um loco marcador está associado a outro loco marcador ou algum outro loco. A relação de ligação entre um marcador molecular e um loco que afeta um fenótipo é dada como uma “probabilidade” ou “probabilidade ajustada”. A ligação pode ser expressa como uma faixa ou limite desejado. Por exemplo, em algumas modalidades, qualquer marcador é ligado (genética e fisicamente) a qualquer outro marcador quando os marcadores são separados por menos de 50, 40, 30, 25, 20 ou 15 unidades de mapa (ou cM) de um mapa de meiose único (um mapa genético com base em uma população que foi submetida a um ciclo de meiose, como, por exemplo, um F2; os mapas IBM2 consistem em múltiplas meioses). Em alguns aspectos, é vantajoso definir uma faixa limitada de ligação, por exemplo, entre 10 e 20 cM, entre 10 e 30 cM, ou entre 10 e 40 cM. Quanto mais estritamente o marcador é ligado a um segundo loco, mais satisfatório o marcador se torna um indicador para o segundo loco. Desse modo, “loci estreitamente ligados”, como um locus marcador e um segundo locus, exibem uma frequência de recombinação inter-locus de 10% ou menos, preferencialmente cerca de 9% ou menos, ainda mais preferencialmente cerca de 8% ou menos, ainda mais preferencialmente cerca de 7% ou menos, ainda mais preferencialmente cerca de 6% ou menos, ainda mais preferencialmente cerca de 5% ou menos, ainda mais preferencialmente cerca de 4% ou menos, ainda mais preferencialmente cerca de 3% ou menos, e ainda mais preferencialmente cerca de 2% ou menos. Em modalidades altamente preferidas, os loci relevantes exibem uma frequência de recombinação de cerca de 1% ou menos, por exemplo, cerca de 0,75% ou menos, mais preferencialmente cerca de 0,5% ou menos, ou ainda mais preferencialmente cerca de 0,25% ou menos. Dois loci que são localizados no mesmo cromossomo, e em tal distância que a recombinação entre os dois loci ocorre a uma frequência menor que 10% (por exemplo, cerca de 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 0,75%, 0,5%, 0,25%, ou menos) também são ditos como "em proximidade" entre si. Visto que um cM é a distância entre dois marcadores que mostram uma frequência de recombinação de 1%, qualquer marcador é estreitamente ligado (genética e fisicamente) a qualquer outro marcador que está em proximidade estreita, por exemplo, em ou menos de 10 cM de distância. Dois marcadores estreitamente ligados no mesmo cromossomo podem ser posicionados 9, 8, 7, 6, 5, 4, 3, 2, 1, 0,75, 0,5 ou 0,25 cM ou menos entre si.[0052] As used in this document, the term "bond" is used to describe the degree to which a marker locus is associated with another marker locus or some other locus. The linkage relationship between a molecular marker and a locus that affects a phenotype is given as a "probability" or "adjusted probability". The connection can be expressed as a desired range or boundary. For example, in some modalities, any marker is linked (genetically and physically) to any other marker when the markers are separated by less than 50, 40, 30, 25, 20 or 15 map units (or cM) from a map. single meiosis (a genetic map based on a population that has undergone a cycle of meiosis, such as, for example, an F2; IBM2 maps consist of multiple meioses). In some respects, it is advantageous to define a limited connection range, for example, between 10 and 20 cM, between 10 and 30 cM, or between 10 and 40 cM. The more strictly the marker is linked to a second locus, the more satisfactory the marker becomes an indicator for the second locus. Thus, "closely linked loci", such as a marker locus and a second locus, exhibit an inter-locus recombination frequency of 10% or less, preferably about 9% or less, even more preferably about 8% or less, even more preferably about 7% or less, even more preferably about 6% or less, even more preferably about 5% or less, even more preferably about 4% or less, even more preferably about 3% or less, and even more preferably about 2% or less. In highly preferred embodiments, the relevant loci exhibit a frequency of recombination of about 1% or less, for example, about 0.75% or less, more preferably about 0.5% or less, or even more preferably about 0.25% or less. Two loci that are located on the same chromosome, and at such a distance that the recombination between the two loci occurs at a frequency less than 10% (for example, about 9%, 8%, 7%, 6%, 5%, 4 %, 3%, 2%, 1%, 0.75%, 0.5%, 0.25%, or less) are also said to be "in proximity" to each other. Since a cM is the distance between two markers showing a recombination frequency of 1%, any marker is closely linked (genetically and physically) to any other marker that is in close proximity, for example, at or less than 10 cM in distance. Two closely linked markers on the same chromosome can be positioned 9, 8, 7, 6, 5, 4, 3, 2, 1, 0.75, 0.5 or 0.25 cM or less to each other.

[0053] O termo "desequilíbrio de ligação" se refere a uma segregação não aleatória de loci ou traços genéticos (ou ambos). Em qualquer caso, o desequilíbrio de ligação implica que os loci relevantes estão dentro de proximidade física suficiente ao longo de um comprimento de um cromossomo para que segreguem juntos com uma frequência maior do que aleatória (isto é, não aleatória). Os marcadores que mostram o desequilíbrio de ligação são considerados ligados. Os loci ligados cossegregam mais do que 50% do tempo, por exemplo, a partir de cerca de 51% a cerca de 100% do tempo. Em outras palavras, dois marcadores que cossegregam têm uma frequência de recombinação menor que 50% (e por definição, são separados por menos de 50 cM no mesmo grupo de ligação). Conforme usado no presente documento, ligação pode ser entre dois marcadores, ou alternativamente entre um marcador e um loco que afeta um fenótipo. Um loco marcador pode estar “associado a” (ligado a) uma característica. O grau de ligação de um loco marcador e um loco que afeta um característica fenotípica é medido, por exemplo, como uma probabilidade estatística de cossegregação daquele marcador molecular com o fenótipo (por exemplo, uma estatística F ou escore LOD).[0053] The term "linkage imbalance" refers to a non-random segregation of loci or genetic traits (or both). In any case, the linkage imbalance implies that the relevant loci are within sufficient physical proximity along a length of a chromosome to secrete together at a frequency that is greater than random (that is, not random). Markers showing the link imbalance are considered linked. Linked loci co-secrete more than 50% of the time, for example, from about 51% to about 100% of the time. In other words, two co-segregating markers have a recombination frequency of less than 50% (and, by definition, are separated by less than 50 cM in the same binding group). As used in this document, linkage can be between two markers, or alternatively between a marker and a locus that affects a phenotype. A marker locus can be "associated with" (linked to) a characteristic. The degree of binding of a marker locus and a locus that affects a phenotypic characteristic is measured, for example, as a statistical probability of cosegregation of that molecular marker with the phenotype (for example, an F statistic or LOD score).

[0054] O desequilíbrio de ligação é mais comumente avaliado com o uso da medida r2, a qual é calculada com o uso da fórmula descrita por Hill, W.G. e Robertson, A, Theor. Appl. Genet. 38:226 a 231(1968). Quando r2 = 1, LD completo existe entre os dois loci marcadores, o que significa que os marcadores não foram separados por recombinação e têm a mesma frequência de alelos. O valor de r2 será dependente da população usada. Os valores para r2 acima de 1/3 indicam LD suficientemente forte para ser útil para mapeamento (Ardlie et al., Nature Reviews Genetics 3:299 a 309[0054] The link imbalance is most commonly assessed with the use of measure r2, which is calculated using the formula described by Hill, W.G. and Robertson, A, Theor. Appl. Genet. 38: 226 to 231 (1968). When r2 = 1, complete LD exists between the two marker loci, which means that the markers were not separated by recombination and have the same frequency as alleles. The value of r2 will be dependent on the population used. Values for r2 above 1/3 indicate LD strong enough to be useful for mapping (Ardlie et al., Nature Reviews Genetics 3: 299 to 309

(2002)). Então, os alelos estão em desequilíbrio de ligação quando valores de r2 entre loci marcadores em par são maiores ou iguais a 0,33, 0,4, 0,5, 0,6, 0,7, 0,8, 0,9, ou 1,0.(2002)). So, the alleles are in linkage imbalance when r2 values between pair marker loci are greater than or equal to 0.33, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9 , or 1.0.

[0055] Conforme usado no presente documento, “equilíbrio de ligação" descreve uma situação em que dois marcadores segregam independentemente, isto é, selecionam entre progênie aleatoriamente. Os marcadores que mostram equilíbrio de ligação são considerados não ligados (quer residam ou não no mesmo cromossomo).[0055] As used in this document, "linkage balance" describes a situation in which two markers segregate independently, that is, they select among progeny randomly. Markers that show linkage balance are considered unrelated (whether or not they reside in the same chromosome).

[0056] Um "locus" é uma posição em um cromossomo, por exemplo, onde um nucleotídeo, gene, sequência, ou marcador está localizado.[0056] A "locus" is a position on a chromosome, for example, where a nucleotide, gene, sequence, or marker is located.

[0057] O "logaritmo de valor de chances (LOD)" ou "escore de LOD" (Risch, Science 255:803 a 804 (1992)) é usado em mapeamento de intervalo genético para descrever o grau de ligação entre dois loci marcadores. Um escore de LOD de três entre dois marcadores indica que a ligação é 1.000 vezes mais provável do que nenhuma ligação, enquanto um escore de LOD de dois indica que a ligação é 100 vezes mais provável que nenhuma ligação. Os escores de LOD superiores ou iguais a dois podem ser usados para detectar a ligação. Os escores de LOD também podem ser usados para mostrar a força de associação entre locos marcadores e características quantitativas no mapeamento de “locos de características quantitativas”. Nesse caso, o tamanho do escore de LOD é dependente da proximidade do loco marcador com o loco que afeta a característica quantitativa, assim como o tamanho do efeito da característica quantitativa.[0057] The "odds value logarithm (LOD)" or "LOD score" (Risch, Science 255: 803 to 804 (1992)) is used in genetic range mapping to describe the degree of linkage between two marker loci . A LOD score of three between two markers indicates that the link is 1,000 times more likely than no link, while a LOD score of two indicates that the link is 100 times more likely than no link. LOD scores greater than or equal to two can be used to detect binding. LOD scores can also be used to show the strength of association between marker loci and quantitative characteristics in the mapping of “quantitative characteristic loci”. In this case, the size of the LOD score is dependent on the proximity of the marker locus to the locus that affects the quantitative characteristic, as well as the size of the effect of the quantitative characteristic.

[0058] O termo “planta” inclui plantas inteiras, células de planta, protoplasto de planta, cultura de células ou tecidos de planta a partir da qual plantas podem ser regeneradas, calos de planta, touceiras de planta e células de planta que estão intactas em plantas ou partes de plantas, tais como sementes, flores, cotilédones, folhas, hastes, brotos, raízes, pontas de raízes e similares. Como usado aqui, uma "planta modificada" significa qualquer planta que tem uma alteração genética devido a intervenção humana. Uma planta modificada pode ter alterações genéticas introduzidas através de transformação da planta, edição do genoma, ou melhoramento convencional de plantas.[0058] The term "plant" includes whole plants, plant cells, plant protoplasts, cell cultures or plant tissues from which plants can be regenerated, plant calluses, plant clumps and plant cells that are intact on plants or parts of plants, such as seeds, flowers, cotyledons, leaves, stems, buds, roots, root tips and the like. As used here, a "modified plant" means any plant that has a genetic alteration due to human intervention. A modified plant may have genetic changes introduced through plant transformation, genome editing, or conventional plant breeding.

[0059] Um “marcador” é um meio para encontrar uma posição em um mapa genético ou físico, ou então ligações entre marcadores e locos de características (locos que afetam características). A posição que o marcador detecta pode ser conhecida por meio de detecção de alelos polimórficos e seu mapeamento genético, ou então por hibridação, correspondência de sequências ou amplificação de uma sequência que foi fisicamente mapeada. Um marcador pode ser um marcador de DNA (detecta polimorfismos de DNA), uma proteína (detecta variação em um polipeptídeo codificado), ou um fenótipo simplesmente herdado (tal como o fenótipo ‘ceroso’). Um marcador de DNA pode ser desenvolvido a partir de uma sequência de nucleotídeos genômica ou a partir de sequências de nucleotídeos expressas (por exemplo, a partir de um RNA encadeado ou um cDNA). Dependendo da tecnologia de marcador de DNA, o marcador consistirá em iniciadores complementares que flanqueiam o loco e/ou sondas complementares que hibridam com alelos polimórficos no loco. Um marcador de DNA, ou um marcador genético, também pode ser usado para descrever o gene, sequência de DNA ou nucleotídeo no próprio cromossomo (em vez dos componentes usados para detectar o gene ou a sequência de DNA) e é frequentemente usado quando esse marcador de DNA estiver associado a uma característica particular na genética humana (por exemplo, um marcador para câncer de mama). O termo loco marcador é o loco (gene, sequência ou nucleotídeo) que o marcador detecta.[0059] A "marker" is a means to find a position on a genetic or physical map, or links between markers and loci of traits (loci that affect traits). The position that the marker detects can be known through the detection of polymorphic alleles and their genetic mapping, or else by hybridization, sequence matching or amplification of a sequence that has been physically mapped. A marker can be a DNA marker (detects DNA polymorphisms), a protein (detects variation in an encoded polypeptide), or a simply inherited phenotype (such as the 'waxy' phenotype). A DNA marker can be developed from a genomic nucleotide sequence or from expressed nucleotide sequences (for example, from a linked RNA or a cDNA). Depending on the DNA marker technology, the marker will consist of complementary primers that flank the locus and / or complementary probes that hybridize to polymorphic alleles at the locus. A DNA marker, or genetic marker, can also be used to describe the gene, DNA sequence or nucleotide on the chromosome itself (instead of the components used to detect the gene or DNA sequence) and is often used when that marker of DNA is associated with a particular trait in human genetics (for example, a marker for breast cancer). The term loco marker is the locus (gene, sequence or nucleotide) that the marker detects.

[0060] Os marcadores que detectam polimorfismos genéticos entre membros de uma população são bem estabelecidos na técnica. Os marcadores podem ser definidos pelo tipo de polimorfismo que detectam e também pela tecnologia de marcador usada para detectar o polimorfismo. Os tipos de marcador incluem, mas sem limitação, por exemplo, a detecção de polimorfismos de comprimento de fragmentos de restrição (RFLP), detecção de marcadores de isozimas, DNA polimórfico aleatoriamente amplificado (RAPD), polimorfismos de comprimento de fragmentos amplificados (AFLPs), detecção de repetições de sequências simples (SSRs), detecção de sequências variáveis amplificadas do genoma vegetal, detecção de replicação de sequência autossustentada ou detecção de polimorfismos de nucleotídeo único (SNPs). SNPs podem ser detectados, por exemplo, por meio de sequenciamento de DNA, métodos de amplificação específicos para sequências com base em PCR, detecção de polimorfismos polinucleotídicos por hibridação alelo- específica (ASH), hibridação alelo-específica dinâmica (DASH, do inglês “dynamic allele-specific hybridization”), sinalizadores moleculares (molecular beacons), hibridação de microarranjo,[0060] Markers that detect genetic polymorphisms between members of a population are well established in the art. Markers can be defined by the type of polymorphism they detect and also by the marker technology used to detect the polymorphism. Marker types include, but are not limited to, for example, detection of restriction fragment length polymorphisms (RFLP), detection of isozyme markers, randomly amplified polymorphic DNA (RAPD), amplified fragment length polymorphisms (AFLPs) , detection of single sequence repeats (SSRs), detection of amplified variable sequences from the plant genome, detection of self-sustained sequence replication or detection of single nucleotide polymorphisms (SNPs). SNPs can be detected, for example, through DNA sequencing, specific amplification methods for PCR-based sequences, detection of polynucleotide polymorphisms by allele-specific hybridization (ASH), dynamic allele-specific hybridization (DASH) dynamic allele-specific hybridization ”), molecular beacons, microarray hybridization,

ensaios de oligonucleotídeo ligase, endonucleases Flap, endonucleases 5’, extensão de iniciador, polimorfismo de conformação de fita simples (SSCP, do inglês “single strand conformation polymorphism”) ou eletroforese em gel com gradiente de temperatura (TGGE, do inglês “temperature gradient gel electrophoresis”). O sequenciamento de DNA, tal como a tecnologia de pirossequenciamento, tem a vantagem de ser capaz de detectar uma série de alelos de SNP ligados que constituem um haplótipo. Os haplótipos tendem a ser mais informativos (detectam um nível mais alto de polimorfismo) do que SNPs.oligonucleotide ligase assays, Flap endonucleases, 5 'endonucleases, primer extension, single strand conformation polymorphism (SSCP) or temperature gradient gel electrophoresis (TGGE) gel electrophoresis ”). DNA sequencing, like pyro-sequencing technology, has the advantage of being able to detect a series of linked SNP alleles that constitute a haplotype. Haplotypes tend to be more informative (they detect a higher level of polymorphism) than SNPs.

[0061] Um “alelo marcador”, alternativamente um “alelo de um loco marcador”, pode se referir a uma dentre uma pluralidade de sequências de nucleotídeos polimórficas encontradas em um loco marcador em uma população.[0061] A "marker allele", alternatively a "marker locus allele", can refer to one of a plurality of polymorphic nucleotide sequences found in a marker locus in a population.

[0062] "Seleção auxiliada por marcador" (de MAS) é um processo pelo qual plantas individuais são selecionadas com base em genótipos marcadores.[0062] "Marker-assisted selection" (from MAS) is a process by which individual plants are selected based on marker genotypes.

[0063] "Contrasseleção auxiliada por marcador" é um processo pelo qual os genótipos marcadores são usados para identificar plantas que não serão selecionadas, o que permite que as mesmas sejam removidas de um programa de reprodução ou plantação.[0063] "Marker-assisted counter-selection" is a process by which marker genotypes are used to identify plants that will not be selected, which allows them to be removed from a breeding or planting program.

[0064] Um "haplótipo marcador" se refere a uma combinação de alelos em um locus marcador.[0064] A "marker haplotype" refers to a combination of alleles at a marker locus.

[0065] Um "locus marcador" é uma localização cromossômica específica no genoma de uma espécie onde um marcador específico pode ser encontrado. Um locus marcador pode ser usado para rastrear a presença de um segundo locus ligado, por exemplo, um que afeta a expressão de um traço fenotípico. Por exemplo, um locus marcador pode ser usado para monitorar a segregação de alelos em um locus geneticamente ou fisicamente ligado.[0065] A "marker locus" is a specific chromosomal location in the genome of a species where a specific marker can be found. A marker locus can be used to track the presence of a second linked locus, for example, one that affects the expression of a phenotypic trait. For example, a marker locus can be used to monitor segregation of alleles at a genetically or physically linked locus.

[0066] O termo “marcador molecular” pode ser usado para se referir a um marcador genético, como definido acima, ou um produto codificado do mesmo (por exemplo, uma proteína) usado como um ponto de referência durante a identificação de um loco ligado. Um marcador pode ser derivado de sequências de nucleotídeos genômicas ou de sequências de nucleotídeos expressas (por exemplo, a partir de um RNA encadeado, um cDNA, etc.), ou a partir de um polipeptídeo codificado. O termo também se refere às sequências de ácidos nucleicos complementares a, ou que flanqueiam, as sequências de marcadores, tais como ácidos nucleicos usados como sondas ou pares de iniciadores capazes de amplificar a sequência de marcador. Uma “sonda de marcador molecular” é uma sequência ou molécula de ácido nucleico que pode ser usada para identificar a presença de um loco marcador, por exemplo, uma sonda de ácido nucleico que é complementar a uma sequência de loco marcador. Alternativamente, em alguns aspectos, uma sonda de marcador refere-se a uma sonda de qualquer tipo que seja capaz de distinguir (isto é, genotipar) o alelo particular que está presente em um loco marcador. Ácidos nucleicos são "complementares" quando hibridam especificamente em solução. Alguns dos marcadores descritos no presente documento também são chamados de marcadores de hibridação quando localizados em uma região indel, tal como a região não colinear descrita no presente documento. Isso é devido ao fato de que a região de inserção é, por definição, um polimorfismo vis a vis uma planta sem a inserção. Desse modo, o marcador precisa indicar apenas se a região indel está presente ou ausente. Qualquer tecnologia de detecção de marcadores adequada pode ser usada para identificar tal marcador de hibridação, por exemplo, tecnologia SNP é usada nos exemplos proporcionados aqui.[0066] The term "molecular marker" can be used to refer to a genetic marker, as defined above, or a product encoded therein (for example, a protein) used as a reference point when identifying a linked locus . A marker can be derived from genomic nucleotide sequences or from expressed nucleotide sequences (for example, from a linked RNA, a cDNA, etc.), or from an encoded polypeptide. The term also refers to nucleic acid sequences complementary to, or flanking, the marker sequences, such as nucleic acids used as probes or pairs of primers capable of amplifying the marker sequence. A "molecular marker probe" is a nucleic acid sequence or molecule that can be used to identify the presence of a marker locus, for example, a nucleic acid probe that is complementary to a marker locus sequence. Alternatively, in some respects, a marker probe refers to a probe of any type that is capable of distinguishing (i.e., genotyping) the particular allele that is present in a marker locus. Nucleic acids are "complementary" when they specifically hybridize to solution. Some of the markers described in this document are also called hybridization markers when located in an indelible region, such as the non-collinear region described in this document. This is due to the fact that the insertion region is, by definition, a polymorphism vis a vis a plant without insertion. Thus, the marker needs to indicate only if the indelible region is present or absent. Any suitable marker detection technology can be used to identify such a hybridization marker, for example, SNP technology is used in the examples provided here.

[0067] Um alelo se correlaciona “negativamente” com uma característica quando está ligado à mesma e quando a presença do alelo é um indicador de que uma característica ou forma de característica desejada não ocorrerá em uma planta compreendendo o alelo.[0067] An allele correlates "negatively" with a characteristic when it is linked to it and when the presence of the allele is an indicator that a desired characteristic or form of characteristic will not occur in a plant comprising the allele.

[0068] O termo “fenótipo”, “característica fenotípica” ou “característica” pode se referir à expressão observável de um gene ou série de genes. O fenótipo pode ser observável ao olho nu, ou por quaisquer outros meios de avaliação conhecidos na técnica, por exemplo, pesagem, contagem, medição (comprimento, largura, ângulos, etc.), microscopia, análise bioquímica, ou um ensaio eletromecânico. Em alguns casos, um fenótipo é diretamente controlado por um único gene ou loco genético, isto é, uma “característica de gene único” ou uma “característica simplesmente herdada”. Na ausência de níveis grandes de variação ambiental, as características de gene único podem segregar em uma população para gerar uma distribuição “qualitativa” ou “discreta”, isto é, o fenótipo se enquadra em classes discretas. Em outros casos, um fenótipo é o resultado de vários genes e pode ser considerado uma “característica multigênica” ou uma “característica complexa”. As características multigênicas segregam em uma população para gerar uma distribuição “quantitativa” ou “contínua”, isto é, o fenótipo não pode ser separado em classes discretas. Tanto as características de gene simples quanto as características multigênicas podem ser afetadas pelo ambiente no qual estão sendo expressas, mas as características multigênicas tendem a ter um maior componente ambiental.[0068] The term "phenotype", "phenotypic characteristic" or "characteristic" can refer to the observable expression of a gene or series of genes. The phenotype can be observed with the naked eye, or by any other means of evaluation known in the art, for example, weighing, counting, measuring (length, width, angles, etc.), microscopy, biochemical analysis, or an electromechanical test. In some cases, a phenotype is directly controlled by a single gene or genetic locus, that is, a "single gene trait" or a "simply inherited trait". In the absence of large levels of environmental variation, the characteristics of a single gene can segregate in a population to generate a “qualitative” or “discrete” distribution, that is, the phenotype falls into discrete classes. In other cases, a phenotype is the result of several genes and can be considered a "multigene trait" or a "complex trait". Multigenic characteristics segregate in a population to generate a “quantitative” or “continuous” distribution, that is, the phenotype cannot be separated into discrete classes. Both single gene and multigenic traits can be affected by the environment in which they are being expressed, but multigenic traits tend to have a greater environmental component.

[0069] Um “mapa físico” do genoma é um mapa que mostra a ordem linear de marcos identificáveis (incluindo genes, marcadores, etc.) no DNA cromossômico. Entretanto, em contraste com os mapas genéticos, as distâncias entre os marcos são absolutas (por exemplo, medidas em pares de bases ou fragmentos genéticos contíguos isolados e sobrepostos) e não com base na recombinação genética (que pode variar em populações diferentes).[0069] A "physical map" of the genome is a map that shows the linear order of identifiable landmarks (including genes, markers, etc.) in chromosomal DNA. However, in contrast to genetic maps, the distances between landmarks are absolute (for example, measured in base pairs or contiguous isolated and overlapping genetic fragments) and not based on genetic recombination (which can vary in different populations).

[0070] Um “polimorfismo” é uma variação no DNA entre dois ou mais indivíduos dentro de uma população. Um polimorfismo tem preferencialmente uma frequência de pelo menos 1% em uma população. Um polimorfismo útil pode incluir um polimorfismo de nucleotídeo único (SNP), uma repetição de sequência simples (SSR), ou um polimorfismo de inserção/deleção, também chamado no presente documento de “indel”.[0070] A "polymorphism" is a variation in DNA between two or more individuals within a population. A polymorphism preferably has a frequency of at least 1% in a population. A useful polymorphism may include a single nucleotide polymorphism (SNP), a single sequence repeat (SSR), or an insertion / deletion polymorphism, also referred to herein as "indel".

[0071] Um “marcador de produção” ou “marcador SNP de produção” é um marcador que foi desenvolvido com propósitos de produtividade alta. Os marcadores SNP de produção são desenvolvidos para detectar polimorfismos específicos e são projetados para uso com uma variedade de químicas e plataformas.[0071] A "production marker" or "SNP production marker" is a marker that was developed for high productivity purposes. SNP production markers are designed to detect specific polymorphisms and are designed for use with a variety of chemicals and platforms.

[0072] O termo "locus de traços quantitativos" ou "QTL" se refere a uma região de DNA que está associada à expressão diferencial de um traço fenotípico quantitativo em pelo menos um fundo genético, por exemplo, em pelo menos uma população de melhoramento. A região do QTL abrange ou está estreitamente ligada ao gene ou genes que afetam o traço em questão.[0072] The term "quantitative trait locus" or "QTL" refers to a region of DNA that is associated with the differential expression of a quantitative phenotypic trait in at least one genetic background, for example, in at least one breeding population . The QTL region encompasses or is closely linked to the gene or genes that affect the trait in question.

[0073] Uma “sequência de referência" ou uma “sequência de consenso" é uma sequência definida usada como base para comparação de sequências. A sequência de referência para um marcador é obtida por sequenciamento de algumas linhagens no loco, alinhando as sequências de nucleotídeos em um programa de alinhamento de sequências (por exemplo, Sequencher), e obtendo, então, a sequência de nucleotídeos mais comum do alinhamento. Os polimorfismos encontrados dentre as sequências individuais são anotados dentro da sequência de consenso. Uma sequência de referência não é normalmente uma cópia exata de qualquer sequência de DNA individual, mas representa uma amálgama de sequências disponíveis e é útil para projetar iniciadores e sondas para polimorfismos dentro da sequência.[0073] A "reference sequence" or a "consensus sequence" is a defined sequence used as a basis for comparing sequences. The reference sequence for a marker is obtained by sequencing some strains at the locus, aligning the nucleotide sequences in a sequence alignment program (for example, Sequencher), and then obtaining the most common nucleotide sequence in the alignment. Polymorphisms found within the individual sequences are noted within the consensus sequence. A reference sequence is not normally an exact copy of any individual DNA sequence, but it does represent an amalgamation of available sequences and is useful for designing primers and probes for polymorphisms within the sequence.

[0074] Um “alelo desfavorável” de um marcador é um alelo marcador que segrega com o fenótipo de planta desfavorável, fornecendo, portanto, o benefício de identificar plantas que podem ser removidas de um programa de melhoramento ou plantio.[0074] An "unfavorable allele" of a marker is a marker allele that secretes with the unfavorable plant phenotype, thus providing the benefit of identifying plants that can be removed from a breeding or planting program.

[0075] O termo "rendimento" se refere à produtividade por área unitária de um produto de planta particular de valor comercial. O rendimento é afetado tanto por fatores genéticos quanto ambientais. "Agronômicos", “traços agronômicos", e "desempenho agronômico" se referem aos traços (e elementos genéticos subjacentes) de uma dada variedade de planta que contribuem para o rendimento ao longo da temporada de cultivo. Os traços agronômicos individuais incluem vigor da emergência, vigor vegetativo, tolerância ao estresse, resistência ou tolerância a doenças, resistência a herbicidas, ramificação, florescimento, conjunto de sementes, tamanho das sementes, densidade das sementes, resistência, capacidade para ser debulhado e semelhantes. O rendimento é, portanto, a culminação final de todos os traços agronômicos.[0075] The term "yield" refers to the productivity per unit area of a particular plant product of commercial value. Yield is affected by both genetic and environmental factors. "Agronomic", "agronomic traits", and "agronomic performance" refer to the traits (and underlying genetic elements) of a given plant variety that contribute to yield throughout the growing season. Individual agronomic traits include emergence vigor , vegetative vigor, stress tolerance, disease resistance or tolerance, herbicide resistance, branching, flowering, seed set, seed size, seed density, resistance, threshing capacity and the like. final culmination of all agronomic traits.

[0076] Loci marcadores que demonstram cossegregação estatisticamente significativa com um traço de resistência a doenças que confere resistência ampla contra uma doença ou doenças especificadas são proporcionados aqui. A detecção desses loci ou loci adicionais ligados e o gene de resistência podem ser usados em seleção auxiliada por marcador como parte de um programa de melhoramento para produzir plantas que têm resistência a uma doença ou doenças. Mapeamento genético[0076] Loci markers that demonstrate statistically significant cosegregation with a disease resistance trait that confers broad resistance against a specified disease or diseases are provided here. The detection of these additional linked loci or loci and the resistance gene can be used in marker-assisted selection as part of an breeding program to produce plants that are resistant to a disease or diseases. Genetic mapping

[0077] Foi reconhecido desde há algum tempo que os loci genéticos específicos que se correlacionam com fenótipos particulares, como resistência a doenças, podem ser mapeados no genoma de um organismo. O reprodutor de plantas pode usar vantajosamente marcadores moleculares para identificar indivíduos desejados detectando-se alelos marcadores que mostram uma probabilidade estatisticamente significativa de cossegregação com um fenótipo desejado, manifestado como desequilíbrio de ligação. Identificando-se um marcador molecular ou agrupamentos de marcadores moleculares que cossegregam com um traço de interesse,[0077] It has been recognized for some time that specific genetic loci that correlate with particular phenotypes, such as disease resistance, can be mapped into an organism's genome. The plant breeder can advantageously use molecular markers to identify desired individuals by detecting marker alleles that show a statistically significant probability of cosegregation with a desired phenotype, manifested as binding imbalance. Identifying a molecular marker or clusters of molecular markers that co-segregate with a trait of interest,

o reprodutor pode selecionar rapidamente um fenótipo desejado selecionando-se o alelo marcador molecular apropriado (um processo chamado seleção auxiliada por marcador ou MAS).the breeder can quickly select a desired phenotype by selecting the appropriate molecular marker allele (a process called marker-assisted selection or MAS).

[0078] Uma variedade de métodos bem conhecidos na técnica são disponibilizados para detectar marcadores moleculares ou agrupamentos de marcadores moleculares que se cossegregam com um traço de interesse, tal como um traço de resistência a doenças. A ideia básica subjacente a estes métodos é a detecção de marcadores, para os quais genótipos (ou alelos) alternativos têm fenótipos médios significativamente diferentes. Desse modo, uma pessoa faz uma comparação entre locos marcadores da magnitude de diferença entre genótipos (ou alelos) alternativos ou do nível de significância dessa diferença. Infere-se que os genes de características estão localizados mais próximos do(s) marcador(es) que têm a maior diferença genotípica associada. Dois métodos do tipo utilizados para detectar locos de características de interesse são: 1) Análise de associação com base em população (isto é, mapeamento de associação) e 2) Análise de ligação tradicional. Mapeamento de Associação[0078] A variety of methods well known in the art are available to detect molecular markers or clusters of molecular markers that co-secrete with a trait of interest, such as a disease resistance trait. The basic idea behind these methods is the detection of markers, for which alternative genotypes (or alleles) have significantly different mean phenotypes. In this way, a person makes a comparison between locus markers of the magnitude of difference between alternative genotypes (or alleles) or of the level of significance of that difference. It is inferred that the characteristic genes are located closer to the marker (s) that have the largest associated genotypic difference. Two such methods used to detect loci of characteristics of interest are: 1) Population-based association analysis (ie association mapping) and 2) Traditional linkage analysis. Association Mapping

[0079] Entender a extensão e os padrões de desequilíbrio de ligação (LD) no genoma é um pré-requisito para desenvolver abordagens de associação eficientes para identificar e mapear loci de traços quantitativos (QTL). O desequilíbrio de ligação (LD) se refere à associação não aleatória de alelos em uma coleção de indivíduos. Quando LD é observado dentre alelos em loci ligados, o mesmo é medido como decaimento de LD através de uma região específica de um cromossomo. A extensão do LD é um reflexo do histórico recombinatório daquela região. A taxa média de decaimento de LD em um genoma pode ajudar a prever o número e a densidade de marcadores que são necessários para empreender um estudo de associação em todo o genoma e fornece uma estimativa da resolução que pode ser esperada.[0079] Understanding the extent and patterns of linkage disequilibrium (LD) in the genome is a prerequisite for developing efficient association approaches to identify and map quantitative trace loci (QTL). Link imbalance (LD) refers to the non-random association of alleles in a collection of individuals. When LD is observed among alleles at linked loci, it is measured as LD decay through a specific region of a chromosome. The extension of the LD is a reflection of the recombinatory history of that region. The average rate of LD decay in a genome can help to predict the number and density of markers that are needed to undertake an association study across the genome and provides an estimate of the resolution that can be expected.

[0080] Mapeamento de associação ou LD tem como objetivo identificar associações genótipo-fenótipo significativas. O mesmo foi explorado como uma ferramenta poderosa para mapeamento fino em cruzamento exogâmico de espécies como humanos (Corder et al. (1994) "Protective effect of apolipoprotein-E type-2 allele for late-onset Alzheimer-disease", Nat Genet 7:180 a 184; Hastbacka et al. (1992) "Linkage disequilibrium mapping in isolated founder populations: diastrophic dysplasia in Finland" Nat Genet 2:204 a 211; Kerem et al. (1989) "Identification of the cystic fibrosis gene: genetic analysis", Science 245:1073 a 1080) e milho (Remington et al., (2001) "Structure of linkage disequilibrium and phenotype associations in the maize genome", Proc Natl Acad Sci USA 98:11479 a 11484; Thornsberry et al. (2001) "Dwarf8 polymorphisms associate with variation in flowering time", Nat Genet 28:286 a 289; revisado por Flint-Garcia et al. (2003) "Structure of linkage disequilibrium in plants", Annu Rev Plant Biol. 54:357 a 374), em que a recombinação entre heterozigotos é frequente e resulta em um decaimento rápido de LD. Em cruzamentos cossanguíneos de espécies em que a recombinação entre genótipos homozigóticos não é geneticamente detectável, a extensão de LD é maior (isto é, blocos maiores de marcadores ligados são herdados juntos) e isso intensifica dramaticamente o poder de detecção do mapeamento de associação (Wall e Pritchard (2003) "Haplotype blocks and linkage disequilibrium in the human genome", Nat Rev Genet 4:587 a 597).[0080] Association mapping or LD aims to identify significant genotype-phenotype associations. It was explored as a powerful tool for fine mapping in exogamous crossing of species like humans (Corder et al. (1994) "Protective effect of apolipoprotein-E type-2 allele for late-onset Alzheimer-disease", Nat Genet 7: 180 to 184; Hastbacka et al. (1992) "Linkage disequilibrium mapping in isolated founder populations: diastrophic dysplasia in Finland" Nat Genet 2: 204 to 211; Kerem et al. (1989) "Identification of the cystic fibrosis gene: genetic analysis ", Science 245: 1073 to 1080) and corn (Remington et al., (2001)" Structure of linkage disequilibrium and phenotype associations in the maize genome ", Proc Natl Acad Sci USA 98: 11479 to 11484; Thornsberry et al. ( 2001) "Dwarf8 polymorphisms associate with variation in flowering time", Nat Genet 28: 286 to 289; revised by Flint-Garcia et al. (2003) "Structure of linkage disequilibrium in plants", Annu Rev Plant Biol. 54: 357 a 374), where recombination between heterozygotes is frequent and results in rapid decay of LD. In cossanguine crosses of species where recombination between homozygous genotypes is not genetically detectable, the extent of LD is greater (that is, larger blocks of linked markers are inherited together) and this dramatically enhances the detection power of association mapping (Wall and Pritchard (2003) "Haplotype blocks and linkage disequilibrium in the human genome", Nat Rev Genet 4: 587 to 597).

[0081] O histórico recombinatório e de mutação de uma população é uma função do hábito de acasalamento, assim como do tamanho efetivo e a idade de uma população. Os tamanhos de população grandes oferecem possibilidades aprimoradas para detectar recombinação, enquanto as populações mais velhas são geralmente associadas a níveis mais altos de polimorfismo, ambos os quais contribuem para taxas aceleradas de modo observável de decaimento de LD. Por outro lado, os tamanhos de população efetivos menores, por exemplo, aqueles que experimentaram um efeito de gargalo genético recente, tendem a mostrar uma taxa mais lenta de decaimento de LD, o que resulta em conservação de haplótipos mais extensa (Flint-Garcia et al. (2003) "Structure of linkage disequilibrium in plants", Annu Rev Plant Biol. 54:357 a 374).[0081] The recombinatory and mutation history of a population is a function of the mating habit, as well as the effective size and age of a population. Large population sizes offer improved possibilities for detecting recombination, while older populations are generally associated with higher levels of polymorphism, both of which contribute to observably accelerated rates of LD decay. On the other hand, smaller effective population sizes, for example, those that have experienced a recent genetic bottleneck effect, tend to show a slower rate of LD decay, which results in more extensive haplotype conservation (Flint-Garcia et al. (2003) "Structure of linkage disequilibrium in plants", Annu Rev Plant Biol. 54: 357 to 374).

[0082] As linhagens de reprodução de elite fornecem um ponto de partida valioso para análises de associação. As análises de associação usam escores fenotípicos quantitativos (por exemplo, tolerância a doenças classificada de um a nove para cada linhagem) na análise (em oposição a olhar apenas para distribuições de frequência de alelos tolerantes versus resistentes em tipos de análise de distribuição de alelos intergrupos). A disponibilidade de dados de desempenho fenotípico detalhados coletados por programas de reprodução ao longo de múltiplos anos e ambientes para um número grande de linhagens de elite fornece um conjunto de dados valioso para análises de mapeamento de associação de marcadores genéticos. Isso cria o caminho para integração contínua entre pesquisa e aplicação e toma vantagem dos conjuntos de dados historicamente acumulados. Entretanto, um entendimento da relação entre polimorfismo e recombinação é útil no desenvolvimento de estratégias apropriadas para extrair de modo eficaz o máximo de informações desses recursos.[0082] Elite breeding lines provide a valuable starting point for association analysis. Association analyzes use quantitative phenotypic scores (for example, disease tolerance rated from one to nine for each strain) in the analysis (as opposed to looking only at frequency distributions of tolerant versus resistant alleles in types of intergroup allele distribution analysis. ). The availability of detailed phenotypic performance data collected by breeding programs over multiple years and environments for a large number of elite strains provides a valuable data set for analysis of association mapping of genetic markers. This creates the path for continuous integration between research and application and takes advantage of historically accumulated data sets. However, an understanding of the relationship between polymorphism and recombination is useful in developing appropriate strategies to effectively extract the maximum amount of information from these resources.

[0083] Esse tipo de análise de associação não gera nem necessita de quaisquer dados de mapa, mas é independente de posição de mapa. Essa análise compara o escore fenotípico das plantas com os genótipos nos vários loci. Subsequentemente, qualquer mapa adequado (por exemplo, um mapa compósito) pode ser opcionalmente usado para ajudar a observar a distribuição dos marcadores QTL e/ou agrupamento de marcadores QTL identificados com o uso de localizações de mapa anteriormente determinadas dos marcadores. Análise de ligação tradicional[0083] This type of association analysis does not generate or require any map data, but is independent of map position. This analysis compares the phenotypic score of the plants with the genotypes in the various loci. Subsequently, any suitable map (for example, a composite map) can optionally be used to help observe the distribution of the QTL markers and / or the grouping of QTL markers identified using previously determined map locations of the markers. Traditional bond analysis

[0084] Os mesmos princípios são subjacentes à análise de ligação tradicional; entretanto, LD é gerado criando-se uma população a partir de um número pequeno de fundadores. Os fundadores são selecionados para maximizar o nível de polimorfismo dentro da população construída, e sítios polimórficos são avaliados por seu nível de cossegregação com um dado fenótipo. Alguns métodos estatísticos foram usados para identificar associações marcador- traço significativas. Um tal método é uma abordagem de mapeamento de intervalo (Lander e Botstein, Genetics 121:185 a 199 (1989)), no qual cada uma das muitas posições ao longo de um mapa genético (dizer em intervalos de 1 cM) é testada quanto à probabilidade de um gene controlando um traço de interesse estar localizado naquela posição. Os dados de genótipo/fenótipo são usados para calcular, para cada posição de teste, um escore de LOD (log de razão de probabilidades). Quando o escore de LOD excede um valor de limiar, há evidência significativa da localização de um gene que controla a característica de interesse naquela posição no mapa genético (que estará entre dois locos marcadores particulares).[0084] The same principles underlie traditional linkage analysis; however, LD is generated by creating a population from a small number of founders. Founders are selected to maximize the level of polymorphism within the constructed population, and polymorphic sites are assessed for their level of co-segregation with a given phenotype. Some statistical methods were used to identify significant marker-trait associations. One such method is an interval mapping approach (Lander and Botstein, Genetics 121: 185 to 199 (1989)), in which each of the many positions along a genetic map (say at 1 cM intervals) is tested for the probability that a gene controlling a trait of interest is located in that position. The genotype / phenotype data is used to calculate, for each test position, an LOD score (probability ratio log). When the LOD score exceeds a threshold value, there is significant evidence of the location of a gene that controls the trait of interest in that position on the genetic map (which will be between two particular marker loci).

[0085] Locos marcadores que demonstram cossegregação estatisticamente significativa com um traço de resistência a doenças, conforme determinado pela análise de ligação tradicional e pela análise de associação em todo o genoma, são fornecidos no presente documento. A detecção desses locos ou locos ligados adicionais pode ser usada em programas de melhoramento assistido por marcadores para produzir plantas com resistência a doenças.[0085] Marker loci that demonstrate statistically significant cosegregation with a trace of disease resistance, as determined by traditional linkage analysis and association analysis across the genome, are provided in this document. The detection of these additional linked loci or loci can be used in marker-assisted breeding programs to produce disease-resistant plants.

[0086] As atividades em programas de reprodução auxiliados por marcador podem incluir, mas sem limitação: selecionar dentre populações de reprodução novas para identificar qual população tem a frequência mais alta de sequências de ácidos nucleicos favoráveis com base no genótipo histórico e associações de traços agronômicos, selecionar sequências de ácidos nucleicos favoráveis dentre progênie em populações de reprodução, selecionar dentre linhagens parentais com base na previsão de desempenho da progênie, e avançar linhagens em atividades de melhora de germoplasma com base na presença de sequências de ácidos nucleicos favoráveis. Intervalos cromossômicos[0086] Activities in marker-assisted breeding programs may include, but are not limited to: selecting from new breeding populations to identify which population has the highest frequency of favorable nucleic acid sequences based on historical genotype and associations of agronomic traits , select favorable nucleic acid sequences among progeny in breeding populations, select among parental strains based on progeny performance prediction, and advance strains in germplasm improvement activities based on the presence of favorable nucleic acid sequences. Chromosomal ranges

[0087] Os intervalos cromossômicos que se correlacionam com o traço de resistência a doenças são fornecidos.[0087] Chromosomal intervals that correlate with the disease resistance trait are provided.

Uma variedade de métodos bem conhecidos na técnica está disponível para identificar intervalos cromossômicos. Os limites de tais intervalos cromossômicos são traçados de modo a abranger marcadores que estarão ligados ao(s) gene(s) que controla(m) a característica de interesse. Em outras palavras, o intervalo cromossômico é traçado de modo que qualquer marcador que se situe dentro desse intervalo (incluindo os marcadores terminais que definem os limites do intervalo) possa ser usado como um marcador para um traço de resistência a doença.A variety of methods well known in the art are available for identifying chromosomal intervals. The limits of such chromosomal intervals are drawn to encompass markers that will be linked to the gene (s) that control (s) the characteristic of interest. In other words, the chromosome range is plotted so that any marker that falls within that range (including the terminal markers that define the limits of the range) can be used as a marker for a disease resistance trait.

[0088] Inversamente, por exemplo, se dois marcadores em estreita proximidade mostrarem cossegregação com o traço fenotípico desejado, algumas vezes não é claro se cada um desses marcadores identifica o mesmo gene ou dois genes diferentes ou múltiplos genes. Independentemente, o conhecimento de quantos genes estão em um intervalo físico/genômico particular não é necessário para implementar ou praticar o que é apresentado na presente revelação.Conversely, for example, if two markers in close proximity show cosegregation with the desired phenotypic trait, it is sometimes unclear whether each of these markers identifies the same gene or two different genes or multiple genes. Regardless, knowing how many genes are in a particular physical / genomic range is not necessary to implement or practice what is presented in the present disclosure.

[0089] Os intervalos cromossômicos também podem ser definidos por marcadores que estão ligados a (mostram desequilíbrio de ligação com) um gene resistente a doenças, e r2 é uma medida comum do desequilíbrio de ligação (LD) no contexto de estudos de associação. Se o valor r2 de LD entre um locus marcador de cromossomo 7 em um intervalo de interesse e outro locus marcador de cromossomo 7 em proximidade estreita for maior que 1/3 (Ardlie et al., Nature Reviews Genetics 3:299 a 309 (2002)), os loci estão em desequilíbrio de ligação entre si. Marcadores e relações de ligação[0089] Chromosomal intervals can also be defined by markers that are linked to (show linkage imbalance with) a disease-resistant gene, and r2 is a common measure of linkage imbalance (LD) in the context of association studies. If the LD value r2 between a chromosome 7 marker locus in a range of interest and another chromosome 7 marker locus in close proximity is greater than 1/3 (Ardlie et al., Nature Reviews Genetics 3: 299 to 309 (2002 )), the loci are unbalanced in connection with each other. Linking markers and relationships

[0090] Uma medida comum de ligação é a frequência com a qual os traços cossegregam. Isso pode ser expresso como uma porcentagem de cossegregação (frequência de recombinação) ou em centiMorgans (cM). O cM é uma unidade de medida de frequência de recombinação genética. Um cM é igual a uma chance de 1% de um traço em um locus genético ser separado de um traço em outro locus devido ao cruzamento ao longo de uma única geração (o que significa que os traços segregam juntos 99% do tempo). Devido ao fato de a distância cromossômica ser aproximadamente proporcional à frequência de cruzamento de eventos entre traços, há uma distância física aproximada que se correlaciona com a frequência de recombinação.[0090] A common measure of connection is the frequency with which the strokes co-secrete. This can be expressed as a percentage of cosegregation (frequency of recombination) or in centiMorgans (cM). The cM is a unit of measure for the frequency of genetic recombination. A cM is equal to a 1% chance that a trait in one genetic locus will be separated from a trait in another locus due to crossing over a single generation (meaning that the traits segregate together 99% of the time). Due to the fact that the chromosomal distance is approximately proportional to the frequency of crossing events between strokes, there is an approximate physical distance that correlates with the frequency of recombination.

[0091] Os loci marcadores são traços em si e podem ser avaliados de acordo com a análise de ligação padrão rastreando os loci marcadores durante a segregação. Desse modo, um cM é igual a uma chance de 1% de um locus marcador ser separado de outro locus, devido ao cruzamento em uma única geração.[0091] The marker loci are traits in themselves and can be evaluated according to the standard linkage analysis by tracking the marker loci during segregation. Thus, a cM is equal to a 1% chance that a marker locus will be separated from another locus, due to crossing in a single generation.

[0092] Quanto mais próximo um marcador estiver de um gene que controla um traço de interesse, mais eficaz e vantajoso esse marcador é como indicador para o traço desejado. Os loci estreitamente ligados exibem uma frequência de cruzamento inter- locus de cerca de 10% ou menos, preferencialmente cerca de 9% ou menos, ainda mais preferencialmente cerca de 8% ou menos, ainda mais preferencialmente cerca de 7% ou menos, ainda mais preferencialmente cerca de 6% ou menos, ainda mais preferencialmente cerca de 5% ou menos, ainda mais preferencialmente cerca de 4% ou menos, ainda mais preferencialmente cerca de 3% ou menos, e ainda mais preferencialmente cerca de 2% ou menos. Em modalidades altamente preferidas, os loci relevantes (por exemplo, um locus marcador e um locus-alvo) exibem uma frequência de recombinação de cerca de 1% ou menos, por exemplo, cerca de 0,75% ou menos, mais preferencialmente cerca de 0,5% ou menos, ou ainda mais preferencialmente cerca de 0,25% ou menos. Desse modo, os locos são separados por cerca de 10 cM, 9 cM, 8 cM, 7 cM, 6 cM, 5 cM, 4 cM, 3 cM, 2 cM, 1 cM, 0,75 cM, 0,5 cM ou 0,25 cM ou menos. Dito de outro modo, dois locos que estão localizados no mesmo cromossomo, e a uma distância tal que a recombinação entre os dois locos ocorre a uma frequência inferior a 10% (por exemplo, cerca de 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 0,75%, 0,5%, 0,25% ou menos), são considerados “próximos” um do outro.[0092] The closer a marker is to a gene that controls a trait of interest, the more effective and advantageous that marker is as an indicator for the desired trait. The closely linked loci exhibit an inter-locus crossing frequency of about 10% or less, preferably about 9% or less, even more preferably about 8% or less, even more preferably about 7% or less, even more preferably about 6% or less, even more preferably about 5% or less, even more preferably about 4% or less, even more preferably about 3% or less, and even more preferably about 2% or less. In highly preferred embodiments, the relevant loci (for example, a marker locus and a target locus) exhibit a recombination frequency of about 1% or less, for example, about 0.75% or less, more preferably about 0.5% or less, or even more preferably about 0.25% or less. Thus, the loci are separated by about 10 cM, 9 cM, 8 cM, 7 cM, 6 cM, 5 cM, 4 cM, 3 cM, 2 cM, 1 cM, 0.75 cM, 0.5 cM or 0.25 cM or less. In other words, two loci that are located on the same chromosome, and at such a distance that the recombination between the two loci occurs at a frequency of less than 10% (for example, about 9%, 8%, 7%, 6 %, 5%, 4%, 3%, 2%, 1%, 0.75%, 0.5%, 0.25% or less), are considered “close” to each other.

[0093] Embora alelos marcadores particulares possam cossegregar com o traço de resistência a doenças, é importante observar que o locus marcador não é necessariamente responsável pela expressão do fenótipo de resistência a doenças. Por exemplo, não é uma necessidade que a sequência polinucleotídica marcadora faça parte de um gene que é responsável pelo fenótipo resistente a doenças (por exemplo, faça parte da fase de leitura aberta do gene). A associação entre um alelo marcador específico e o traço de resistência a doenças é devido à fase de ligação de "acoplamento" original entre o alelo marcador e o alelo na linhagem ancestral de onde é originário o alelo. No final, com recombinação repetida, os eventos de permutação entre o marcador e o loco genético podem alterar esta orientação. Por esse motivo, o alelo marcador favorável pode se alterar dependendo da fase de ligação que existe no progenitor que tem resistência à doença que é usado para criar populações de segregação. Isso não muda o fato de que o marcador pode ser usado para monitorar a segregação do fenótipo. Apenas muda qual alelo marcador é considerado favorável em uma dada população de segregação.[0093] Although particular marker alleles may co-segment with the disease resistance trait, it is important to note that the marker locus is not necessarily responsible for the expression of the disease resistance phenotype. For example, it is not necessary that the marker polynucleotide sequence be part of a gene that is responsible for the disease resistant phenotype (for example, it is part of the gene's open reading phase). The association between a specific marker allele and the disease resistance trait is due to the original "coupling" binding phase between the marker allele and the allele in the ancestral lineage from which the allele originates. In the end, with repeated recombination, the permutation events between the marker and the genetic locus can change this orientation. For this reason, the favorable marker allele may change depending on the binding phase that exists in the parent that is resistant to the disease that is used to create segregation populations. This does not change the fact that the marker can be used to monitor segregation of the phenotype. It only changes which marker allele is considered favorable in a given population of segregation.

[0094] Os métodos apresentados no presente documento incluem detectar a presença de um ou mais alelos marcadores associados à resistência a doenças em uma planta e, então, identificar e/ou selecionar plantas que têm alelos favoráveis em tais loci marcadores. Foram identificados aqui marcadores como estando associados ao traço de resistência a doenças e, assim, podem ser usados para prever resistência a doenças em uma planta. Qualquer marcador dentro de 50 cM, 40 cM, 30 cM, 20 cM, 15 cM, 10 cM, 9 cM, 8 cM, 7 cM, 6 cM, 5 cM, 4 cM, 3 cM, 2 cM, 1 cM, 0,75 cM, 0,5 cM ou 0,25 cM (com base em um mapa genético baseado em meiose única) também pode ser usado para prever a resistência a doenças em uma planta. Seleção assistida por marcadores[0094] The methods presented in this document include detecting the presence of one or more marker alleles associated with disease resistance in a plant and then identifying and / or selecting plants that have favorable alleles at such marker loci. Markers have been identified here as being associated with the disease resistance trait and thus can be used to predict disease resistance in a plant. Any marker within 50 cM, 40 cM, 30 cM, 20 cM, 15 cM, 10 cM, 9 cM, 8 cM, 7 cM, 6 cM, 5 cM, 4 cM, 3 cM, 2 cM, 1 cM, 0 .75 cM, 0.5 cM or 0.25 cM (based on a genetic map based on single meiosis) can also be used to predict disease resistance in a plant. Marker-assisted selection

[0095] Os marcadores moleculares podem ser usados em uma variedade de aplicações de reprodução de planta (por exemplo, consultar Staub et al. (1996) Hortscience 31: 729 a 741; Tanksley (1983) Plant Molecular Biology Reporter. 1: 3-8). Uma das principais áreas de interesse é aumentar a eficiência do retrocruzamento e introgressão de genes com o uso de seleção auxiliada por marcadores (MAS). Um marcador molecular que demonstra ligação a um locus que afeta um traço fenotípico desejado fornece uma ferramenta útil para a seleção do traço em uma população de plantas. Isso é particularmente verdadeiro quando o fenótipo é difícil de ensaiar. Visto que os ensaios de marcador de DNA são menos trabalhosos e ocupam menos espaço físico do que a fenotipagem de campo, populações muito maiores podem ser ensaiadas, o que aumenta as chances de encontrar um recombinante com o segmento- alvo da linhagem doadora movido para a linhagem receptora. Quanto mais próxima a ligação, mais útil o marcador, visto que a recombinação é menos propensa a ocorrer entre o marcador e o gene que causa o traço, o que pode resultar em falsos positivos. Ter marcadores de flanqueamento diminui as chances de ocorrência de seleção de falsos positivos visto que um evento de recombinação dupla seria necessário. A situação ideal é ter um marcador no próprio gene, para que a recombinação não possa ocorrer entre o marcador e o gene. Em algumas modalidades, os métodos revelados aqui produzem um marcador em um gene de resistência a doenças, em que o gene foi identificado inferindo a localização genômica a partir do agrupamento de domínios conservados ou uma análise de agrupamento.[0095] Molecular markers can be used in a variety of plant breeding applications (for example, see Staub et al. (1996) Hortscience 31: 729 to 741; Tanksley (1983) Plant Molecular Biology Reporter. 1: 3- 8). One of the main areas of interest is to increase the efficiency of backcrossing and introgression of genes with the use of marker-assisted selection (MAS). A molecular marker that demonstrates binding to a locus that affects a desired phenotypic trait provides a useful tool for selecting the trait in a plant population. This is particularly true when the phenotype is difficult to test. Since DNA marker assays are less laborious and take up less physical space than field phenotyping, much larger populations can be tested, which increases the chances of finding a recombinant with the target segment of the donor strain moved to the receiving lineage. The closer the link, the more useful the marker, since recombination is less likely to occur between the marker and the gene that causes the trait, which can result in false positives. Having flanking markers decreases the chances of false positive selection occurring since a double recombination event would be necessary. The ideal situation is to have a marker on the gene itself, so that recombination cannot occur between the marker and the gene. In some embodiments, the methods disclosed here produce a marker on a disease resistance gene, in which the gene has been identified by inferring the genomic location from the cluster of conserved domains or a cluster analysis.

[0096] Quando um gene é introgressado por MAS, não apenas o gene é introduzido, como também as regiões de flanqueamento (Gepts. (2002). Crop Sci; 42: 1780-1790). Tal é referido como "arraste de ligação". No caso em que a planta doadora é altamente não relacionada com a planta receptora, essas regiões de flanqueamento têm genes adicionais que podem codificar características agronomicamente indesejáveis. Este “arraste de ligação” também pode resultar em rendimento reduzido ou outras características agronômicas negativas até mesmo após múltiplos ciclos de retrocruzamento na linhagem de elite.[0096] When a gene is introgressed by MAS, not only the gene is introduced, but also the flanking regions (Gepts. (2002). Crop Sci; 42: 1780-1790). This is referred to as "link drag". In the event that the donor plant is highly unrelated to the recipient plant, these flanking regions have additional genes that can encode agronomically undesirable characteristics. This “link drag” can also result in reduced yield or other negative agronomic characteristics even after multiple cycles of backcross in the elite line.

Tal também é por vezes referido como “arraste de rendimento”. O tamanho da região de flanqueamento pode ser diminuído por retrocruzamento adicional, embora isso não seja sempre bem-sucedido, visto que reprodutores não têm controle sobre o tamanho da região ou os pontos de interrupção de recombinação (Young et al. (1998) Genetics 120:579 a 585). Em reprodução clássica, é normalmente apenas por chance que são selecionadas recombinações que contribuem para uma redução do tamanho do segmento doador (Tanksley et al. (1989). Biotechnology 7: 257-264). Mesmo após 20 retrocruzamentos em retrocruzamentos desse tipo, uma pessoa pode esperar encontrar um pedaço razoavelmente grande do cromossomo doador ainda ligado ao gene selecionado.This is also sometimes referred to as “income drag”. The size of the flanking region can be decreased by additional backcrossing, although this is not always successful, as breeders have no control over the size of the region or the recombination breakpoints (Young et al. (1998) Genetics 120 : 579 to 585). In classical reproduction, it is usually only by chance that recombinations are selected that contribute to a reduction in the size of the donor segment (Tanksley et al. (1989). Biotechnology 7: 257-264). Even after 20 backcrosses in such backcrosses, a person can expect to find a reasonably large chunk of the donor chromosome still attached to the selected gene.

Com marcadores, no entanto, é possível selecionar aqueles indivíduos raros que experimentaram recombinação próxima ao gene de interesse.With markers, however, it is possible to select those rare individuals who have experienced recombination close to the gene of interest.

Em 150 plantas de retrocruzamento, há uma chance de 95% de que pelo menos uma planta tenha experimentado uma permutação dentro de 1 cM do gene, com base em uma distância de mapa de meiose única.In 150 backcross plants, there is a 95% chance that at least one plant has experienced a permutation within 1 cM of the gene, based on a unique meiosis map distance.

Os marcadores permitirão a identificação não equivocada desses indivíduos.The markers will allow the mistaken identification of these individuals.

Com um retrocruzamento adicional de 300 plantas, haverá 95% de probabilidade de um cruzamento em 1 cM de distância do mapa de meiose única do outro lado do gene, gerando um segmento em redor do gene-alvo menor do que 2 cM com base na distância do mapa de meiose única.With an additional 300 plants backcross, there will be a 95% probability of crossing 1 cM away from the unique meiosis map on the other side of the gene, generating a segment around the target gene less than 2 cM based on distance of the single meiosis map.

Isso pode ser cumprido em duas gerações com marcadores, enquanto teriam sido necessárias em média 100 gerações sem marcadores (Consulte Tanksley et al., supra). Quando a localização exata de um gene é conhecida, os marcadores de flanqueamento que circundam o gene podem ser utilizados para selecionar as recombinações em tamanhos de população diferentes. Por exemplo, em tamanhos populacionais menores, recombinações podem ser esperadas distantes do gene e, portanto, marcadores de flanqueamento mais distais serão necessários para detectar a recombinação.This can be accomplished in two generations with markers, while an average of 100 generations without markers would have been required (See Tanksley et al., Supra). When the exact location of a gene is known, the flanking markers surrounding the gene can be used to select recombination in different population sizes. For example, at smaller population sizes, recombination can be expected away from the gene and therefore more distal flanking markers will be needed to detect the recombination.

[0097] Os componentes-chave para a implantação de MAS são: (i) Definir a população dentro da qual a associação marcador- traço será determinada, a qual pode ser uma população de segregação, ou uma população aleatória ou estruturada; (ii) monitorar a segregação ou associação de marcadores polimórficos em relação ao traço, e determinar a ligação ou associação com o uso de métodos estatísticos; (iii) definir um conjunto de marcadores desejáveis com base nos resultados da análise estatística, e (iv) o uso e/ou extrapolação dessas informações para o conjunto atual de germoplasma de reprodução para possibilitar que sejam tomadas decisões de seleção com base em marcador. Os marcadores descritos nessa revelação, assim como outros tipos de marcador, como SSRs e FLPs, podem ser usados em protocolos de seleção auxiliados por marcador.[0097] The key components for the implantation of MAS are: (i) Define the population within which the marker-trait association will be determined, which can be a segregation population, or a random or structured population; (ii) monitor the segregation or association of polymorphic markers in relation to the trait, and determine the link or association with the use of statistical methods; (iii) defining a set of desirable markers based on the results of the statistical analysis, and (iv) the use and / or extrapolation of this information to the current set of reproductive germplasm to enable selection decisions to be made based on the marker. The markers described in this disclosure, as well as other types of markers, such as SSRs and FLPs, can be used in marker-assisted selection protocols.

[0098] SSRs podem ser definidos como rondas relativamente curtas de DNA repetido em tandem com comprimentos de 6 pb ou menos (Tautz (1989) Nucleic Acid Research 17: 6463 a 6471; Wang et al. (1994) Theoretical and Applied Genetics, 88:1 a 6). Polimorfismos surgem devido à variação do número de unidades de repetição, provavelmente causados por deslize durante a replicação de DNA (Levinson e Gutman (1987) Mol Biol Evol 4: 203-221). A variação do comprimento das repetições pode ser detectada projetando-se iniciadores de PCR para as regiões de flanqueamento não repetitivas conservadas (Weber e May (1989) Am J Hum Genet. 44:388 a 396). SSRs são altamente adequados para mapeamento e MAS visto que são multialélicos, codominantes, reproduzíveis e propensos a automatização de produtividade alta (Rafalski et al. (1996) "Generating and using DNA markers in plants". Em: Non- mammalian genomic analysis: a practical guide. Academic press. páginas 75 a 135).[0098] SSRs can be defined as relatively short rounds of DNA repeated in tandem with lengths of 6 bp or less (Tautz (1989) Nucleic Acid Research 17: 6463 to 6471; Wang et al. (1994) Theoretical and Applied Genetics, 88 : 1 to 6). Polymorphisms arise due to the variation in the number of repetition units, probably caused by slipping during DNA replication (Levinson and Gutman (1987) Mol Biol Evol 4: 203-221). The variation in the length of the repetitions can be detected by designing PCR primers for the conserved non-repetitive flanking regions (Weber and May (1989) Am J Hum Genet. 44: 388 to 396). SSRs are highly suitable for mapping and MAS since they are multi-allelic, codominant, reproducible and prone to high productivity automation (Rafalski et al. (1996) "Generating and using DNA markers in plants". In: Non-mammalian genomic analysis: a practical guide. Academic press. pages 75 to 135).

[0099] Vários tipos de marcadores SSR podem ser gerados, e perfis de SSR podem ser obtidos por eletroforese em gel dos produtos de amplificação. O escore de genótipo de marcador tem base no tamanho do fragmento amplificado.[0099] Various types of SSR markers can be generated, and SSR profiles can be obtained by gel electrophoresis of the amplification products. The marker genotype score is based on the size of the amplified fragment.

[0100] Vários tipos de marcadores FLP também podem ser gerados. Muito comumente, iniciadores de amplificação são usados para gerar polimorfismos de comprimento de fragmento. Tais marcadores FLP são de muitas maneiras similares aos marcadores SSR, exceto pela região amplificada pelos iniciadores não ser tipicamente uma região altamente repetitiva. Adicionalmente, a região amplificada, ou amplicon, terá variabilidade suficiente entre germoplasma, frequentemente devido a inserções ou deleções, de modo que os fragmentos gerados pelos iniciadores de amplificação podem ser distinguidos entre indivíduos polimórficos, e tais indels são conhecidos por ocorrerem frequentemente em milho (Bhattramakki et al. (2002). Plant Mol Biol 48, 539 a 547; Rafalski (2002b), supra).[0100] Various types of FLP markers can also be generated. Very commonly, amplification primers are used to generate fragment length polymorphisms. Such FLP markers are in many ways similar to SSR markers, except that the region amplified by the primers is not typically a highly repetitive region. In addition, the amplified region, or amplicon, will have sufficient variability between germplasm, often due to insertions or deletions, so that fragments generated by amplification primers can be distinguished between polymorphic individuals, and such indels are known to occur frequently in maize ( Bhattramakki et al. (2002). Plant Mol Biol 48, 539 to 547; Rafalski (2002b), supra).

[0101] Os marcadores SNP detectam substituições de nucleotídeos de pares de bases únicos.[0101] SNP markers detect single base pair nucleotide substitutions.

Dentre todos os tipos de marcador molecular, SNPs são os mais abundantes, tendo, desse modo, o potencial para fornecer a resolução de mapa genético mais alta (Bhattramakki et al. 2002 Plant Molecular Biology 48:539 a 547). Os SNPs podem ser avaliados em um nível ainda mais alto de produtividade do que SSRs, de uma maneira chamada de “produtividade ultra-alta”, visto que SNPs não necessitam de quantidades grandes de DNA e a automatização do ensaio pode ser simples.Among all types of molecular marker, SNPs are the most abundant, thus having the potential to provide the highest genetic map resolution (Bhattramakki et al. 2002 Plant Molecular Biology 48: 539 to 547). SNPs can be evaluated at an even higher level of productivity than SSRs, in a way called “ultra-high productivity”, since SNPs do not require large amounts of DNA and automating the assay can be simple.

Os SNPs também prometem ser sistemas de custo relativamente baixo.SNPs also promise to be relatively low-cost systems.

Esses três fatores juntos tornam SNPs altamente atrativos para uso em MAS.These three factors together make SNPs highly attractive for use in MAS.

Estão disponíveis vários métodos para a genotipagem de SNPs, incluindo mas não se limitando a, hibridação, extensão de iniciadores, ligação de oligonucleotídeos, clivagem por nucleases, minissequenciamento e esferas codificadas.Various methods are available for SNP genotyping, including but not limited to, hybridization, primer extension, oligonucleotide binding, nuclease cleavage, mini-sequencing and encoded beads.

Tais métodos foram revistos em: Gut (2001) Hum Mutat 17 pp. 475-492; Shi (2001) Clin Chem 47, pp. 164-172; Kwok (2000) Pharmacogenomics 1, pp. 95-100; e Bhattramakki e Rafalski (2001) "Discovery and application of single nucleotide polymorphism markers in plants". Em: R.Such methods were reviewed in: Gut (2001) Hum Mutat 17 pp. 475-492; Shi (2001) Clin Chem 47, pp. 164-172; Kwok (2000) Pharmacogenomics 1, pp. 95-100; and Bhattramakki and Rafalski (2001) "Discovery and application of single nucleotide polymorphism markers in plants". In R.

J.J.

Henry, Ed, Plant Genotyping: The DNA Fingerprinting of Plants, CABI Publishing, Wallingford.Henry, Ed, Plant Genotyping: The DNA Fingerprinting of Plants, CABI Publishing, Wallingford.

Uma faixa ampla de tecnologias comercialmente disponíveis utiliza esses e outros métodos para interrogar SNPs incluindo Masscode.TM. (Qiagen), INVADER®. (Third Wave Technologies) e Invader PLUS®, SNAPSHOT®. (Applied Biosystems), TAQMAN®. (Applied Biosystems) e BEADARRAYS®. (Illumina).A wide range of commercially available technologies use these and other methods to interrogate SNPs including Masscode.TM. (Qiagen), INVADER®. (Third Wave Technologies) and Invader PLUS®, SNAPSHOT®. (Applied Biosystems), TAQMAN®. (Applied Biosystems) and BEADARRAYS®. (Illumina).

[0102] Alguns SNPs juntos dentro de uma sequência, ou através de sequências ligadas, podem ser usados para descrever um haplótipo para qualquer genótipo particular (Ching et al. (2002), BMC Genet. 3:19 páginas Gupta et al. 2001, Rafalski (2002b), Plant Science 162:329 a 333). Os haplótipos podem ser mais informativos do que SNPs únicos e podem ser mais descritivos de qualquer genótipo particular. Por exemplo, um SNP único pode ser o alelo “T” para uma linhagem ou variedade específica com resistência a doenças, mas o alelo “T” também pode ocorrer na população de melhoramento sendo utilizada para progenitores recorrentes. Nesse caso, um haplótipo, por exemplo, uma combinação de alelos em marcadores SNP ligados, pode ser mais informativo. Depois de um haplótipo único ter sido atribuído a uma região cromossômica doadora, esse haplótipo pode ser usado nessa população ou qualquer seu subconjunto para determinar se um indivíduo tem um gene particular. Consulte, por exemplo, WO2003054229. O uso de plataformas de detecção de marcadores de produtividade alta automatizadas conhecidas por aqueles de habilidade comum na técnica torna esse processo altamente eficiente e eficaz.[0102] Some SNPs together within a sequence, or through linked sequences, can be used to describe a haplotype for any particular genotype (Ching et al. (2002), BMC Genet. 3:19 pages Gupta et al. 2001, Rafalski (2002b), Plant Science 162: 329 to 333). Haplotypes can be more informative than single SNPs and can be more descriptive of any particular genotype. For example, a single SNP can be the "T" allele for a specific strain or strain with disease resistance, but the "T" allele can also occur in the breeding population being used for recurrent parents. In this case, a haplotype, for example, a combination of alleles on linked SNP markers, can be more informative. After a single haplotype has been assigned to a donor chromosomal region, that haplotype can be used in that population or any subset of it to determine whether an individual has a particular gene. See, for example, WO2003054229. The use of automated high productivity marker detection platforms known to those of ordinary skill in the art makes this process highly efficient and effective.

[0103] Muitos dos marcadores apresentados aqui podem ser prontamente usados como marcadores de polimorfismo de um único nucleotídeo (SNP) para selecionar o gene R. Com o uso de PCR, os iniciadores são usados para amplificar segmentos de DNA a partir de indivíduos (preferencialmente congênitos) que representam a diversidade da população de interesse. Os produtos de PCR são sequenciados diretamente em uma ou ambas as direções. As sequências resultantes são alinhadas e polimorfismos são identificados. Os polimorfismos não são limitados a polimorfismos de nucleotídeo único (SNPs), mas também incluem indels, CAPS, SSRs e VNTRs (número variável de repetições em tandem). Especificamente em relação às informações de mapa fino descritas no presente documento, uma pessoa pode usar prontamente as informações fornecidas no presente documento para obter SNPs polimórficos adicionais (e outros marcadores) dentro da região amplificada pelos iniciadores aqui revelados. Os marcadores dentro da região de mapa descrita podem ser hibridados com BACs ou outras bibliotecas genômicas, ou eletronicamente alinhados com sequências de genoma, para encontrar sequências novas na mesma localização aproximada da dos marcadores descritos.[0103] Many of the markers presented here can readily be used as single nucleotide polymorphism (SNP) markers to select the R gene. With the use of PCR, primers are used to amplify DNA segments from individuals (preferably birth defects) that represent the diversity of the population of interest. PCR products are sequenced directly in one or both directions. The resulting sequences are aligned and polymorphisms are identified. Polymorphisms are not limited to single nucleotide polymorphisms (SNPs), but also include indels, CAPS, SSRs and VNTRs (variable number of tandem repetitions). Specifically in relation to the thin map information described in this document, a person can readily use the information provided in this document to obtain additional polymorphic SNPs (and other markers) within the region amplified by the initiators disclosed herein. Markers within the described map region can be hybridized with BACs or other genomic libraries, or electronically aligned with genome sequences, to find new sequences in the same approximate location as the described markers.

[0104] Além de SSRs, FLPs e SNPs, conforme descrito acima, outros tipos de marcadores moleculares também são amplamente usados, incluindo, mas sem limitação, etiquetas de sequência expressas (ESTs), marcadores SSR derivados de sequências EST, DNA polimórfico aleatoriamente amplificado (RAPD), e outros marcadores à base de ácidos nucleicos.[0104] In addition to SSRs, FLPs and SNPs, as described above, other types of molecular markers are also widely used, including, but not limited to, express sequence tags (ESTs), SSR markers derived from EST sequences, randomly amplified polymorphic DNA (RAPD), and other nucleic acid based markers.

[0105] Os perfis de isozima e características morfológicas ligadas também podem ser, em alguns casos, indiretamente usados como marcadores. Mesmo apesar de não detectarem diretamente diferenças de DNA, os mesmos são frequentemente influenciados por diferenças genéticas específicas. Entretanto, os marcadores que detectam a variação de DNA são muito mais numerosos e polimórficos do que os marcadores de isozima ou morfológicos (Tanksley (1983) Plant Molecular Biology Reporter 1:3 a 8).[0105] Isozyme profiles and linked morphological characteristics can also, in some cases, be used indirectly as markers. Even though they do not directly detect DNA differences, they are often influenced by specific genetic differences. However, markers that detect DNA variation are much more numerous and polymorphic than isozyme or morphological markers (Tanksley (1983) Plant Molecular Biology Reporter 1: 3 to 8).

[0106] Os alinhamentos de sequência ou contigs também podem ser usados para encontrar sequências a montante ou a jusante dos marcadores específicos mencionados no presente documento. Essas sequências novas, próximas dos marcadores descritos no presente documento, são, então, usadas para descobrir e desenvolver marcadores funcionalmente equivalentes. Por exemplo, mapas físicos e/ou genéticos diferentes são alinhados para localizar marcadores equivalentes não descritos na presente divulgação, mas que estão dentro de regiões similares. Esses mapas podem estar dentro da espécie, ou até mesmo através de outras espécies que foram genética ou fisicamente alinhadas.[0106] Sequence alignments or contigs can also be used to find sequences upstream or downstream of the specific markers mentioned in this document. These new sequences, close to the markers described in this document, are then used to discover and develop functionally equivalent markers. For example, different physical and / or genetic maps are aligned to locate equivalent markers not described in the present disclosure, but which are within similar regions. These maps can be within the species, or even through other species that have been genetically or physically aligned.

[0107] De modo geral, MAS usa marcadores polimórficos que foram identificados como tendo uma probabilidade significativa de cossegregação com um traço, tal como o traço de resistência a doenças. Se presume que tais marcadores mapeiam próximo de um gene ou genes que fornecem à planta seu fenótipo resistente a doenças, e são considerados como indicadores para o traço desejado, ou marcadores. As plantas são testadas quanto à presença de um alelo desejado no marcador, e se espera que as plantas contendo um genótipo desejado em um ou mais locos transfiram o genótipo desejado, juntamente com um fenótipo desejado, à sua progênie. Desse modo, as plantas com resistência a doenças podem ser selecionadas detectando um ou mais alelos marcadores e, além disso, plantas da progênie derivadas de tais plantas também podem ser selecionadas. Desse modo, uma planta que contém um genótipo desejado em uma determinada região cromossômica (isto é, um genótipo associado a resistência a doenças) é obtida e, então,[0107] In general, MAS uses polymorphic markers that have been identified as having a significant probability of co-segregation with a trait, such as the disease resistance trait. Such markers are presumed to map near a gene or genes that provide the plant with its disease-resistant phenotype, and are considered as indicators for the desired trait, or markers. The plants are tested for the presence of a desired allele in the marker, and plants containing a desired genotype at one or more loci are expected to transfer the desired genotype, along with a desired phenotype, to their progeny. In this way, disease-resistant plants can be selected by detecting one or more marker alleles and, in addition, progeny plants derived from such plants can also be selected. In this way, a plant that contains a desired genotype in a given chromosomal region (that is, a genotype associated with disease resistance) is obtained and then

cruzada com outra planta. A progênie de tal cruzamento será, então, avaliada genotipicamente com o uso de um ou mais marcadores e as plantas da progênie com o mesmo genótipo em uma determinada região cromossômica serão, então, selecionadas como tendo resistência a doenças.crossed with another plant. The progeny of such a cross will then be evaluated genotypically using one or more markers and the plants of the progeny with the same genotype in a given chromosomal region will then be selected as having disease resistance.

[0108] Os SNPs podem ser usados isoladamente ou em combinação (isto é, um haplótipo de SNP) para selecionar um alelo de gene resistente favorável associado a resistência a doenças.[0108] SNPs can be used alone or in combination (ie, a SNP haplotype) to select a favorable resistant gene allele associated with disease resistance.

[0109] O artesão versado na técnica esperará que possa haver sítios polimórficos adicionais em loci marcadores em e em torno de um marcador cromossômico identificado pelos métodos revelados aqui, em que um ou mais sítios polimórficos estão em desequilíbrio de ligação (LD) com um alelo em um ou mais dos sítios polimórficos no haplótipo e podem ser usados, desse modo, em um programa de seleção auxiliada por marcadores para introgressar um alelo de gene ou fragmento genômico de interesse. Dois alelos particulares em sítios polimórficos diferentes são ditos como estando em LD se a presença do alelo em um dos sítios tender a prever a presença do alelo no outro sítio no mesmo cromossomo (Stevens, Mol. Diag. 4:309 a 317 (1999)). Os loci marcadores podem ser localizados em 5 cM, 2 cM ou 1 cM (em um mapa genético à base de meiose única) do do traço de QTL de resistência a doenças.[0109] The artisan skilled in the art will expect that there may be additional polymorphic sites at marker loci in and around a chromosomal marker identified by the methods disclosed here, where one or more polymorphic sites are in unbalance (LD) with an allele at one or more of the polymorphic sites in the haplotype and can thus be used in a marker-assisted selection program to introgress a gene allele or genomic fragment of interest. Two particular alleles at different polymorphic sites are said to be in LD if the presence of the allele at one of the sites tends to predict the presence of the allele at the other site on the same chromosome (Stevens, Mol. Diag. 4: 309 to 317 (1999) ). The marker loci can be located at 5 cM, 2 cM or 1 cM (in a single meiosis-based genetic map) of the disease-resistant QTL trait.

[0110] O artesão versado entenderá que a frequência alélica (e, portanto, a frequência de haplótipo) pode diferir de uma reunião de germoplasma para outra. As reuniões de germoplasma variam devido a diferenças de maturidade, agrupamentos heteróticos, distribuição geográfica, etc. Como resultado, os SNPs e outros polimorfismos podem não ser informativos em algumas reuniões de germoplasma. Composições de planta[0110] The skilled artisan will understand that the allelic frequency (and therefore the haplotype frequency) may differ from one germplasm assembly to another. Germplasm meetings vary due to differences in maturity, heterotic groupings, geographic distribution, etc. As a result, SNPs and other polymorphisms may not be informative in some germplasm meetings. Plant compositions

[0111] As plantas identificadas e/ou selecionadas por qualquer um dos métodos descritos acima também são de interesse. Proteínas e Variantes e Fragmentos Das Mesmas[0111] The plants identified and / or selected by any of the methods described above are also of interest. Proteins and Variants and Fragments of the Same

[0112] Polipeptídeos de genes R são abrangidos pela revelação. "Polipeptídeo de gene R" e "proteína de gene R", como usados aqui alternadamente, se relacionam com polipeptídeo(s) tendo uma atividade de resistência a doenças. Uma variedade de polipeptídeos de gene R é contemplada. Em algumas modalidades, o gene R é um gene NLR01. Em uma modalidade, o gene NLR01 codifica um polipeptídeo como apresentado na SEQ ID NO: 2. Em outra modalidade, a SEQ ID NO: 1 codifica o polipeptídeo como apresentado na SEQ ID NO: 2. "Suficientemente idêntico" é usado aqui para referir uma sequência de aminoácidos que tem pelo menos cerca de 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais de identidade de sequência. Em algumas modalidades, a identidade de sequência é contra a sequência completa de um polipeptídeo. O termo "cerca de" quando usado no presente documento em contexto com identidade de sequência em porcentagem significa +/- 1,0%.[0112] Polypeptides of R genes are covered by the disclosure. "R gene polypeptide" and "R gene protein", as used herein interchangeably, relate to polypeptide (s) having disease-resistant activity. A variety of R gene polypeptides are contemplated. In some embodiments, the R gene is an NLR01 gene. In one embodiment, the NLR01 gene encodes a polypeptide as shown in SEQ ID NO: 2. In another embodiment, SEQ ID NO: 1 encodes the polypeptide as shown in SEQ ID NO: 2. "Sufficiently identical" is used here to refer to an amino acid sequence that is at least about 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83 %, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more of string identity. In some embodiments, the sequence identity is against the complete sequence of a polypeptide. The term "about" when used in this document in context with percent sequence identity means +/- 1.0%.

[0113] Uma "proteína recombinante" é usado aqui para referir uma proteína que já não está no seu ambiente natural, por exemplo, in vitro ou em uma célula hospedeira recombinante bacteriana ou de planta; uma proteína que é expressa a partir de um polinucleotídeo que foi editado relativamente à sua versão nativa; ou uma proteína que é expressa a partir de um polinucleotídeo em uma posição genômica diferente relativamente à sequência nativa.[0113] A "recombinant protein" is used here to refer to a protein that is no longer in its natural environment, for example, in vitro or in a recombinant bacterial or plant host cell; a protein that is expressed from a polynucleotide that has been edited relative to its native version; or a protein that is expressed from a polynucleotide in a different genomic position relative to the native sequence.

[0114] “Substancialmente isento de material celular”, conforme usado no presente documento, refere-se a um polipeptídeo que inclui preparações de proteína que têm menos de cerca de 30%, 20%, 10% ou 5% (em peso seco) de proteína não alvo (também denominada no presente documento como “proteína contaminante”).[0114] "Substantially free of cellular material", as used herein, refers to a polypeptide that includes protein preparations that are less than about 30%, 20%, 10% or 5% (in dry weight) of non-target protein (also referred to herein as “contaminating protein”).

[0115] "Fragmentos" ou "porções biologicamente ativas" incluem fragmentos de polipeptídeos ou polinucleotídeos compreendendo sequências suficientemente idênticas a um polipeptídeo ou polinucleotídeo de gene R, respectivamente, e que exibem resistência a doenças quando expressos em uma planta.[0115] "Fragments" or "biologically active moieties" include fragments of polypeptides or polynucleotides comprising sequences sufficiently identical to an R gene polypeptide or polynucleotide, respectively, and which exhibit disease resistance when expressed in a plant.

[0116] "Variantes", como usado aqui, se relaciona com proteínas ou polipeptídeos tendo uma sequência de aminoácidos que é pelo menos cerca de 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais idêntica à sequência de aminoácidos paterna.[0116] "Variants", as used here, relate to proteins or polypeptides having an amino acid sequence that is at least about 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81 %, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or more identical to the paternal amino acid sequence.

[0117] Métodos para tais manipulações são geralmente conhecidos na técnica. Por exemplo, as variantes de sequências de aminoácidos de um polipeptídeo podem ser preparadas por mutações no DNA. Isso pode ser também realizado por uma dentre diversas formas de mutagênese, tal como, por exemplo, tecnologia de quebra de fita dupla específica para sítio e/ou em evolução dirigida. Em alguns aspectos, as mudanças codificadas na sequência de aminoácidos não afetarão substancialmente a função da proteína. Tais variantes terão a atividade desejada. No entanto, é entendido que a capacidade de um polipeptídeo de gene R para conferir resistência a doenças pode ser aprimorada pelo uso de tais técnicas nas composições desta revelação. Moléculas de Ácidos Nucleicos e Variantes e Fragmentos das Mesmas[0117] Methods for such manipulations are generally known in the art. For example, amino acid sequence variants of a polypeptide can be prepared by mutations in the DNA. This can also be accomplished by one of several forms of mutagenesis, such as, for example, site-specific and / or directed evolution double-strand breaking technology. In some ways, the changes encoded in the amino acid sequence will not substantially affect the function of the protein. Such variants will have the desired activity. However, it is understood that the ability of an R gene polypeptide to confer resistance to disease can be enhanced by the use of such techniques in the compositions of this disclosure. Nucleic Acid Molecules and Variants and Fragments of the Same

[0118] As moléculas de ácido nucleico isoladas ou recombinantes que compreendem sequências de ácido nucleico que codificam polipeptídeos de gene R ou porções biologicamente ativas dos mesmos, assim como moléculas de ácido nucleico suficientes para uso como sondas de hibridação para identificar moléculas de ácido nucleico que codificam as proteínas com regiões de homologia de sequência são fornecidas. Conforme usado no presente documento, o termo "molécula de ácido nucleico" se refere a moléculas de DNA (por exemplo, DNA recombinante, cDNA, DNA genômico, DNA plastídico, DNA mitocondrial) e moléculas de RNA (por exemplo, mRNA) e análogos do DNA ou RNA gerados com o uso de análogos nucleotídicos. A molécula de ácido nucleico pode ser de fita única ou de fita dupla, mas preferencialmente é DNA de fita dupla.[0118] Isolated or recombinant nucleic acid molecules comprising nucleic acid sequences encoding R gene polypeptides or biologically active portions thereof, as well as nucleic acid molecules sufficient for use as hybridization probes to identify nucleic acid molecules that encoding proteins with regions of sequence homology are provided. As used herein, the term "nucleic acid molecule" refers to DNA molecules (eg, recombinant DNA, cDNA, genomic DNA, plastidic DNA, mitochondrial DNA) and RNA molecules (eg, mRNA) and analogues of DNA or RNA generated using nucleotide analogs. The nucleic acid molecule can be single-stranded or double-stranded, but is preferably double-stranded DNA.

[0119] Uma molécula de ácido nucleico (ou DNA) "isolada" é usada no presente documento para se referir a uma sequência de ácido nucleico (ou DNA) que não está mais em seu ambiente natural, por exemplo, in vitro. Uma molécula de ácido nucleico (ou DNA) “recombinante” é usada no presente documento para se referir a uma sequência de ácido nucleico (ou DNA) que está em uma célula hospedeira bacteriana ou de planta recombinante; foi editada relativamente à sua sequência nativa; ou está localizada em uma localização diferente relativamente à sequência nativa. Em algumas modalidades, um ácido nucleico "isolado" ou "recombinante" está livre de sequências (preferentemente sequências que codificam proteínas) que flanqueiam naturalmente o ácido nucleico (ou seja, sequências localizadas nas extremidades 5' e 3' do ácido nucleico) no DNA genômico do organismo do qual o ácido nucleico é derivado. Para os propósitos da revelação, "isolado" ou "recombinante" quando usado para referir moléculas de ácido nucleico, exclui cromossomos isolados. Por exemplo, em várias modalidades, as moléculas de ácido nucleico recombinante que codificam polipeptídeos de gene R podem conter menos de cerca de 5 kb, 4 kb, 3 kb, 2 kb, 1 kb, 0,5 kb ou 0,1 kb de sequências de ácido nucleico que flanqueiam naturalmente a molécula de ácido nucleico no DNA genômico da célula da qual o ácido nucleico é derivado.[0119] An "isolated" nucleic acid (or DNA) molecule is used in this document to refer to a nucleic acid (or DNA) sequence that is no longer in its natural environment, for example, in vitro. A "recombinant" nucleic acid (or DNA) molecule is used herein to refer to a nucleic acid (or DNA) sequence that is in a recombinant bacterial or plant host cell; it was edited in relation to its native sequence; or is located in a different location relative to the native string. In some embodiments, an "isolated" or "recombinant" nucleic acid is free of sequences (preferably protein-encoding sequences) that naturally flank the nucleic acid (i.e., sequences located at the 5 'and 3' ends of the nucleic acid) in the DNA genome of the organism from which the nucleic acid is derived. For the purposes of the disclosure, "isolated" or "recombinant" when used to refer to nucleic acid molecules, excludes isolated chromosomes. For example, in various embodiments, recombinant nucleic acid molecules encoding R gene polypeptides may contain less than about 5 kb, 4 kb, 3 kb, 2 kb, 1 kb, 0.5 kb or 0.1 kb of nucleic acid sequences that naturally flank the nucleic acid molecule in the genomic DNA of the cell from which the nucleic acid is derived.

[0120] Em algumas modalidades, uma molécula de ácido nucleico isolada que codifica polipeptídeos de gene R tem uma ou mais alterações na sequência de ácido nucleico em comparação com a sequência de ácido nucleico nativa ou genômica. Em algumas modalidades, a mudança na sequência de ácido nucleico nativa ou genômica inclui, mas sem limitação: mudanças na sequência de ácido nucleico devido à degenerescência do código genético; mudanças na sequência de ácido nucleico devido à substituição, inserção, deleção e/ou adição de aminoácidos em comparação com a sequência nativa ou genômica; remoção de um ou mais íntrons; deleção de uma ou mais regiões reguladoras a montante ou a jusante, e deleção da região 5' e/ou 3' não traduzida associada à sequência de ácido nucleico genômico. Em algumas modalidades, a molécula de ácido nucleico que codifica um polipeptídeo de gene R é uma sequência não genômica.[0120] In some embodiments, an isolated nucleic acid molecule encoding R gene polypeptides has one or more changes in the nucleic acid sequence compared to the native or genomic nucleic acid sequence. In some embodiments, the change in the native or genomic nucleic acid sequence includes, but is not limited to: changes in the nucleic acid sequence due to the degeneracy of the genetic code; changes in the nucleic acid sequence due to substitution, insertion, deletion and / or addition of amino acids compared to the native or genomic sequence; removing one or more introns; deletion of one or more regulatory regions upstream or downstream, and deletion of the 5 'and / or 3' untranslated region associated with the genomic nucleic acid sequence. In some embodiments, the nucleic acid molecule that encodes an R gene polypeptide is a non-genomic sequence.

[0121] Uma variedade de polinucleotídeos que codificam polipeptídeos de gene R ou proteínas relacionadas é contemplada. Tais polinucleotídeos são úteis para a produção de polipeptídeos de gene R em células hospedeiras quando ligados de modo operacional a uma sequência promotora, de terminação de transcrição e/ou de poliadenilação adequada. Tais polinucleotídeos também são úteis como sondas para isolar polinucleotídeos homólogos ou substancialmente homólogos que codificam polipeptídeos de gene R ou proteínas relacionadas. Em algumas modalidades, o gene R é um gene NLR01. Em uma modalidade, o gene NLR01 codifica um polipeptídeo como apresentado na SEQ ID NO: 2. Em outra modalidade, a SEQ ID NO: 1 codifica o polipeptídeo como apresentado na SEQ ID NO: 2.[0121] A variety of polynucleotides encoding R gene polypeptides or related proteins are contemplated. Such polynucleotides are useful for the production of R gene polypeptides in host cells when operably linked to a suitable promoter, transcription termination and / or polyadenylation sequence. Such polynucleotides are also useful as probes to isolate homologous or substantially homologous polynucleotides that encode R gene polypeptides or related proteins. In some embodiments, the R gene is an NLR01 gene. In one embodiment, the NLR01 gene encodes a polypeptide as shown in SEQ ID NO: 2. In another embodiment, SEQ ID NO: 1 encodes the polypeptide as shown in SEQ ID NO: 2.

[0122] “Complemento" é usado no presente documento para se referir a uma sequência de ácido nucleico que é suficientemente complementar a uma dada sequência de ácido nucleico, de modo que a mesma pode hibridar com a dada sequência de ácido nucleico para desse modo formar um dúplex estável. “Variantes de sequência de polinucleotídeo" é usado no presente documento para referir a uma sequência de ácido nucleico que, exceto pela degenerescência do código genético, codifica o mesmo polipeptídeo.[0122] "Complement" is used herein to refer to a nucleic acid sequence that is sufficiently complementary to a given nucleic acid sequence, so that it can hybridize to the given nucleic acid sequence to thereby form a stable duplex. "Polynucleotide sequence variants" is used in this document to refer to a nucleic acid sequence that, except for the degeneracy of the genetic code, encodes the same polypeptide.

[0123] Em algumas modalidades, a molécula de ácido nucleico que codifica o polipeptídeo de gene R é uma sequência de ácido nucleico não genômica. Conforme usado no presente documento, uma "sequência de ácido nucleico não genômica" ou "molécula de ácido nucleico não genômica" ou "polinucleotídeo não genômico" se refere a uma molécula de ácido nucleico que tem uma ou mais alterações na sequência de ácido nucleico em comparação a uma sequência de ácido nucleico nativa ou genômica. Em algumas modalidades, a mudança em relação a uma molécula de ácido nucleico nativa ou genômica inclui, porém sem limitação: mudanças na sequência de ácido nucleico devido à degenerescência do código genético; otimização da sequência de ácido nucleico para expressão em plantas; mudanças na sequência de ácido nucleico para introduzir pelo menos uma substituição, inserção, deleção e/ou adição de aminoácidos em comparação com a sequência nativa ou genômica; remoção de um ou mais íntrons associados à sequência de ácido nucleico genômica; inserção de um ou mais íntrons heterólogos; deleção de uma ou mais regiões reguladoras a montante ou a jusante associadas à sequência de ácido nucleico genômica; inserção de uma ou mais regiões reguladoras a montante ou a jusante heterólogas; deleção da região não traduzida 5' e/ou 3' associada à sequência de ácido nucleico genômico; inserção de uma região não traduzida 5' e/ou 3' heteróloga, e modificação de um sítio de poliadenilação. Em algumas modalidades, a molécula de ácido nucleico não genômico é uma sequência de ácido nucleico sintético.[0123] In some embodiments, the nucleic acid molecule encoding the R gene polypeptide is a non-genomic nucleic acid sequence. As used herein, a "non-genomic nucleic acid sequence" or "non-genomic nucleic acid molecule" or "non-genomic polynucleotide" refers to a nucleic acid molecule that has one or more changes in the nucleic acid sequence in comparison to a native or genomic nucleic acid sequence. In some embodiments, the change from a native or genomic nucleic acid molecule includes, but is not limited to: changes in the nucleic acid sequence due to the degeneracy of the genetic code; optimization of the nucleic acid sequence for expression in plants; changes in the nucleic acid sequence to introduce at least one amino acid substitution, insertion, deletion and / or addition compared to the native or genomic sequence; removing one or more introns associated with the genomic nucleic acid sequence; insertion of one or more heterologous introns; deletion of one or more regulatory regions upstream or downstream associated with the genomic nucleic acid sequence; insertion of one or more heterologous upstream or downstream regulatory regions; deletion of the 5 'and / or 3' untranslated region associated with the genomic nucleic acid sequence; insertion of a 5 'and / or 3' heterologous untranslated region, and modification of a polyadenylation site. In some embodiments, the non-genomic nucleic acid molecule is a sequence of synthetic nucleic acid.

[0124] Moléculas de ácidos nucleicos que são fragmentos dessas sequências de ácidos nucleicos que codificam polipeptídeos de gene R também são abrangidas pelas modalidades. “Fragmento", conforme usado no presente documento, se refere a uma porção da sequência de ácido nucleico que codifica um polipeptídeo de gene R. Um fragmento de uma sequência de ácido nucleico pode codificar uma porção biologicamente ativa de um polipeptídeo de gene R ou pode ser um fragmento que pode ser usado como uma sonda de hibridação ou iniciador de PCR com o uso dos métodos revelados abaixo. As moléculas de ácido nucleico são fragmentos de uma sequência de ácido nucleico que codifica um polipeptídeo de gene R compreendem pelo menos cerca de 150, 180, 210, 240, 270, 300, 330, 360, 400, 450 ou 500 nucleotídeos contíguos ou até o número de nucleotídeos presentes em uma sequência de ácido nucleico de comprimento total que codifica um polipeptídeo de gene R identificado pelos métodos revelados no presente documento, dependendo do uso pretendido. “Nucleotídeos contíguos" é usado no presente documento para referir resíduos de nucleotídeos que são imediatamente adjacentes uns aos outros. Os fragmentos das sequências de ácidos nucleicos das modalidades codificarão fragmentos de proteína que retêm a atividade biológica do polipeptídeo de gene R e, por isso, retêm resistência a doenças. "Retêm resistência a doenças" é usado aqui para referir um polipeptídeo tendo pelo menos cerca de 10%, pelo menos cerca de 30%, pelo menos cerca de 50%, pelo menos cerca de 70%, 80%, 90%, 95% ou mais da resistência a doenças do polipeptídeo de gene R completo.[0124] Nucleic acid molecules that are fragments of those nucleic acid sequences that encode R gene polypeptides are also covered by the modalities. "Fragment", as used herein, refers to a portion of the nucleic acid sequence that encodes an R gene polypeptide. A fragment of a nucleic acid sequence may encode a biologically active portion of a R gene polypeptide or may be a fragment that can be used as a hybridization probe or PCR primer using the methods disclosed below. Nucleic acid molecules are fragments of a nucleic acid sequence encoding an R gene polypeptide comprising at least about 150 , 180, 210, 240, 270, 300, 330, 360, 400, 450 or 500 contiguous nucleotides or even the number of nucleotides present in a full-length nucleic acid sequence encoding an R gene polypeptide identified by the methods disclosed in this document, depending on the intended use. “Contiguous nucleotides" is used in this document to refer to nucleotide residues that are immediately adjacent to each other . Fragments of the nucleic acid sequences of the modalities will encode protein fragments that retain the biological activity of the R gene polypeptide and therefore retain disease resistance. "Retain disease resistance" is used here to refer to a polypeptide having at least about 10%, at least about 30%, at least about 50%, at least about 70%, 80%, 90%, 95% or more of the disease resistance of the complete R gene polypeptide.

[0125] “Porcentagem (%) de identidade de sequência” relativamente a uma sequência de referência (tema) é determinada como a porcentagem de resíduos de aminoácidos ou nucleotídeos em uma sequência candidata (de busca) que são idênticos aos resíduos de aminoácidos ou nucleotídeos respectivos na sequência de referência, depois do alinhamento das sequências e da introdução de intervalos, se necessário, para se alcançar a porcentagem máxima de identidade de sequência, e não considerando quaisquer substituições conservativas de aminoácidos como parte da identidade de sequência. O alinhamento com propósitos de determinação da porcentagem de identidade de sequência pode ser alcançado de vários modos que estão dentro da habilidade da técnica, por exemplo, com o uso de software de computador publicamente disponível, tal como BLAST, BLAST-2. Os indivíduos versados na técnica podem determinar parâmetros adequados para alinhar sequências, incluindo quaisquer algoritmos necessários para se alcançar o alinhamento máximo ao longo de todo o comprimento das sequências que estão a ser comparadas. A identidade percentual entre as duas sequências é uma função do número de posições idênticas compartilhadas pelas sequências (por exemplo, identidade percentual de sequência de busca = número de posições idênticas entre as sequências de busca e de tema/número total de posições de sequência de busca ×100).[0125] "Percentage (%) of sequence identity" relative to a reference sequence (theme) is determined as the percentage of amino acid or nucleotide residues in a candidate (search) sequence that are identical to amino acid or nucleotide residues in the reference sequence, after aligning the sequences and introducing intervals, if necessary, to achieve the maximum percentage of sequence identity, and not considering any conservative amino acid substitutions as part of the sequence identity. Alignment for purposes of determining the percentage of sequence identity can be achieved in a number of ways that are within the skill of the art, for example, with the use of publicly available computer software, such as BLAST, BLAST-2. Those skilled in the art can determine suitable parameters for aligning sequences, including any algorithms necessary to achieve maximum alignment over the entire length of the sequences being compared. The percent identity between the two strings is a function of the number of identical positions shared by the strings (for example, percent search string identity = number of identical positions between the search strings and theme / total number of search string positions × 100).

[0126] As modalidades também abrangem moléculas de ácidos nucleicos que codificam variantes de polipeptídeo de gene R. “Variantes" das sequências de ácido nucleico que codificam os polipeptídeos de gene R incluem aquelas sequências que codificam os polipeptídeos de gene R identificados pelos métodos revelados no presente documento, mas que diferem conservativamente devido à degenerescência do código genético assim como aquelas que são suficientemente idênticas conforme discutido acima. As variantes alélicas de ocorrência natural podem ser identificadas com o uso de técnicas de biologia molecular bem conhecidas, tais como reação em cadeia da polimerase (PCR) e técnicas de hibridação conforme delineado acima. As sequências de ácidos nucleicos variantes também incluem sequências de ácidos nucleicos sinteticamente derivadas que foram geradas, por exemplo, com o uso de mutagênese sítio- dirigida, mas que ainda codificam os polipeptídeos de gene R revelados aqui.[0126] The modalities also encompass nucleic acid molecules that encode variants of the R gene polypeptide. "Variants" of the nucleic acid sequences that encode the R gene polypeptides include those sequences that encode the R gene polypeptides identified by the methods disclosed in present document, but which differ conservatively due to the degeneracy of the genetic code as well as those which are sufficiently identical as discussed above. Naturally occurring allelic variants can be identified with the use of well-known molecular biology techniques, such as polymerase (PCR) and hybridization techniques as outlined above.The variant nucleic acid sequences also include synthetically derived nucleic acid sequences that have been generated, for example, using site-directed mutagenesis, but which still encode gene polypeptides R revealed here.

[0127] O perito na técnica irá também apreciar que mudanças podem ser introduzidas por mutação das sequências de ácidos nucleicos, o que leva a mudanças na sequência de aminoácidos dos polipeptídeos de gene R codificados, sem alterar a atividade biológica das proteínas. Portanto, as moléculas de ácidos nucleicos variantes podem ser criadas introduzindo uma ou mais substituições, adições e/ou deleções de nucleotídeos na sequência de ácido nucleico correspondente revelada no presente documento, de modo que uma ou mais substituições, adições ou deleções de aminoácidos são introduzidas na proteína codificada. As mutações podem ser introduzidas por técnicas padrão, como mutagênese dirigida a sítios e mutagênese mediada por PCR. Tais sequências de ácidos nucleicos variantes são também englobadas pela presente divulgação.[0127] The person skilled in the art will also appreciate that changes can be introduced by mutating the nucleic acid sequences, which leads to changes in the amino acid sequence of the encoded R gene polypeptides, without altering the biological activity of the proteins. Therefore, variant nucleic acid molecules can be created by introducing one or more nucleotide substitutions, additions and / or deletions into the corresponding nucleic acid sequence disclosed herein, so that one or more amino acid substitutions, additions or deletions are introduced. in the encoded protein. Mutations can be introduced by standard techniques, such as site-directed mutagenesis and PCR-mediated mutagenesis. Such variant nucleic acid sequences are also encompassed by the present disclosure.

[0128] Alternativamente, as sequências de ácidos nucleicos variantes podem ser preparadas introduzindo mutações aleatoriamente ao longo de toda ou parte da sequência de codificação, como por mutagênese por saturação, e os mutantes resultantes podem ser triados quanto à capacidade para conferir atividade com o propósito de identificar mutantes que retêm a atividade. Após a mutagênese, a proteína codificada pode ser expressa de modo recombinante e a atividade da proteína pode ser determinada com o uso de técnicas de ensaio padrão.[0128] Alternatively, variant nucleic acid sequences can be prepared by introducing mutations at random throughout all or part of the coding sequence, as by saturation mutagenesis, and the resulting mutants can be screened for the ability to confer activity for the purpose to identify mutants that retain activity. After mutagenesis, the encoded protein can be expressed recombinantly and the activity of the protein can be determined using standard assay techniques.

[0129] Os polinucleotídeos da divulgação e fragmentos dos mesmos são opcionalmente usados como substratos para uma variedade de reações de recombinação e recombinação recursiva, além de métodos de clonagem padrão, conforme estabelecido, por exemplo, em Ausubel, Berger e Sambrook, isto é, para produzir homólogos de polipeptídeos adicionais e fragmentos dos mesmos com propriedades desejadas. Uma variedade de tais reações é conhecida. Métodos para produzir uma variante de qualquer ácido nucleico listado no presente documento compreendendo recombinar recursivamente tal polinucleotídeo com um segundo polinucleotídeo (ou mais), formando, assim, uma biblioteca de polinucleotídeos variantes, são também modalidades da divulgação, assim como as bibliotecas produzidas, as células que compreendem as bibliotecas e qualquer polinucleotídeo recombinante produzido por tais métodos. Adicionalmente, tais métodos compreendem opcionalmente selecionar um polinucleotídeo variante de tais bibliotecas com base na atividade, em que tal combinação recursiva é feita in vitro ou in vivo.[0129] The polynucleotides of the disclosure and fragments thereof are optionally used as substrates for a variety of recombination and recursive recombination reactions, in addition to standard cloning methods, as established, for example, in Ausubel, Berger and Sambrook, that is, to produce additional polypeptide homologues and fragments thereof with desired properties. A variety of such reactions are known. Methods for producing a variant of any nucleic acid listed in this document comprising recursively recombining such a polynucleotide with a second polynucleotide (or more), thus forming a library of variant polynucleotides, are also modalities of disclosure, as are the libraries produced, the cells comprising the libraries and any recombinant polynucleotide produced by such methods. In addition, such methods optionally comprise selecting a polynucleotide variant from such libraries based on activity, where such a recursive combination is made in vitro or in vivo.

[0130] Uma variedade de protocolos geradores de diversidade, incluindo protocolos de recombinação recursiva de ácido nucleico, está disponível e completamente descrita na técnica. Os procedimentos podem ser usados separadamente e/ou em combinação para produzir uma ou mais variantes de um ácido nucleico ou conjunto de ácidos nucleicos, assim como variantes de proteínas codificadas. Individual e coletivamente, esses procedimentos fornecem maneiras amplamente aplicáveis e robustas para gerar ácidos nucleicos diversificados e conjuntos de ácidos nucleicos (incluindo, por exemplo, bibliotecas de ácidos nucleicos) úteis, por exemplo, para a modificação ou evolução rápida de ácidos nucleicos, proteínas, vias, células e/ou organismos com características novas e/ou melhoradas.[0130] A variety of diversity-generating protocols, including nucleic acid recursive recombination protocols, are available and fully described in the art. The procedures can be used separately and / or in combination to produce one or more variants of a nucleic acid or set of nucleic acids, as well as variants of encoded proteins. Individually and collectively, these procedures provide widely applicable and robust ways to generate diverse nucleic acids and sets of nucleic acids (including, for example, nucleic acid libraries) useful, for example, for the modification or rapid evolution of nucleic acids, proteins, pathways, cells and / or organisms with new and / or improved characteristics.

[0131] Embora distinções e classificações sejam feitas no decorrer da discussão por motivos de clareza, será notado que as técnicas normalmente não são mutuamente exclusivas. De fato, os vários métodos podem ser usados isoladamente ou em combinação, em paralelo ou em série, para acessar diversas variantes de sequência.[0131] Although distinctions and classifications are made in the course of the discussion for the sake of clarity, it will be noted that the techniques are normally not mutually exclusive. In fact, the various methods can be used alone or in combination, in parallel or in series, to access different sequence variants.

[0132] O resultado de qualquer um dos procedimentos de geração de diversidade descritos no presente documento pode ser a geração de um ou mais ácidos nucleicos, os quais podem ser selecionados ou triados quanto a ácidos nucleicos com ou que conferem propriedades desejáveis ou que codificam proteínas com ou que conferem propriedades desejáveis. Após a diversificação por um ou mais dos métodos no presente documento ou disponíveis de outro modo para uma pessoa versada na técnica, quaisquer ácidos nucleicos que sejam produzidos podem ser selecionados quanto a uma atividade ou propriedade desejada, por exemplo, tal atividade a um pH desejado, etc. Isso pode incluir identificar qualquer atividade que possa ser detectada, por exemplo, em um formato automatizado ou automatizável, por qualquer um dentre os ensaios da técnica.[0132] The result of any of the diversity generation procedures described in this document may be the generation of one or more nucleic acids, which can be selected or screened for nucleic acids with or which confer desirable properties or which encode proteins with or that confer desirable properties. After diversification by one or more of the methods in this document or otherwise available to a person skilled in the art, any nucleic acids that are produced can be selected for a desired activity or property, for example, such an activity at a desired pH , etc. This may include identifying any activity that can be detected, for example, in an automated or automatable format, by any of the tests of the technique.

Uma variedade de propriedades relacionadas (ou até mesmo não relacionadas) pode ser avaliada, em série ou em paralelo, a critério do praticante.A variety of related (or even unrelated) properties can be evaluated, in series or in parallel, at the discretion of the practitioner.

[0133] As sequências de nucleotídeos das modalidades podem ser também usadas para isolar sequências correspondentes de uma fonte diferente. Dessa maneira, métodos como PCR, hibridação e similares podem ser usados para identificar tais sequências com base em sua homologia de sequência com as sequências identificadas pelos métodos revelados no presente documento. As sequências que são selecionadas com base em sua identidade de sequência com as sequências inteiras apresentadas no presente documento ou com os fragmentos das mesmas são abrangidas pelas modalidades. Tais sequências incluem sequências que são ortólogos das sequências. O termo "ortólogos" se refere a genes derivados de um gene ancestral comum e que são encontrados em diferentes espécies como resultado da especiação. Os genes encontrados em diferentes espécies são considerados ortólogos quando as suas sequências de nucleotídeos e/ou as suas sequências de proteínas codificadas partilham identidade substancial como definido noutro local no presente documento.[0133] The nucleotide sequences of the modalities can also be used to isolate corresponding sequences from a different source. In this way, methods such as PCR, hybridization and the like can be used to identify such sequences based on their sequence homology with the sequences identified by the methods disclosed in this document. Sequences that are selected based on their sequence identity with the entire sequences presented in this document or with their fragments are covered by the modalities. Such sequences include sequences that are orthologous to the sequences. The term "orthologists" refers to genes derived from a common ancestral gene and which are found in different species as a result of speciation. The genes found in different species are considered orthologs when their nucleotide sequences and / or their encoded protein sequences share substantial identity as defined elsewhere in this document.

[0134] Em uma abordagem de PCR, os iniciadores oligonucleotídicos podem ser projetados para o uso em reações de PCR para amplificar sequências de DNA correspondentes a partir de cDNA ou DNA genômico extraído de qualquer organismo de interesse. Métodos para projetar iniciadores de PCR e clonagem por PCR são geralmente conhecidos na técnica e são divulgados em Sambrook, et al., (1989) Molecular Cloning: A Laboratory Manual (2ª edição, Cold[0134] In a PCR approach, oligonucleotide primers can be designed for use in PCR reactions to amplify corresponding DNA sequences from cDNA or genomic DNA extracted from any organism of interest. Methods for designing PCR primers and PCR cloning are generally known in the art and are disclosed in Sambrook, et al., (1989) Molecular Cloning: A Laboratory Manual (2nd edition, Cold

Spring Harbor Laboratory Press, Plainview, Nova Iorque), daqui em diante no presente documento, "Sambrook". Consultar também Innis, et al., editores (1990) PCR Protocols: A Guide to Methods and Applications (Academic Press, Nova Iorque); Innis e Gelfand, editores (1995) PCR Strategies (Academic Press, Nova Iorque); e Innis e Gelfand, editores (1999) PCR Methods Manual (Academic Press, Nova Iorque). Métodos conhecidos de PCR incluem, mas não estão limitados a, métodos utilizando iniciadores emparelhados, iniciadores encaixados, iniciadores específicos únicos, iniciadores degenerados, iniciadores específicos para genes, iniciadores específicos para vetores, iniciadores com emparelhamento parcialmente defeituoso, e semelhantes.Spring Harbor Laboratory Press, Plainview, New York), hereinafter in this document, "Sambrook". See also Innis, et al., Editors (1990) PCR Protocols: A Guide to Methods and Applications (Academic Press, New York); Innis and Gelfand, editors (1995) PCR Strategies (Academic Press, New York); and Innis and Gelfand, editors (1999) PCR Methods Manual (Academic Press, New York). Known methods of PCR include, but are not limited to, methods using paired primers, nested primers, unique specific primers, degenerate primers, gene-specific primers, vector-specific primers, partially mismatched primers, and the like.

[0135] Em métodos de hibridação, toda ou parte da sequência de ácido nucleico pode ser usada para triar bibliotecas de cDNA ou genômicas. Métodos para construção de tais bibliotecas de cDNA e genômicas são geralmente conhecidos na técnica e são revelados em Sambrook e Russell, (2001), supra. As chamadas sondas de hibridação podem ser fragmentos de DNA genômico, fragmentos de cDNA, fragmentos de RNA ou outros oligonucleotídeos e podem ser etiquetadas com um grupo detectável, como 32P ou qualquer outro marcador detectável, como outros radioisótopos, um composto fluorescente, uma enzima ou um cofator enzimático. As sondas para hibridação podem ser produzidas marcando-se oligonucleotídeos sintéticos com base nas sequências de ácidos nucleicos codificadoras de polipeptídeos conhecidas reveladas no presente documento. Iniciadores degenerados projetados com base em nucleotídeos ou resíduos de aminoácidos conservados na sequência de ácido nucleico ou sequência de aminoácidos codificada podem adicionalmente ser usados. A sonda compreende tipicamente uma região de sequência de ácido nucleico que hibrida sob condições estringentes com pelo menos cerca de 12, pelo menos cerca de 25, pelo menos cerca de 50, 75, 100, 125, 150, 175 ou 200 nucleotídeos consecutivos de sequências de ácidos nucleicos que codificam polipeptídeos ou um fragmento ou variante dos mesmos. Os métodos para a preparação de sondas para condições de hibridação e estringência são geralmente conhecidos na técnica e são revelados em Sambrook e Russell, (2001), supra. Construtos de Nucleotídeos, Cassetes de Expressão e Vetores[0135] In hybridization methods, all or part of the nucleic acid sequence can be used to screen cDNA or genomic libraries. Methods for constructing such cDNA and genomic libraries are generally known in the art and are disclosed in Sambrook and Russell, (2001), supra. The so-called hybridization probes can be fragments of genomic DNA, fragments of cDNA, fragments of RNA or other oligonucleotides and can be labeled with a detectable group, such as 32P or any other detectable marker, such as other radioisotopes, a fluorescent compound, an enzyme or an enzymatic cofactor. Hybridization probes can be produced by tagging synthetic oligonucleotides based on the nucleic acid sequences encoding known polypeptides disclosed herein. Degenerate primers designed based on nucleotides or amino acid residues conserved in the nucleic acid sequence or encoded amino acid sequence can additionally be used. The probe typically comprises a nucleic acid sequence region that hybridizes under stringent conditions to at least about 12, at least about 25, at least about 50, 75, 100, 125, 150, 175 or 200 consecutive nucleotides of sequences nucleic acids encoding polypeptides or a fragment or variant thereof. Methods for preparing probes for hybridization and stringency conditions are generally known in the art and are disclosed in Sambrook and Russell, (2001), supra. Nucleotide Constructs, Expression Cassettes and Vectors

[0136] O uso do termo "construtos de nucleotídeos" no presente documento não é destinado a limitar as modalidades aos construtos de nucleotídeos que compreendem DNA. Os habitualmente peritos na técnica reconhecerão que construtos de nucleotídeos, particularmente polinucleotídeos e oligonucleotídeos compostos por ribonucleotídeos e combinações de ribonucleotídeos e desoxirribonucleotídeos, podem também ser empregues nos métodos aqui revelados. Os construtos de nucleotídeos, ácidos nucleicos e sequências de nucleotídeos das modalidades abrangem adicionalmente todas as formas complementares de tais construtos, moléculas e sequências. Além disso, os construtos de nucleotídeos, moléculas de nucleotídeos e sequências de nucleotídeos das modalidades abrangem todos os construtos, moléculas e sequências de nucleotídeos que podem ser empregues nos métodos das modalidades para transformação de plantas incluindo, mas não se limitando a,[0136] The use of the term "nucleotide constructs" in this document is not intended to limit modalities to nucleotide constructs that comprise DNA. Those of ordinary skill in the art will recognize that nucleotide constructs, particularly polynucleotides and oligonucleotides composed of ribonucleotides and combinations of ribonucleotides and deoxyribonucleotides, can also be employed in the methods disclosed herein. The nucleotide constructs, nucleic acids and nucleotide sequences of the modalities additionally cover all complementary forms of such constructs, molecules and sequences. In addition, the nucleotide constructs, nucleotide molecules and nucleotide sequences of the modalities encompass all the constructs, molecules and nucleotide sequences that can be employed in the methods of the modalities for transforming plants including, but not limited to,

aqueles compreendidos por desoxirribonucleotídeos, ribonucleotídeos, e suas combinações. Tais desoxirribonucleotídeos e ribonucleotídeos incluem tanto moléculas de ocorrência natural como análogos sintéticos. Os construtos de nucleotídeos, ácidos nucleicos e sequências de nucleotídeos das modalidades também abrangem todas as formas de construtos de nucleotídeos incluindo, mas sem limitação, formas de fita única, formas de fita dupla, grampos, estruturas de haste e alça e semelhantes.those comprised of deoxyribonucleotides, ribonucleotides, and their combinations. Such deoxyribonucleotides and ribonucleotides include both naturally occurring molecules and synthetic analogs. The nucleotide constructs, nucleic acids and nucleotide sequences of the modalities also encompass all forms of nucleotide constructs including, but not limited to, single-stranded forms, double-stranded forms, clamps, rod and loop structures and the like.

[0137] Uma modalidade adicional se refere a um organismo transformado, como um organismo selecionado dentre células de plantas, bactérias, levedura, baculovírus, protozoários, nematódeos e algas. O organismo transformado compreende uma molécula de DNA das modalidades, um cassete de expressão que compreende a molécula de DNA ou um vetor que compreende o cassete de expressão, o qual pode ser incorporado de modo estável no genoma do organismo transformado.[0137] An additional modality refers to a transformed organism, such as an organism selected from cells of plants, bacteria, yeast, baculovirus, protozoa, nematodes and algae. The transformed organism comprises a DNA molecule of the modalities, an expression cassette comprising the DNA molecule or a vector comprising the expression cassette, which can be stably incorporated into the genome of the transformed organism.

[0138] As sequências das modalidades são fornecidas em construtos de DNA para expressão no organismo de interesse. O construto incluirá sequências reguladoras 5' e 3' ligadas de modo operacional a uma sequência das modalidades. O termo “operativamente ligado”, conforme usado no presente documento, se refere a uma ligação funcional entre um promotor e uma segunda sequência, em que a sequência promotora inicia e medeia a transcrição da sequência de DNA correspondente à segunda sequência. De modo geral, ligado operativamente significa que as sequências de ácidos nucleicos sendo ligadas são contíguas e, quando necessário, para unir duas regiões de codificação de proteína no mesmo quadro de leitura. O construto pode conter adicionalmente pelo menos um gene adicional a ser cotransformado no organismo. Alternativamente, o(s) gene(s) adicional(ais) pode(m) ser proporcionado(s) em múltiplos construtos de DNA.[0138] The modalities sequences are provided in DNA constructs for expression in the organism of interest. The construct will include regulatory sequences 5 'and 3' operably linked to a sequence of modalities. The term "operably linked", as used herein, refers to a functional link between a promoter and a second sequence, where the promoter sequence initiates and mediates the transcription of the DNA sequence corresponding to the second sequence. In general, operatively linked means that the nucleic acid sequences being linked are contiguous and, when necessary, to join two protein coding regions in the same reading frame. The construct can additionally contain at least one additional gene to be co-transformed in the organism. Alternatively, the additional gene (s) can be provided in multiple DNA constructs.

[0139] Tal construto de DNA é dotado de uma pluralidade de sítios de restrição para que a inserção da sequência genética do polipeptídeo da revelação fique sob regulação de transcrição das regiões reguladoras. O construto de DNA pode adicionalmente conter genes marcadores selecionáveis.[0139] Such a DNA construct is provided with a plurality of restriction sites so that the insertion of the genetic sequence of the polypeptide of the disclosure is under transcriptional regulation of the regulatory regions. The DNA construct can additionally contain selectable marker genes.

[0140] O construto de DNA incluirá geralmente, na direção de 5' para 3' de transcrição: uma região de iniciação de transcrição e tradução (isto é, um promotor), uma sequência de DNA das modalidades, e uma região de terminação de transcrição e de tradução (isto é, região de terminação) funcional no organismo que serve como um hospedeiro. A região de iniciação de transcrição (isto é, o promotor) pode ser nativa, análoga, estranha ou heteróloga ao organismo hospedeiro e/ou à sequência das modalidades. Adicionalmente, o promotor pode ser a sequência natural ou alternativamente uma sequência sintética. O termo "estranho", tal como aqui utilizado, indica que o promotor não se encontra no organismo nativo no qual o promotor é introduzido. Quando o promotor é "estranho" ou "heterólogo" à sequência das modalidades, se pretende que o promotor não seja o promotor nativo ou de ocorrência natural para a sequência operativamente ligada das modalidades. Tal como aqui utilizado, um gene quimérico compreende uma sequência de codificação operativamente ligada a uma região de iniciação da transcrição que é heteróloga à sequência de codificação. Quando o promotor é uma sequência nativa ou natural, a expressão da sequência ligada operativamente é alterada da expressão de tipo selvagem, o que resulta em uma alteração no fenótipo.[0140] The DNA construct will generally include, in the 5 'to 3' direction of transcription: a transcription and translation initiation region (ie, a promoter), a DNA sequence for the modalities, and a termination region for transcription and translation (i.e., termination region) functional in the organism that serves as a host. The transcription initiation region (i.e., the promoter) can be native, analogous, foreign or heterologous to the host organism and / or the sequence of modalities. In addition, the promoter can be the natural sequence or alternatively a synthetic sequence. The term "foreign", as used herein, indicates that the promoter is not found in the native organism into which the promoter is introduced. When the promoter is "foreign" or "heterologous" to the sequence of the modalities, it is intended that the promoter is not the native or naturally occurring promoter for the operably linked sequence of the modalities. As used herein, a chimeric gene comprises a coding sequence operably linked to a transcription initiation region that is heterologous to the coding sequence. When the promoter is a native or natural sequence, the expression of the operably linked sequence is altered from that of wild type, which results in a change in the phenotype.

[0141] Em algumas modalidades, o construto de DNA compreende um polinucleotídeo codificando um polipeptídeo de gene R das modalidades. Em algumas modalidades, o construto de DNA compreende um polinucleotídeo que codifica uma proteína de fusão que compreende um polipeptídeo de gene R das modalidades.[0141] In some embodiments, the DNA construct comprises a polynucleotide encoding an R gene polypeptide of the modalities. In some embodiments, the DNA construct comprises a polynucleotide that encodes a fusion protein that comprises a modal R gene polypeptide.

[0142] Em algumas modalidades, o construto de DNA também pode incluir uma sequência intensificadora da transcrição. Conforme usado no presente documento, o termo um "intensificador" se refere a uma sequência de DNA que pode estimular a atividade promotora e pode ser um elemento inato do promotor ou um elemento heterólogo inserido para acentuar o nível ou a especificidade para tecidos de um promotor. Vários intensificadores são conhecidos na técnica incluindo, por exemplo, íntrons com propriedades de intensificação de expressão de gene em plantas (Publicação de Pedido de Patente Número US 2009/0144863, o íntron de ubiquitina (isto é, o íntron de ubiquitina de maís 1 (consulte, por exemplo, sequência de NCBI S94464)), o intensificador ômega ou o intensificador de iniciador ômega (Gallie, et al., (1989) "Molecular Biology of RNA" editora Cech (Liss, Nova York) 237 a 256 e Gallie, et al., (1987) Gene 60:217 a 225), o intensificador de CaMV 35S (consulte, por exemplo, Benfey, et al., (1990) EMBO J. 9:1685 a 1696) e os intensificadores de Patente número US 7,803,992 também podem ser usados. A lista acima de intensificadores de transcrição não é destinada a ser limitante. Qualquer intensificador de transcrição apropriado pode ser usado nas modalidades.[0142] In some embodiments, the DNA construct may also include a transcription enhancing sequence. As used herein, the term an "enhancer" refers to a DNA sequence that can stimulate promoter activity and can be an innate element of the promoter or a heterologous element inserted to enhance the level or tissue specificity of a promoter . Various enhancers are known in the art including, for example, introns with enhancing properties of gene expression in plants (US Patent Application Publication Number 2009/0144863, the ubiquitin intron (i.e., the most ubiquitin intron 1) ( see, for example, NCBI sequence S94464)), the omega enhancer or the omega primer enhancer (Gallie, et al., (1989) "Molecular Biology of RNA" publisher Cech (Liss, New York) 237 to 256 and Gallie , et al., (1987) Gene 60: 217 to 225), the CaMV 35S intensifier (see, for example, Benfey, et al., (1990) EMBO J. 9: 1685 to 1696) and the Patent intensifiers US number 7,803,992 may also be used The above list of transcription enhancers is not intended to be limiting Any appropriate transcription enhancer may be used in the modalities.

[0143] A região de terminação pode ser nativa com a região de iniciação de transcrição, pode ser nativa com a sequência de DNA de interesse ligada de modo operacional, pode ser nativa com o hospedeiro de planta ou pode ser derivada de outra fonte (isto é, estranha ou heteróloga ao promotor, à sequência de interesse, ao hospedeiro de planta ou qualquer combinação dos mesmos).[0143] The termination region can be native to the transcription initiation region, can be native with the DNA sequence of interest operably linked, can be native to the plant host, or can be derived from another source (ie is, strange or heterologous to the promoter, the sequence of interest, the plant host or any combination thereof).

[0144] Regiões de terminação convenientes são disponibilizadas pelo plasmídeo Ti de A. tumefaciens, como as regiões de terminação de octopina sintase e nopalina sintase. Ver também, Guerineau, et al., (1991) Mol. Gen. Genet. 262:141 a 144; Proudfoot, (1991) Cell 64:671 a 674; Sanfacon, et al., (1991) Genes Dev. 5:141 a 149; Mogen, et al., (1990) Plant Cell 2:1261 a 1272; Munroe, et al., (1990) Gene 91:151 a 158; Ballas, et al., (1989) Nucleic Acids Res. 17:7891 a 7903 e Joshi, et al., (1987) Nucleic Acid Res. 15:9627 a 9639.[0144] Convenient termination regions are provided by the plasmid Ti of A. tumefaciens, such as the octopine synthase and nopaline synthase termination regions. See also, Guerineau, et al., (1991) Mol. Gen. Genet. 262: 141 to 144; Proudfoot, (1991) Cell 64: 671 to 674; Sanfacon, et al., (1991) Genes Dev. 5: 141 to 149; Mogen, et al., (1990) Plant Cell 2: 1261 to 1272; Munroe, et al., (1990) Gene 91: 151 to 158; Ballas, et al., (1989) Nucleic Acids Res. 17: 7891 to 7903 and Joshi, et al., (1987) Nucleic Acid Res. 15: 9627 to 9639.

[0145] Quando apropriado, um ácido nucleico pode ser otimizado para a expressão aumentada no organismo hospedeiro. Assim, quando o organismo hospedeiro é uma planta, os ácidos nucleicos sintéticos podem ser sintetizados utilizando-se códons preferenciais para plantas para uma expressão melhorada. Consultar, por exemplo, Campbell e Gowri, (1990) Plant Physiol. 92:1 a 11 quanto a uma discussão sobre o uso preferido de hospedeiros. Por exemplo, embora as sequências de ácidos nucleicos das modalidades possam ser expressas em espécies de planta tanto monocotiledôneas quanto dicotiledôneas, as sequências podem ser modificadas de modo a representar as preferências específicas e as preferências de teor de GC de monocotiledôneas ou dicotiledôneas, uma vez que se demonstrou que essas preferências diferem (Murray et al. (1989) Nucleic Acids Res. 17:477 a 498). Assim, a planta preferencial para um aminoácido particular pode ser derivada de sequências de genes conhecidas de plantas.[0145] When appropriate, a nucleic acid can be optimized for increased expression in the host organism. Thus, when the host organism is a plant, synthetic nucleic acids can be synthesized using plant-preferred codons for improved expression. See, for example, Campbell and Gowri, (1990) Plant Physiol. 92: 1 to 11 for a discussion of the preferred use of hosts. For example, although the nucleic acid sequences of the modalities can be expressed in both monocot and dicot plant species, the sequences can be modified to represent the specific preferences and GC content preferences of monocot or dicot plant, since these preferences have been shown to differ (Murray et al. (1989) Nucleic Acids Res. 17: 477 to 498). Thus, the preferred plant for a particular amino acid can be derived from known plant gene sequences.

[0146] As modificações de sequência adicionais são conhecidas por acentuarem a expressão de genes em um hospedeiro celular. Estas incluem a eliminação de sequências que codificam sinais de poliadenilação espúrios, sinais de sítio de encadeamento éxon-íntron, repetições semelhantes a transposons e outras sequências bem caracterizadas que podem ser prejudiciais para a expressão de genes. O teor de GC da sequência pode ser ajustado para níveis médios para um dado hospedeiro celular, conforme calculado em referência a genes conhecidos expressos na célula hospedeira. O termo "célula hospedeira", conforme usado no presente documento, se refere a uma célula que contém um vetor e suporta a replicação e/ou expressão do vetor de expressão pretendida. As células hospedeiras podem ser células procarióticas, como E. coli, ou células eucarióticas, como células de levedura, inseto, anfíbio ou mamífero ou células de plantas monocotiledôneas ou dicotiledôneas. Um exemplo de uma célula hospedeira monocotiledônea é uma célula hospedeira de milho. Quando possível, a sequência é modificada para evitar as estruturas de mRNA secundárias em grampo previstas.[0146] Additional sequence modifications are known to enhance gene expression in a cell host. These include the elimination of sequences encoding spurious polyadenylation signals, exon-intron linkage site signals, transposon-like repeats and other well-characterized sequences that can be detrimental to gene expression. The GC content of the sequence can be adjusted to average levels for a given cell host, as calculated in reference to known genes expressed in the host cell. The term "host cell", as used herein, refers to a cell that contains a vector and supports the replication and / or expression of the desired expression vector. The host cells can be prokaryotic cells, such as E. coli, or eukaryotic cells, such as yeast, insect, amphibian or mammalian cells or cells of monocot or dicot plants. An example of a monocotyledon host cell is a corn host cell. When possible, the sequence is modified to avoid the predicted clamp secondary mRNA structures.

[0147] Na preparação do cassete de expressão, os vários fragmentos de DNA podem ser manipulados de modo a proporcionar as sequências de DNA na orientação adequada e, conforme apropriado, no quadro de leitura adequado. Para este fim podem ser utilizados adaptadores ou ligantes para juntar os fragmentos de DNA, ou outras manipulações podem estar envolvidas para proporcionar locais de restrição convenientes, remoção de DNA supérfluo, remoção de locais de restrição ou semelhantes. Para esse propósito, mutagênese in vitro, reparo de iniciadores, restrição, hibridação, ressubstituições, por exemplo, transições e transversões, podem estar envolvidos.[0147] In preparing the expression cassette, the various DNA fragments can be manipulated to provide the DNA sequences in the proper orientation and, as appropriate, in the appropriate reading frame. For this purpose, adapters or ligands may be used to join the DNA fragments, or other manipulations may be involved to provide convenient restriction sites, removal of superfluous DNA, removal of restriction sites or the like. For this purpose, in vitro mutagenesis, primer repair, restriction, hybridization, resubstitutions, for example, transitions and transversions, may be involved.

[0148] Alguns promotores podem ser usados na prática das modalidades. Os promotores podem ser selecionados com base no resultado desejado. Os ácidos nucleicos podem ser combinados com promotores constitutivos, preferenciais para tecidos, induzíveis ou outros promotores para expressão no organismo hospedeiro. Transformação de Planta[0148] Some promoters can be used in the practice of the modalities. Promoters can be selected based on the desired outcome. Nucleic acids can be combined with constitutive, tissue-preferred, inducible or other promoters for expression in the host organism. Plant Transformation

[0149] Os métodos das modalidades envolvem introduzir um polipeptídeo ou polinucleotídeo em uma planta. "Introduzir" significa, conforme usado no presente documento, apresentar à planta o polinucleotídeo ou polipeptídeo de tal maneira que a sequência ganhe acesso ao interior de uma célula da planta. Os métodos das modalidades não dependem de um método específico para introduzir um polinucleotídeo ou polipeptídeo em uma planta, apenas que o polinucleotídeo (ou polinucleotídeos) ou o polipeptídeo (ou polipeptídeos) ganhe acesso ao interior de pelo menos uma célula da planta. Métodos para introduzir polinucleotídeo (ou polinucleotídeos) ou polipeptídeo (ou polipeptídeos) em plantas são conhecidos na técnica, incluindo, porém sem limitação, métodos de transformação estável, métodos de transformação transiente e métodos mediados por vírus.[0149] The methods of the modalities involve introducing a polypeptide or polynucleotide into a plant. "Introducing" means, as used herein, presenting the polynucleotide or polypeptide to the plant in such a way that the sequence gains access to the interior of a plant cell. The methods of the modalities do not depend on a specific method for introducing a polynucleotide or polypeptide into a plant, only that the polynucleotide (or polynucleotides) or the polypeptide (or polypeptides) gains access to the interior of at least one cell of the plant. Methods for introducing polynucleotides (or polynucleotides) or polypeptides (or polypeptides) into plants are known in the art, including, but not limited to, stable transformation methods, transient transformation methods and virus-mediated methods.

[0150] “Transformação estável”, conforme usado no presente documento, significa que o construto de nucleotídeos introduzido em uma planta integra o genoma da planta e tem capacidade para ser herdado pela progênie da mesma. "Transformação transiente" significa, conforme usado no presente documento, que um polinucleotídeo é introduzido na planta e não se integra no genoma da planta ou um polipeptídeo é introduzido em uma planta. "Planta" se refere, conforme usado no presente documento, a plantas inteiras, órgãos de plantas (por exemplo, folhas, hastes, raízes, etc.), sementes, células de plantas, propágulos, embriões e descendência dos mesmos. As células de planta podem ser diferenciadas ou não diferenciadas (por exemplo, calo, células de cultura em suspensão, protoplastos, células de folha, células de raiz, células de floema e pólen).[0150] “Stable transformation”, as used in this document, means that the nucleotide construct introduced in a plant integrates the plant's genome and has the capacity to be inherited by the progeny of the same. "Transient transformation" means, as used herein, that a polynucleotide is introduced into the plant and does not integrate into the plant's genome or a polypeptide is introduced into a plant. "Plant" refers, as used herein, to whole plants, plant organs (for example, leaves, stems, roots, etc.), seeds, plant cells, propagules, embryos and their offspring. Plant cells can be differentiated or undifferentiated (for example, callus, suspension culture cells, protoplasts, leaf cells, root cells, phloem cells and pollen).

[0151] Os protocolos de transformação, assim como protocolos para introduzir sequências de nucleotídeos em plantas, podem variar dependendo do tipo de planta ou célula de planta, isto é, monocotiledônea ou dicotiledônea, visada para transformação. Métodos adequados para introduzir sequências de nucleotídeos em células de plantas e inserção subsequente no genoma de plantas incluem microinjeção (Crossway, et al., (1986) Biotechniques 4:320 a 334), eletroporação (Riggs, et al., (1986) Proc. Natl. Acad. Sci. USA 83:5602 a 5606), transformação mediada por Agrobacterium[0151] Transformation protocols, as well as protocols for introducing nucleotide sequences into plants, may vary depending on the type of plant or plant cell, that is, monocot or dicot, intended for transformation. Suitable methods for introducing nucleotide sequences into plant cells and subsequent insertion into the plant genome include microinjection (Crossway, et al., (1986) Biotechniques 4: 320 to 334), electroporation (Riggs, et al., (1986) Proc Natl. Acad. Sci. USA 83: 5602 to 5606), Agrobacterium-mediated transformation

(Patentes nos U.S. 5,563,055 e 5,981,840), transferência de genes direta (Paszkowski, et al., (1984) EMBO J. 3:2717 a 2722) e aceleração balística de partículas (consultar, por exemplo, Patentes nos U.S. 4,945,050; 5,879,918; 5,886,244 e 5,932,782; Tomes, et al., (1995) em Plant Cell, Tissue, and Organ Culture: Fundamental Methods, editores Gamborg e Phillips, (Springer- Verlag, Berlim) e McCabe, et al., (1988) Biotechnology 6:923 a 926) e transformação Lecl (documento nº WO 00/28058). Quanto a transformação de batata ver Tu, et al., (1998) Plant Molecular Biology 37:829 a 838 e Chong, et al., (2000) Transgenic Research 9:71 a 78. Os procedimentos de transformação adicionais podem ser encontrados em Weissinger, et al., (1988) Ann.(US patents 5,563,055 and 5,981,840), direct gene transfer (Paszkowski, et al., (1984) EMBO J. 3: 2717 to 2722) and ballistic particle acceleration (see, for example, US patents 4,945,050; 5,879,918; 5,886,244 and 5,932,782; Tomes, et al., (1995) in Plant Cell, Tissue, and Organ Culture: Fundamental Methods, editors Gamborg and Phillips, (Springer-Verlag, Berlin) and McCabe, et al., (1988) Biotechnology 6 : 923 to 926) and Lecl transformation (document No. WO 00/28058). As for potato processing, see Tu, et al., (1998) Plant Molecular Biology 37: 829 to 838 and Chong, et al., (2000) Transgenic Research 9:71 to 78. Additional processing procedures can be found at Weissinger, et al., (1988) Ann.

Rev.Rev.

Genet. 22:421 a 477; Sanford, et al., (1987) Particulate Science and Technology 5:27 a 37 (cebola); Christou, et al., (1988) Plant Physiol. 87:671 a 674 (soja); McCabe, et al., (1988) Bio/Technology 6:923 a 926 (soja); Finer e McMullen, (1991) In Vitro Cell Dev.Genet. 22: 421 to 477; Sanford, et al., (1987) Particulate Science and Technology 5:27 to 37 (onion); Christou, et al., (1988) Plant Physiol. 87: 671 to 674 (soy); McCabe, et al., (1988) Bio / Technology 6: 923 to 926 (soybeans); Finer and McMullen, (1991) In Vitro Cell Dev.

Biol. 27P:175 a 182 (soja); Singh, et al., (1998) Theor.Biol. 27P: 175 to 182 (soy); Singh, et al., (1998) Theor.

Appl.Appl.

Genet. 96:319 a 324 (soja); Datta, et al., (1990) Biotechnology 8:736 a 740 (arroz); Klein, et al., (1988) Proc.Genet. 96: 319 to 324 (soy); Datta, et al., (1990) Biotechnology 8: 736 to 740 (rice); Klein, et al., (1988) Proc.

Natl.Natl.

Acad.Acad.

Sci.Sci.

USA 85:4305 a 4309 (maís); Klein, et al., (1988) Biotechnology 6:559 a 563 (maís); Patentes US números 5,240,855; 5,322,783 e 5,324,646; Klein, et al., (1988) Plant Physiol. 91:440 a 444 (maís); Fromm, et al., (1990) Biotechnology 8:833 a 839 (maís); Hooykaas-Van Slogteren, et al., (1984) Nature (Londres) 311:763 a 764; Patente US número 5,736,369 (cereais); Bytebier, et al., (1987) Proc.USA 85: 4305 to 4309 (more); Klein, et al., (1988) Biotechnology 6: 559 to 563 (more); US patent numbers 5,240,855; 5,322,783 and 5,324,646; Klein, et al., (1988) Plant Physiol. 91: 440 to 444 (more); Fromm, et al., (1990) Biotechnology 8: 833 to 839 (more); Hooykaas-Van Slogteren, et al., (1984) Nature (London) 311: 763 to 764; US patent number 5,736,369 (cereals); Bytebier, et al., (1987) Proc.

Natl.Natl.

Acad.Acad.

Sci.Sci.

USA 84:5345 a 5349 (Liliaceae); De Wet, et al., (1985) em The Experimental Manipulation of Ovule Tissues, ed.USA 84: 5345 to 5349 (Liliaceae); De Wet, et al., (1985) in The Experimental Manipulation of Ovule Tissues, ed.

Chapman, et al., (Longman, Nova Iorque), páginas 197 a 209 (pólen); Kaeppler, et al., (1990) Plant Cell Reports 9:415 a 418 e Kaeppler, et al., (1992) Theor. Appl. Genet. 84:560 a 566 (transformação mediada por fibras); D'Halluin, et al., (1992) Plant Cell 4:1495 a 1505 (eletroporação); Li, et al., (1993) Plant Cell Reports 12:250 a 255 e Christou e Ford, (1995) Annals of Botany 75:407 a 413 (arroz); Osjoda, et al., (1996) Nature Biotechnology 14:745 a 750 (maís por meio de Agrobacterium tumefaciens). Métodos para Introduzir Tecnologias de Edição de Genoma em PlantasChapman, et al., (Longman, New York), pages 197 to 209 (pollen); Kaeppler, et al., (1990) Plant Cell Reports 9: 415 to 418 and Kaeppler, et al., (1992) Theor. Appl. Genet. 84: 560 to 566 (fiber-mediated transformation); D'Halluin, et al., (1992) Plant Cell 4: 1495 to 1505 (electroporation); Li, et al., (1993) Plant Cell Reports 12: 250 to 255 and Christou and Ford, (1995) Annals of Botany 75: 407 to 413 (rice); Osjoda, et al., (1996) Nature Biotechnology 14: 745 to 750 (more by means of Agrobacterium tumefaciens). Methods to Introduce Genome Editing Technologies in Plants

[0152] Em algumas modalidades, as composições de polinucleotídeos podem ser introduzidas no genoma de uma planta com o uso de tecnologias de edição de genoma, ou polinucleotídeos anteriormente introduzidos no genoma de uma planta podem ser editados com o uso de tecnologias de edição de genoma. Por exemplo, os polinucleotídeos identificados podem ser introduzidos em uma localização desejada no genoma de uma planta através do uso de tecnologias de quebra de fita dupla, tais como TALENs, meganucleases, nucleases dedos de zinco, CRISPR-Cas e similares. Por exemplo, os polinucleotídeos identificados podem ser introduzidos em uma localização desejada em um genoma com o uso de um sistema CRISPR-Cas, para o propósito de inserção específica para sítios. A localização desejada em um genoma de planta pode ser qualquer local-alvo desejado para inserção, tal como uma região genômica favorável para melhoramento, ou pode ser um local-alvo localizado em uma janela genômica com um traço de interesse existente. Os traços de interesse existentes podem ser um traço endógeno ou um traço anteriormente introduzido.[0152] In some embodiments, polynucleotide compositions can be introduced into a plant's genome using genome editing technologies, or polynucleotides previously introduced into a plant's genome can be edited using genome editing technologies . For example, the identified polynucleotides can be introduced to a desired location in a plant's genome through the use of double-stranded break technologies, such as TALENs, meganucleases, zinc finger nucleases, CRISPR-Cas and the like. For example, the identified polynucleotides can be introduced at a desired location in a genome using a CRISPR-Cas system, for the purpose of site specific insertion. The desired location in a plant genome can be any desired target location for insertion, such as a favorable genomic region for breeding, or it can be a target location located in a genomic window with an existing trait of interest. The existing traits of interest can be an endogenous trait or a trait previously introduced.

[0153] Em algumas modalidades, quando um alelo R tiver sido identificado em um genoma, tecnologias de edição do genoma podem ser usadas para alterar ou modificar a sequência polinucleotídica. As modificações específicas para sítios que podem ser introduzidas no polinucleotídeo de alelo de gene R reveladas incluem aqueles produzidas com o uso de qualquer método para introduzir a modificação específica para sítios, incluindo, mas sem limitação, através do uso de oligonucleotídeos de reparo de genes (por exemplo, Publicação nº US 2013/0019349), ou através do uso de tecnologias de quebra de fita dupla, como TALENs, meganucleases, nucleases dedos de zinco, CRISPR-Cas e semelhantes. Tais tecnologias podem ser usadas para modificar o polinucleotídeo anteriormente introduzido através de inserção, deleção ou substituição de nucleotídeos dentro do polinucleotídeo introduzido. Alternativamente, tecnologias de quebra de fita dupla podem ser usadas para adicionar sequências de nucleotídeos adicionais ao polinucleotídeo introduzido. As sequências adicionais que podem ser adicionadas incluem elementos de expressão adicionais, tais como sequências intensificadoras e promotoras. Em outra modalidade, tecnologias de edição do genoma podem ser usadas para posicionar proteínas resistentes a doenças adicionais de modo próximo das composições de polinucleotídeos de gene R dentro do genoma de uma planta, a fim de gerar empilhamentos moleculares de proteínas resistentes a doenças.[0153] In some embodiments, when an R allele has been identified in a genome, genome editing technologies can be used to alter or modify the polynucleotide sequence. Site-specific modifications that can be introduced into the revealed R gene allele polynucleotide include those produced using any method of introducing site-specific modification, including, but not limited to, using gene repair oligonucleotides ( for example, Publication No. US 2013/0019349), or through the use of double-ribbon breaking technologies, such as TALENs, meganucleases, zinc finger nucleases, CRISPR-Cas and the like. Such technologies can be used to modify the previously introduced polynucleotide through insertion, deletion or substitution of nucleotides within the introduced polynucleotide. Alternatively, double-stranded technologies can be used to add additional nucleotide sequences to the introduced polynucleotide. Additional sequences that can be added include additional expression elements, such as enhancer and promoter sequences. In another embodiment, genome-editing technologies can be used to position proteins resistant to additional diseases in a similar way to the R gene polynucleotide compositions within the genome of a plant, in order to generate molecular stacks of disease-resistant proteins.

[0154] Um “sítio-alvo alterado”, “sequência-alvo alterada”, "sítio-alvo modificado" e "sequência-alvo modificada" são usados de forma intercambiável no presente documento e se referem a uma sequência-alvo conforme revelado no presente documento que compreende pelo menos uma alteração em comparação com a sequência-alvo não alterada. Tais “alterações” incluem, por exemplo: (i) substituição de pelo menos um nucleotídeo, (ii) uma deleção de pelo menos um nucleotídeo, (iii) uma inserção de pelo menos um nucleotídeo, ou (iv) qualquer combinação de (i) - (iii).[0154] An “altered target site”, “altered target sequence”, “modified target site” and “modified target sequence” are used interchangeably in this document and refer to a target sequence as revealed in the this document that comprises at least one change compared to the unchanged target sequence. Such "changes" include, for example: (i) replacement of at least one nucleotide, (ii) a deletion of at least one nucleotide, (iii) an insertion of at least one nucleotide, or (iv) any combination of (i ) - (iii).

EXEMPLOSEXAMPLES

[0155] Os exemplos a seguir são oferecidos para ilustrar, mas não limitar, a matéria reivindicada. É entendido que os exemplos e modalidades descritos no presente documento têm apenas propósitos ilustrativos, e pessoas versadas na técnica reconhecerão vários reagentes ou parâmetros que podem ser alterados sem se afastar do espírito da revelação ou do escopo das reivindicações anexas. Exemplo 1 Mineração de genomas de milho conhecidos[0155] The following examples are offered to illustrate, but not limit, the claimed subject. It is understood that the examples and modalities described in this document are for illustrative purposes only, and persons skilled in the art will recognize various reagents or parameters that can be changed without departing from the spirit of the disclosure or the scope of the appended claims. Example 1 Mining of known corn genomes

[0156] Um conjunto de sondas para o "pull down" de novos genes de endogâmicos de milho resistentes a doenças foi planejado usando genomas sequenciados de algumas espécies que foram inspecionados cuidadosamente quanto a regiões com o potencial de codificar duas grandes classes de genes de resistência a doenças: proteínas intracelulares com sítio de ligação a nucleotídeos e uma repetição rica em leucina (NLRs) e cinases de membrana ou associadas a paredes com um sítio de miristilação N-terminal[0156] A set of probes for the "pull down" of new disease-resistant corn inbreeding genes was planned using sequenced genomes of some species that have been carefully inspected for regions with the potential to encode two major classes of resistance genes to diseases: intracellular proteins with a nucleotide-binding site and a leucine-rich repeat (NLRs) and membrane kinases or associated with walls with an N-terminal myristylation site

(WAKs). O conjunto de genomas usado para o planejamento de sondas design incluiu cinco linhagens de milho com a sequência do genoma completa ou parcial disponível, bem como sorgo, teossinto e arroz. A mineração foi efetuada em ambos os modelos de transcritos anotados, bem como regiões genômicas traduzidas sem modelos genéticos conhecidos.(WAKs). The set of genomes used for planning probe design included five strains of corn with the complete or partial genome sequence available, as well as sorghum, teosynth and rice. Mining was carried out on both models of annotated transcripts, as well as translated genomic regions without known genetic models.

[0157] As pesquisas foram conduzidas usando HMMer com modelos de Markov escondidos (HMMs) correspondentes a domínios conservados (Eddy, 1998). Transcritos e regiões genômicas que incluíram um domínio de sítio de ligação a nucleotídeos (NB-ARC), bem como regiões de repetições ricas em Leucina (LRRs) foram incluídos como NLRs potenciais (Baggs et al., 2017). Transcritos e regiões genômicas que incluíram um domínio de Cinase, bem como um domínio de ligação a galacturonano (ligação-GUB-WAK) foram considerados possíveis WAKs associados a doença e sujeitos a análise adicional. WAKs potenciais sem uma arginina imediatamente antes do aspartato catalítico do seu domínio de cinase foram considerados mais provavelmente associados a doença e foram incluídos no conjunto de sondas. No total foram encontrados 786 genes a partir destes genomas e transcriptomas (Tabela 1). Após filtração para remover genes redundantes, um conjunto final de 441 genes foi usado para o planejamento de sondas.[0157] The searches were conducted using HMMer with hidden Markov models (HMMs) corresponding to conserved domains (Eddy, 1998). Transcripts and genomic regions that included a nucleotide-binding site domain (NB-ARC), as well as Leucine-rich repeat regions (LRRs) were included as potential NLRs (Baggs et al., 2017). Transcripts and genomic regions that included a kinase domain, as well as a galacturonan binding domain (GUB-WAK-binding) were considered possible disease-associated WAKs and subject to further analysis. Potential WAKs without an arginine just before the catalytic aspartate in their kinase domain were considered most likely to be associated with the disease and were included in the probe set. In total, 786 genes were found from these genomes and transcriptomes (Table 1). After filtration to remove redundant genes, a final set of 441 genes was used for probe design.

[0158] Sequências de sondas foram planejadas inspecionando cuidadosamente genomas existentes quanto a domínios conservados associados a genes R. "Scripts" Python customizados foram utilizados para tentar unir acertos de domínios parciais, que podem surgir via encadeamento. Sequências mineradas a partir destes genomas conhecidos foram então mascaradas com repetições usando "scripts" Python customizados, com uma tolerância mais elevada a repetições dentro dos domínios LRR. As sequências mascaradas foram então sintetizadas em sondas pela Nimblegen. Tabela 1: NLRs e WAKs minerados a partir de genomas e transcriptomas sequenciados. Espécie NLRs WAKs Milho (B73) 95 38 Milho (Mo17) 96 33 Milho * 98 33 Milho * 52 8 Milho * 62 14 Sorgo 145 22 Teossinto * 16 4 Arroz * 36 * indica que um genoma completo não estava disponível ou não foi usado na análise. Exemplo 2 "Pulldown" e montagem de milho[0158] Probe sequences were planned by carefully inspecting existing genomes for conserved domains associated with R genes. Customized Python "Scripts" were used to try to match partial domain hits, which may arise via chaining. Sequences mined from these known genomes were then masked with repetitions using customized Python "scripts", with a higher tolerance for repetitions within the LRR domains. The masked sequences were then synthesized in probes by Nimblegen. Table 1: NLRs and WAKs mined from sequenced genomes and transcriptomes. Species NLRs WAKs Maize (B73) 95 38 Maize (Mo17) 96 33 Maize * 98 33 Maize * 52 8 Maize * 62 14 Sorghum 145 22 Teossinto * 16 4 Rice * 36 * indicates that a complete genome was not available or was not used in the analysis. Example 2 "Pulldown" and corn assembly

[0159] 20 linhagens de milho com regiões conhecidas de melhoramento direto de resistência a doenças e loci de traços quantitativos foram selecionadas para "pulldown". Estas incluíram, mas sem limitação, resistências a doenças importantes de milho, tais como Helmintosporiose, Podridão do Caule de Antracnose, Podridão do Caule por Gibberella, Mancha Foliar Cinzenta e Ferrugem do Sul. Regiões codificando potencialmente NLRs e cinases associadas a paredes (WAKS) foram capturadas usando sondas planejadas a partir de genomas e transcriptomas sequenciados. Estas regiões foram então sequenciadas com PacBio e polidas usando leituras curtas por Illumina. O RNA de todas as linhagens também foi sequenciado, e estas leituras foram usadas para prever modelos de transcritos.[0159] 20 strains of corn with regions known to directly improve disease resistance and loci of quantitative traits were selected for "pulldown". These included, but were not limited to, resistance to major corn diseases, such as Helminthosporiosis, Anthracnose Stem Rot, Gibberella Stem Rot, Gray Foliage and Southern Rust. Regions potentially encoding NLRs and wall-associated kinases (WAKS) were captured using probes designed from sequenced genomes and transcriptomes. These regions were then sequenced with PacBio and polished using short readings by Illumina. The RNA of all strains was also sequenced, and these readings were used to predict transcript models.

[0160] DNA de elevado peso molecular de alta qualidade, bem como RNA, foram isolados de cada linhagem de milho. As sondas foram então aplicadas a estas linhagens e o DNA capturado foi sequenciado via PacBio e Illumina. Leituras de consenso foram geradas a partir de dados de sequenciamento de leituras longas de PacBio. Estas foram unidas em conjunto e adicionalmente polidas usando software de montagem SPADes e CAP3 (Huang e Madan, Genome Res, 1999; Bankevich et al., J Comput Biol, 2012). Dados de RNA- seq foram mapeados contra estes contigs montados usando Tophat2 (Kim et al., 2013). As leituras mapeadas foram então montadas em modelos genéticos via StringTie (Pertea et al., Nat Biotechnol, 2015). Regiões com o potencial de codificar NLRs ou WAKs mas que não conseguiram gerar modelos genéticos foram aumentadas usando previsões genéticas FGENESH (Asaf A. Salamov e Victor V. Solovyev, Genome Research, 2000).[0160] High quality high molecular weight DNA, as well as RNA, were isolated from each corn strain. The probes were then applied to these strains and the captured DNA was sequenced via PacBio and Illumina. Consensus readings were generated from sequencing data from long readings of PacBio. These were joined together and further polished using SPADes and CAP3 assembly software (Huang and Madan, Genome Res, 1999; Bankevich et al., J Comput Biol, 2012). RNA-seq data were mapped against these contigs assembled using Tophat2 (Kim et al., 2013). The mapped readings were then mounted on genetic models via StringTie (Pertea et al., Nat Biotechnol, 2015). Regions with the potential to encode NLRs or WAKs but which have failed to generate genetic models have been augmented using FGENESH genetic predictions (Asaf A. Salamov and Victor V. Solovyev, Genome Research, 2000).

[0161] As sondas de "pulldown" foram planejadas baseadas maioritariamente em germoplasma norte-americano. A eficácia da captura de NLRs de linhagens tropicais usando as sondas planejadas a partir de germoplasma norte-americano foi incerta. NLRs também têm uma variação presença-ausência elevada ao longo do germoplasma. Para avaliar a eficácia, o genoma de uma linhagem tropical interna foi totalmente sequenciado via PacBio. NLRs foram mineradas para fora do genoma completo como descrito no Exemplo 1, e as sequências NLR foram pesquisadas contra contigs montados a partir do "pulldown" via BLAST. No total, 92% das NLRs presentes na sequência do genoma PacBio da linhagem tropical interna também estavam presentes no "pulldown" com 100% de cobertura. 6% estavam presentes com um ligeiro truncamento na extremidade 5' ou 3', e 2% não conseguiram efetuar o "pull down". Exemplo 3 Colocação genômica por agrupamento[0161] The "pulldown" probes were designed based mostly on North American germplasm. The effectiveness of capturing NLRs from tropical strains using probes designed from North American germplasm was uncertain. NLRs also have a high presence-absence variation throughout the germplasm. To assess efficacy, the genome of an internal tropical strain was fully sequenced via PacBio. NLRs were mined out of the complete genome as described in Example 1, and NLR sequences were searched against contigs assembled from the "pulldown" via BLAST. In total, 92% of the NLRs present in the sequence of the PacBio genome of the internal tropical strain were also present in the "pulldown" with 100% coverage. 6% were present with a slight truncation at the 5 'or 3' end, and 2% were unable to pull down. Example 3 Genomic placement by grouping

[0162] Uma vez que as linhagens de milho inicialmente utilizadas tinham resistência a doenças mapeada em intervalos específicos, o conhecimento acerca da localização de genes capturados foi crítico para estabelecer prioridades de genes funcionais potenciais para testes transgênicos. No entanto, NLRs têm variação presença-ausência (PAV) especialmente elevada, o que dificulta a determinação da sua localização genômica (Bush et al., Mol Biol Evol, 2014). Se crê que NLRs evoluem através de duplicação dentro de agrupamentos genômicos físicos, seguida de divergência rápida para visar novos patógenos e efetores (Jacob et al., Front Immunol, 2013). Esta divergência rápida pode ser medida como uma razão positiva entre mutações não sinônimas e sinônimas (Ka/Ks). Foi notado que, apesar de NLRs terem globalmente Ka/Ks anormalmente elevada, a sua taxa de alteração não está distribuída uniformemente ao longo de suas regiões codificadoras (Meyers et al., Plant Cell, 1998). Domínios LRR, que estão provavelmente envolvidos em interações proteína-proteína, divergem muito rapidamente após duplicação (Ka/Ks elevada). Por outro lado, domínios NB-ARC, que tipicamente atuam no controle da ativação, estão sob pressão evolutiva para permanecerem inalterados (Ka/Ks baixa).[0162] Since the maize strains initially used had disease resistance mapped at specific intervals, knowledge about the location of captured genes was critical to establishing potential functional gene priorities for transgenic testing. However, NLRs have an especially high presence-absence variation (VAP), which makes it difficult to determine their genomic location (Bush et al., Mol Biol Evol, 2014). NLRs are believed to evolve through duplication within physical genomic clusters, followed by rapid divergence to target new pathogens and effectors (Jacob et al., Front Immunol, 2013). This rapid divergence can be measured as a positive ratio between non-synonymous and synonymous mutations (Ka / Ks). It was noted that, although NLRs have abnormally high Ka / Ks overall, their rate of change is not evenly distributed across their coding regions (Meyers et al., Plant Cell, 1998). LRR domains, which are probably involved in protein-protein interactions, diverge very quickly after duplication (elevated Ka / Ks). On the other hand, NB-ARC domains, which typically act on the control of activation, are under evolutionary pressure to remain unchanged (low Ka / Ks).

[0163] Dada a natureza conservada da região NB-ARC de NLRs, as suas localizações em genomas sequenciados foram usadas como "âncoras" para colocar novos NLRs em "pulldowns". Domínios NB-ARC, que foram encontrados através de pesquisas anteriores com HMMer de genomas de milho sequenciados, foram utilizados para esta abordagem. Usando "scripts" Python customizados, os acertos de HMMer para domínios NB-ARC foram traduzidos de modo reverso de novo para os ~900 nucleotídeos de DNA que os codificam. Sequências NB- ARC das linhagens de milho B73, PH1V69 e Mo17, que tinham genomas totalmente sequenciados, foram então reunidas e agrupadas de um modo agnóstico quanto à localização usando um algoritmo de união de vizinhos mais próximos (Saitou e Nei, Mol Biol Evol, 1987). A árvore resultante demonstrou claramente que sequências NB-ARC se agrupam de um modo dependente da localização (FIG. 2). A mesma análise também foi conduzida usando os domínios de cinase de WAKs, com eficácia similar.[0163] Given the conserved nature of the NB-ARC region of NLRs, their locations in sequenced genomes were used as "anchors" to place new NLRs in "pulldowns". NB-ARC domains, which were found through previous HMMer searches for sequenced corn genomes, were used for this approach. Using custom Python "scripts", the HMMer hits for NB-ARC domains were reversed back to the ~ 900 DNA nucleotides that encode them. NB-ARC sequences from maize strains B73, PH1V69 and Mo17, which had fully sequenced genomes, were then grouped and grouped in an agnostic manner as to location using an algorithm for joining closer neighbors (Saitou and Nei, Mol Biol Evol, 1987). The resulting tree clearly demonstrated that NB-ARC sequences are grouped in a location-dependent manner (FIG. 2). The same analysis was also conducted using the WAK kinase domains, with similar efficacy.

[0164] A linhagem tropical sequenciada que fazia parte do "pulldown" inicial foi usada para avaliar a eficácia da abordagem de agrupamento em germoplasma tropical. As regiões de DNA codificando todos os NB-ARCs da linhagem tropical no seu genoma foram agrupadas com NB-ARCs de três Linhagens norte-americanas: B73, Mo17 e PH1V69. No total, cerca de 98% dos domínios NB-ARC da linhagem tropical se agruparam próximo da localização genômica correta. Adicionalmente, os três genes que não foram colocados corretamente não originaram falsos positivos, ao invés existiram em agrupamentos separados.[0164] The sequenced tropical strain that was part of the initial "pulldown" was used to evaluate the effectiveness of the clustering approach in tropical germplasm. The DNA regions encoding all NB-ARCs of the tropical strain in their genome were grouped with NB-ARCs of three North American strains: B73, Mo17 and PH1V69. In total, about 98% of the NB-ARC domains of the tropical strain were grouped close to the correct genomic location. Additionally, the three genes that were not placed correctly did not give rise to false positives, instead they existed in separate clusters.

[0165] Como comparação, uma análise similar foi efetuada correndo um BLAST das sequências genéticas completas da linhagem tropical contra B73. Métodos anteriores se basearam somente em correr um BLAST, sem nenhuma abordagem de agrupamento. Tal originou uma taxa de 25% de falsos positivos, em que o acerto de topo foi no cromossomo errado ou na localização errada de um cromossomo. Exemplo 4 Seleção de genes para testes transgênicos[0165] As a comparison, a similar analysis was performed by running a BLAST of the complete genetic sequences of the tropical strain against B73. Previous methods were based only on running a BLAST, with no grouping approach. This resulted in a 25% rate of false positives, where the top hit was on the wrong chromosome or the wrong location of a chromosome. Example 4 Selection of genes for transgenic tests

[0166] Todas as linhagens de milho selecionadas para "pulldown" incluíram múltiplas regiões de melhoramento direto relacionadas com doença (regiões do genoma que cultivadores notaram que estavam positivamente correlacionadas com resistência a doenças) e QTLs para resistência a doenças. Após agrupamento dos domínios conservados de genes montados destas linhagens com genomas já sequenciados, a informação da posição provável foi inferida. Um total de 14 QTLs diferentes de 9 linhagens de milho diferentes foi selecionado para validação transgênica. O QTL médio continha 2,3 NLRs, totalizando 32 genes diferentes testados na validação transgênica. 1 dos 32 genes testados exibiu resistência aumentada em uma planta transgênica como descrito no Exemplo 8. A abordagem de agrupamento de Genes R ajudou a identificar o gene causal em 1 de 14 sítios de QTL em significativamente menos tempo do que uma abordagem normal de mapeamento fino de QTLs. Os genes testados provieram predominantemente de regiões de melhoramento direto na primeira ronda do rastreio, mas será de esperar uma taxa de validação transgênica mais elevada ao utilizar QTLs que estão ativamente sendo mapeados de modo fino, pois estes tenderão a ser intervalos menores com sinal genético mais forte. Exemplo 5 Transformação Mediada por Agrobacterium de Maís e Regeneração de Plantas Transgênicas[0166] All corn lines selected for "pulldown" included multiple disease-related direct breeding regions (regions of the genome that growers noted were positively correlated with disease resistance) and QTLs for disease resistance. After grouping the conserved domains of genes assembled from these strains with genomes already sequenced, information on the probable position was inferred. A total of 14 different QTLs from 9 different maize strains were selected for transgenic validation. The average QTL contained 2.3 NLRs, totaling 32 different genes tested in transgenic validation. 1 of the 32 genes tested exhibited increased resistance in a transgenic plant as described in Example 8. The R Gen pooling approach helped to identify the causal gene at 1 of 14 QTL sites in significantly less time than a normal fine mapping approach of QTLs. The tested genes came predominantly from regions of direct improvement in the first round of screening, but a higher transgenic validation rate would be expected when using QTLs that are actively being mapped thinly, as these will tend to be shorter intervals with more genetic signal strong. Example 5 Agrobacterium-Mediated Transformation of Maís and Regeneration of Transgenic Plants

[0167] Para transformação mediada por Agrobacterium de maís com uma sequência de elementos reguladores da revelação, o método de Zhao foi empregue (Patente nº US 5,981,840, e publicação de patente nº PCT WO98/32326; cujo conteúdo é incorporado ao presente documento, a título de referência). Brevemente, os embriões imaturos foram isolados de maís e os embriões fizeram contato com uma suspensão de Agrobacterium sob condições pelas quais as bactérias tiveram capacidade para transferir a sequência de elementos reguladores da revelação para pelo menos uma célula de pelo menos um dos embriões imaturos (etapa 1: a etapa de infecção). Nessa etapa, os embriões imaturos foram imersos em uma suspensão de Agrobacterium para a iniciação de inoculação. Os embriões foram cocultivados durante um tempo com Agrobacterium (etapa 2: a etapa de cocultivo). Os embriões imaturos foram cultivados em meio sólido após a etapa de infecção. Após o período de cocultivo, uma etapa de "repouso" opcional foi realizada. Nessa etapa de repouso, os embriões foram incubados na presença de pelo menos um antibiótico conhecido por inibir o crescimento de Agrobacterium sem a adição de um agente seletivo para transformantes de planta (etapa 3: etapa de repouso). A seguir, os embriões inoculados foram cultivados em meio que contém um agente seletivo e os calos transformados por crescimento foram recuperados (etapa 4: a etapa de seleção). As plântulas foram regeneradas dos calos (etapa 5: a etapa de regeneração) antes da transferência para a estufa. Exemplo 6 Edição de Genes R Via Substituição de Alelos Seleção de sítio-alvo[0167] For Agrobacterium-mediated transformation of more with a sequence of disclosure regulatory elements, the Zhao method was employed (US Patent No. 5,981,840, and PCT Patent Publication No. WO98 / 32326; the content of which is incorporated into this document, the reference title). Briefly, the immature embryos were isolated from more and the embryos made contact with a suspension of Agrobacterium under conditions under which the bacteria were able to transfer the sequence of regulatory elements of the development to at least one cell of at least one of the immature embryos (step 1: the infection stage). At this stage, the immature embryos were immersed in a suspension of Agrobacterium to initiate inoculation. The embryos were co-cultivated for a time with Agrobacterium (step 2: the co-cultivation step). Immature embryos were cultured in a solid medium after the infection stage. After the co-cultivation period, an optional "rest" step was performed. In this resting stage, the embryos were incubated in the presence of at least one antibiotic known to inhibit the growth of Agrobacterium without the addition of a selective agent for plant transformers (stage 3: resting stage). Then, the inoculated embryos were grown in a medium containing a selective agent and the calluses transformed by growth were recovered (step 4: the selection step). The seedlings were regenerated from the calli (step 5: the regeneration step) before transfer to the greenhouse. Example 6 Editing R Genes Via Allele Replacement Target site selection

[0168] O sistema de nucleases dirigidas a Sítios gRNA/Cas9, descrito em WO2015026885, WO20158026887, WO2015026883 e WO2015026886 (cada um incorporado aqui a título de referência), tem como propósito editar o gene R por substituição de um alelo nativo por um alelo resistente. Pares de sítios-alvo são usados para remover a totalidade do alelo R da linhagem-alvo, incluindo o promotor presumido, a sequência codificadora, e 1 kb da 3' UTR. O modelo de reparo de DNA é codistribuído com plasmídeos de Cas9 e RNA-guia. Construção de vetor Cas9[0168] The nuclease system directed to gRNA / Cas9 Sites, described in WO2015026885, WO20158026887, WO2015026883 and WO2015026886 (each incorporated herein by reference), aims to edit the R gene by replacing a native allele with an allele resistant. Pairs of target sites are used to remove the entire R allele from the target strain, including the presumed promoter, the coding sequence, and 1 kb of the 3 'UTR. The DNA repair model is co-distributed with Cas9 plasmids and guide RNA. Cas9 vector construction

[0169] Um gene Cas9 de Streptococcus pyogenes M1 GAS (SF370) é otimizado quanto a códons de milho por técnicas comuns conhecidas na técnica, e o íntron ST-LS1 de batata é introduzido para eliminar a sua expressão em E.coli e Agrobacterium. Para facilitar a localização nuclear da proteína Cas9 em células de milho, o sinal da localização nuclear amino-terminal monopartida do vírus Símio 40 (SV40) é incorporado no terminal amino do quadro de leitura aberto de Cas9. O gene de Cas9 otimizado para milho é operativamente ligado a um promotor de Ubiquitina de milho com o uso de técnicas biológicas moleculares padrão. Adicionalmente ao sinal de localização nuclear de terminal amino de SV40, um sinal de localização nuclear bipartida de terminal C da endonuclease VirD2 de Agrobacterium tumefaciens foi fundido na extremidade do éxon 2. A sequência resultante inclui o promotor de ubiquitina de Zea mays, a 5′UTR do gene de ubiquitina ZM, íntron 1 do gene de ubiquitina ZM, o sinal de localização nuclear do SV40, éxon 1 de Cas9 (ST1), o íntron de LS1 batata, éxon 2 de Cas9 (ST1), o sinal de localização nuclear de endonuclease VirD2 e o terminador pinII. Construção de vetor de RNA-guia[0169] A Cas9 gene from Streptococcus pyogenes M1 GAS (SF370) is optimized for corn codons by common techniques known in the art, and the potato ST-LS1 intron is introduced to eliminate its expression in E.coli and Agrobacterium. To facilitate the nuclear localization of the Cas9 protein in corn cells, the signal of the simian 40 monopartite amino-terminal nuclear location (SV40) is incorporated into the amino terminal of the open reading frame of Cas9. The corn-optimized Cas9 gene is operably linked to a corn Ubiquitin promoter using standard molecular biological techniques. In addition to the SV40 amino terminal nuclear localization signal, a split C nuclear terminal signal from Agrobacterium tumefaciens endonuclease VirD2 has been fused at the exon 2 end. The resulting sequence includes the Zea mays ubiquitin promoter, at 5 ′ UTR of the ubiquitin ZM gene, intron 1 of the ubiquitin ZM gene, the SV40 nuclear localization signal, Cas9 exon 1 (ST1), the potato LS1 intron, Cas9 exon 2 (ST1), the nuclear localization signal of endonuclease VirD2 and the pinII terminator. Guide RNA vector construction

[0170] Para direcionar nuclease Cas9 para os sítios- alvo genômicos designados, um promotor de polimerase III U6 de milho (consultar WO2015026885, WO20158026887, WO2015026883 e WO2015026886) e suas sequências de terminação de polimerase III U6 cognatas (TTTTTTTT) são usados para direcionar a iniciação e terminação da expressão de gRNA. Domínios visando nucleotídeos variáveis de RNA-guia para edição de genes R são identificados, que correspondem aos sítios-alvo genômicos. Oligos contendo o DNA codificando cada um dos domínios visando nucleotídeos variáveis são sintetizados e clonados em um cassete de expressão de gRNA. Cada cassete de expressão de RNA-guia consiste no promotor de polimerase III U6 de milho operacionalmente ligado a uma das versões de DNA do RNA-guia seguido da sequência de terminação de polimerase III U6 cognata. A versão do DNA do RNA-guia consiste no respectivo domínio de alvejamento de nucleotídeos variáveis seguido por uma sequência de polinucleotídeo que tem capacidade para interagir com a endonuclease de indução de quebra de fita dupla.[0170] To target Cas9 nuclease to designated genomic target sites, a corn U6 polymerase III promoter (see WO2015026885, WO20158026887, WO2015026883 and WO2015026886) and its cognate polymerase III U6 termination sequences (TTTTTTTT) are used to target the initiation and termination of gRNA expression. Domains targeting variable nucleotides of guide RNA for editing R genes are identified, which correspond to the genomic target sites. Oligos containing the DNA encoding each of the domains for variable nucleotides are synthesized and cloned into a gRNA expression cassette. Each guide RNA expression cassette consists of the corn U6 polymerase III promoter operatively linked to one of the DNA versions of the guide RNA followed by the cognate U6 polymerase III termination sequence. The DNA version of the guide RNA consists of the respective variable nucleotide targeting domain followed by a polynucleotide sequence that is capable of interacting with the double-strand-inducing endonuclease.

Construção de vetor de modelo de reparoConstruction repair model vector

[0171] O modelo de substituição/reposição para CR6/CR9 contém o alelo resistente do gene R, e o modelo de substituição contém o mesmo alelo resistente do gene R e as sequências de homologia flanqueando 5' e 3' na linhagem-alvo. As sequências de braço de homologia são sintetizadas e então clonadas com sequências genômicas de genes R substitutivas por meio de um método de clonagem Gibson ininterrupta padrão. Entrega do DNA de sistema de RNA-guia/endonuclease Cas9 ao maís[0171] The replacement / replacement model for CR6 / CR9 contains the resistant allele of the R gene, and the replacement model contains the same resistant allele of the R gene and the homology sequences flanking 5 'and 3' in the target strain. The homology arm sequences are synthesized and then cloned with substitutive R gene genomic sequences using a standard uninterrupted Gibson cloning method. Delivery of Cas9 guide RNA / endonuclease system DNA to the country

[0172] Plasmídeos que contêm os cassetes de expressão de RNA-guia e Cas9 descritos acima são cobombardeados com plasmídeos que contêm o marcador selecionável de transformação NPTII e os genes de desenvolvimento de intensificação da transformação ODP2 (fator de transcrição de domínio AP2 ODP2 (Proteína de desenvolvimento de óvulo 2)) e Wuschel (20151030-6752 USPSP) em genomas das linhagens de milho de elite. A transformação de embriões imaturos de milho pode ser realizada com o uso de qualquer método conhecido na técnica ou o método descrito abaixo.[0172] Plasmids containing the guide RNA and Cas9 expression cassettes described above are cobombarded with plasmids containing the selectable NPTII transformation marker and transformation-enhancing development genes ODP2 (AP2 domain transcription factor ODP2 (Protein of egg development 2)) and Wuschel (20151030-6752 USPSP) in genomes of elite maize strains. The transformation of immature corn embryos can be carried out using any method known in the art or the method described below.

[0173] Em um método de transformação, as espigas são descascadas e a superfície esterilizada em lixívia Clorox 30-50% mais detergente Micro 0,5% por 10 minutos e, então, enxaguadas duas vezes com água esterilizada. Os embriões imaturos são isolados e colocados com o eixo geométrico do embrião invertido (escutelo para cima), com 25 embriões por placa, em meio 13224E por 2 a 4 horas e, então, alinhados dentro da zona alvo de 2,5 cm em preparação para bombardeamento.[0173] In a transformation method, the ears are peeled and the surface sterilized in 30-50% Clorox bleach plus 0.5% Micro detergent for 10 minutes and then rinsed twice with sterile water. Immature embryos are isolated and placed with the geometric axis of the embryo inverted (scutellum upwards), with 25 embryos per plate, in 13224E medium for 2 to 4 hours and then aligned within the 2.5 cm target zone in preparation for bombing.

[0174] DNA de plasmídeos é aderido a pelotas de ouro de 0,6 µm (diâmetro médio) com o uso de uma mistura de lipídio e polímero própria de TransIT®-2020 (nº de Cat MIR 5404, Mirus Bio LLC, Madison, WI 5371). Uma solução de DNA foi preparada com o uso de 1 µg de DNA plasmídico e opcionalmente, outros construtos foram preparados para cobombardeamento com o uso de 10 ng (0,5 µL) de cada plasmídeo. Ao DNA pré-misturado, 50 µL de partículas de ouro preparadas (30 mg/mL) e 1 µL de TransIT®-2020 são adicionados e misturados com cuidado. A mistura final é deixada em incubação sob vortexação constante em velocidade baixa durante 10 minutos. Após o período de precipitação, os tubos são centrifugados brevemente e o líquido é removido. As partículas de ouro são peletizadas em uma microcentrífuga a 10.000 rpm por 1 min e o sobrenadante aquoso é removido. 120 µL de EtOH 100% são adicionados, e as partículas são ressuspensas por sonicação breve. Então, 10 µL são colocados em forma de ponto no centro de cada macrotransportador e deixados secar cerca de 2 minutos antes do bombardeamento, com um total de dez alíquotas tomadas de cada tubo de partículas preparadas/DNA.[0174] Plasmid DNA is adhered to 0.6 µm (medium diameter) gold pellets using a proprietary TransIT®-2020 blend of lipid and polymer (Cat MIR No. 5404, Mirus Bio LLC, Madison, WI 5371). A DNA solution was prepared using 1 µg of plasmid DNA and, optionally, other constructs were prepared for cobombarding using 10 ng (0.5 µL) of each plasmid. To the pre-mixed DNA, 50 µL of prepared gold particles (30 mg / mL) and 1 µL of TransIT®-2020 are added and mixed carefully. The final mixture is left to incubate under constant vortexing at low speed for 10 minutes. After the precipitation period, the tubes are centrifuged briefly and the liquid is removed. The gold particles are pelleted in a microcentrifuge at 10,000 rpm for 1 min and the aqueous supernatant is removed. 120 µL of 100% EtOH is added, and the particles are resuspended by brief sonication. Then, 10 µL are placed as a dot in the center of each macrocarrier and allowed to dry about 2 minutes before the bombardment, with a total of ten aliquots taken from each tube of prepared particles / DNA.

[0175] As placas de amostra são bombardeadas com um PDA-1000/He biolístico (Bio-Rad). Embriões estão a 6 cm do macrotransportador, com um intervalo de 1/8o de polegada entre o disco de ruptura de 200 psi e o macrotransportador. Todas as amostras recebem uma única dose.[0175] The sample plates are bombarded with a biological PDA-1000 / He (Bio-Rad). Embryos are 6 cm from the macrotransporter, with an interval of 1 / 8th of an inch between the 200 psi rupture disk and the macrotransporter. All samples receive a single dose.

[0176] Após o bombardeamento, os embriões são incubados na placa de bombardeamento durante ~20 horas, então, transferidos para 13266L (meio de repouso/indução) durante 7 a 9 dias em temperaturas que se situam na faixa de 26 a 30 °C. Os embriões são, então, transferidos para o meio de maturação 289H durante ~ 21 dias. Os embriões somáticos maduros são, então, transferidos para o meio de germinação 272G e movidos para a luz. Em cerca de 1 a 2 semanas, as plântulas que contêm brotos e raízes viáveis são amostradas para análise e enviadas para a estufa onde são transferidas para elementos planos (equivalente a um vaso de 2,5 polegadas) que contêm terra para envasamento. Após 1 a 2 semanas, as plantas são transferidas para vasos Classic 600 (1,6 galões) e cultivadas até a maturidade. Meio:[0176] After bombardment, embryos are incubated on the bombardment plate for ~ 20 hours, then transferred to 13266L (resting / induction medium) for 7 to 9 days at temperatures ranging from 26 to 30 ° C . The embryos are then transferred to the 289H maturation medium for ~ 21 days. The mature somatic embryos are then transferred to the 272G germination medium and moved to the light. In about 1 to 2 weeks, seedlings containing viable shoots and roots are sampled for analysis and sent to the greenhouse where they are transferred to flat elements (equivalent to a 2.5-inch pot) that contain potting soil. After 1 to 2 weeks, the plants are transferred to Classic 600 pots (1.6 gallons) and grown until maturity. Quite:

[0177] O meio de bombardeamento (13224E) compreende 4,0 g/L de sais basais N6 (SIGMA C-1416), 1,0 mL/L de Mistura de Vitaminas de Eriksson (1000X SIGMA-1511), 0,5 mg/L de tiamina HCl, 190,0 g/L de sacarose, 1,0 mg/L de 2,4-D e 2,88 g/L de L-prolina (levada até o volume com D-I H2O após o ajuste para pH 5,8 com KOH); 6,3 g/L de ágar Sigma (adicionado após levado até o volume com D-I H2O); e 8,5 mg/L de nitrato de prata (adicionado após esterilização do meio e resfriamento até a temperatura ambiente).[0177] The bombardment medium (13224E) comprises 4.0 g / L of basal salts N6 (SIGMA C-1416), 1.0 mL / L of Eriksson's Vitamin Blend (1000X SIGMA-1511), 0.5 mg / L of thiamine HCl, 190.0 g / L of sucrose, 1.0 mg / L of 2.4-D and 2.88 g / L of L-proline (brought up to volume with DI H2O after adjustment to pH 5.8 with KOH); 6.3 g / L of Sigma agar (added after being brought to volume with D-I H2O); and 8.5 mg / L of silver nitrate (added after sterilization of the medium and cooling to room temperature).

[0178] O meio de seleção (13266L) compreende 1650 mg/L de Nitrato de amônio, 277,8 mg/L de sulfato de Amônio, 5278 mg/L de nitrato de potássio, cloreto de cálcio, anidro, 407,4 mg/L de cloreto de cálcio, anidro, 234,92 mg/L de sulfato de magnésio, anidro, 410 mg/L de fosfato de potássio, monobásico, 8 mg/L de ácido bórico, 8,6 mg/L, sulfato de zinco•7H2O, 1,28 mg/L de iodeto de potássio, 44,54 mg/L de sulfato ferroso•7H2O, 59,46 mg/L de Na2EDTA•2H2O, 0,025 mg/L de cloreto de cobalto•6H2O, 0,4 mg/L de ácido molíbdico (sal sódico)•2H2O, 0,025 mg/L de sulfato cúprico•5H2O, 6 mg/L de mono-hidrato de sulfato de manganês, 2 mg/L de tiamina, 0,6 mL/L de sais menores b5h 1000x, 0,4 mL/L de vitaminas de Eriksson 1000x, 6 mL/L de estoque de vitaminas s&h 100x, 1,98 g/L de l-prolina, 3,4 mg/L de nitrato de prata, 0,3 g/L de hidrolisado de caseína (ácido), 20 g/L de sacarose, 0,6 g/L de glicose, 0,8 mg/L de 2,4-d, 1,2 mg/L de dicamba, 6 g/L de ágar tc, 100 mg/L de carbenicilina AgriBio, 25 mg/L de cefotaxima e 150 mg/L de geneticina (g418).[0178] The selection medium (13266L) comprises 1650 mg / L of ammonium nitrate, 277.8 mg / L of ammonium sulfate, 5278 mg / L of potassium nitrate, calcium chloride, anhydrous, 407.4 mg / L of calcium chloride, anhydrous, 234.92 mg / L of magnesium sulfate, anhydrous, 410 mg / L of potassium phosphate, monobasic, 8 mg / L of boric acid, 8.6 mg / L, sulfate of zinc • 7H2O, 1.28 mg / L of potassium iodide, 44.54 mg / L of ferrous sulphate • 7H2O, 59.46 mg / L of Na2EDTA • 2H2O, 0.025 mg / L of cobalt chloride • 6H2O, 0 , 4 mg / L molybdic acid (sodium salt) • 2H2O, 0.025 mg / L of cupric sulfate • 5H2O, 6 mg / L of manganese sulfate monohydrate, 2 mg / L of thiamine, 0.6 ml / L of minor salts b5h 1000x, 0.4 ml / L of Eriksson vitamins 1000x, 6 ml / L of stock of vitamins s & h 100x, 1.98 g / L of l-proline, 3.4 mg / L of nitrate silver, 0.3 g / L of casein hydrolyzate (acid), 20 g / L of sucrose, 0.6 g / L of glucose, 0.8 mg / L of 2.4-d, 1.2 mg / L of dicamba, 6 g / L of agar tc, 100 mg / L of carbenicillin AgriBio, 25 mg / L of cefotaxime and 150 mg / L of geneticin (g418).

[0179] O meio de regeneração de plantas (289H) compreende 4,3 g/L de sais MS (GIBCO 11117-074), 5,0 mL/L de solução de estoque de vitaminas MS (0,100 g de ácido nicotínico, 0,02 g/L de tiamina HCL, 0,10 g/L de piridoxina HCL e 0,40 g/L de glicina levada ao volume com D-I H2O filtrada) (Murashige e Skoog (1962) Physiol. Plant. 15:473), 100 mg/L de mio-inositol, 0,5 mg/L de zeatina, 60 g/L de sacarose e 1,0 mL/L de ácido abscísico 0,1 mM (levado ao volume com D-I H2O filtrada após ajuste para pH 5,6); 8,0 g/L de ágar Sigma (adicionado após levar até o volume com D-I H2O); e 1,0 mg/L de ácido indolacético e 150 mg/L de Geneticina (G418) (adicionado após esterilização do meio e resfriamento para 60 °C).[0179] The plant regeneration medium (289H) comprises 4.3 g / L of MS salts (GIBCO 11117-074), 5.0 mL / L of stock solution of vitamins MS (0.100 g of nicotinic acid, 0 , 02 g / L of thiamine HCL, 0.10 g / L of pyridoxine HCL and 0.40 g / L of glycine brought to volume with filtered H2 H2O) (Murashige and Skoog (1962) Physiol. Plant. 15: 473) , 100 mg / L of myo-inositol, 0.5 mg / L of zeatin, 60 g / L of sucrose and 1.0 mL / L of 0.1 mM abscisic acid (brought to volume with filtered DI H2O after adjustment for pH 5.6); 8.0 g / L of Sigma agar (added after making up to volume with D-I H2O); and 1.0 mg / L of indolacetic acid and 150 mg / L of Geneticin (G418) (added after sterilization of the medium and cooling to 60 ° C).

[0180] O meio sem hormônio (272G) compreende 4,3 g/L de sais MS (GIBCO 11117-074), 5,0 mL/L de solução de estoque de vitaminas MS (0,100 g/L de ácido nicotínico, 0,02 g/L de tiamina HCL, 0,10 g/L de piridoxina HCL e 0,40 g/L de glicina levado ao volume com D-I H2O filtrada), 0,1 g/L de mio-inositol e 40,0 g/L de sacarose (levado ao volume com D-I H2O filtrada após ajustar o pH para 5,6); e 0,5 mg/L de IBA e 150 mg/L de Geneticina (G418) 6 g/L de bacto-ágar (adicionado após levar ao volume com D-I H2O filtrada), esterilizado e resfriado para 60 °C. Triagem de plantas T0 e caracterização de eventos[0180] The hormone-free medium (272G) comprises 4.3 g / L of MS salts (GIBCO 11117-074), 5.0 mL / L of stock solution of vitamins MS (0.100 g / L of nicotinic acid, 0 , 02 g / L of thiamine HCL, 0.10 g / L of pyridoxine HCL and 0.40 g / L of glycine brought to volume with filtered DI H2O), 0.1 g / L of myo-inositol and 40.0 g / L of sucrose (brought to volume with filtered DI H2O after adjusting the pH to 5.6); and 0.5 mg / L of IBA and 150 mg / L of Geneticin (G418) 6 g / L of bacto-agar (added after making it to the volume with filtered D-I H2O), sterilized and cooled to 60 ° C. Screening of T0 plants and characterization of events

[0181] Para identificar eventos positivos de troca, PCR é realizada com o uso de mistura pronta de PCR Sigma Extract- N-Amp. PCR é realizada para avaliar a junção 5' usando um par de iniciadores do gene R, enquanto PCR primária com par de iniciadores foi combinada com qPCR secundária de diferenciação de alelos para rastrear a junção 3' devido à alta homologia das variantes editadas pretendidas e à sequência genômica não modificada. Análise de T1[0181] To identify positive exchange events, PCR is performed using a ready made PCR mix Sigma Extract-N-Amp. PCR is performed to evaluate the 5 'junction using a primer pair of the R gene, while primary PCR with primer pair has been combined with secondary allele differentiation qPCR to screen for the 3' junction due to the high homology of the intended edited variants and the unmodified genomic sequence. T1 analysis

[0182] As variantes de troca de alelos são transferidas para um ambiente controlado. Pólen de plantas T0 é transferido para plantas paternas recorrentes para produzir sementes. Plantas T1 são submetidas a caracterização molecular mais abrangente não só para confirmar que as trocas observadas em planta T0 são estavelmente herdadas, mas também para verificar que as plantas T1 ou plantas de gerações posteriores estão isentas de quaisquer elementos de DNA estranhos usados durante o processo de transformação. Em primeiro lugar, qPCR é realizada em todos os genes auxiliadores incluindo Cas9, os RNAs-guia, o marcador de seleção de transformação (NPTII) e os genes intensificadores da transformação ODP2 e WUS2 para assegurar que os genes segregaram na direção oposta à dos alelos mutantes gerados. As plantas T1 são submetidas a amostragem com o uso de Southern por análise de Sequenciamento (SbS) para demonstrar adicionalmente que as plantas estão desprovidas de qualquer DNA estranho.[0182] Allele exchange variants are transferred to a controlled environment. Plant pollen T0 is transferred to recurrent parent plants to produce seeds. T1 plants are subjected to more comprehensive molecular characterization not only to confirm that the changes observed in T0 plants are stably inherited, but also to verify that T1 plants or plants of later generations are free of any foreign DNA elements used during the process of transformation. First, qPCR is performed on all helper genes including Cas9, the guide RNAs, the transformation selection marker (NPTII) and the ODP2 and WUS2 transformation enhancer genes to ensure that the genes have secreted in the opposite direction of the alleles generated mutants. T1 plants are sampled using Southern by Sequencing analysis (SbS) to further demonstrate that the plants are devoid of any foreign DNA.

Exemplo 7 Rastreio de Plantas quanto a Resistência a Doenças Mancha Foliar CinzentaExample 7 Screening Plants for Disease Resistance Gray Foliage

[0183] As plantas são inoculadas com Cercospora zeae- maydis na estufa e/ou campo. O escore da doença é realizado classificando as plantas em uma escala de 1-9 com 1 como o pior e 9 como o melhor. Endogâmicas e/ou híbridos verificados com resposta à doença conhecida são usados como guia quanto ao melhor momento para pontuar e quanto à calibração da classificação. Os dados de florescimento também são recolhidos observando a data em que 50% de cada planta mostrou sedas e convertendo esta em um escore de unidades de calor do grau de crescimento (GDUSLK) com base em dados meteorológicos nessa localização. Podridão do Caule de Antracnose[0183] The plants are inoculated with Cercospora zeae-maydis in the greenhouse and / or field. The disease score is performed by classifying plants on a scale of 1-9 with 1 as the worst and 9 as the best. Inbreeding and / or hybrids verified in response to the known disease are used as a guide as to the best time to score and regarding the calibration of the classification. Flowering data is also collected by looking at the date on which 50% of each plant showed silks and converting it into a growth grade heat unit score (GDUSLK) based on meteorological data at that location. Anthracnose Stalk Rot

[0184] As plantas são cultivadas e avaliadas quanto à resposta a Cg (Colletotrichum graminicola). As plantas são avaliadas quanto a resistência a Cg na estufa e/ou por inoculação com Cg. Tardiamente no estágio de crescimento, os caules são fendidos e a progressão da doença é pontuada por observação da cor negra característica do fungo à medida que sobe no caule. As classificações da doença são conduzidas como descrito por Jung et al. (1994) Theoretical and Applied Genetics, 89:413 a 418). O número total de internodos com descoloração maior do que 75% (antgr75) é registrado nos primeiros cinco internodos (Ver a Figura 20). Tal proporcionou um escore da doença variando desde 0 até 5, com zero indicando nenhuns internodos mais do que 75% descoloridos e 5 indicando descoloração completa dos primeiros cinco internodos.[0184] Plants are grown and evaluated for response to Cg (Colletotrichum graminicola). Plants are evaluated for resistance to Cg in the greenhouse and / or by inoculation with Cg. Late in the growth stage, the stems are split and the disease progression is punctuated by observing the black color characteristic of the fungus as it rises on the stem. Classifications of the disease are conducted as described by Jung et al. (1994) Theoretical and Applied Genetics, 89: 413 to 418). The total number of internodes with discoloration greater than 75% (antgr75) is recorded in the first five internodes (See Figure 20). This provided a disease score ranging from 0 to 5, with zero indicating no internodes more than 75% discolored and 5 indicating complete discoloration of the first five internodes.

As duas porções de terreno centrais são recolhidas via combinação na maturidade fisiológica e o rendimento de grãos em kg/ha foi determinado. HelmintosporioseThe two central portions of land are collected by combining at physiological maturity and the grain yield in kg / ha was determined. Helminthporporosis

[0185] Plantas são testadas em experiências de estufa e/ou campo quanto a eficácia contra o patógeno da helmintosporiose (Exserohilum turcicum). As plantas são provocadas com o patógeno contra o qual se crê que os genes R conferem resistência. As plantas são classificadas como resistentes ou suscetíveis com base em sintomas da doença; no campo, plantas serão pontuadas em uma escala de 1-9 em que 9 é muito resistente e 1 é muito suscetível. Carvão do Pendão[0185] Plants are tested in greenhouse and / or field experiments for efficacy against the helminthsporiosis pathogen (Exserohilum turcicum). Plants are challenged with the pathogen against which the R genes are believed to confer resistance. Plants are classified as resistant or susceptible based on symptoms of the disease; in the field, plants will be scored on a scale of 1-9 where 9 is very resistant and 1 is very susceptible. Coal of the Tassel

[0186] Os soros contendo teliósporos de S. reliana são recolhidos do campo na estação de crescimento anterior e armazenados em um saco de pano em um ambiente seco e bem ventilado. Antes do plantio, esporos são removidos dos soros, filtrados, e então misturados com solo a uma razão de 1:1000. A mistura de solo e teliósporos é usada para tapar grãos de milho aquando da semeadura de sementes para conduzir inoculação artificial. Plantas no estágio da maturidade são classificadas quanto à presença/ausência de soro em espigas ou pendões como indicador da suscetibilidade/resistência. Exemplo 8 Descoberta de um novo gene de resistência a Helmintosporiose[0186] Serums containing teliospores of S. reliana are collected from the field in the previous growing season and stored in a cloth bag in a dry, well-ventilated environment. Before planting, spores are removed from the serums, filtered, and then mixed with soil at a ratio of 1: 1000. The mixture of soil and teliospores is used to cover corn kernels when sowing seeds to conduct artificial inoculation. Plants in the maturity stage are classified according to the presence / absence of serum in ears or tassels as an indicator of susceptibility / resistance. Example 8 Discovery of a new gene for resistance to Helminthsporiosis

[0187] PH8CW é uma linhagem de milho resistente a Helmintosporiose com uma região de melhoramento direto para NLB no cromossomo 1. Genes R desta linhagem foram capturados e sequenciados como descrito no Exemplo 2. O agrupamento de domínios NB-ARC revelou um gene candidato, NLR01 (SEQ ID NO: 2), que se previu estar localizado dentro da região de resistência a Helmintosporiose do cromossomo 1 como descrito no Exemplo 3. Plantas transgênicas contendo estes dois genes foram criadas e subsequentemente testadas na estufa quanto a resistência a NLB. Dos dois genes NLR testados quanto a resistência a NLB neste QTL de melhoramento direto identificados pelo agrupamento de genes R, NLR01 foi validado como tendo resistência aumentada a Helmintosporiose relativamente a plantas nulas transgênicas como descrito nos Exemplos 4, 5, e 7. Das 22 plantas nulas, 21 tinham um fenótipo suscetível e 12/13 plantas resistentes expressaram a CDS do transgene NLR01 (SEQ ID NO: 1). Exemplo 9 Descoberta de um novo gene de resistência a Ferrugem do Sul[0187] PH8CW is a helminthsporiosis resistant maize strain with a direct breeding region for NLB on chromosome 1. R genes from this strain were captured and sequenced as described in Example 2. The NB-ARC domain cluster revealed a candidate gene, NLR01 (SEQ ID NO: 2), which was predicted to be located within the Helminthporporiosis resistance region of chromosome 1 as described in Example 3. Transgenic plants containing these two genes were created and subsequently tested in the greenhouse for resistance to NLB. Of the two NLR genes tested for NLB resistance in this direct breeding QTL identified by the R gene cluster, NLR01 was validated to have increased resistance to Helminthosporiosis with respect to null transgenic plants as described in Examples 4, 5, and 7. Of the 22 plants null, 21 had a susceptible phenotype and 12/13 resistant plants expressed the CDS of transgene NLR01 (SEQ ID NO: 1). Example 9 Discovery of a new Southern Rust resistance gene

[0188] CML496 é uma linhagem de milho resistente a Ferrugem do Sul. A resistência foi mapeada de modo fino em uma pequena região do cromossomo 10. Genes R de CML496 foram capturados e sequenciados como descrito no Exemplo 2. O agrupamento de domínios NB-ARC revelou um gene candidato, NLR03 (SEQ ID NO: 4), que se previu estar localizado dentro do intervalo de mapeamento fino do cromossomo 10 como descrito no Exemplo 3. É esperado que este gene confira resistência à Ferrugem do Sul em plantas transgênicas relativamente a nulas quando a CDS de NLR03 é transgenicamente expressa (SEQ ID NO: 3).[0188] CML496 is a Southern Rust resistant maize strain. The resistance was thinly mapped to a small region on chromosome 10. CML496 R genes were captured and sequenced as described in Example 2. The NB- domain cluster ARC revealed a candidate gene, NLR03 (SEQ ID NO: 4), which was predicted to be located within the fine mapping range of chromosome 10 as described in Example 3. This gene is expected to confer resistance to Southern Rust in transgenic plants relatively to null when the NLR03 CDS is transgenically expressed (SEQ ID NO: 3).

[0189] A sequência genômica do gene NLR03 (incluindo a região promotora) é sintetizada e clonada em um vetor binário para transformação em HC69. Eventos de qualidade de uma única cópia são cruzados com PHR03 para gerar sementes T1 com segregação. Plantas T1 são inoculadas com os urediósporos de Puccinia polysora e mantidas na estufa durante 10 dias. A classificação da doença na estufa é efetuada visualmente como suscetível (S) ou resistente (R) com base na presença ou ausência de urédios em erupção (uma pústula em esporulação), respectivamente. Cerca de 30 plantas T1 com uma única cópia do transgene e 30 plantas T1 sem o transgene, todas provenientes dos mesmos 6 eventos, são testadas quanto a resistência a SCR na estufa. É esperado que todas as 30 plantas positivas para o transgene deem origem ao fenótipo resistente, ao passo que é esperado que todas as plantas negativas para o transgene sejam classificadas como suscetíveis.[0189] The genomic sequence of the NLR03 gene (including the promoter region) is synthesized and cloned into a binary vector for transformation into HC69. Quality events of a single copy are crossed with PHR03 to generate segregated T1 seeds. T1 plants are inoculated with the urediospores of Puccinia polysora and kept in the greenhouse for 10 days. The classification of the disease in the greenhouse is made visually as susceptible (S) or resistant (R) based on the presence or absence of erupting urunders (a sporulation pustule), respectively. About 30 T1 plants with a single copy of the transgene and 30 T1 plants without the transgene, all from the same 6 events, are tested for SCR resistance in the greenhouse. All 30 transgene-positive plants are expected to give rise to the resistant phenotype, while all transgene-negative plants are expected to be classified as susceptible.

[0190] Foi efetuado mapeamento fino e sequenciamento do genoma em paralelo e levaram à identificação do mesmo gene mapeado no cromossomo 10.[0190] Fine mapping and sequencing of the genome was carried out in parallel and led to the identification of the same gene mapped on chromosome 10.

Claims (34)

REIVINDICAÇÕES 1. Método para identificar um gene R em uma planta caracterizado pelo fato de que compreende: a. obter uma planta ou linhagem de planta exibindo resistência a doenças; b. efetuar um "pull down" à base de sondas a partir da planta ou linhagem de planta exibindo resistência a doenças usando uma pluralidade de sondas, em que cada sonda é gerada a partir de pelo menos um genoma sequenciado e visa um gene R; c. sequenciar a sequência capturada; d. montar as leituras do sequenciamento a partir da pluralidade de sondas para gerar uma sequência montada; e. aplicar uma abordagem de agrupamento a domínios conservados do gene R da sequência montada; e f. selecionar novos genes R.1. Method for identifying an R gene in a plant characterized by the fact that it comprises: a. obtain a plant or plant lineage exhibiting disease resistance; B. performing a probe-based pull down from the plant or plant lineage exhibiting disease resistance using a plurality of probes, where each probe is generated from at least one sequenced genome and targets an R gene; ç. sequence the captured sequence; d. assembling the sequencing readings from the plurality of probes to generate an assembled sequence; and. apply a clustering approach to conserved domains of the assembled sequence R gene; and f. select new R genes. 2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a seleção de novos genes R compreende adicionalmente comparar a localização genômica de sequências identificadas com a região QTL conhecida ou região de melhoramento direto.2. Method, according to claim 1, characterized by the fact that the selection of new R genes further comprises comparing the genomic location of identified sequences with the known QTL region or region of direct improvement. 3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende adicionalmente transformar uma planta com o novo gene R, em que a planta transformada exibe resistência aumentada a uma doença em comparação com uma planta de controle não transformada.3. Method according to claim 1, characterized by the fact that it further comprises transforming a plant with the new R gene, wherein the transformed plant exhibits increased resistance to a disease compared to an untransformed control plant. 4. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende adicionalmente editar o genoma de uma planta, em que a edição compreende introduzir o gene R ou alelo do gene R ou haplótipo do gene R selecionado na planta e em que a planta editada exibe resistência aumentada a uma doença.4. Method according to claim 1, characterized by the fact that it additionally comprises editing the genome of a plant, in which the edition comprises introducing the R gene or allele of the R gene or haplotype of the selected R gene into the plant and in which the edited plant exhibits increased resistance to a disease. 5. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende adicionalmente cruzar a planta exibindo resistência a doenças com uma segunda planta, em que a progênie tem resistência aumentada a doenças em comparação com a segunda planta paterna usando marcadores identificados dentro de um gene do novo gene R selecionado.5. Method according to claim 1, characterized by the fact that it additionally comprises crossing the plant exhibiting disease resistance with a second plant, in which the progeny have increased disease resistance compared to the second parent plant using markers identified within of a gene from the newly selected R gene. 6. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que a segunda planta paterna compreende germoplasma de elite.6. Method, according to claim 5, characterized by the fact that the second paternal plant comprises elite germplasm. 7. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a planta exibe resistência contra helmintosporiose, Mancha foliar cinzenta, podridão do caule de antracnose, estria bacteriana da folha do milho, podridão bacteriana do caule, murcha de Goss, murcha de Stewart, podridão do caule e manchas da espiga de Fusarium e Gibberella, mancha da espiga de Aspergillus, podridão do caule de Stenocarpella, carvão do pendão, carvão do pendão falso, ferrugem do sul, ferrugem comum, podridão do caule de Botrydiplodia, Podridão de carvão, murcha do milho e murcha tardia ou doença de tombamento de mudas pré- e pós- emergência.7. Method according to claim 1, characterized by the fact that the plant exhibits resistance against helminthsporiosis, Gray leaf spot, anthracnose stem rot, bacterial streak of the corn leaf, bacterial stem rot, Goss wilt, wilt Stewart, stem rot and Fusarium and Gibberella spike spots, Aspergillus spike spot, Stenocarpella stem rot, tassel coal, false tassel coal, southern rust, common rust, Botrydiplodia stem rot, Rot coal, corn wilt and late wilt or pre- and post-emergence seedling tipping disease. 8. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a planta ou linhagem de planta é uma dicotiledônea.8. Method, according to claim 1, characterized by the fact that the plant or plant lineage is a dicot. 9. Método, de acordo com a reivindicação 8, caracterizado pelo fato de que a dicotiledônea é soja, canola, alfafa, girassol, cártamo, tabaco, Arabidopsis ou algodão.9. Method, according to claim 8, characterized by the fact that the dicotyledon is soy, canola, alfalfa, sunflower, safflower, tobacco, Arabidopsis or cotton. 10. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a planta ou linhagem de planta é uma monocotiledônea.10. Method according to claim 1, characterized by the fact that the plant or plant lineage is a monocot. 11. Método, de acordo com a reivindicação 10, caracterizado pelo fato de que a monocotiledônea é milho, cevada, milhete, trigo ou arroz.11. Method according to claim 10, characterized by the fact that the monocot is corn, barley, millet, wheat or rice. 12. Método para identificar um gene R em uma planta de milho, caracterizado pelo fato de que compreende: a. obter uma linhagem de milho resistente a doenças; b. efetuar um "pull down" à base de sondas a partir da linhagem de milho resistente a doenças usando uma pluralidade de sondas, em que cada sonda é gerada a partir de pelo menos um genoma sequenciado e visa um gene R; c. sequenciar a sequência capturada; d. montar as leituras do sequenciamento a partir da pluralidade de sondas; e. aplicar uma abordagem de agrupamento aos domínios conservados do gene R da sequência montada; e f. selecionar novos genes R.12. Method for identifying an R gene in a corn plant, characterized by the fact that it comprises: a. obtain a strain of disease-resistant maize; B. perform a probe-based pull down from the disease-resistant maize line using a plurality of probes, where each probe is generated from at least one sequenced genome and targets an R gene; ç. sequence the captured sequence; d. assemble the sequencing readings from the plurality of probes; and. apply a clustering approach to conserved domains of the assembled sequence R gene; and f. select new R genes. 13. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que a seleção de novos genes R compreende adicionalmente comparar a localização genômica de sequências identificadas com a região QTL conhecida ou região de melhoramento direto.13. Method according to claim 12, characterized by the fact that the selection of new R genes further comprises comparing the genomic location of identified sequences with the known QTL region or region of direct improvement. 14. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que compreende adicionalmente transformar uma planta de milho com o novo gene R, em que a planta de milho transformada exibe resistência aumentada a uma doença em comparação com uma planta de milho de controle não transformada.14. Method according to claim 12, characterized in that it further comprises transforming a maize plant with the new R gene, wherein the transformed maize plant exhibits increased resistance to a disease compared to a maize plant. untransformed control. 15. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que compreende adicionalmente editar o genoma de uma planta de milho, em que a edição compreende introduzir o gene R ou alelo do gene R ou haplótipo do gene R selecionado na planta de milho e em que a planta de milho editada exibe resistência aumentada a uma doença.15. Method, according to claim 12, characterized by the fact that it additionally comprises editing the genome of a corn plant, wherein the edition comprises introducing the R gene or allele of the R gene or haplotype of the selected R gene into the corn plant. maize and where the edited maize plant exhibits increased resistance to a disease. 16. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que compreende adicionalmente cruzar uma planta de milho da linhagem de milho resistente a doenças com uma segunda planta de milho, em que a progênie tem resistência aumentada a doenças em comparação com a segunda planta de milho paterna usando marcadores identificados dentro de um gene do novo gene R selecionado.16. Method, according to claim 12, characterized by the fact that it additionally comprises crossing a disease resistant maize maize plant with a second maize plant, in which the progeny have increased disease resistance compared to the second paternal corn plant using markers identified within a gene of the newly selected R gene. 17. Método, de acordo com a reivindicação 16, caracterizado pelo fato de que a segunda planta de milho paterna compreende germoplasma de elite.17. Method according to claim 16, characterized by the fact that the second paternal corn plant comprises elite germplasm. 18. Método para obter uma planta resistente a doenças, caracterizado pelo fato de que compreende:18. Method for obtaining a disease-resistant plant, characterized by the fact that it comprises: a. obter uma planta ou linhagem de planta exibindo resistência a doenças; b. efetuar um "pull down" à base de sondas a partir da planta ou linhagem de planta exibindo resistência a doenças usando uma pluralidade de sondas, em que cada sonda é gerada a partir de pelo menos um genoma sequenciado e visa um gene R; c. sequenciar a sequência capturada; d. montar as leituras do sequenciamento a partir da pluralidade de sondas; e. aplicar uma abordagem de agrupamento a domínios conservados do gene R da sequência montada; f. selecionar novos genes R; e g. introduzir o gene R ou alelo do gene R ou haplótipo do gene R selecionado na planta através de transformação, edição do genoma, ou melhoramento da planta.The. obtain a plant or plant lineage exhibiting disease resistance; B. performing a probe-based pull down from the plant or plant lineage exhibiting disease resistance using a plurality of probes, where each probe is generated from at least one sequenced genome and targets an R gene; ç. sequence the captured sequence; d. assemble the sequencing readings from the plurality of probes; and. apply a clustering approach to conserved domains of the assembled sequence R gene; f. select new R genes; and g. introduce the R gene or allele of the R gene or haplotype of the selected R gene into the plant through transformation, genome editing, or plant improvement. 19. Método, de acordo com a reivindicação 18, caracterizado pelo fato de que a planta exibe resistência contra helmintosporiose, Mancha foliar cinzenta, podridão do caule de antracnose, estria bacteriana da folha do milho, podridão bacteriana do caule, murcha de Goss, murcha de Stewart, podridão do caule e manchas da espiga de Fusarium e Gibberella, mancha da espiga de Aspergillus, podridão do caule de Stenocarpella, carvão do pendão, carvão do pendão falso, ferrugem do sul, ferrugem comum, podridão do caule de Botrydiplodia, Podridão de carvão, murcha do milho e murcha tardia, doença de tombamento de mudas pré- e pós- emergência.19. Method according to claim 18, characterized by the fact that the plant exhibits resistance against helminthsporiosis, Gray leaf spot, anthracnose stem rot, bacterial streak of the corn leaf, bacterial stem rot, Goss wilt, wilt Stewart, stem rot and Fusarium and Gibberella spike stains, Aspergillus spike stain, Stenocarpella stem rot, tassel coal, false tassel coal, southern rust, common rust, Botrydiplodia stem rot, Rot coal, corn wilt and late wilt, pre- and post-emergence seedling tipping disease. 20. Método, de acordo com a reivindicação 18, caracterizado pelo fato de que a planta ou linhagem de planta é uma dicotiledônea.20. Method according to claim 18, characterized by the fact that the plant or plant lineage is a dicot. 21. Método, de acordo com a reivindicação 20, caracterizado pelo fato de que a dicotiledônea é soja, canola, alfafa, girassol, cártamo, tabaco, Arabidopsis ou algodão.21. Method according to claim 20, characterized by the fact that the dicotyledon is soy, canola, alfalfa, sunflower, safflower, tobacco, Arabidopsis or cotton. 22. Método, de acordo com a reivindicação 18, caracterizado pelo fato de que a planta ou linhagem de planta é uma monocotiledônea.22. Method according to claim 18, characterized by the fact that the plant or plant lineage is a monocot. 23. Método, de acordo com a reivindicação 22, caracterizado pelo fato de que a monocotiledônea é milho, cevada, milhete, trigo ou arroz.23. Method according to claim 22, characterized by the fact that the monocot is corn, barley, millet, wheat or rice. 24. Planta modificada tendo resistência aumentada a uma doença, caracterizada pelo fato de que o alelo causador da resistência a doença aumentada é um novo gene R, e em que o novo gene R se agrupa com uma pluralidade de genes R em um QTL conhecido de uma planta tendo resistência à doença.24. Modified plant having increased resistance to a disease, characterized by the fact that the allele causing the increased disease resistance is a new R gene, and in which the new R gene is grouped with a plurality of R genes in a QTL known to a plant having resistance to disease. 25. Planta modificada, de acordo com a reivindicação 24, caracterizada pelo fato de que a planta modificada é produzida por um processo compreendendo: a. Obter uma planta ou linhagem de planta exibindo resistência a doenças; b. efetuar um "pull down" à base de sondas a partir da planta ou linhagem de planta exibindo resistência a doenças usando uma pluralidade de sondas, em que cada sonda é gerada a partir de pelo menos um genoma sequenciado e visa genes R; c. sequenciar a sequência capturada;25. Modified plant according to claim 24, characterized by the fact that the modified plant is produced by a process comprising: a. Obtain a plant or plant lineage exhibiting disease resistance; B. perform a probe-based "pull down" from the plant or plant lineage exhibiting disease resistance using a plurality of probes, where each probe is generated from at least one sequenced genome and targets R genes; ç. sequence the captured sequence; d. montar as leituras do sequenciamento a partir da pluralidade de sondas; e. aplicar uma abordagem de agrupamento a domínios conservados do gene R da sequência montada; f. selecionar novos genes R; e g. introduzir o gene R ou alelo do gene R ou haplótipo do gene R selecionado na planta através de transformação, edição do genoma, ou melhoramento da planta produzindo a planta modificada.d. assemble the sequencing readings from the plurality of probes; and. apply a clustering approach to conserved domains of the assembled sequence R gene; f. select new R genes; and g. introduce the R gene or allele of the R gene or haplotype of the selected R gene into the plant through transformation, genome editing, or plant improvement by producing the modified plant. 26. Planta modificada, de acordo com a reivindicação 24, caracterizada pelo fato de que a pluralidade de genes R consiste em genes R conhecidos.26. Modified plant according to claim 24, characterized in that the plurality of R genes consists of known R genes. 27. Planta modificada, de acordo com a reivindicação 24, caracterizada pelo fato de que a pluralidade de genes R consiste em genes R novos.27. Modified plant according to claim 24, characterized by the fact that the plurality of R genes consists of new R genes. 28. Planta modificada, de acordo com a reivindicação 24, caracterizada pelo fato de que o alelo causador da resistência aumentada a doenças é introduzido na planta modificada através de transformação, edição do genoma ou melhoramento da planta produzindo a planta modificada.28. Modified plant according to claim 24, characterized by the fact that the allele causing increased disease resistance is introduced into the modified plant through transformation, genome editing or plant improvement by producing the modified plant. 29. Método para introduzir uma variante alélica de um gene NLR01 em que a referida variante alélica está associada a resistência aumentada a ferrugem polissora do sul, caracterizado pelo fato de que o método compreende introduzir uma mutação no gene NLR01 endógeno de modo que a variante alélica compreende uma sequência polinucleotídica codificando uma proteína que é pelo menos 90% idêntica à SEQ ID NO: 2, usando nuclease dedos de zinco,29. Method for introducing an allelic variant of an NLR01 gene in which said allelic variant is associated with increased resistance to southern polishing rust, characterized by the fact that the method comprises introducing a mutation in the endogenous NLR01 gene so that the allelic variant comprises a polynucleotide sequence encoding a protein that is at least 90% identical to SEQ ID NO: 2, using zinc finger nuclease, Nuclease Efetora do Tipo Ativador da Transcrição (TALEN), o sistema CRISPR/Cas, ou meganuclease.Transcription Activator-Type Effective Nuclease (TALEN), the CRISPR / Cas system, or meganuclease. 30. Construto de DNA recombinante, caracterizado pelo fato de que compreende um polinucleotídeo operativamente ligado a pelo menos uma sequência reguladora, em que o referido polinucleotídeo compreende uma sequência de ácido nucleico codificando uma sequência de aminoácidos com pelo menos 90% de identidade de sequência, em comparação com a SEQ ID NO: 2.30. Recombinant DNA construct, characterized by the fact that it comprises a polynucleotide operably linked to at least one regulatory sequence, wherein said polynucleotide comprises a nucleic acid sequence encoding an amino acid sequence with at least 90% sequence identity, compared to SEQ ID NO: 2. 31. Construto de DNA recombinante, de acordo com a reivindicação 17, caracterizado pelo fato de que a referida pelo menos uma sequência reguladora é um promotor funcional em uma célula de planta.31. Recombinant DNA construct according to claim 17, characterized in that said at least one regulatory sequence is a functional promoter in a plant cell. 32. Construto de DNA recombinante, de acordo com a reivindicação 17, caracterizado pelo fato de que o polinucleotídeo compreende uma sequência de ácido nucleico tendo pelo menos 95% de identidade de sequência com a SEQ ID NO: 1.32. Recombinant DNA construct according to claim 17, characterized in that the polynucleotide comprises a nucleic acid sequence having at least 95% sequence identity with SEQ ID NO: 1. 33. Célula de planta transgênica caracterizada pelo fato de que compreende o construto de DNA recombinante, conforme definido na reivindicação 17.33. Transgenic plant cell characterized by the fact that it comprises the recombinant DNA construct, as defined in claim 17. 34. Planta transgênica caracterizada pelo fato de que compreende a célula de planta transgênica, conforme definida na reivindicação 20.34. Transgenic plant characterized by the fact that it comprises the transgenic plant cell, as defined in claim 20.
BR112020019198-1A 2018-03-23 2019-03-15 method for identifying an r gene in a plant, method for obtaining a disease-resistant plant, modified plant having increased disease resistance, method for introducing an allelic variant of a nlr01 gene, recombinant dna construct, transgenic plant cell and plant transgenic BR112020019198A2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862646972P 2018-03-23 2018-03-23
US62/646,972 2018-03-23
PCT/US2019/022432 WO2019182884A1 (en) 2018-03-23 2019-03-15 Methods of identifying, selecting, and producing disease resistant crops

Publications (1)

Publication Number Publication Date
BR112020019198A2 true BR112020019198A2 (en) 2021-02-17

Family

ID=65952181

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020019198-1A BR112020019198A2 (en) 2018-03-23 2019-03-15 method for identifying an r gene in a plant, method for obtaining a disease-resistant plant, modified plant having increased disease resistance, method for introducing an allelic variant of a nlr01 gene, recombinant dna construct, transgenic plant cell and plant transgenic

Country Status (6)

Country Link
US (1) US20210040569A1 (en)
EP (1) EP3768845A1 (en)
CN (1) CN111902547A (en)
BR (1) BR112020019198A2 (en)
CA (1) CA3093000A1 (en)
WO (1) WO2019182884A1 (en)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113631722A (en) * 2019-03-11 2021-11-09 先锋国际良种公司 Methods for identifying, selecting and producing southern corn rust resistant crops
CN110564888A (en) * 2019-10-09 2019-12-13 广西壮族自治区农业科学院玉米研究所 Major QTL influencing southern rust resistance of corn and application thereof
CN110592259A (en) * 2019-10-09 2019-12-20 广西壮族自治区农业科学院玉米研究所 Molecular marker for detecting corn southern rust resistant gene RPPS313 and application
CN115335506A (en) * 2019-11-06 2022-11-11 先锋国际良种公司 Methods for identifying, selecting and producing southern corn rust resistant crops
CN111436344A (en) * 2020-04-24 2020-07-24 云南省烟草农业科学研究院 Method for screening tobacco brown spot disease resistant breeding material by accelerating maturity of leaves in seedling stage
CN112359043B (en) * 2020-11-17 2022-05-10 广东省微生物研究所(广东省微生物分析检测中心) CRISPR/Cas9 vector applicable to phomopsis FS508 and construction method and application thereof
CN112852829B (en) * 2020-12-19 2022-07-08 河南农业大学 Wheat stem basal rot related gene TaDIR-B1 and application thereof
CN113061171B (en) * 2021-04-13 2022-10-04 四川农业大学 Rice blast resistant protein and gene, isolated nucleic acid and application thereof
CN113278729B (en) * 2021-07-26 2021-10-01 广东省农业科学院作物研究所 SNP molecular marker of tobacco bacterial wilt, and obtaining method and application thereof
CN113628687A (en) * 2021-08-13 2021-11-09 南京大学 Construction method of plant paired NLR resistance gene database and multi-species paired NLR gene database thereof
CN116376929A (en) * 2023-03-21 2023-07-04 安徽农业大学 Application of Cs-miR397a targeted CsLAC1 gene in regulation and control of sensitivity of alternaria alternata

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4945050A (en) 1984-11-13 1990-07-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
US5990387A (en) 1988-06-10 1999-11-23 Pioneer Hi-Bred International, Inc. Stable transformation of plant cells
US5240855A (en) 1989-05-12 1993-08-31 Pioneer Hi-Bred International, Inc. Particle gun
US5879918A (en) 1989-05-12 1999-03-09 Pioneer Hi-Bred International, Inc. Pretreatment of microprojectiles prior to using in a particle gun
US5322783A (en) 1989-10-17 1994-06-21 Pioneer Hi-Bred International, Inc. Soybean transformation by microparticle bombardment
US5932782A (en) 1990-11-14 1999-08-03 Pioneer Hi-Bred International, Inc. Plant transformation method using agrobacterium species adhered to microprojectiles
US5324646A (en) 1992-01-06 1994-06-28 Pioneer Hi-Bred International, Inc. Methods of regeneration of Medicago sativa and expressing foreign DNA in same
BR9306802A (en) 1992-07-27 1998-12-08 Pioneer Hi Bred Int Independent genotype process for the production of transgenic soybean plant and soybean plant regeneration process from cotyledon nodes
US5736369A (en) 1994-07-29 1998-04-07 Pioneer Hi-Bred International, Inc. Method for producing transgenic cereal plants
US5981840A (en) 1997-01-24 1999-11-09 Pioneer Hi-Bred International, Inc. Methods for agrobacterium-mediated transformation
AU768243B2 (en) 1998-11-09 2003-12-04 E.I. Du Pont De Nemours And Company Transcriptional activator LEC1 nucleic acids, polypeptides and their uses
FR2833615A1 (en) 2001-12-14 2003-06-20 Genoplante Valor Evaluating digestibility of fodder plants, useful for strain selection, comprises detecting alleles of the cafeoyl coenzymeA 3-O-methyltransferase gene
EP1670916A4 (en) * 2003-09-25 2007-03-14 Univ Queensland Banana resistance genes and uses thereof
FR2878532B1 (en) * 2004-11-26 2007-03-02 Genoplante Valor Soc Par Actio METHOD OF ADDRESSING NUCLEIC ACIDS TO PLASTS
EP2166100B1 (en) 2005-03-08 2012-07-18 BASF Plant Science GmbH Expression enhancing intron sequences
ATE544861T1 (en) 2005-08-24 2012-02-15 Pioneer Hi Bred Int METHODS AND COMPOSITIONS FOR EXPRESSING A POLYNUCLEOTIDE OF INTEREST
SI2465341T1 (en) 2006-01-12 2015-04-30 Cibus Europe B.V. EPSPS Mutants
US8362325B2 (en) * 2007-10-03 2013-01-29 Ceres, Inc. Nucleotide sequences and corresponding polypeptides conferring modulated plant characteristics
US20130333068A1 (en) * 2008-04-29 2013-12-12 Marie Coffin Genes and uses for plant enhancement
CN103805595A (en) * 2012-11-13 2014-05-21 南京大学 High-flux method for cloning plant disease-resistant gene
WO2014117988A1 (en) * 2013-01-29 2014-08-07 Basf Plant Science Company Gmbh Fungal resistant plants expressing hcp7
CA3109801C (en) 2013-08-22 2024-01-09 Andrew Cigan Plant genome modification using guide rna/cas endonuclease systems and methods of use
US20150315605A1 (en) * 2014-02-21 2015-11-05 E I Du Pont De Nemours And Company Novel transcripts and uses thereof for improvement of agronomic characteristics in crop plants
CN106636181B (en) * 2016-10-12 2019-07-26 中国农业科学院作物科学研究所 OsSAPK9 albumen and its encoding gene are improving the application in Bacterial Blight Resistance in Rice

Also Published As

Publication number Publication date
EP3768845A1 (en) 2021-01-27
WO2019182884A1 (en) 2019-09-26
CN111902547A (en) 2020-11-06
US20210040569A1 (en) 2021-02-11
CA3093000A1 (en) 2019-09-26

Similar Documents

Publication Publication Date Title
BR112020025031A2 (en) molecule that has pesticidal utility, compositions and processes related to it
BR112020019198A2 (en) method for identifying an r gene in a plant, method for obtaining a disease-resistant plant, modified plant having increased disease resistance, method for introducing an allelic variant of a nlr01 gene, recombinant dna construct, transgenic plant cell and plant transgenic
US20240093223A1 (en) Methods of identifying, selecting, and producing southern corn rust resistant crops
US20040025202A1 (en) Nucleic acid molecules associated with oil in plants
WO2021143587A1 (en) Methods of identifying, selecting, and producing disease resistant crops
US11473101B2 (en) Methods of identifying, selecting, and producing southern corn rust resistant crops
CN111988988A (en) Method for identifying, selecting and producing bacterial blight resistant rice
EP2699080A1 (en) Cucurbita plant resistant to potyvirus
EP3808170A1 (en) Lactuca sativa resistance to bremia lactucae
WO2022218158A1 (en) Plant pathogen effector and disease resistance gene identification, compositions, and methods of use
US20220282338A1 (en) Methods of identifying, selecting, and producing anthracnose stalk rot resistant crops
CA3200892A1 (en) Compositions and methods to increase resistance to phytophthora sojae in soybean
US20200029523A1 (en) Lactuca Sativa with Bremia Lactucae (Downy Mildew) Resistance
US20230151382A1 (en) Plant pathogen effector and disease resistance gene identification, compositions, and methods of use
US11661609B2 (en) Methods of identifying, selecting, and producing disease resistant crops
US20210222189A1 (en) Methods of identifying, selecting, and producing southern corn rust resistant crops
WO2023023499A1 (en) Compositions and methods for gray leaf spot resistance

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]