BR112020019198A2 - método para identificar um gene r em uma planta, método para obter uma planta resistente a doenças, planta modificada tendo resistência aumentada a uma doença, método para introduzir uma variante alélica de um gene nlr01, construto de dna recombinante, célula de planta transgênica e planta transgênica - Google Patents

método para identificar um gene r em uma planta, método para obter uma planta resistente a doenças, planta modificada tendo resistência aumentada a uma doença, método para introduzir uma variante alélica de um gene nlr01, construto de dna recombinante, célula de planta transgênica e planta transgênica Download PDF

Info

Publication number
BR112020019198A2
BR112020019198A2 BR112020019198-1A BR112020019198A BR112020019198A2 BR 112020019198 A2 BR112020019198 A2 BR 112020019198A2 BR 112020019198 A BR112020019198 A BR 112020019198A BR 112020019198 A2 BR112020019198 A2 BR 112020019198A2
Authority
BR
Brazil
Prior art keywords
plant
gene
fact
sequence
disease
Prior art date
Application number
BR112020019198-1A
Other languages
English (en)
Inventor
Jennifer S. Jaqueth
Bailin Li
Girma M. Tabor
Shawn THATCHER
Original Assignee
Pioneer Hi-Bred International, Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Hi-Bred International, Inc. filed Critical Pioneer Hi-Bred International, Inc.
Publication of BR112020019198A2 publication Critical patent/BR112020019198A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Mycology (AREA)
  • Botany (AREA)
  • Cell Biology (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

As composições e métodos se relacionam com melhoramento de plantas e métodos de identificação e seleção de genes de resistência a doença. São proporcionados métodos para identificar novos genes que codificam proteínas proporcionando resistência de plantas a várias doenças e seus usos. Estes genes resistentes a doenças são úteis na produção de plantas resistentes através de melhoramento, modificação transgênica, ou edição do genoma.

Description

"MÉTODO PARA IDENTIFICAR UM GENE R EM UMA PLANTA, MÉTODO PARA OBTER UMA PLANTA RESISTENTE A DOENÇAS, PLANTA MODIFICADA TENDO RESISTÊNCIA AUMENTADA A UMA DOENÇA, MÉTODO PARA INTRODUZIR UMA VARIANTE ALÉLICA DE UM GENE NLR01, CONSTRUTO DE DNA RECOMBINANTE, CÉLULA DE PLANTA TRANSGÊNICA E PLANTA TRANSGÊNICA"
CAMPO
[0001] O domínio se relaciona com o melhoramento de plantas, métodos de identificação e seleção de genes de resistência a doenças, e métodos e composições compreendendo genes de resistência a doenças. São proporcionados métodos para identificar novos genes que codificam proteínas proporcionando resistência de plantas a várias doenças e seus usos. Estes genes resistentes a doenças são úteis na produção de plantas resistentes através de melhoramento, modificação transgênica, ou edição do genoma.
REFERÊNCIA CRUZADA A PEDIDOS RELACIONADOS
[0002] Este pedido reivindica o benefício do Pedido Provisório U.S. No. 62/646,972 depositado em 23 de março, 2018 que é aqui incorporado a título de referência na sua totalidade.
REFERÊNCIA A UMA LISTAGEM DE SEQUÊNCIAS SUBMETIDA COMO UM FICHEIRO DE TEXTO VIA EFS-WEB
[0003] A cópia oficial da listagem de sequências é submetida simultaneamente ao relatório descritivo como um ficheiro de texto através de EFS-Web, de acordo com o Código do Padrão
Americano para Intercâmbio de Informações (ASCII), com um nome de ficheiro 7766_Seq_List.txt, data de criação de 8 de março de 2019 e um tamanho de 29 Kb. A listagem de sequências depositada através de EFS-Web é parte do relatório descritivo e é, dessa forma, incorporada em sua totalidade a título de referência ao presente documento.
ANTECEDENTES
[0004] Muito trabalho tem sido desenvolvido sobre os mecanismos de resistência a doenças em plantas. Alguns mecanismos de resistência têm natureza específica não patogênica, ou a denominada "resistência não hospedeira". Estes podem se basear na estrutura de paredes celulares ou mecanismos protetores similares. No entanto, não obstante plantas não terem um sistema imune com anticorpos em circulação e os outros atributos de um sistema imune de mamífero, têm outros mecanismos para proteção especificamente contra patógenos. Os mais importantes e mais bem estudados destes são os genes de resistência a doenças de plantas, ou "genes R". Um dos muitos artigos de revisão sobre este mecanismo de resistência e os genes R pode ser encontrado em Bekhadir et al., (2004), Current Opinion in Plant Biology 7:391-399. Há 5 classes reconhecidas de genes R: proteínas intracelulares com um sítio de ligação a nucleotídeos (NBS ou NB-ARC) e uma repetição rica em leucina (LRR); proteínas transmembrana com um domínio LRR extracelular (TM-LRR); LRR transmembrana e extracelular com um domínio citoplasmático de cinase (TM-CK-LRR); proteína ancorada a sinal de membrana com um domínio citoplasmático em super-hélice (MSAP-CC); e cinases associadas a membrana ou parede com um sítio de miristilação N-terminal (MAK-N ou WAK) (Ver, por exemplo: Cohn, et al., (2001), Immunology, 13:55-62; Dangl, et al. (2001), Nature, 411:826-833). Há uma necessidade continuada de plantas resistentes a doenças e métodos para encontrar genes resistentes a doenças, em consequência, é necessário um método mais rápido de identificação de genes de resistência a doenças com maior rendimento.
SUMÁRIO
[0005] Composições e métodos úteis na identificação e seleção de genes de resistência a doenças de plantas, ou "genes R," são proporcionados aqui. As composições e métodos são úteis na seleção de plantas resistentes, criando plantas resistentes transgênicas, e/ou criando plantas com genoma editado resistentes. Plantas que têm resistência recém-conferida ou aprimorada a várias doenças de plantas em comparação com plantas de controle também são fornecidas no presente documento.
[0006] Em uma modalidade, métodos para identificar e/ou selecionar genes R são apresentados. Em algumas modalidades, os métodos compreendem a) obter uma linhagem de milho resistente a doenças; b) efetuar um "pull down" baseado em sondas a partir da linhagem resistente usando uma pluralidade de sondas, em que cada sonda é gerada a partir de pelo menos um genoma sequenciado e visa genes R; c) sequenciar a sequência capturada; d) montar leituras capturadas pela pluralidade de sondas; e) selecionar quanto a domínios de genes R conservados desejados ou remover sequências que não são domínios de genes R conservados; f) aplicar uma abordagem de agrupamento a domínios de genes R selecionados; g) selecionar novos genes R putativos; e h) introduzir o gene R ou alelo do gene R ou haplótipo do gene R selecionado na planta através de transformação, edição do genoma, ou melhoramento da planta.
[0007] Em algumas modalidades, um método para identificar um gene de resistência a doenças em uma planta compreende a) obter uma planta ou linhagem de planta exibindo resistência a doenças; b) efetuar um "pull down" baseado em sondas a partir da planta ou linhagem de planta exibindo resistência a doenças usando uma pluralidade de sondas, em que cada sonda é gerada a partir de pelo menos um genoma sequenciado e visa genes R; c) sequenciar a sequência capturada; d) montar as leituras do sequenciamento a partir da pluralidade de sondas; e) aplicar uma abordagem de agrupamento a domínios de genes R conservados a partir da sequência montada; e f) selecionar novos genes R. Em modalidades adicionais, a seleção de novos genes R putativos compreende adicionalmente comparar a localização genômica com a região QTL conhecida ou região de melhoramento direto. Em outra modalidade, o método compreende adicionalmente transformar uma planta com o novo gene R putativo. Em uma modalidade, o método compreende adicionalmente editar o genoma de uma planta não resistente, em que a edição compreende introduzir o gene R ou alelo do gene R selecionado na planta não resistente. Em outra modalidade, o método compreende adicionalmente cruzar a planta resistente com uma segunda planta, em que a progênie tem resistência aumentada a doenças em comparação com a segunda planta paterna. Em algumas modalidades, a segunda planta paterna pode ser germoplasma de elite.
[0008] Uma planta resistente pode ser cruzada com uma segunda planta para obter uma planta da progênie que tem o alelo do gene resistente. A resistência a doenças pode ser recém- conferida ou aprimorada em relação a uma planta de controle que não tem o alelo favorável. O alelo do gene R pode ser adicionalmente refinado para um intervalo cromossômico definido por e incluindo marcadores definidos. A etapa de análise pode ser realizada isolando ácidos nucleicos e detectando um ou mais alelos marcadores ligados a e associados ao alelo do gene R.
[0009] Em outra modalidade, métodos de introgressão de um gene R em uma planta são apresentados aqui. Nestes métodos, uma população de plantas é rastreada com um ou mais marcadores para determinar se quaisquer das plantas têm um alelo do gene R associado a resistência, e pelo menos uma planta que tem o alelo do gene R associado a resistência é selecionada da população.
[0010] Em algumas modalidades, a introgressão de genes R a partir de linhagens resistentes até suscetíveis pode ser alcançada por abordagens de introgressão de traços auxiliada por marcadores, transgênicas, ou de edição do genoma.
[0011] Em algumas modalidades, as composições e métodos se relacionam com uma planta modificada tendo resistência aumentada a uma doença, em que o alelo causador da resistência aumentada a doenças é um novo gene R, e em que o novo gene R se agrupa com uma pluralidade de genes R em um QTL conhecido de uma planta tendo resistência à doença.
[0012] Os métodos incorporados pela presente revelação se relacionam com 1) um método para transformar uma célula hospedeira, incluindo uma célula de planta, compreendendo transformar a célula hospedeira com o polinucleotídeo de uma modalidade da presente revelação, 2) um método para produzir uma planta, compreendendo transformar uma célula de planta com o construto de DNA recombinante de uma modalidade da presente revelação e regenerar uma planta a partir da célula de planta transformada, e 3) métodos para conferir ou intensificar a resistência a doenças, compreendendo transformar uma planta com o construto de DNA recombinante revelado aqui.
[0013] Também são incorporados métodos para alterar o nível de expressão de uma proteína capaz de conferir resistência a doenças em uma planta ou célula de planta, compreendendo (a) transformar uma célula de planta com um construto de DNA recombinante revelado aqui e (b) cultivar a célula de planta transformada sob condições que são adequadas para a expressão do construto de DNA recombinante, em que a expressão do construto de DNA recombinante resulta na produção de níveis alterados de uma proteína capaz de conferir resistência a doenças no hospedeiro transformado.
[0014] Plantas identificadas e/ou selecionadas com o uso de qualquer um dos métodos apresentados acima também são fornecidas.
[0015] Modalidades incluem um polinucleotídeo isolado compreendendo uma sequência de nucleotídeos codificando um polipeptídeo NLR01 capaz de conferir resistência a SCR, em que o polipeptídeo NLR01 tem uma sequência de aminoácidos com pelo menos 50%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, pelo menos 95% de identidade, pelo menos 96% de identidade,
pelo menos 97% de identidade, pelo menos 98% de identidade, ou pelo menos 99% de identidade em comparação com a SEQ ID NO: 2. Em outra modalidade, um polinucleotídeo isolado compreende uma sequência de nucleotídeos codificando um polipeptídeo NLR01 capaz de conferir resistência a SCR, em que o polipeptídeo NLR01 tem uma sequência de aminoácidos com pelo menos 50%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, e pelo menos 95% de identidade, em comparação com a SEQ ID NO: 2.
[0016] Modalidades adicionais da presente revelação incluem um vetor compreendendo um polinucleotídeo da revelação, tal como a SEQ ID NO: 1, ou um construto de DNA recombinante compreendendo um polinucleotídeo revelado aqui operativamente ligado a pelo menos uma sequência reguladora. Também são incorporadas uma célula de planta, bem como uma planta, cada uma compreendendo o construto de DNA recombinante de uma modalidade revelada aqui, e uma semente compreendendo o construto de DNA recombinante.
[0017] Em algumas modalidades, as composições e métodos se relacionam com uma planta modificada tendo resistência aumentada a uma doença, em que o alelo causador da resistência aumentada a doenças compreende uma sequência de nucleotídeos codificando um gene de resistência NLR01, em que o gene de resistência NLR01 tem pelo menos 50%, pelo menos 75%, pelo menos 80%, pelo menos 85%, pelo menos 90%, e pelo menos 95% de identidade, pelo menos 96% de identidade, pelo menos 97% de identidade, pelo menos 98% de identidade, ou pelo menos 99% de identidade com a sequência apresentada na SEQ ID NO: 2.
DESCRIÇÃO DOS DESENHOS
[0018] A FIG. 1 mostra um fluxograma do processo global para modalidades da identificação de genes R.
[0019] A FIG. 2 mostra sequências de domínios conservados de genomas sequenciados extraídos e agrupados com sequências de localização genômica desconhecida para ancorar as novas sequências a posições prováveis. O processo funcionou mesmo na elevada variação presença-ausência (PAV) quando um gene duplicou e divergiu quanto ao genótipo de interesse.
DESCRIÇÃO DETALHADA
[0020] Conforme usado no presente documento, as formas singulares “um”, “uma”, e "o" e “a” incluem referentes no plural a menos que o contexto determine claramente de outro modo. Desse modo, por exemplo, a referência a "uma célula" inclui uma pluralidade de tais células e referência "à proteína" inclui referência a uma ou mais proteínas e equivalentes das mesmas e assim por diante. Todos os termos técnicos e científicos usados no presente documento têm o mesmo significado que o comumente entendido por uma pessoa de habilidade comum na técnica à qual esta divulgação pertence, a menos que claramente indicado de outro modo.
[0021] O grupo NBS-LRR ("NLR") de genes R é a maior classe de genes R descoberta até à data. Em Arabidopsis thaliana, é previsto que mais de 150 estejam presentes no genoma (Meyers, et al., (2003), Plant Cell, 15:809-834; Monosi, et al., (2004), Theoretical and Applied Genetics, 109:1434-1447), ao passo que em arroz foram previstos aproximadamente 500 genes NLR (Monosi,
(2004) supra). A classe NBS-LRR de genes R é compreendida por duas subclasses. Os genes NLR da classe 1 contêm um domínio do tipo TIR-Toll/Interleucina-1 no seu terminal N'; que até à data só havia sido encontrado em dicotiledôneas (Meyers, (2003) supra; Monosi, (2004) supra). A segunda classe de NBS-LRR contém um domínio em super-hélice ou um domínio (nt) no seu terminal N (Bai, et al. (2002) Genome Research, 12:1871-1884; Monosi, (2004) supra; Pan, et al., (2000), Journal of Molecular Evolution, 50:203-213). NBS-LRR da classe 2 foram encontrados em espécies dicotiledôneas e monocotiledôneas (Bai, (2002) supra; Meyers, (2003) supra; Monosi, (2004) supra; Pan, (2000) supra).
[0022] O domínio NBS do gene aparenta desempenhar um papel na sinalização em mecanismos de defesa das plantas (van der Biezen, et al., (1998), Current Biology: CB, 8:R226-R227). A região LRR aparenta ser a região que interage com os produtos AVR patogênicos (Michelmore, et al., (1998), Genome Res., 8:1113-1130; Meyers, (2003) supra). Esta região LRR, em comparação com o domínio NB-ARC (NBS), está sob uma pressão de seleção muito maior para diversificar (Michelmore, (1998) supra; Meyers, (2003) supra; Palomino, et al., (2002), Genome Research, 12:1305-1315). Os domínios LRR também estão presentes em outros contextos; estes motivos com 20-29 resíduos estão presentes em séries em tandem em algumas proteínas com funções diversificadas, tais como interações hormônio – receptor, inibição enzimática, adesão celular e tráfego celular. Alguns estudos recentes revelaram o envolvimento de proteínas LRR no desenvolvimento inicial de mamíferos,
desenvolvimento neural, polarização celular, regulação da expressão genética e sinalização da apoptose.
[0023] O gene de resistência das modalidades da presente revelação codifica um novo gene R. Os genes R mais numerosos correspondem ao tipo NBS-LRR. Também tem havido muitos genes R do tipo WAK identificados. Não obstante terem sido descritos muitos genes NBS-LRR, podem diferir muito na sua resposta a diferentes patógenos e ação exata.
[0024] A clonagem posicional (ou clonagem à base de mapa) tem sido o principal método na identificação de genes causais responsáveis por variações na resistência a doenças. Nesta abordagem, uma linhagem de resistência é cruzada com uma linhagem suscetível para gerar uma população de mapeamento segregando resistência e suscetibilidade. O mapeamento de ligação é efetuado com dados de genotipagem e fenotipagem para detectar QTL (Locos de Traços Quantitativos) de doença. Um QTL importante de doença é "mendelizado" através de retrocruzamento com os progenitores suscetíveis e validado. Um QTL validado é então mapeado de modo fino em um pequeno intervalo com uma grande população de segregação (tipicamente com mais de 3000 indivíduos). Sequências abrangendo o intervalo de QTL são obtidas da linhagem de resistência via identificação/sequenciamento clones BAC ou sequenciamento do genoma. A sequência do genoma é anotada, genes candidatos são identificados e testados em plantas transgênicas. O gene candidato conferindo resistência em plantas transgênicas é o gene causal subjacente ao QTL de doença.
[0025] Como usado aqui, "resistente a doença" ou "ter resistência a uma doença" se relaciona com uma planta exibindo aumento de resistência a uma doença em comparação com uma planta de controle. A resistência a doença pode se manifestar em lesões em menos quantidade e/ou menores, saúde intensificada da planta, rendimento acrescido, massa radicular aumentada, vigor aumentado da planta, menos ou nenhuma descoloração, crescimento aumentado, área necrótica reduzida, ou definhamento reduzido.
[0026] Doenças afetando plantas de milho plantas incluem, mas sem limitação, crestamento e podridão do caule bacterianos; mancha foliar bacteriana; listra bacteriana; mancha de chocolate; murcha e queima bacterianas de Goss; mancha de Holcus; bainha foliar púrpura; podridão da semente-queima de plântulas; murcha bacteriana; enfezamento do milho; crestamento de antracnose; podridão do caule de antracnose; podridão da espiga e do grão por Aspergillus; mancha foliar e da bainha em bandas; murcha do milho; podridão negra do grão; borde blanco; mancha marrom; mancha negra; podridão do caule; podridão do grão por Cephalosporium; podridão de carvão; podridão da espiga por Corticium; mancha foliar por Curvularia; mancha foliar por Didymella; podridão da espiga e podridão do caule por Diplodia; podridão da espiga por Diplodia; podridão da semente; queima da plântula do milho; mancha foliar ou estria foliar por Diplodia; míldios penugentos; míldio penugento de listra marrom; míldio penugento de pendão louco; míldio penugento da espiga verde; míldio penugento por Graminicola; míldio penugento de Java; míldio penugento Filipino; míldio penugento do sorgo; míldio penugento espontâneo; míldio penugento da cana-de-açúcar; podridão seca da espiga; cravagem-do-centeio; dente-de-cavalo; acama do milho; podridão da espiga e do caule por Fusarium; queima por Fusarium; podridão da raiz das plântulas; podridão da espiga e do caule por Gibberella; podridão cinzenta da espiga; mancha foliar cinzenta; mancha foliar por Cercospora; podridão da raiz por Helminthosporium; podridão da espiga por Hormodendrum; podridão por Cladosporium; mancha foliar por Hyalothyridium; murcha tardia; helmintosporiose; brusone branca; podridão coroa do caule; listra do milho; helmintosporiose; podridão da espiga por Helminthosporium; podridão da espiga por Penicillium; olho azul do milho; bolor azul; podridão do caule e podridão da raiz por Phaeocytostroma; mancha foliar por Phaeosphaeria; podridão da espiga por Physalospora; podridão da espiga por Botryosphaeria; podridão do caule e podridão da raiz por Pyrenochaeta; podridão da raiz por Pythium; podridão do caule por Pythium; mancha avermelhada do grão; podridão da espiga por Rhizoctonia; podridão do esclerócio; podridão da raiz e podridão do caule por Rhizoctonia; mancha foliar por Rostratum; ferrugem do milho comum; ferrugem polissora do sul; ferrugem do milho tropical; podridão da espiga por Sclerotium; queima do sul; mancha foliar por Selenophoma; podridão da bainha; podridão-do-colo; bolor da silagem; fuligem comum; fuligem falsa; carvão do pendão; crestamento e podridão do caule do milho do sul; mancha foliar do sul; mancha de piche; podridão da espiga e podridão da raiz por Trichoderma; podridão branca da espiga, podridão da raiz e do caule; crestamento amarelo; mancha foliar zonada; estriado do trigo americano (mosaico estriado do trigo); mosaico listrado da cevada; nanismo amarelo da cevada; mosaico Brome; mosqueado clorótico de cereais; necrose letal (doença da necrose letal do milho); mosaico do pepino; mosaico do sorgo-bravo; enfezamento vermelho do milho; nanismo clorótico do milho; mosqueado clorótico do milho; mosaico do nanismo do milho; pinta foliar do milho; mancha anelar pelúcida do milho; raiado fino do milho; folha vermelha e listra vermelha do milho; listra vermelha do milho; mosqueado anelar do milho; nanismo rugoso do milho; enfezamento estéril do milho; estria do milho; listra do milho; aborto do pendão do milho; enação das nervuras do milho; orelha do wallaby do milho; folha branca do milho; mosaico das linhas brancas do milho; folha vermelha de milhete; e mosaico de cereais do norte.
[0027] Doenças afetando plantas de arroz incluem, mas sem limitação, queima bacteriana; estria bacteriana da folha do milho; podridão do pé; podridão do grão; podridão marrom da bainha; brusone; mancha marrom; podridão coroa da bainha; míldio penugento; acama; fuligem falsa; fuligem do grão; fuligem da folha; escaldadura foliar; mancha foliar marrom estreita; podridão da raiz; queima da plântula; queima da bainha; podridão da bainha; mancha da bainha; mancha foliar por Alternaria; e podridão da haste.
[0028] Doenças afetando plantas de soja incluem, mas sem limitação, mancha foliar por Alternaria; antracnose; crestamento negro; podridão negra da raiz; mancha marrom; podridão marrom da haste; podridão de carvão; crestamento por Choanephora; míldio penugento; queima por Drechslera; cercosporiose; mancha foliar por Leptosphaerulina; podridão da raiz por Mycoleptodiscus; podridão da haste por Neocosmospora; podridão da semente por Phomopsis; podridão da raiz e da haste por Phytophthora; mancha foliar por Phyllosticta; podridão da raiz por Phymatotrichum; queima da vagem e haste; oídio; mancha púrpura da semente; mancha foliar por Pyrenochaeta; podridão por Pythium; podridão coroa vermelha; mancha foliar por Dactuliophora; queima das partes aéreas por Rhizoctonia; podridão da raiz e da haste por Rhizoctonia; ferrugem; sarna; podridão da haste por Sclerotinia; queima por Sclerotium; cancro da haste; crestamento por Stemphylium; síndrome de morte súbita; mancha alvo; mancha de levedura; nematódeo lanceolado; nematódeo formador de lesões; nematódeo em forma de alfinete; nematódeo reniforme; nematódeo anelado; nematódeo das galhas radiculares; nematódeo de bainha; nematódeo formador de cistos; nematódeo espiralado; nematódeo de estilete das raízes; nematódeo de encurtamento e engrossamento da raiz; nematódeo do enfezamento; mosaico da alfafa; mosqueado do feijoeiro; mosaico amarelo do feijoeiro; queima do broto brasileira; mosqueado clorótico; mosaico amarelo; mosqueado do amendoim; listra do amendoim; enfezamento do amendoim; mosqueado clorótico; encarquilhamento foliar; nanismo; enfezamento grave; e mancha anelar do tabaco ou queima do broto.
[0029] Doenças afetando plantas de canola incluem, mas sem limitação, podridão negra bacteriana; mancha foliar bacteriana; podridão da vagem bacteriana; podridão mole bacteriana; sarna; galha da coroa; mancha negra por Alternaria; antracnose; canela- negra; podridão-mole negra; podridão negra da raiz; podridão da raiz de anelamento marrom ("brown girdling root rot"); mancha foliar por Cercospora; hérnia das crucíferas; míldio penugento; murcha por Fusarium; bolor cinzento; podridão da cabeça; mancha foliar; mancha foliar clara; podridão da vagem; oídio; mancha anelar; podridão da raiz; podridão da haste por Sclerotinia; podridão da semente, tombamento de mudas; fuligem das galhas radiculares; queima do sul; murcha por Verticillium; queima branca; mancha foliar branca; blister branco; amarelos; vírus do encarquilhamento; vírus do mosaico; vírus de amarelos.
[0030] Doenças afetando plantas de girassol incluem, mas sem limitação, clorose apical; mancha foliar bacteriana; murcha bacteriana; galha da coroa; podridão do caule e podridão da cabeça por Erwinia; crestamento por Alternaria, mancha da haste e podridão da cabeça; podridão da cabeça por Botrytis; podridão de carvão; míldio penugento; podridão do caule por Fusarium; murcha por Fusarium; mancha foliar e da haste por Myrothecium; amarelos por Phialophora; haste negra por Phoma; cancro marrom da haste por Phomopsis; podridão da raiz por Phymatotrichum; podridão da haste por Phytophthora; oídio; queima de plântula e podridão da raiz por Pythium; queima de plântula por Rhizoctonia; podridão da cabeça por Rhizopus; ferrugem do girassol; pecíolo basal e podridão da raiz por Sclerotium; mancha foliar por Septoria; murcha por Verticillium; ferrugem branca; ferrugem amarela; nematódeo em forma de adaga; em forma de alfinete; formador de lesões; reniforme; das galhas radiculares; e mosqueado clorótico.
[0031] Doenças afetando plantas de sorgo incluem, mas sem limitação, mancha foliar bacteriana; estria bacteriana da folha do milho; listra foliar bacteriana; murcha por Acremonium; antracnose; podridão de carvão; míldio penugento de pendão louco; tombamento de mudas e podridão da semente; cravagem-do-centeio; queima da cabeça por Fusarium, podridão da raiz e do caule; bolor de armazenamento de grãos; Mancha foliar cinzenta; mancha foliar tardia; crestamento; doença de milo; mancha foliar oval; Pokkah boeng; podridão da raiz por Pythium; mancha foliar rugosa; ferrugem; queima de plântula e podridão da semente; fuligem, núcleo coberto; fuligem, cabeça; fuligem, grão solto; listra fuliginosa; míldio penugento; mancha de piche; mancha alvo foliar; e mancha foliar zonada e queima da bainha.
[0032] Uma planta tendo resistência a doenças pode ter 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, ou 100% de resistência aumentada a uma doença em comparação com uma planta de controle. Em algumas modalidades, uma planta pode ter 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, ou 100% de saúde da planta aumentada na presença de uma doença em comparação com uma planta de controle.
[0033] Como usado aqui, o termo "agrupamento" ou "abordagem de agrupamento" significa reunião e agrupamento de sequências de um modo agnóstico quanto à localização usando um algoritmo de união de vizinhos mais próximos, agrupamento hierárquico tal como o método de Ward, um método de probabilidade máxima, ou qualquer outro algoritmo ou método de agrupamento.
[0034] O termo “cruzado” ou “cruzar” refere-se a um cruzamento sexuado e que envolveu a fusão de dois gâmetas haploides por meio de polinização para produzir progênie diploide (por exemplo, células, sementes ou plantas). O termo abrange tanto a polinização de uma planta por outra quanto o autocruzamento (ou autopolinização, por exemplo, quando o pólen e o óvulo são da mesma planta).
[0035] Uma “linhagem de elite" é qualquer linhagem resultante de melhoramento e seleção quanto a desempenho agronômico superior.
[0036] Uma "cepa exótica", uma "linhagem tropical" ou um “germoplasma exótico" é uma cepa derivada de uma planta que não pertence a uma linhagem ou cepa de elite disponível de germoplasma. No contexto de um cruzamento entre duas plantas ou estirpes de germoplasma, um germoplasma exótico não está intimamente relacionado por descendência com o germoplasma de elite com o qual é cruzado. Muito vulgarmente, o germoplasma exótico não é derivado de qualquer linhagem de elite conhecida, mas em vez disso é selecionado para introduzir novos elementos genéticos (tipicamente novos alelos) em um programa de melhoramento.
[0037] Um "alelo favorável” é o alelo em um loco particular (um marcador, um QTL, um gene, etc.) que confere, ou contribui para, um fenótipo agronomicamente desejável, por exemplo, resistência a doenças, e que permite a identificação de plantas com tal fenótipo agronomicamente desejável. Um alelo favorável de um marcador é um alelo marcador que segrega com o fenótipo favorável.
[0038] "Marcadores genéticos" são ácidos nucleicos que são polimórficos em uma população e cujos alelos podem ser detectados e distinguidos por um ou mais métodos analíticos, por exemplo, RFLP, AFLP, isozima, SNP, SSR e semelhantes. O termo também se refere a sequências de ácidos nucleicos complementares às sequências genômicas, como ácidos nucleicos usados como sondas. Os marcadores correspondentes a polimorfismos genéticos entre membros de uma população podem ser detectados por métodos bem estabelecidos na técnica. Os mesmos incluem, por exemplo, métodos de amplificação específicos para sequências com base em PCR, detecção de polimorfismos de comprimento de fragmentos de restrição (RFLP), detecção de marcadores de isozimas, detecção de polimorfismos de polinucleotídeos por hibridação específica para alelos (ASH), detecção de sequências variáveis amplificadas do genoma da planta, detecção de replicação de sequências autossustentada, detecção de repetições de sequências simples (SSRs), detecção de polimorfismos de nucleotídeo simples (SNPs) ou detecção de polimorfismos de comprimento de fragmentos amplificados (AFLPs). Também são conhecidos métodos bem estabelecidos para a detecção de caudas de sequências expressas (ESTs) e marcadores SSR derivados de sequências EST e DNA polimórfico amplificado ao acaso (RAPD).
[0039] "Germoplasma" se refere ao material genético de ou proveniente de um indivíduo (por exemplo, uma planta), um grupo de indivíduos (por exemplo, uma linhagem, variedade ou família de planta) ou um clone derivado de uma linhagem, variedade, espécie ou cultura, ou mais geralmente, todos os indivíduos dentro de uma espécie ou para diversas espécies (por exemplo, coleção de germoplasma de maís ou coleção de germoplasma andino). O germoplasma pode ser parte de um organismo ou célula, ou pode ser separado do organismo ou célula. Em geral, o germoplasma fornece material genético com uma constituição molecular específica que fornece uma base física para algumas ou todas as qualidades hereditárias de um organismo ou cultura celular. Conforme usado no presente documento, germoplasma inclui células, semente ou tecidos a partir dos quais as plantas novas podem ser cultivadas, ou partes de planta, como folhas, hastes, pólen ou células, que podem ser cultivados em uma planta total.
[0040] Um “haplótipo” é o genótipo de um indivíduo em uma pluralidade de locos genéticos, ou seja, uma combinação de alelos. Tipicamente, os locos genéticos descritos por um haplótipo estão ligados física e geneticamente, ou seja, no mesmo segmento cromossômico.
[0041] O termo “heterogeneidade" é usado para indicar que indivíduos dentro do grupo diferem no genótipo em um ou mais locos específicos.
[0042] A resposta heterótica de material, ou "heterose", pode ser definida por desempenho que excede a média dos parentes (ou parente superior) quando cruzado com outros grupos dissimilares ou não relacionados.
[0043] Um "grupo heterótico" compreende um conjunto de genótipos que têm desempenho satisfatório quando cruzados com genótipos de um grupo heterótico diferente (Hallauer et al. (1998) Corn breeding, páginas 463 a 564. Em G.F. Sprague e J.W. Dudley (ed.) Corn and corn improvement). As linhagens congênitas são classificadas em grupos heteróticos e são adicionalmente subdivididas em famílias dentro de um grupo heterótico, com base em diversos critérios como descendência, associações com base em marcador molecular e desempenho em combinações híbridas (Smith et al. (1990) Theor. Appl. Gen. 80:833 a 840). Os dois grupos heteróticos mais amplamente usados nos Estados Unidos são denominados "Iowa Stiff Stalk Synthetic" (também denominado no presente documento como "colmo rígido") e "Lancaster" ou "Lancaster Sure Crop" (algumas vezes denominado como NSS, ou Colmo não Rígido).
[0044] Alguns grupos heteróticos possuem os traços necessários para ser um parente feminino, e outros, traços para um parente masculino. Por exemplo, em maís, os resultados de rendimento de congênitos públicos liberados a partir de uma população chamada BSSS (população Iowa Stiff Stalk Synthetic) resultou nesses congênitos e seus derivados se tornando o grupamento feminino no Cinturão do Milho central. Os congênitos BSSS foram cruzados com outros congênitos, por exemplo, SD 105 e Maiz Amargo, e esse grupo geral de materiais se tornou conhecido como Stiff Stalk Synthetics (SSS) mesmo que nem todos os congênitos sejam derivados da população BSSS original (Mikel e Dudley (2006) Crop Sci: 46:1193 a 1205). Por padrão, todos os outros congênitos que se combinam bem com os congênitos SSS foram atribuídos ao grupamento masculino, o qual pela ausência de um nome mais satisfatório foi designado NSS, isto é, Colmo Não Rígido. Esse grupo inclui diversos grupos heteróticos principais como Lancaster Surecrop, Iodent e Leaming Corn.
[0045] O termo "homogeneidade" indica que membros de um grupo têm o mesmo genótipo em um ou mais locos específicos.
[0046] O termo “híbrido” refere-se à progênie obtida entre o cruzamento de pelo menos dois genitores geneticamente dissimilares.
[0047] O termo “consanguíneo” refere-se a uma linhagem que foi gerada para homogeneidade genética.
[0048] O termo “indel” refere-se a uma inserção ou deleção, em que uma linhagem pode ser dita como tendo um nucleotídeo ou fragmento de DNA inserido em relação a uma segunda linhagem, ou a segunda linhagem pode ser dita como tendo um nucleotídeo ou fragmento de DNA deletado em relação à primeira linhagem.
[0049] O termo “introgressão” refere-se à transmissão de um alelo desejado de um loco genético de um fundo genético para outro. Por exemplo, a introgressão de um alelo desejado em um loco específico pode ser transmitida a pelo menos uma progênie por meio de um cruzamento sexuado entre dois genitores da mesma espécie, em que pelo menos um dos genitores tem o alelo desejado no seu genoma. Alternativamente, por exemplo, a transmissão de um alelo pode ocorrer por meio de recombinação entre dois genomas doadores, por exemplo, em um protoplasto fundido, em que pelo menos um dos protoplastos doadores tem o alelo desejado no seu genoma. O alelo desejado pode ser, por exemplo, detectado por um marcador que está associado a um fenótipo, em um QTL, um transgene ou similar. Em todo caso, a prole compreendendo o alelo desejado pode ser submetida a retrocruzamento repetido com uma linhagem que tem um fundo genético desejado e selecionada em termos do alelo desejado, de modo que o alelo se torne fixo em um fundo genético selecionado.
[0050] O processo de “introgressão” é frequentemente chamado de “retrocruzamento” quando o processo é repetido duas ou mais vezes.
[0051] Uma “linhagem” ou “estirpe” é um grupo de indivíduos de ascendência idêntica que são geralmente consanguíneos, até certo grau, e que geralmente são homozigotos e homogêneos na maioria dos locos (isogênicos ou quase isogênicos). Uma “sublinhagem” refere-se a um subconjunto consanguíneo de descendentes que são geneticamente distintos de outros subconjuntos similarmente consanguíneos descendentes do mesmo genitor.
[0052] Como usado no presente documento, o termo “ligação” é usado para descrever o grau em que um loco marcador está associado a outro loco marcador ou algum outro loco. A relação de ligação entre um marcador molecular e um loco que afeta um fenótipo é dada como uma “probabilidade” ou “probabilidade ajustada”. A ligação pode ser expressa como uma faixa ou limite desejado. Por exemplo, em algumas modalidades, qualquer marcador é ligado (genética e fisicamente) a qualquer outro marcador quando os marcadores são separados por menos de 50, 40, 30, 25, 20 ou 15 unidades de mapa (ou cM) de um mapa de meiose único (um mapa genético com base em uma população que foi submetida a um ciclo de meiose, como, por exemplo, um F2; os mapas IBM2 consistem em múltiplas meioses). Em alguns aspectos, é vantajoso definir uma faixa limitada de ligação, por exemplo, entre 10 e 20 cM, entre 10 e 30 cM, ou entre 10 e 40 cM. Quanto mais estritamente o marcador é ligado a um segundo loco, mais satisfatório o marcador se torna um indicador para o segundo loco. Desse modo, “loci estreitamente ligados”, como um locus marcador e um segundo locus, exibem uma frequência de recombinação inter-locus de 10% ou menos, preferencialmente cerca de 9% ou menos, ainda mais preferencialmente cerca de 8% ou menos, ainda mais preferencialmente cerca de 7% ou menos, ainda mais preferencialmente cerca de 6% ou menos, ainda mais preferencialmente cerca de 5% ou menos, ainda mais preferencialmente cerca de 4% ou menos, ainda mais preferencialmente cerca de 3% ou menos, e ainda mais preferencialmente cerca de 2% ou menos. Em modalidades altamente preferidas, os loci relevantes exibem uma frequência de recombinação de cerca de 1% ou menos, por exemplo, cerca de 0,75% ou menos, mais preferencialmente cerca de 0,5% ou menos, ou ainda mais preferencialmente cerca de 0,25% ou menos. Dois loci que são localizados no mesmo cromossomo, e em tal distância que a recombinação entre os dois loci ocorre a uma frequência menor que 10% (por exemplo, cerca de 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 0,75%, 0,5%, 0,25%, ou menos) também são ditos como "em proximidade" entre si. Visto que um cM é a distância entre dois marcadores que mostram uma frequência de recombinação de 1%, qualquer marcador é estreitamente ligado (genética e fisicamente) a qualquer outro marcador que está em proximidade estreita, por exemplo, em ou menos de 10 cM de distância. Dois marcadores estreitamente ligados no mesmo cromossomo podem ser posicionados 9, 8, 7, 6, 5, 4, 3, 2, 1, 0,75, 0,5 ou 0,25 cM ou menos entre si.
[0053] O termo "desequilíbrio de ligação" se refere a uma segregação não aleatória de loci ou traços genéticos (ou ambos). Em qualquer caso, o desequilíbrio de ligação implica que os loci relevantes estão dentro de proximidade física suficiente ao longo de um comprimento de um cromossomo para que segreguem juntos com uma frequência maior do que aleatória (isto é, não aleatória). Os marcadores que mostram o desequilíbrio de ligação são considerados ligados. Os loci ligados cossegregam mais do que 50% do tempo, por exemplo, a partir de cerca de 51% a cerca de 100% do tempo. Em outras palavras, dois marcadores que cossegregam têm uma frequência de recombinação menor que 50% (e por definição, são separados por menos de 50 cM no mesmo grupo de ligação). Conforme usado no presente documento, ligação pode ser entre dois marcadores, ou alternativamente entre um marcador e um loco que afeta um fenótipo. Um loco marcador pode estar “associado a” (ligado a) uma característica. O grau de ligação de um loco marcador e um loco que afeta um característica fenotípica é medido, por exemplo, como uma probabilidade estatística de cossegregação daquele marcador molecular com o fenótipo (por exemplo, uma estatística F ou escore LOD).
[0054] O desequilíbrio de ligação é mais comumente avaliado com o uso da medida r2, a qual é calculada com o uso da fórmula descrita por Hill, W.G. e Robertson, A, Theor. Appl. Genet. 38:226 a 231(1968). Quando r2 = 1, LD completo existe entre os dois loci marcadores, o que significa que os marcadores não foram separados por recombinação e têm a mesma frequência de alelos. O valor de r2 será dependente da população usada. Os valores para r2 acima de 1/3 indicam LD suficientemente forte para ser útil para mapeamento (Ardlie et al., Nature Reviews Genetics 3:299 a 309
(2002)). Então, os alelos estão em desequilíbrio de ligação quando valores de r2 entre loci marcadores em par são maiores ou iguais a 0,33, 0,4, 0,5, 0,6, 0,7, 0,8, 0,9, ou 1,0.
[0055] Conforme usado no presente documento, “equilíbrio de ligação" descreve uma situação em que dois marcadores segregam independentemente, isto é, selecionam entre progênie aleatoriamente. Os marcadores que mostram equilíbrio de ligação são considerados não ligados (quer residam ou não no mesmo cromossomo).
[0056] Um "locus" é uma posição em um cromossomo, por exemplo, onde um nucleotídeo, gene, sequência, ou marcador está localizado.
[0057] O "logaritmo de valor de chances (LOD)" ou "escore de LOD" (Risch, Science 255:803 a 804 (1992)) é usado em mapeamento de intervalo genético para descrever o grau de ligação entre dois loci marcadores. Um escore de LOD de três entre dois marcadores indica que a ligação é 1.000 vezes mais provável do que nenhuma ligação, enquanto um escore de LOD de dois indica que a ligação é 100 vezes mais provável que nenhuma ligação. Os escores de LOD superiores ou iguais a dois podem ser usados para detectar a ligação. Os escores de LOD também podem ser usados para mostrar a força de associação entre locos marcadores e características quantitativas no mapeamento de “locos de características quantitativas”. Nesse caso, o tamanho do escore de LOD é dependente da proximidade do loco marcador com o loco que afeta a característica quantitativa, assim como o tamanho do efeito da característica quantitativa.
[0058] O termo “planta” inclui plantas inteiras, células de planta, protoplasto de planta, cultura de células ou tecidos de planta a partir da qual plantas podem ser regeneradas, calos de planta, touceiras de planta e células de planta que estão intactas em plantas ou partes de plantas, tais como sementes, flores, cotilédones, folhas, hastes, brotos, raízes, pontas de raízes e similares. Como usado aqui, uma "planta modificada" significa qualquer planta que tem uma alteração genética devido a intervenção humana. Uma planta modificada pode ter alterações genéticas introduzidas através de transformação da planta, edição do genoma, ou melhoramento convencional de plantas.
[0059] Um “marcador” é um meio para encontrar uma posição em um mapa genético ou físico, ou então ligações entre marcadores e locos de características (locos que afetam características). A posição que o marcador detecta pode ser conhecida por meio de detecção de alelos polimórficos e seu mapeamento genético, ou então por hibridação, correspondência de sequências ou amplificação de uma sequência que foi fisicamente mapeada. Um marcador pode ser um marcador de DNA (detecta polimorfismos de DNA), uma proteína (detecta variação em um polipeptídeo codificado), ou um fenótipo simplesmente herdado (tal como o fenótipo ‘ceroso’). Um marcador de DNA pode ser desenvolvido a partir de uma sequência de nucleotídeos genômica ou a partir de sequências de nucleotídeos expressas (por exemplo, a partir de um RNA encadeado ou um cDNA). Dependendo da tecnologia de marcador de DNA, o marcador consistirá em iniciadores complementares que flanqueiam o loco e/ou sondas complementares que hibridam com alelos polimórficos no loco. Um marcador de DNA, ou um marcador genético, também pode ser usado para descrever o gene, sequência de DNA ou nucleotídeo no próprio cromossomo (em vez dos componentes usados para detectar o gene ou a sequência de DNA) e é frequentemente usado quando esse marcador de DNA estiver associado a uma característica particular na genética humana (por exemplo, um marcador para câncer de mama). O termo loco marcador é o loco (gene, sequência ou nucleotídeo) que o marcador detecta.
[0060] Os marcadores que detectam polimorfismos genéticos entre membros de uma população são bem estabelecidos na técnica. Os marcadores podem ser definidos pelo tipo de polimorfismo que detectam e também pela tecnologia de marcador usada para detectar o polimorfismo. Os tipos de marcador incluem, mas sem limitação, por exemplo, a detecção de polimorfismos de comprimento de fragmentos de restrição (RFLP), detecção de marcadores de isozimas, DNA polimórfico aleatoriamente amplificado (RAPD), polimorfismos de comprimento de fragmentos amplificados (AFLPs), detecção de repetições de sequências simples (SSRs), detecção de sequências variáveis amplificadas do genoma vegetal, detecção de replicação de sequência autossustentada ou detecção de polimorfismos de nucleotídeo único (SNPs). SNPs podem ser detectados, por exemplo, por meio de sequenciamento de DNA, métodos de amplificação específicos para sequências com base em PCR, detecção de polimorfismos polinucleotídicos por hibridação alelo- específica (ASH), hibridação alelo-específica dinâmica (DASH, do inglês “dynamic allele-specific hybridization”), sinalizadores moleculares (molecular beacons), hibridação de microarranjo,
ensaios de oligonucleotídeo ligase, endonucleases Flap, endonucleases 5’, extensão de iniciador, polimorfismo de conformação de fita simples (SSCP, do inglês “single strand conformation polymorphism”) ou eletroforese em gel com gradiente de temperatura (TGGE, do inglês “temperature gradient gel electrophoresis”). O sequenciamento de DNA, tal como a tecnologia de pirossequenciamento, tem a vantagem de ser capaz de detectar uma série de alelos de SNP ligados que constituem um haplótipo. Os haplótipos tendem a ser mais informativos (detectam um nível mais alto de polimorfismo) do que SNPs.
[0061] Um “alelo marcador”, alternativamente um “alelo de um loco marcador”, pode se referir a uma dentre uma pluralidade de sequências de nucleotídeos polimórficas encontradas em um loco marcador em uma população.
[0062] "Seleção auxiliada por marcador" (de MAS) é um processo pelo qual plantas individuais são selecionadas com base em genótipos marcadores.
[0063] "Contrasseleção auxiliada por marcador" é um processo pelo qual os genótipos marcadores são usados para identificar plantas que não serão selecionadas, o que permite que as mesmas sejam removidas de um programa de reprodução ou plantação.
[0064] Um "haplótipo marcador" se refere a uma combinação de alelos em um locus marcador.
[0065] Um "locus marcador" é uma localização cromossômica específica no genoma de uma espécie onde um marcador específico pode ser encontrado. Um locus marcador pode ser usado para rastrear a presença de um segundo locus ligado, por exemplo, um que afeta a expressão de um traço fenotípico. Por exemplo, um locus marcador pode ser usado para monitorar a segregação de alelos em um locus geneticamente ou fisicamente ligado.
[0066] O termo “marcador molecular” pode ser usado para se referir a um marcador genético, como definido acima, ou um produto codificado do mesmo (por exemplo, uma proteína) usado como um ponto de referência durante a identificação de um loco ligado. Um marcador pode ser derivado de sequências de nucleotídeos genômicas ou de sequências de nucleotídeos expressas (por exemplo, a partir de um RNA encadeado, um cDNA, etc.), ou a partir de um polipeptídeo codificado. O termo também se refere às sequências de ácidos nucleicos complementares a, ou que flanqueiam, as sequências de marcadores, tais como ácidos nucleicos usados como sondas ou pares de iniciadores capazes de amplificar a sequência de marcador. Uma “sonda de marcador molecular” é uma sequência ou molécula de ácido nucleico que pode ser usada para identificar a presença de um loco marcador, por exemplo, uma sonda de ácido nucleico que é complementar a uma sequência de loco marcador. Alternativamente, em alguns aspectos, uma sonda de marcador refere-se a uma sonda de qualquer tipo que seja capaz de distinguir (isto é, genotipar) o alelo particular que está presente em um loco marcador. Ácidos nucleicos são "complementares" quando hibridam especificamente em solução. Alguns dos marcadores descritos no presente documento também são chamados de marcadores de hibridação quando localizados em uma região indel, tal como a região não colinear descrita no presente documento. Isso é devido ao fato de que a região de inserção é, por definição, um polimorfismo vis a vis uma planta sem a inserção. Desse modo, o marcador precisa indicar apenas se a região indel está presente ou ausente. Qualquer tecnologia de detecção de marcadores adequada pode ser usada para identificar tal marcador de hibridação, por exemplo, tecnologia SNP é usada nos exemplos proporcionados aqui.
[0067] Um alelo se correlaciona “negativamente” com uma característica quando está ligado à mesma e quando a presença do alelo é um indicador de que uma característica ou forma de característica desejada não ocorrerá em uma planta compreendendo o alelo.
[0068] O termo “fenótipo”, “característica fenotípica” ou “característica” pode se referir à expressão observável de um gene ou série de genes. O fenótipo pode ser observável ao olho nu, ou por quaisquer outros meios de avaliação conhecidos na técnica, por exemplo, pesagem, contagem, medição (comprimento, largura, ângulos, etc.), microscopia, análise bioquímica, ou um ensaio eletromecânico. Em alguns casos, um fenótipo é diretamente controlado por um único gene ou loco genético, isto é, uma “característica de gene único” ou uma “característica simplesmente herdada”. Na ausência de níveis grandes de variação ambiental, as características de gene único podem segregar em uma população para gerar uma distribuição “qualitativa” ou “discreta”, isto é, o fenótipo se enquadra em classes discretas. Em outros casos, um fenótipo é o resultado de vários genes e pode ser considerado uma “característica multigênica” ou uma “característica complexa”. As características multigênicas segregam em uma população para gerar uma distribuição “quantitativa” ou “contínua”, isto é, o fenótipo não pode ser separado em classes discretas. Tanto as características de gene simples quanto as características multigênicas podem ser afetadas pelo ambiente no qual estão sendo expressas, mas as características multigênicas tendem a ter um maior componente ambiental.
[0069] Um “mapa físico” do genoma é um mapa que mostra a ordem linear de marcos identificáveis (incluindo genes, marcadores, etc.) no DNA cromossômico. Entretanto, em contraste com os mapas genéticos, as distâncias entre os marcos são absolutas (por exemplo, medidas em pares de bases ou fragmentos genéticos contíguos isolados e sobrepostos) e não com base na recombinação genética (que pode variar em populações diferentes).
[0070] Um “polimorfismo” é uma variação no DNA entre dois ou mais indivíduos dentro de uma população. Um polimorfismo tem preferencialmente uma frequência de pelo menos 1% em uma população. Um polimorfismo útil pode incluir um polimorfismo de nucleotídeo único (SNP), uma repetição de sequência simples (SSR), ou um polimorfismo de inserção/deleção, também chamado no presente documento de “indel”.
[0071] Um “marcador de produção” ou “marcador SNP de produção” é um marcador que foi desenvolvido com propósitos de produtividade alta. Os marcadores SNP de produção são desenvolvidos para detectar polimorfismos específicos e são projetados para uso com uma variedade de químicas e plataformas.
[0072] O termo "locus de traços quantitativos" ou "QTL" se refere a uma região de DNA que está associada à expressão diferencial de um traço fenotípico quantitativo em pelo menos um fundo genético, por exemplo, em pelo menos uma população de melhoramento. A região do QTL abrange ou está estreitamente ligada ao gene ou genes que afetam o traço em questão.
[0073] Uma “sequência de referência" ou uma “sequência de consenso" é uma sequência definida usada como base para comparação de sequências. A sequência de referência para um marcador é obtida por sequenciamento de algumas linhagens no loco, alinhando as sequências de nucleotídeos em um programa de alinhamento de sequências (por exemplo, Sequencher), e obtendo, então, a sequência de nucleotídeos mais comum do alinhamento. Os polimorfismos encontrados dentre as sequências individuais são anotados dentro da sequência de consenso. Uma sequência de referência não é normalmente uma cópia exata de qualquer sequência de DNA individual, mas representa uma amálgama de sequências disponíveis e é útil para projetar iniciadores e sondas para polimorfismos dentro da sequência.
[0074] Um “alelo desfavorável” de um marcador é um alelo marcador que segrega com o fenótipo de planta desfavorável, fornecendo, portanto, o benefício de identificar plantas que podem ser removidas de um programa de melhoramento ou plantio.
[0075] O termo "rendimento" se refere à produtividade por área unitária de um produto de planta particular de valor comercial. O rendimento é afetado tanto por fatores genéticos quanto ambientais. "Agronômicos", “traços agronômicos", e "desempenho agronômico" se referem aos traços (e elementos genéticos subjacentes) de uma dada variedade de planta que contribuem para o rendimento ao longo da temporada de cultivo. Os traços agronômicos individuais incluem vigor da emergência, vigor vegetativo, tolerância ao estresse, resistência ou tolerância a doenças, resistência a herbicidas, ramificação, florescimento, conjunto de sementes, tamanho das sementes, densidade das sementes, resistência, capacidade para ser debulhado e semelhantes. O rendimento é, portanto, a culminação final de todos os traços agronômicos.
[0076] Loci marcadores que demonstram cossegregação estatisticamente significativa com um traço de resistência a doenças que confere resistência ampla contra uma doença ou doenças especificadas são proporcionados aqui. A detecção desses loci ou loci adicionais ligados e o gene de resistência podem ser usados em seleção auxiliada por marcador como parte de um programa de melhoramento para produzir plantas que têm resistência a uma doença ou doenças. Mapeamento genético
[0077] Foi reconhecido desde há algum tempo que os loci genéticos específicos que se correlacionam com fenótipos particulares, como resistência a doenças, podem ser mapeados no genoma de um organismo. O reprodutor de plantas pode usar vantajosamente marcadores moleculares para identificar indivíduos desejados detectando-se alelos marcadores que mostram uma probabilidade estatisticamente significativa de cossegregação com um fenótipo desejado, manifestado como desequilíbrio de ligação. Identificando-se um marcador molecular ou agrupamentos de marcadores moleculares que cossegregam com um traço de interesse,
o reprodutor pode selecionar rapidamente um fenótipo desejado selecionando-se o alelo marcador molecular apropriado (um processo chamado seleção auxiliada por marcador ou MAS).
[0078] Uma variedade de métodos bem conhecidos na técnica são disponibilizados para detectar marcadores moleculares ou agrupamentos de marcadores moleculares que se cossegregam com um traço de interesse, tal como um traço de resistência a doenças. A ideia básica subjacente a estes métodos é a detecção de marcadores, para os quais genótipos (ou alelos) alternativos têm fenótipos médios significativamente diferentes. Desse modo, uma pessoa faz uma comparação entre locos marcadores da magnitude de diferença entre genótipos (ou alelos) alternativos ou do nível de significância dessa diferença. Infere-se que os genes de características estão localizados mais próximos do(s) marcador(es) que têm a maior diferença genotípica associada. Dois métodos do tipo utilizados para detectar locos de características de interesse são: 1) Análise de associação com base em população (isto é, mapeamento de associação) e 2) Análise de ligação tradicional. Mapeamento de Associação
[0079] Entender a extensão e os padrões de desequilíbrio de ligação (LD) no genoma é um pré-requisito para desenvolver abordagens de associação eficientes para identificar e mapear loci de traços quantitativos (QTL). O desequilíbrio de ligação (LD) se refere à associação não aleatória de alelos em uma coleção de indivíduos. Quando LD é observado dentre alelos em loci ligados, o mesmo é medido como decaimento de LD através de uma região específica de um cromossomo. A extensão do LD é um reflexo do histórico recombinatório daquela região. A taxa média de decaimento de LD em um genoma pode ajudar a prever o número e a densidade de marcadores que são necessários para empreender um estudo de associação em todo o genoma e fornece uma estimativa da resolução que pode ser esperada.
[0080] Mapeamento de associação ou LD tem como objetivo identificar associações genótipo-fenótipo significativas. O mesmo foi explorado como uma ferramenta poderosa para mapeamento fino em cruzamento exogâmico de espécies como humanos (Corder et al. (1994) "Protective effect of apolipoprotein-E type-2 allele for late-onset Alzheimer-disease", Nat Genet 7:180 a 184; Hastbacka et al. (1992) "Linkage disequilibrium mapping in isolated founder populations: diastrophic dysplasia in Finland" Nat Genet 2:204 a 211; Kerem et al. (1989) "Identification of the cystic fibrosis gene: genetic analysis", Science 245:1073 a 1080) e milho (Remington et al., (2001) "Structure of linkage disequilibrium and phenotype associations in the maize genome", Proc Natl Acad Sci USA 98:11479 a 11484; Thornsberry et al. (2001) "Dwarf8 polymorphisms associate with variation in flowering time", Nat Genet 28:286 a 289; revisado por Flint-Garcia et al. (2003) "Structure of linkage disequilibrium in plants", Annu Rev Plant Biol. 54:357 a 374), em que a recombinação entre heterozigotos é frequente e resulta em um decaimento rápido de LD. Em cruzamentos cossanguíneos de espécies em que a recombinação entre genótipos homozigóticos não é geneticamente detectável, a extensão de LD é maior (isto é, blocos maiores de marcadores ligados são herdados juntos) e isso intensifica dramaticamente o poder de detecção do mapeamento de associação (Wall e Pritchard (2003) "Haplotype blocks and linkage disequilibrium in the human genome", Nat Rev Genet 4:587 a 597).
[0081] O histórico recombinatório e de mutação de uma população é uma função do hábito de acasalamento, assim como do tamanho efetivo e a idade de uma população. Os tamanhos de população grandes oferecem possibilidades aprimoradas para detectar recombinação, enquanto as populações mais velhas são geralmente associadas a níveis mais altos de polimorfismo, ambos os quais contribuem para taxas aceleradas de modo observável de decaimento de LD. Por outro lado, os tamanhos de população efetivos menores, por exemplo, aqueles que experimentaram um efeito de gargalo genético recente, tendem a mostrar uma taxa mais lenta de decaimento de LD, o que resulta em conservação de haplótipos mais extensa (Flint-Garcia et al. (2003) "Structure of linkage disequilibrium in plants", Annu Rev Plant Biol. 54:357 a 374).
[0082] As linhagens de reprodução de elite fornecem um ponto de partida valioso para análises de associação. As análises de associação usam escores fenotípicos quantitativos (por exemplo, tolerância a doenças classificada de um a nove para cada linhagem) na análise (em oposição a olhar apenas para distribuições de frequência de alelos tolerantes versus resistentes em tipos de análise de distribuição de alelos intergrupos). A disponibilidade de dados de desempenho fenotípico detalhados coletados por programas de reprodução ao longo de múltiplos anos e ambientes para um número grande de linhagens de elite fornece um conjunto de dados valioso para análises de mapeamento de associação de marcadores genéticos. Isso cria o caminho para integração contínua entre pesquisa e aplicação e toma vantagem dos conjuntos de dados historicamente acumulados. Entretanto, um entendimento da relação entre polimorfismo e recombinação é útil no desenvolvimento de estratégias apropriadas para extrair de modo eficaz o máximo de informações desses recursos.
[0083] Esse tipo de análise de associação não gera nem necessita de quaisquer dados de mapa, mas é independente de posição de mapa. Essa análise compara o escore fenotípico das plantas com os genótipos nos vários loci. Subsequentemente, qualquer mapa adequado (por exemplo, um mapa compósito) pode ser opcionalmente usado para ajudar a observar a distribuição dos marcadores QTL e/ou agrupamento de marcadores QTL identificados com o uso de localizações de mapa anteriormente determinadas dos marcadores. Análise de ligação tradicional
[0084] Os mesmos princípios são subjacentes à análise de ligação tradicional; entretanto, LD é gerado criando-se uma população a partir de um número pequeno de fundadores. Os fundadores são selecionados para maximizar o nível de polimorfismo dentro da população construída, e sítios polimórficos são avaliados por seu nível de cossegregação com um dado fenótipo. Alguns métodos estatísticos foram usados para identificar associações marcador- traço significativas. Um tal método é uma abordagem de mapeamento de intervalo (Lander e Botstein, Genetics 121:185 a 199 (1989)), no qual cada uma das muitas posições ao longo de um mapa genético (dizer em intervalos de 1 cM) é testada quanto à probabilidade de um gene controlando um traço de interesse estar localizado naquela posição. Os dados de genótipo/fenótipo são usados para calcular, para cada posição de teste, um escore de LOD (log de razão de probabilidades). Quando o escore de LOD excede um valor de limiar, há evidência significativa da localização de um gene que controla a característica de interesse naquela posição no mapa genético (que estará entre dois locos marcadores particulares).
[0085] Locos marcadores que demonstram cossegregação estatisticamente significativa com um traço de resistência a doenças, conforme determinado pela análise de ligação tradicional e pela análise de associação em todo o genoma, são fornecidos no presente documento. A detecção desses locos ou locos ligados adicionais pode ser usada em programas de melhoramento assistido por marcadores para produzir plantas com resistência a doenças.
[0086] As atividades em programas de reprodução auxiliados por marcador podem incluir, mas sem limitação: selecionar dentre populações de reprodução novas para identificar qual população tem a frequência mais alta de sequências de ácidos nucleicos favoráveis com base no genótipo histórico e associações de traços agronômicos, selecionar sequências de ácidos nucleicos favoráveis dentre progênie em populações de reprodução, selecionar dentre linhagens parentais com base na previsão de desempenho da progênie, e avançar linhagens em atividades de melhora de germoplasma com base na presença de sequências de ácidos nucleicos favoráveis. Intervalos cromossômicos
[0087] Os intervalos cromossômicos que se correlacionam com o traço de resistência a doenças são fornecidos.
Uma variedade de métodos bem conhecidos na técnica está disponível para identificar intervalos cromossômicos. Os limites de tais intervalos cromossômicos são traçados de modo a abranger marcadores que estarão ligados ao(s) gene(s) que controla(m) a característica de interesse. Em outras palavras, o intervalo cromossômico é traçado de modo que qualquer marcador que se situe dentro desse intervalo (incluindo os marcadores terminais que definem os limites do intervalo) possa ser usado como um marcador para um traço de resistência a doença.
[0088] Inversamente, por exemplo, se dois marcadores em estreita proximidade mostrarem cossegregação com o traço fenotípico desejado, algumas vezes não é claro se cada um desses marcadores identifica o mesmo gene ou dois genes diferentes ou múltiplos genes. Independentemente, o conhecimento de quantos genes estão em um intervalo físico/genômico particular não é necessário para implementar ou praticar o que é apresentado na presente revelação.
[0089] Os intervalos cromossômicos também podem ser definidos por marcadores que estão ligados a (mostram desequilíbrio de ligação com) um gene resistente a doenças, e r2 é uma medida comum do desequilíbrio de ligação (LD) no contexto de estudos de associação. Se o valor r2 de LD entre um locus marcador de cromossomo 7 em um intervalo de interesse e outro locus marcador de cromossomo 7 em proximidade estreita for maior que 1/3 (Ardlie et al., Nature Reviews Genetics 3:299 a 309 (2002)), os loci estão em desequilíbrio de ligação entre si. Marcadores e relações de ligação
[0090] Uma medida comum de ligação é a frequência com a qual os traços cossegregam. Isso pode ser expresso como uma porcentagem de cossegregação (frequência de recombinação) ou em centiMorgans (cM). O cM é uma unidade de medida de frequência de recombinação genética. Um cM é igual a uma chance de 1% de um traço em um locus genético ser separado de um traço em outro locus devido ao cruzamento ao longo de uma única geração (o que significa que os traços segregam juntos 99% do tempo). Devido ao fato de a distância cromossômica ser aproximadamente proporcional à frequência de cruzamento de eventos entre traços, há uma distância física aproximada que se correlaciona com a frequência de recombinação.
[0091] Os loci marcadores são traços em si e podem ser avaliados de acordo com a análise de ligação padrão rastreando os loci marcadores durante a segregação. Desse modo, um cM é igual a uma chance de 1% de um locus marcador ser separado de outro locus, devido ao cruzamento em uma única geração.
[0092] Quanto mais próximo um marcador estiver de um gene que controla um traço de interesse, mais eficaz e vantajoso esse marcador é como indicador para o traço desejado. Os loci estreitamente ligados exibem uma frequência de cruzamento inter- locus de cerca de 10% ou menos, preferencialmente cerca de 9% ou menos, ainda mais preferencialmente cerca de 8% ou menos, ainda mais preferencialmente cerca de 7% ou menos, ainda mais preferencialmente cerca de 6% ou menos, ainda mais preferencialmente cerca de 5% ou menos, ainda mais preferencialmente cerca de 4% ou menos, ainda mais preferencialmente cerca de 3% ou menos, e ainda mais preferencialmente cerca de 2% ou menos. Em modalidades altamente preferidas, os loci relevantes (por exemplo, um locus marcador e um locus-alvo) exibem uma frequência de recombinação de cerca de 1% ou menos, por exemplo, cerca de 0,75% ou menos, mais preferencialmente cerca de 0,5% ou menos, ou ainda mais preferencialmente cerca de 0,25% ou menos. Desse modo, os locos são separados por cerca de 10 cM, 9 cM, 8 cM, 7 cM, 6 cM, 5 cM, 4 cM, 3 cM, 2 cM, 1 cM, 0,75 cM, 0,5 cM ou 0,25 cM ou menos. Dito de outro modo, dois locos que estão localizados no mesmo cromossomo, e a uma distância tal que a recombinação entre os dois locos ocorre a uma frequência inferior a 10% (por exemplo, cerca de 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 0,75%, 0,5%, 0,25% ou menos), são considerados “próximos” um do outro.
[0093] Embora alelos marcadores particulares possam cossegregar com o traço de resistência a doenças, é importante observar que o locus marcador não é necessariamente responsável pela expressão do fenótipo de resistência a doenças. Por exemplo, não é uma necessidade que a sequência polinucleotídica marcadora faça parte de um gene que é responsável pelo fenótipo resistente a doenças (por exemplo, faça parte da fase de leitura aberta do gene). A associação entre um alelo marcador específico e o traço de resistência a doenças é devido à fase de ligação de "acoplamento" original entre o alelo marcador e o alelo na linhagem ancestral de onde é originário o alelo. No final, com recombinação repetida, os eventos de permutação entre o marcador e o loco genético podem alterar esta orientação. Por esse motivo, o alelo marcador favorável pode se alterar dependendo da fase de ligação que existe no progenitor que tem resistência à doença que é usado para criar populações de segregação. Isso não muda o fato de que o marcador pode ser usado para monitorar a segregação do fenótipo. Apenas muda qual alelo marcador é considerado favorável em uma dada população de segregação.
[0094] Os métodos apresentados no presente documento incluem detectar a presença de um ou mais alelos marcadores associados à resistência a doenças em uma planta e, então, identificar e/ou selecionar plantas que têm alelos favoráveis em tais loci marcadores. Foram identificados aqui marcadores como estando associados ao traço de resistência a doenças e, assim, podem ser usados para prever resistência a doenças em uma planta. Qualquer marcador dentro de 50 cM, 40 cM, 30 cM, 20 cM, 15 cM, 10 cM, 9 cM, 8 cM, 7 cM, 6 cM, 5 cM, 4 cM, 3 cM, 2 cM, 1 cM, 0,75 cM, 0,5 cM ou 0,25 cM (com base em um mapa genético baseado em meiose única) também pode ser usado para prever a resistência a doenças em uma planta. Seleção assistida por marcadores
[0095] Os marcadores moleculares podem ser usados em uma variedade de aplicações de reprodução de planta (por exemplo, consultar Staub et al. (1996) Hortscience 31: 729 a 741; Tanksley (1983) Plant Molecular Biology Reporter. 1: 3-8). Uma das principais áreas de interesse é aumentar a eficiência do retrocruzamento e introgressão de genes com o uso de seleção auxiliada por marcadores (MAS). Um marcador molecular que demonstra ligação a um locus que afeta um traço fenotípico desejado fornece uma ferramenta útil para a seleção do traço em uma população de plantas. Isso é particularmente verdadeiro quando o fenótipo é difícil de ensaiar. Visto que os ensaios de marcador de DNA são menos trabalhosos e ocupam menos espaço físico do que a fenotipagem de campo, populações muito maiores podem ser ensaiadas, o que aumenta as chances de encontrar um recombinante com o segmento- alvo da linhagem doadora movido para a linhagem receptora. Quanto mais próxima a ligação, mais útil o marcador, visto que a recombinação é menos propensa a ocorrer entre o marcador e o gene que causa o traço, o que pode resultar em falsos positivos. Ter marcadores de flanqueamento diminui as chances de ocorrência de seleção de falsos positivos visto que um evento de recombinação dupla seria necessário. A situação ideal é ter um marcador no próprio gene, para que a recombinação não possa ocorrer entre o marcador e o gene. Em algumas modalidades, os métodos revelados aqui produzem um marcador em um gene de resistência a doenças, em que o gene foi identificado inferindo a localização genômica a partir do agrupamento de domínios conservados ou uma análise de agrupamento.
[0096] Quando um gene é introgressado por MAS, não apenas o gene é introduzido, como também as regiões de flanqueamento (Gepts. (2002). Crop Sci; 42: 1780-1790). Tal é referido como "arraste de ligação". No caso em que a planta doadora é altamente não relacionada com a planta receptora, essas regiões de flanqueamento têm genes adicionais que podem codificar características agronomicamente indesejáveis. Este “arraste de ligação” também pode resultar em rendimento reduzido ou outras características agronômicas negativas até mesmo após múltiplos ciclos de retrocruzamento na linhagem de elite.
Tal também é por vezes referido como “arraste de rendimento”. O tamanho da região de flanqueamento pode ser diminuído por retrocruzamento adicional, embora isso não seja sempre bem-sucedido, visto que reprodutores não têm controle sobre o tamanho da região ou os pontos de interrupção de recombinação (Young et al. (1998) Genetics 120:579 a 585). Em reprodução clássica, é normalmente apenas por chance que são selecionadas recombinações que contribuem para uma redução do tamanho do segmento doador (Tanksley et al. (1989). Biotechnology 7: 257-264). Mesmo após 20 retrocruzamentos em retrocruzamentos desse tipo, uma pessoa pode esperar encontrar um pedaço razoavelmente grande do cromossomo doador ainda ligado ao gene selecionado.
Com marcadores, no entanto, é possível selecionar aqueles indivíduos raros que experimentaram recombinação próxima ao gene de interesse.
Em 150 plantas de retrocruzamento, há uma chance de 95% de que pelo menos uma planta tenha experimentado uma permutação dentro de 1 cM do gene, com base em uma distância de mapa de meiose única.
Os marcadores permitirão a identificação não equivocada desses indivíduos.
Com um retrocruzamento adicional de 300 plantas, haverá 95% de probabilidade de um cruzamento em 1 cM de distância do mapa de meiose única do outro lado do gene, gerando um segmento em redor do gene-alvo menor do que 2 cM com base na distância do mapa de meiose única.
Isso pode ser cumprido em duas gerações com marcadores, enquanto teriam sido necessárias em média 100 gerações sem marcadores (Consulte Tanksley et al., supra). Quando a localização exata de um gene é conhecida, os marcadores de flanqueamento que circundam o gene podem ser utilizados para selecionar as recombinações em tamanhos de população diferentes. Por exemplo, em tamanhos populacionais menores, recombinações podem ser esperadas distantes do gene e, portanto, marcadores de flanqueamento mais distais serão necessários para detectar a recombinação.
[0097] Os componentes-chave para a implantação de MAS são: (i) Definir a população dentro da qual a associação marcador- traço será determinada, a qual pode ser uma população de segregação, ou uma população aleatória ou estruturada; (ii) monitorar a segregação ou associação de marcadores polimórficos em relação ao traço, e determinar a ligação ou associação com o uso de métodos estatísticos; (iii) definir um conjunto de marcadores desejáveis com base nos resultados da análise estatística, e (iv) o uso e/ou extrapolação dessas informações para o conjunto atual de germoplasma de reprodução para possibilitar que sejam tomadas decisões de seleção com base em marcador. Os marcadores descritos nessa revelação, assim como outros tipos de marcador, como SSRs e FLPs, podem ser usados em protocolos de seleção auxiliados por marcador.
[0098] SSRs podem ser definidos como rondas relativamente curtas de DNA repetido em tandem com comprimentos de 6 pb ou menos (Tautz (1989) Nucleic Acid Research 17: 6463 a 6471; Wang et al. (1994) Theoretical and Applied Genetics, 88:1 a 6). Polimorfismos surgem devido à variação do número de unidades de repetição, provavelmente causados por deslize durante a replicação de DNA (Levinson e Gutman (1987) Mol Biol Evol 4: 203-221). A variação do comprimento das repetições pode ser detectada projetando-se iniciadores de PCR para as regiões de flanqueamento não repetitivas conservadas (Weber e May (1989) Am J Hum Genet. 44:388 a 396). SSRs são altamente adequados para mapeamento e MAS visto que são multialélicos, codominantes, reproduzíveis e propensos a automatização de produtividade alta (Rafalski et al. (1996) "Generating and using DNA markers in plants". Em: Non- mammalian genomic analysis: a practical guide. Academic press. páginas 75 a 135).
[0099] Vários tipos de marcadores SSR podem ser gerados, e perfis de SSR podem ser obtidos por eletroforese em gel dos produtos de amplificação. O escore de genótipo de marcador tem base no tamanho do fragmento amplificado.
[0100] Vários tipos de marcadores FLP também podem ser gerados. Muito comumente, iniciadores de amplificação são usados para gerar polimorfismos de comprimento de fragmento. Tais marcadores FLP são de muitas maneiras similares aos marcadores SSR, exceto pela região amplificada pelos iniciadores não ser tipicamente uma região altamente repetitiva. Adicionalmente, a região amplificada, ou amplicon, terá variabilidade suficiente entre germoplasma, frequentemente devido a inserções ou deleções, de modo que os fragmentos gerados pelos iniciadores de amplificação podem ser distinguidos entre indivíduos polimórficos, e tais indels são conhecidos por ocorrerem frequentemente em milho (Bhattramakki et al. (2002). Plant Mol Biol 48, 539 a 547; Rafalski (2002b), supra).
[0101] Os marcadores SNP detectam substituições de nucleotídeos de pares de bases únicos.
Dentre todos os tipos de marcador molecular, SNPs são os mais abundantes, tendo, desse modo, o potencial para fornecer a resolução de mapa genético mais alta (Bhattramakki et al. 2002 Plant Molecular Biology 48:539 a 547). Os SNPs podem ser avaliados em um nível ainda mais alto de produtividade do que SSRs, de uma maneira chamada de “produtividade ultra-alta”, visto que SNPs não necessitam de quantidades grandes de DNA e a automatização do ensaio pode ser simples.
Os SNPs também prometem ser sistemas de custo relativamente baixo.
Esses três fatores juntos tornam SNPs altamente atrativos para uso em MAS.
Estão disponíveis vários métodos para a genotipagem de SNPs, incluindo mas não se limitando a, hibridação, extensão de iniciadores, ligação de oligonucleotídeos, clivagem por nucleases, minissequenciamento e esferas codificadas.
Tais métodos foram revistos em: Gut (2001) Hum Mutat 17 pp. 475-492; Shi (2001) Clin Chem 47, pp. 164-172; Kwok (2000) Pharmacogenomics 1, pp. 95-100; e Bhattramakki e Rafalski (2001) "Discovery and application of single nucleotide polymorphism markers in plants". Em: R.
J.
Henry, Ed, Plant Genotyping: The DNA Fingerprinting of Plants, CABI Publishing, Wallingford.
Uma faixa ampla de tecnologias comercialmente disponíveis utiliza esses e outros métodos para interrogar SNPs incluindo Masscode.TM. (Qiagen), INVADER®. (Third Wave Technologies) e Invader PLUS®, SNAPSHOT®. (Applied Biosystems), TAQMAN®. (Applied Biosystems) e BEADARRAYS®. (Illumina).
[0102] Alguns SNPs juntos dentro de uma sequência, ou através de sequências ligadas, podem ser usados para descrever um haplótipo para qualquer genótipo particular (Ching et al. (2002), BMC Genet. 3:19 páginas Gupta et al. 2001, Rafalski (2002b), Plant Science 162:329 a 333). Os haplótipos podem ser mais informativos do que SNPs únicos e podem ser mais descritivos de qualquer genótipo particular. Por exemplo, um SNP único pode ser o alelo “T” para uma linhagem ou variedade específica com resistência a doenças, mas o alelo “T” também pode ocorrer na população de melhoramento sendo utilizada para progenitores recorrentes. Nesse caso, um haplótipo, por exemplo, uma combinação de alelos em marcadores SNP ligados, pode ser mais informativo. Depois de um haplótipo único ter sido atribuído a uma região cromossômica doadora, esse haplótipo pode ser usado nessa população ou qualquer seu subconjunto para determinar se um indivíduo tem um gene particular. Consulte, por exemplo, WO2003054229. O uso de plataformas de detecção de marcadores de produtividade alta automatizadas conhecidas por aqueles de habilidade comum na técnica torna esse processo altamente eficiente e eficaz.
[0103] Muitos dos marcadores apresentados aqui podem ser prontamente usados como marcadores de polimorfismo de um único nucleotídeo (SNP) para selecionar o gene R. Com o uso de PCR, os iniciadores são usados para amplificar segmentos de DNA a partir de indivíduos (preferencialmente congênitos) que representam a diversidade da população de interesse. Os produtos de PCR são sequenciados diretamente em uma ou ambas as direções. As sequências resultantes são alinhadas e polimorfismos são identificados. Os polimorfismos não são limitados a polimorfismos de nucleotídeo único (SNPs), mas também incluem indels, CAPS, SSRs e VNTRs (número variável de repetições em tandem). Especificamente em relação às informações de mapa fino descritas no presente documento, uma pessoa pode usar prontamente as informações fornecidas no presente documento para obter SNPs polimórficos adicionais (e outros marcadores) dentro da região amplificada pelos iniciadores aqui revelados. Os marcadores dentro da região de mapa descrita podem ser hibridados com BACs ou outras bibliotecas genômicas, ou eletronicamente alinhados com sequências de genoma, para encontrar sequências novas na mesma localização aproximada da dos marcadores descritos.
[0104] Além de SSRs, FLPs e SNPs, conforme descrito acima, outros tipos de marcadores moleculares também são amplamente usados, incluindo, mas sem limitação, etiquetas de sequência expressas (ESTs), marcadores SSR derivados de sequências EST, DNA polimórfico aleatoriamente amplificado (RAPD), e outros marcadores à base de ácidos nucleicos.
[0105] Os perfis de isozima e características morfológicas ligadas também podem ser, em alguns casos, indiretamente usados como marcadores. Mesmo apesar de não detectarem diretamente diferenças de DNA, os mesmos são frequentemente influenciados por diferenças genéticas específicas. Entretanto, os marcadores que detectam a variação de DNA são muito mais numerosos e polimórficos do que os marcadores de isozima ou morfológicos (Tanksley (1983) Plant Molecular Biology Reporter 1:3 a 8).
[0106] Os alinhamentos de sequência ou contigs também podem ser usados para encontrar sequências a montante ou a jusante dos marcadores específicos mencionados no presente documento. Essas sequências novas, próximas dos marcadores descritos no presente documento, são, então, usadas para descobrir e desenvolver marcadores funcionalmente equivalentes. Por exemplo, mapas físicos e/ou genéticos diferentes são alinhados para localizar marcadores equivalentes não descritos na presente divulgação, mas que estão dentro de regiões similares. Esses mapas podem estar dentro da espécie, ou até mesmo através de outras espécies que foram genética ou fisicamente alinhadas.
[0107] De modo geral, MAS usa marcadores polimórficos que foram identificados como tendo uma probabilidade significativa de cossegregação com um traço, tal como o traço de resistência a doenças. Se presume que tais marcadores mapeiam próximo de um gene ou genes que fornecem à planta seu fenótipo resistente a doenças, e são considerados como indicadores para o traço desejado, ou marcadores. As plantas são testadas quanto à presença de um alelo desejado no marcador, e se espera que as plantas contendo um genótipo desejado em um ou mais locos transfiram o genótipo desejado, juntamente com um fenótipo desejado, à sua progênie. Desse modo, as plantas com resistência a doenças podem ser selecionadas detectando um ou mais alelos marcadores e, além disso, plantas da progênie derivadas de tais plantas também podem ser selecionadas. Desse modo, uma planta que contém um genótipo desejado em uma determinada região cromossômica (isto é, um genótipo associado a resistência a doenças) é obtida e, então,
cruzada com outra planta. A progênie de tal cruzamento será, então, avaliada genotipicamente com o uso de um ou mais marcadores e as plantas da progênie com o mesmo genótipo em uma determinada região cromossômica serão, então, selecionadas como tendo resistência a doenças.
[0108] Os SNPs podem ser usados isoladamente ou em combinação (isto é, um haplótipo de SNP) para selecionar um alelo de gene resistente favorável associado a resistência a doenças.
[0109] O artesão versado na técnica esperará que possa haver sítios polimórficos adicionais em loci marcadores em e em torno de um marcador cromossômico identificado pelos métodos revelados aqui, em que um ou mais sítios polimórficos estão em desequilíbrio de ligação (LD) com um alelo em um ou mais dos sítios polimórficos no haplótipo e podem ser usados, desse modo, em um programa de seleção auxiliada por marcadores para introgressar um alelo de gene ou fragmento genômico de interesse. Dois alelos particulares em sítios polimórficos diferentes são ditos como estando em LD se a presença do alelo em um dos sítios tender a prever a presença do alelo no outro sítio no mesmo cromossomo (Stevens, Mol. Diag. 4:309 a 317 (1999)). Os loci marcadores podem ser localizados em 5 cM, 2 cM ou 1 cM (em um mapa genético à base de meiose única) do do traço de QTL de resistência a doenças.
[0110] O artesão versado entenderá que a frequência alélica (e, portanto, a frequência de haplótipo) pode diferir de uma reunião de germoplasma para outra. As reuniões de germoplasma variam devido a diferenças de maturidade, agrupamentos heteróticos, distribuição geográfica, etc. Como resultado, os SNPs e outros polimorfismos podem não ser informativos em algumas reuniões de germoplasma. Composições de planta
[0111] As plantas identificadas e/ou selecionadas por qualquer um dos métodos descritos acima também são de interesse. Proteínas e Variantes e Fragmentos Das Mesmas
[0112] Polipeptídeos de genes R são abrangidos pela revelação. "Polipeptídeo de gene R" e "proteína de gene R", como usados aqui alternadamente, se relacionam com polipeptídeo(s) tendo uma atividade de resistência a doenças. Uma variedade de polipeptídeos de gene R é contemplada. Em algumas modalidades, o gene R é um gene NLR01. Em uma modalidade, o gene NLR01 codifica um polipeptídeo como apresentado na SEQ ID NO: 2. Em outra modalidade, a SEQ ID NO: 1 codifica o polipeptídeo como apresentado na SEQ ID NO: 2. "Suficientemente idêntico" é usado aqui para referir uma sequência de aminoácidos que tem pelo menos cerca de 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais de identidade de sequência. Em algumas modalidades, a identidade de sequência é contra a sequência completa de um polipeptídeo. O termo "cerca de" quando usado no presente documento em contexto com identidade de sequência em porcentagem significa +/- 1,0%.
[0113] Uma "proteína recombinante" é usado aqui para referir uma proteína que já não está no seu ambiente natural, por exemplo, in vitro ou em uma célula hospedeira recombinante bacteriana ou de planta; uma proteína que é expressa a partir de um polinucleotídeo que foi editado relativamente à sua versão nativa; ou uma proteína que é expressa a partir de um polinucleotídeo em uma posição genômica diferente relativamente à sequência nativa.
[0114] “Substancialmente isento de material celular”, conforme usado no presente documento, refere-se a um polipeptídeo que inclui preparações de proteína que têm menos de cerca de 30%, 20%, 10% ou 5% (em peso seco) de proteína não alvo (também denominada no presente documento como “proteína contaminante”).
[0115] "Fragmentos" ou "porções biologicamente ativas" incluem fragmentos de polipeptídeos ou polinucleotídeos compreendendo sequências suficientemente idênticas a um polipeptídeo ou polinucleotídeo de gene R, respectivamente, e que exibem resistência a doenças quando expressos em uma planta.
[0116] "Variantes", como usado aqui, se relaciona com proteínas ou polipeptídeos tendo uma sequência de aminoácidos que é pelo menos cerca de 50%, 55%, 60%, 65%, 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou mais idêntica à sequência de aminoácidos paterna.
[0117] Métodos para tais manipulações são geralmente conhecidos na técnica. Por exemplo, as variantes de sequências de aminoácidos de um polipeptídeo podem ser preparadas por mutações no DNA. Isso pode ser também realizado por uma dentre diversas formas de mutagênese, tal como, por exemplo, tecnologia de quebra de fita dupla específica para sítio e/ou em evolução dirigida. Em alguns aspectos, as mudanças codificadas na sequência de aminoácidos não afetarão substancialmente a função da proteína. Tais variantes terão a atividade desejada. No entanto, é entendido que a capacidade de um polipeptídeo de gene R para conferir resistência a doenças pode ser aprimorada pelo uso de tais técnicas nas composições desta revelação. Moléculas de Ácidos Nucleicos e Variantes e Fragmentos das Mesmas
[0118] As moléculas de ácido nucleico isoladas ou recombinantes que compreendem sequências de ácido nucleico que codificam polipeptídeos de gene R ou porções biologicamente ativas dos mesmos, assim como moléculas de ácido nucleico suficientes para uso como sondas de hibridação para identificar moléculas de ácido nucleico que codificam as proteínas com regiões de homologia de sequência são fornecidas. Conforme usado no presente documento, o termo "molécula de ácido nucleico" se refere a moléculas de DNA (por exemplo, DNA recombinante, cDNA, DNA genômico, DNA plastídico, DNA mitocondrial) e moléculas de RNA (por exemplo, mRNA) e análogos do DNA ou RNA gerados com o uso de análogos nucleotídicos. A molécula de ácido nucleico pode ser de fita única ou de fita dupla, mas preferencialmente é DNA de fita dupla.
[0119] Uma molécula de ácido nucleico (ou DNA) "isolada" é usada no presente documento para se referir a uma sequência de ácido nucleico (ou DNA) que não está mais em seu ambiente natural, por exemplo, in vitro. Uma molécula de ácido nucleico (ou DNA) “recombinante” é usada no presente documento para se referir a uma sequência de ácido nucleico (ou DNA) que está em uma célula hospedeira bacteriana ou de planta recombinante; foi editada relativamente à sua sequência nativa; ou está localizada em uma localização diferente relativamente à sequência nativa. Em algumas modalidades, um ácido nucleico "isolado" ou "recombinante" está livre de sequências (preferentemente sequências que codificam proteínas) que flanqueiam naturalmente o ácido nucleico (ou seja, sequências localizadas nas extremidades 5' e 3' do ácido nucleico) no DNA genômico do organismo do qual o ácido nucleico é derivado. Para os propósitos da revelação, "isolado" ou "recombinante" quando usado para referir moléculas de ácido nucleico, exclui cromossomos isolados. Por exemplo, em várias modalidades, as moléculas de ácido nucleico recombinante que codificam polipeptídeos de gene R podem conter menos de cerca de 5 kb, 4 kb, 3 kb, 2 kb, 1 kb, 0,5 kb ou 0,1 kb de sequências de ácido nucleico que flanqueiam naturalmente a molécula de ácido nucleico no DNA genômico da célula da qual o ácido nucleico é derivado.
[0120] Em algumas modalidades, uma molécula de ácido nucleico isolada que codifica polipeptídeos de gene R tem uma ou mais alterações na sequência de ácido nucleico em comparação com a sequência de ácido nucleico nativa ou genômica. Em algumas modalidades, a mudança na sequência de ácido nucleico nativa ou genômica inclui, mas sem limitação: mudanças na sequência de ácido nucleico devido à degenerescência do código genético; mudanças na sequência de ácido nucleico devido à substituição, inserção, deleção e/ou adição de aminoácidos em comparação com a sequência nativa ou genômica; remoção de um ou mais íntrons; deleção de uma ou mais regiões reguladoras a montante ou a jusante, e deleção da região 5' e/ou 3' não traduzida associada à sequência de ácido nucleico genômico. Em algumas modalidades, a molécula de ácido nucleico que codifica um polipeptídeo de gene R é uma sequência não genômica.
[0121] Uma variedade de polinucleotídeos que codificam polipeptídeos de gene R ou proteínas relacionadas é contemplada. Tais polinucleotídeos são úteis para a produção de polipeptídeos de gene R em células hospedeiras quando ligados de modo operacional a uma sequência promotora, de terminação de transcrição e/ou de poliadenilação adequada. Tais polinucleotídeos também são úteis como sondas para isolar polinucleotídeos homólogos ou substancialmente homólogos que codificam polipeptídeos de gene R ou proteínas relacionadas. Em algumas modalidades, o gene R é um gene NLR01. Em uma modalidade, o gene NLR01 codifica um polipeptídeo como apresentado na SEQ ID NO: 2. Em outra modalidade, a SEQ ID NO: 1 codifica o polipeptídeo como apresentado na SEQ ID NO: 2.
[0122] “Complemento" é usado no presente documento para se referir a uma sequência de ácido nucleico que é suficientemente complementar a uma dada sequência de ácido nucleico, de modo que a mesma pode hibridar com a dada sequência de ácido nucleico para desse modo formar um dúplex estável. “Variantes de sequência de polinucleotídeo" é usado no presente documento para referir a uma sequência de ácido nucleico que, exceto pela degenerescência do código genético, codifica o mesmo polipeptídeo.
[0123] Em algumas modalidades, a molécula de ácido nucleico que codifica o polipeptídeo de gene R é uma sequência de ácido nucleico não genômica. Conforme usado no presente documento, uma "sequência de ácido nucleico não genômica" ou "molécula de ácido nucleico não genômica" ou "polinucleotídeo não genômico" se refere a uma molécula de ácido nucleico que tem uma ou mais alterações na sequência de ácido nucleico em comparação a uma sequência de ácido nucleico nativa ou genômica. Em algumas modalidades, a mudança em relação a uma molécula de ácido nucleico nativa ou genômica inclui, porém sem limitação: mudanças na sequência de ácido nucleico devido à degenerescência do código genético; otimização da sequência de ácido nucleico para expressão em plantas; mudanças na sequência de ácido nucleico para introduzir pelo menos uma substituição, inserção, deleção e/ou adição de aminoácidos em comparação com a sequência nativa ou genômica; remoção de um ou mais íntrons associados à sequência de ácido nucleico genômica; inserção de um ou mais íntrons heterólogos; deleção de uma ou mais regiões reguladoras a montante ou a jusante associadas à sequência de ácido nucleico genômica; inserção de uma ou mais regiões reguladoras a montante ou a jusante heterólogas; deleção da região não traduzida 5' e/ou 3' associada à sequência de ácido nucleico genômico; inserção de uma região não traduzida 5' e/ou 3' heteróloga, e modificação de um sítio de poliadenilação. Em algumas modalidades, a molécula de ácido nucleico não genômico é uma sequência de ácido nucleico sintético.
[0124] Moléculas de ácidos nucleicos que são fragmentos dessas sequências de ácidos nucleicos que codificam polipeptídeos de gene R também são abrangidas pelas modalidades. “Fragmento", conforme usado no presente documento, se refere a uma porção da sequência de ácido nucleico que codifica um polipeptídeo de gene R. Um fragmento de uma sequência de ácido nucleico pode codificar uma porção biologicamente ativa de um polipeptídeo de gene R ou pode ser um fragmento que pode ser usado como uma sonda de hibridação ou iniciador de PCR com o uso dos métodos revelados abaixo. As moléculas de ácido nucleico são fragmentos de uma sequência de ácido nucleico que codifica um polipeptídeo de gene R compreendem pelo menos cerca de 150, 180, 210, 240, 270, 300, 330, 360, 400, 450 ou 500 nucleotídeos contíguos ou até o número de nucleotídeos presentes em uma sequência de ácido nucleico de comprimento total que codifica um polipeptídeo de gene R identificado pelos métodos revelados no presente documento, dependendo do uso pretendido. “Nucleotídeos contíguos" é usado no presente documento para referir resíduos de nucleotídeos que são imediatamente adjacentes uns aos outros. Os fragmentos das sequências de ácidos nucleicos das modalidades codificarão fragmentos de proteína que retêm a atividade biológica do polipeptídeo de gene R e, por isso, retêm resistência a doenças. "Retêm resistência a doenças" é usado aqui para referir um polipeptídeo tendo pelo menos cerca de 10%, pelo menos cerca de 30%, pelo menos cerca de 50%, pelo menos cerca de 70%, 80%, 90%, 95% ou mais da resistência a doenças do polipeptídeo de gene R completo.
[0125] “Porcentagem (%) de identidade de sequência” relativamente a uma sequência de referência (tema) é determinada como a porcentagem de resíduos de aminoácidos ou nucleotídeos em uma sequência candidata (de busca) que são idênticos aos resíduos de aminoácidos ou nucleotídeos respectivos na sequência de referência, depois do alinhamento das sequências e da introdução de intervalos, se necessário, para se alcançar a porcentagem máxima de identidade de sequência, e não considerando quaisquer substituições conservativas de aminoácidos como parte da identidade de sequência. O alinhamento com propósitos de determinação da porcentagem de identidade de sequência pode ser alcançado de vários modos que estão dentro da habilidade da técnica, por exemplo, com o uso de software de computador publicamente disponível, tal como BLAST, BLAST-2. Os indivíduos versados na técnica podem determinar parâmetros adequados para alinhar sequências, incluindo quaisquer algoritmos necessários para se alcançar o alinhamento máximo ao longo de todo o comprimento das sequências que estão a ser comparadas. A identidade percentual entre as duas sequências é uma função do número de posições idênticas compartilhadas pelas sequências (por exemplo, identidade percentual de sequência de busca = número de posições idênticas entre as sequências de busca e de tema/número total de posições de sequência de busca ×100).
[0126] As modalidades também abrangem moléculas de ácidos nucleicos que codificam variantes de polipeptídeo de gene R. “Variantes" das sequências de ácido nucleico que codificam os polipeptídeos de gene R incluem aquelas sequências que codificam os polipeptídeos de gene R identificados pelos métodos revelados no presente documento, mas que diferem conservativamente devido à degenerescência do código genético assim como aquelas que são suficientemente idênticas conforme discutido acima. As variantes alélicas de ocorrência natural podem ser identificadas com o uso de técnicas de biologia molecular bem conhecidas, tais como reação em cadeia da polimerase (PCR) e técnicas de hibridação conforme delineado acima. As sequências de ácidos nucleicos variantes também incluem sequências de ácidos nucleicos sinteticamente derivadas que foram geradas, por exemplo, com o uso de mutagênese sítio- dirigida, mas que ainda codificam os polipeptídeos de gene R revelados aqui.
[0127] O perito na técnica irá também apreciar que mudanças podem ser introduzidas por mutação das sequências de ácidos nucleicos, o que leva a mudanças na sequência de aminoácidos dos polipeptídeos de gene R codificados, sem alterar a atividade biológica das proteínas. Portanto, as moléculas de ácidos nucleicos variantes podem ser criadas introduzindo uma ou mais substituições, adições e/ou deleções de nucleotídeos na sequência de ácido nucleico correspondente revelada no presente documento, de modo que uma ou mais substituições, adições ou deleções de aminoácidos são introduzidas na proteína codificada. As mutações podem ser introduzidas por técnicas padrão, como mutagênese dirigida a sítios e mutagênese mediada por PCR. Tais sequências de ácidos nucleicos variantes são também englobadas pela presente divulgação.
[0128] Alternativamente, as sequências de ácidos nucleicos variantes podem ser preparadas introduzindo mutações aleatoriamente ao longo de toda ou parte da sequência de codificação, como por mutagênese por saturação, e os mutantes resultantes podem ser triados quanto à capacidade para conferir atividade com o propósito de identificar mutantes que retêm a atividade. Após a mutagênese, a proteína codificada pode ser expressa de modo recombinante e a atividade da proteína pode ser determinada com o uso de técnicas de ensaio padrão.
[0129] Os polinucleotídeos da divulgação e fragmentos dos mesmos são opcionalmente usados como substratos para uma variedade de reações de recombinação e recombinação recursiva, além de métodos de clonagem padrão, conforme estabelecido, por exemplo, em Ausubel, Berger e Sambrook, isto é, para produzir homólogos de polipeptídeos adicionais e fragmentos dos mesmos com propriedades desejadas. Uma variedade de tais reações é conhecida. Métodos para produzir uma variante de qualquer ácido nucleico listado no presente documento compreendendo recombinar recursivamente tal polinucleotídeo com um segundo polinucleotídeo (ou mais), formando, assim, uma biblioteca de polinucleotídeos variantes, são também modalidades da divulgação, assim como as bibliotecas produzidas, as células que compreendem as bibliotecas e qualquer polinucleotídeo recombinante produzido por tais métodos. Adicionalmente, tais métodos compreendem opcionalmente selecionar um polinucleotídeo variante de tais bibliotecas com base na atividade, em que tal combinação recursiva é feita in vitro ou in vivo.
[0130] Uma variedade de protocolos geradores de diversidade, incluindo protocolos de recombinação recursiva de ácido nucleico, está disponível e completamente descrita na técnica. Os procedimentos podem ser usados separadamente e/ou em combinação para produzir uma ou mais variantes de um ácido nucleico ou conjunto de ácidos nucleicos, assim como variantes de proteínas codificadas. Individual e coletivamente, esses procedimentos fornecem maneiras amplamente aplicáveis e robustas para gerar ácidos nucleicos diversificados e conjuntos de ácidos nucleicos (incluindo, por exemplo, bibliotecas de ácidos nucleicos) úteis, por exemplo, para a modificação ou evolução rápida de ácidos nucleicos, proteínas, vias, células e/ou organismos com características novas e/ou melhoradas.
[0131] Embora distinções e classificações sejam feitas no decorrer da discussão por motivos de clareza, será notado que as técnicas normalmente não são mutuamente exclusivas. De fato, os vários métodos podem ser usados isoladamente ou em combinação, em paralelo ou em série, para acessar diversas variantes de sequência.
[0132] O resultado de qualquer um dos procedimentos de geração de diversidade descritos no presente documento pode ser a geração de um ou mais ácidos nucleicos, os quais podem ser selecionados ou triados quanto a ácidos nucleicos com ou que conferem propriedades desejáveis ou que codificam proteínas com ou que conferem propriedades desejáveis. Após a diversificação por um ou mais dos métodos no presente documento ou disponíveis de outro modo para uma pessoa versada na técnica, quaisquer ácidos nucleicos que sejam produzidos podem ser selecionados quanto a uma atividade ou propriedade desejada, por exemplo, tal atividade a um pH desejado, etc. Isso pode incluir identificar qualquer atividade que possa ser detectada, por exemplo, em um formato automatizado ou automatizável, por qualquer um dentre os ensaios da técnica.
Uma variedade de propriedades relacionadas (ou até mesmo não relacionadas) pode ser avaliada, em série ou em paralelo, a critério do praticante.
[0133] As sequências de nucleotídeos das modalidades podem ser também usadas para isolar sequências correspondentes de uma fonte diferente. Dessa maneira, métodos como PCR, hibridação e similares podem ser usados para identificar tais sequências com base em sua homologia de sequência com as sequências identificadas pelos métodos revelados no presente documento. As sequências que são selecionadas com base em sua identidade de sequência com as sequências inteiras apresentadas no presente documento ou com os fragmentos das mesmas são abrangidas pelas modalidades. Tais sequências incluem sequências que são ortólogos das sequências. O termo "ortólogos" se refere a genes derivados de um gene ancestral comum e que são encontrados em diferentes espécies como resultado da especiação. Os genes encontrados em diferentes espécies são considerados ortólogos quando as suas sequências de nucleotídeos e/ou as suas sequências de proteínas codificadas partilham identidade substancial como definido noutro local no presente documento.
[0134] Em uma abordagem de PCR, os iniciadores oligonucleotídicos podem ser projetados para o uso em reações de PCR para amplificar sequências de DNA correspondentes a partir de cDNA ou DNA genômico extraído de qualquer organismo de interesse. Métodos para projetar iniciadores de PCR e clonagem por PCR são geralmente conhecidos na técnica e são divulgados em Sambrook, et al., (1989) Molecular Cloning: A Laboratory Manual (2ª edição, Cold
Spring Harbor Laboratory Press, Plainview, Nova Iorque), daqui em diante no presente documento, "Sambrook". Consultar também Innis, et al., editores (1990) PCR Protocols: A Guide to Methods and Applications (Academic Press, Nova Iorque); Innis e Gelfand, editores (1995) PCR Strategies (Academic Press, Nova Iorque); e Innis e Gelfand, editores (1999) PCR Methods Manual (Academic Press, Nova Iorque). Métodos conhecidos de PCR incluem, mas não estão limitados a, métodos utilizando iniciadores emparelhados, iniciadores encaixados, iniciadores específicos únicos, iniciadores degenerados, iniciadores específicos para genes, iniciadores específicos para vetores, iniciadores com emparelhamento parcialmente defeituoso, e semelhantes.
[0135] Em métodos de hibridação, toda ou parte da sequência de ácido nucleico pode ser usada para triar bibliotecas de cDNA ou genômicas. Métodos para construção de tais bibliotecas de cDNA e genômicas são geralmente conhecidos na técnica e são revelados em Sambrook e Russell, (2001), supra. As chamadas sondas de hibridação podem ser fragmentos de DNA genômico, fragmentos de cDNA, fragmentos de RNA ou outros oligonucleotídeos e podem ser etiquetadas com um grupo detectável, como 32P ou qualquer outro marcador detectável, como outros radioisótopos, um composto fluorescente, uma enzima ou um cofator enzimático. As sondas para hibridação podem ser produzidas marcando-se oligonucleotídeos sintéticos com base nas sequências de ácidos nucleicos codificadoras de polipeptídeos conhecidas reveladas no presente documento. Iniciadores degenerados projetados com base em nucleotídeos ou resíduos de aminoácidos conservados na sequência de ácido nucleico ou sequência de aminoácidos codificada podem adicionalmente ser usados. A sonda compreende tipicamente uma região de sequência de ácido nucleico que hibrida sob condições estringentes com pelo menos cerca de 12, pelo menos cerca de 25, pelo menos cerca de 50, 75, 100, 125, 150, 175 ou 200 nucleotídeos consecutivos de sequências de ácidos nucleicos que codificam polipeptídeos ou um fragmento ou variante dos mesmos. Os métodos para a preparação de sondas para condições de hibridação e estringência são geralmente conhecidos na técnica e são revelados em Sambrook e Russell, (2001), supra. Construtos de Nucleotídeos, Cassetes de Expressão e Vetores
[0136] O uso do termo "construtos de nucleotídeos" no presente documento não é destinado a limitar as modalidades aos construtos de nucleotídeos que compreendem DNA. Os habitualmente peritos na técnica reconhecerão que construtos de nucleotídeos, particularmente polinucleotídeos e oligonucleotídeos compostos por ribonucleotídeos e combinações de ribonucleotídeos e desoxirribonucleotídeos, podem também ser empregues nos métodos aqui revelados. Os construtos de nucleotídeos, ácidos nucleicos e sequências de nucleotídeos das modalidades abrangem adicionalmente todas as formas complementares de tais construtos, moléculas e sequências. Além disso, os construtos de nucleotídeos, moléculas de nucleotídeos e sequências de nucleotídeos das modalidades abrangem todos os construtos, moléculas e sequências de nucleotídeos que podem ser empregues nos métodos das modalidades para transformação de plantas incluindo, mas não se limitando a,
aqueles compreendidos por desoxirribonucleotídeos, ribonucleotídeos, e suas combinações. Tais desoxirribonucleotídeos e ribonucleotídeos incluem tanto moléculas de ocorrência natural como análogos sintéticos. Os construtos de nucleotídeos, ácidos nucleicos e sequências de nucleotídeos das modalidades também abrangem todas as formas de construtos de nucleotídeos incluindo, mas sem limitação, formas de fita única, formas de fita dupla, grampos, estruturas de haste e alça e semelhantes.
[0137] Uma modalidade adicional se refere a um organismo transformado, como um organismo selecionado dentre células de plantas, bactérias, levedura, baculovírus, protozoários, nematódeos e algas. O organismo transformado compreende uma molécula de DNA das modalidades, um cassete de expressão que compreende a molécula de DNA ou um vetor que compreende o cassete de expressão, o qual pode ser incorporado de modo estável no genoma do organismo transformado.
[0138] As sequências das modalidades são fornecidas em construtos de DNA para expressão no organismo de interesse. O construto incluirá sequências reguladoras 5' e 3' ligadas de modo operacional a uma sequência das modalidades. O termo “operativamente ligado”, conforme usado no presente documento, se refere a uma ligação funcional entre um promotor e uma segunda sequência, em que a sequência promotora inicia e medeia a transcrição da sequência de DNA correspondente à segunda sequência. De modo geral, ligado operativamente significa que as sequências de ácidos nucleicos sendo ligadas são contíguas e, quando necessário, para unir duas regiões de codificação de proteína no mesmo quadro de leitura. O construto pode conter adicionalmente pelo menos um gene adicional a ser cotransformado no organismo. Alternativamente, o(s) gene(s) adicional(ais) pode(m) ser proporcionado(s) em múltiplos construtos de DNA.
[0139] Tal construto de DNA é dotado de uma pluralidade de sítios de restrição para que a inserção da sequência genética do polipeptídeo da revelação fique sob regulação de transcrição das regiões reguladoras. O construto de DNA pode adicionalmente conter genes marcadores selecionáveis.
[0140] O construto de DNA incluirá geralmente, na direção de 5' para 3' de transcrição: uma região de iniciação de transcrição e tradução (isto é, um promotor), uma sequência de DNA das modalidades, e uma região de terminação de transcrição e de tradução (isto é, região de terminação) funcional no organismo que serve como um hospedeiro. A região de iniciação de transcrição (isto é, o promotor) pode ser nativa, análoga, estranha ou heteróloga ao organismo hospedeiro e/ou à sequência das modalidades. Adicionalmente, o promotor pode ser a sequência natural ou alternativamente uma sequência sintética. O termo "estranho", tal como aqui utilizado, indica que o promotor não se encontra no organismo nativo no qual o promotor é introduzido. Quando o promotor é "estranho" ou "heterólogo" à sequência das modalidades, se pretende que o promotor não seja o promotor nativo ou de ocorrência natural para a sequência operativamente ligada das modalidades. Tal como aqui utilizado, um gene quimérico compreende uma sequência de codificação operativamente ligada a uma região de iniciação da transcrição que é heteróloga à sequência de codificação. Quando o promotor é uma sequência nativa ou natural, a expressão da sequência ligada operativamente é alterada da expressão de tipo selvagem, o que resulta em uma alteração no fenótipo.
[0141] Em algumas modalidades, o construto de DNA compreende um polinucleotídeo codificando um polipeptídeo de gene R das modalidades. Em algumas modalidades, o construto de DNA compreende um polinucleotídeo que codifica uma proteína de fusão que compreende um polipeptídeo de gene R das modalidades.
[0142] Em algumas modalidades, o construto de DNA também pode incluir uma sequência intensificadora da transcrição. Conforme usado no presente documento, o termo um "intensificador" se refere a uma sequência de DNA que pode estimular a atividade promotora e pode ser um elemento inato do promotor ou um elemento heterólogo inserido para acentuar o nível ou a especificidade para tecidos de um promotor. Vários intensificadores são conhecidos na técnica incluindo, por exemplo, íntrons com propriedades de intensificação de expressão de gene em plantas (Publicação de Pedido de Patente Número US 2009/0144863, o íntron de ubiquitina (isto é, o íntron de ubiquitina de maís 1 (consulte, por exemplo, sequência de NCBI S94464)), o intensificador ômega ou o intensificador de iniciador ômega (Gallie, et al., (1989) "Molecular Biology of RNA" editora Cech (Liss, Nova York) 237 a 256 e Gallie, et al., (1987) Gene 60:217 a 225), o intensificador de CaMV 35S (consulte, por exemplo, Benfey, et al., (1990) EMBO J. 9:1685 a 1696) e os intensificadores de Patente número US 7,803,992 também podem ser usados. A lista acima de intensificadores de transcrição não é destinada a ser limitante. Qualquer intensificador de transcrição apropriado pode ser usado nas modalidades.
[0143] A região de terminação pode ser nativa com a região de iniciação de transcrição, pode ser nativa com a sequência de DNA de interesse ligada de modo operacional, pode ser nativa com o hospedeiro de planta ou pode ser derivada de outra fonte (isto é, estranha ou heteróloga ao promotor, à sequência de interesse, ao hospedeiro de planta ou qualquer combinação dos mesmos).
[0144] Regiões de terminação convenientes são disponibilizadas pelo plasmídeo Ti de A. tumefaciens, como as regiões de terminação de octopina sintase e nopalina sintase. Ver também, Guerineau, et al., (1991) Mol. Gen. Genet. 262:141 a 144; Proudfoot, (1991) Cell 64:671 a 674; Sanfacon, et al., (1991) Genes Dev. 5:141 a 149; Mogen, et al., (1990) Plant Cell 2:1261 a 1272; Munroe, et al., (1990) Gene 91:151 a 158; Ballas, et al., (1989) Nucleic Acids Res. 17:7891 a 7903 e Joshi, et al., (1987) Nucleic Acid Res. 15:9627 a 9639.
[0145] Quando apropriado, um ácido nucleico pode ser otimizado para a expressão aumentada no organismo hospedeiro. Assim, quando o organismo hospedeiro é uma planta, os ácidos nucleicos sintéticos podem ser sintetizados utilizando-se códons preferenciais para plantas para uma expressão melhorada. Consultar, por exemplo, Campbell e Gowri, (1990) Plant Physiol. 92:1 a 11 quanto a uma discussão sobre o uso preferido de hospedeiros. Por exemplo, embora as sequências de ácidos nucleicos das modalidades possam ser expressas em espécies de planta tanto monocotiledôneas quanto dicotiledôneas, as sequências podem ser modificadas de modo a representar as preferências específicas e as preferências de teor de GC de monocotiledôneas ou dicotiledôneas, uma vez que se demonstrou que essas preferências diferem (Murray et al. (1989) Nucleic Acids Res. 17:477 a 498). Assim, a planta preferencial para um aminoácido particular pode ser derivada de sequências de genes conhecidas de plantas.
[0146] As modificações de sequência adicionais são conhecidas por acentuarem a expressão de genes em um hospedeiro celular. Estas incluem a eliminação de sequências que codificam sinais de poliadenilação espúrios, sinais de sítio de encadeamento éxon-íntron, repetições semelhantes a transposons e outras sequências bem caracterizadas que podem ser prejudiciais para a expressão de genes. O teor de GC da sequência pode ser ajustado para níveis médios para um dado hospedeiro celular, conforme calculado em referência a genes conhecidos expressos na célula hospedeira. O termo "célula hospedeira", conforme usado no presente documento, se refere a uma célula que contém um vetor e suporta a replicação e/ou expressão do vetor de expressão pretendida. As células hospedeiras podem ser células procarióticas, como E. coli, ou células eucarióticas, como células de levedura, inseto, anfíbio ou mamífero ou células de plantas monocotiledôneas ou dicotiledôneas. Um exemplo de uma célula hospedeira monocotiledônea é uma célula hospedeira de milho. Quando possível, a sequência é modificada para evitar as estruturas de mRNA secundárias em grampo previstas.
[0147] Na preparação do cassete de expressão, os vários fragmentos de DNA podem ser manipulados de modo a proporcionar as sequências de DNA na orientação adequada e, conforme apropriado, no quadro de leitura adequado. Para este fim podem ser utilizados adaptadores ou ligantes para juntar os fragmentos de DNA, ou outras manipulações podem estar envolvidas para proporcionar locais de restrição convenientes, remoção de DNA supérfluo, remoção de locais de restrição ou semelhantes. Para esse propósito, mutagênese in vitro, reparo de iniciadores, restrição, hibridação, ressubstituições, por exemplo, transições e transversões, podem estar envolvidos.
[0148] Alguns promotores podem ser usados na prática das modalidades. Os promotores podem ser selecionados com base no resultado desejado. Os ácidos nucleicos podem ser combinados com promotores constitutivos, preferenciais para tecidos, induzíveis ou outros promotores para expressão no organismo hospedeiro. Transformação de Planta
[0149] Os métodos das modalidades envolvem introduzir um polipeptídeo ou polinucleotídeo em uma planta. "Introduzir" significa, conforme usado no presente documento, apresentar à planta o polinucleotídeo ou polipeptídeo de tal maneira que a sequência ganhe acesso ao interior de uma célula da planta. Os métodos das modalidades não dependem de um método específico para introduzir um polinucleotídeo ou polipeptídeo em uma planta, apenas que o polinucleotídeo (ou polinucleotídeos) ou o polipeptídeo (ou polipeptídeos) ganhe acesso ao interior de pelo menos uma célula da planta. Métodos para introduzir polinucleotídeo (ou polinucleotídeos) ou polipeptídeo (ou polipeptídeos) em plantas são conhecidos na técnica, incluindo, porém sem limitação, métodos de transformação estável, métodos de transformação transiente e métodos mediados por vírus.
[0150] “Transformação estável”, conforme usado no presente documento, significa que o construto de nucleotídeos introduzido em uma planta integra o genoma da planta e tem capacidade para ser herdado pela progênie da mesma. "Transformação transiente" significa, conforme usado no presente documento, que um polinucleotídeo é introduzido na planta e não se integra no genoma da planta ou um polipeptídeo é introduzido em uma planta. "Planta" se refere, conforme usado no presente documento, a plantas inteiras, órgãos de plantas (por exemplo, folhas, hastes, raízes, etc.), sementes, células de plantas, propágulos, embriões e descendência dos mesmos. As células de planta podem ser diferenciadas ou não diferenciadas (por exemplo, calo, células de cultura em suspensão, protoplastos, células de folha, células de raiz, células de floema e pólen).
[0151] Os protocolos de transformação, assim como protocolos para introduzir sequências de nucleotídeos em plantas, podem variar dependendo do tipo de planta ou célula de planta, isto é, monocotiledônea ou dicotiledônea, visada para transformação. Métodos adequados para introduzir sequências de nucleotídeos em células de plantas e inserção subsequente no genoma de plantas incluem microinjeção (Crossway, et al., (1986) Biotechniques 4:320 a 334), eletroporação (Riggs, et al., (1986) Proc. Natl. Acad. Sci. USA 83:5602 a 5606), transformação mediada por Agrobacterium
(Patentes nos U.S. 5,563,055 e 5,981,840), transferência de genes direta (Paszkowski, et al., (1984) EMBO J. 3:2717 a 2722) e aceleração balística de partículas (consultar, por exemplo, Patentes nos U.S. 4,945,050; 5,879,918; 5,886,244 e 5,932,782; Tomes, et al., (1995) em Plant Cell, Tissue, and Organ Culture: Fundamental Methods, editores Gamborg e Phillips, (Springer- Verlag, Berlim) e McCabe, et al., (1988) Biotechnology 6:923 a 926) e transformação Lecl (documento nº WO 00/28058). Quanto a transformação de batata ver Tu, et al., (1998) Plant Molecular Biology 37:829 a 838 e Chong, et al., (2000) Transgenic Research 9:71 a 78. Os procedimentos de transformação adicionais podem ser encontrados em Weissinger, et al., (1988) Ann.
Rev.
Genet. 22:421 a 477; Sanford, et al., (1987) Particulate Science and Technology 5:27 a 37 (cebola); Christou, et al., (1988) Plant Physiol. 87:671 a 674 (soja); McCabe, et al., (1988) Bio/Technology 6:923 a 926 (soja); Finer e McMullen, (1991) In Vitro Cell Dev.
Biol. 27P:175 a 182 (soja); Singh, et al., (1998) Theor.
Appl.
Genet. 96:319 a 324 (soja); Datta, et al., (1990) Biotechnology 8:736 a 740 (arroz); Klein, et al., (1988) Proc.
Natl.
Acad.
Sci.
USA 85:4305 a 4309 (maís); Klein, et al., (1988) Biotechnology 6:559 a 563 (maís); Patentes US números 5,240,855; 5,322,783 e 5,324,646; Klein, et al., (1988) Plant Physiol. 91:440 a 444 (maís); Fromm, et al., (1990) Biotechnology 8:833 a 839 (maís); Hooykaas-Van Slogteren, et al., (1984) Nature (Londres) 311:763 a 764; Patente US número 5,736,369 (cereais); Bytebier, et al., (1987) Proc.
Natl.
Acad.
Sci.
USA 84:5345 a 5349 (Liliaceae); De Wet, et al., (1985) em The Experimental Manipulation of Ovule Tissues, ed.
Chapman, et al., (Longman, Nova Iorque), páginas 197 a 209 (pólen); Kaeppler, et al., (1990) Plant Cell Reports 9:415 a 418 e Kaeppler, et al., (1992) Theor. Appl. Genet. 84:560 a 566 (transformação mediada por fibras); D'Halluin, et al., (1992) Plant Cell 4:1495 a 1505 (eletroporação); Li, et al., (1993) Plant Cell Reports 12:250 a 255 e Christou e Ford, (1995) Annals of Botany 75:407 a 413 (arroz); Osjoda, et al., (1996) Nature Biotechnology 14:745 a 750 (maís por meio de Agrobacterium tumefaciens). Métodos para Introduzir Tecnologias de Edição de Genoma em Plantas
[0152] Em algumas modalidades, as composições de polinucleotídeos podem ser introduzidas no genoma de uma planta com o uso de tecnologias de edição de genoma, ou polinucleotídeos anteriormente introduzidos no genoma de uma planta podem ser editados com o uso de tecnologias de edição de genoma. Por exemplo, os polinucleotídeos identificados podem ser introduzidos em uma localização desejada no genoma de uma planta através do uso de tecnologias de quebra de fita dupla, tais como TALENs, meganucleases, nucleases dedos de zinco, CRISPR-Cas e similares. Por exemplo, os polinucleotídeos identificados podem ser introduzidos em uma localização desejada em um genoma com o uso de um sistema CRISPR-Cas, para o propósito de inserção específica para sítios. A localização desejada em um genoma de planta pode ser qualquer local-alvo desejado para inserção, tal como uma região genômica favorável para melhoramento, ou pode ser um local-alvo localizado em uma janela genômica com um traço de interesse existente. Os traços de interesse existentes podem ser um traço endógeno ou um traço anteriormente introduzido.
[0153] Em algumas modalidades, quando um alelo R tiver sido identificado em um genoma, tecnologias de edição do genoma podem ser usadas para alterar ou modificar a sequência polinucleotídica. As modificações específicas para sítios que podem ser introduzidas no polinucleotídeo de alelo de gene R reveladas incluem aqueles produzidas com o uso de qualquer método para introduzir a modificação específica para sítios, incluindo, mas sem limitação, através do uso de oligonucleotídeos de reparo de genes (por exemplo, Publicação nº US 2013/0019349), ou através do uso de tecnologias de quebra de fita dupla, como TALENs, meganucleases, nucleases dedos de zinco, CRISPR-Cas e semelhantes. Tais tecnologias podem ser usadas para modificar o polinucleotídeo anteriormente introduzido através de inserção, deleção ou substituição de nucleotídeos dentro do polinucleotídeo introduzido. Alternativamente, tecnologias de quebra de fita dupla podem ser usadas para adicionar sequências de nucleotídeos adicionais ao polinucleotídeo introduzido. As sequências adicionais que podem ser adicionadas incluem elementos de expressão adicionais, tais como sequências intensificadoras e promotoras. Em outra modalidade, tecnologias de edição do genoma podem ser usadas para posicionar proteínas resistentes a doenças adicionais de modo próximo das composições de polinucleotídeos de gene R dentro do genoma de uma planta, a fim de gerar empilhamentos moleculares de proteínas resistentes a doenças.
[0154] Um “sítio-alvo alterado”, “sequência-alvo alterada”, "sítio-alvo modificado" e "sequência-alvo modificada" são usados de forma intercambiável no presente documento e se referem a uma sequência-alvo conforme revelado no presente documento que compreende pelo menos uma alteração em comparação com a sequência-alvo não alterada. Tais “alterações” incluem, por exemplo: (i) substituição de pelo menos um nucleotídeo, (ii) uma deleção de pelo menos um nucleotídeo, (iii) uma inserção de pelo menos um nucleotídeo, ou (iv) qualquer combinação de (i) - (iii).
EXEMPLOS
[0155] Os exemplos a seguir são oferecidos para ilustrar, mas não limitar, a matéria reivindicada. É entendido que os exemplos e modalidades descritos no presente documento têm apenas propósitos ilustrativos, e pessoas versadas na técnica reconhecerão vários reagentes ou parâmetros que podem ser alterados sem se afastar do espírito da revelação ou do escopo das reivindicações anexas. Exemplo 1 Mineração de genomas de milho conhecidos
[0156] Um conjunto de sondas para o "pull down" de novos genes de endogâmicos de milho resistentes a doenças foi planejado usando genomas sequenciados de algumas espécies que foram inspecionados cuidadosamente quanto a regiões com o potencial de codificar duas grandes classes de genes de resistência a doenças: proteínas intracelulares com sítio de ligação a nucleotídeos e uma repetição rica em leucina (NLRs) e cinases de membrana ou associadas a paredes com um sítio de miristilação N-terminal
(WAKs). O conjunto de genomas usado para o planejamento de sondas design incluiu cinco linhagens de milho com a sequência do genoma completa ou parcial disponível, bem como sorgo, teossinto e arroz. A mineração foi efetuada em ambos os modelos de transcritos anotados, bem como regiões genômicas traduzidas sem modelos genéticos conhecidos.
[0157] As pesquisas foram conduzidas usando HMMer com modelos de Markov escondidos (HMMs) correspondentes a domínios conservados (Eddy, 1998). Transcritos e regiões genômicas que incluíram um domínio de sítio de ligação a nucleotídeos (NB-ARC), bem como regiões de repetições ricas em Leucina (LRRs) foram incluídos como NLRs potenciais (Baggs et al., 2017). Transcritos e regiões genômicas que incluíram um domínio de Cinase, bem como um domínio de ligação a galacturonano (ligação-GUB-WAK) foram considerados possíveis WAKs associados a doença e sujeitos a análise adicional. WAKs potenciais sem uma arginina imediatamente antes do aspartato catalítico do seu domínio de cinase foram considerados mais provavelmente associados a doença e foram incluídos no conjunto de sondas. No total foram encontrados 786 genes a partir destes genomas e transcriptomas (Tabela 1). Após filtração para remover genes redundantes, um conjunto final de 441 genes foi usado para o planejamento de sondas.
[0158] Sequências de sondas foram planejadas inspecionando cuidadosamente genomas existentes quanto a domínios conservados associados a genes R. "Scripts" Python customizados foram utilizados para tentar unir acertos de domínios parciais, que podem surgir via encadeamento. Sequências mineradas a partir destes genomas conhecidos foram então mascaradas com repetições usando "scripts" Python customizados, com uma tolerância mais elevada a repetições dentro dos domínios LRR. As sequências mascaradas foram então sintetizadas em sondas pela Nimblegen. Tabela 1: NLRs e WAKs minerados a partir de genomas e transcriptomas sequenciados. Espécie NLRs WAKs Milho (B73) 95 38 Milho (Mo17) 96 33 Milho * 98 33 Milho * 52 8 Milho * 62 14 Sorgo 145 22 Teossinto * 16 4 Arroz * 36 * indica que um genoma completo não estava disponível ou não foi usado na análise. Exemplo 2 "Pulldown" e montagem de milho
[0159] 20 linhagens de milho com regiões conhecidas de melhoramento direto de resistência a doenças e loci de traços quantitativos foram selecionadas para "pulldown". Estas incluíram, mas sem limitação, resistências a doenças importantes de milho, tais como Helmintosporiose, Podridão do Caule de Antracnose, Podridão do Caule por Gibberella, Mancha Foliar Cinzenta e Ferrugem do Sul. Regiões codificando potencialmente NLRs e cinases associadas a paredes (WAKS) foram capturadas usando sondas planejadas a partir de genomas e transcriptomas sequenciados. Estas regiões foram então sequenciadas com PacBio e polidas usando leituras curtas por Illumina. O RNA de todas as linhagens também foi sequenciado, e estas leituras foram usadas para prever modelos de transcritos.
[0160] DNA de elevado peso molecular de alta qualidade, bem como RNA, foram isolados de cada linhagem de milho. As sondas foram então aplicadas a estas linhagens e o DNA capturado foi sequenciado via PacBio e Illumina. Leituras de consenso foram geradas a partir de dados de sequenciamento de leituras longas de PacBio. Estas foram unidas em conjunto e adicionalmente polidas usando software de montagem SPADes e CAP3 (Huang e Madan, Genome Res, 1999; Bankevich et al., J Comput Biol, 2012). Dados de RNA- seq foram mapeados contra estes contigs montados usando Tophat2 (Kim et al., 2013). As leituras mapeadas foram então montadas em modelos genéticos via StringTie (Pertea et al., Nat Biotechnol, 2015). Regiões com o potencial de codificar NLRs ou WAKs mas que não conseguiram gerar modelos genéticos foram aumentadas usando previsões genéticas FGENESH (Asaf A. Salamov e Victor V. Solovyev, Genome Research, 2000).
[0161] As sondas de "pulldown" foram planejadas baseadas maioritariamente em germoplasma norte-americano. A eficácia da captura de NLRs de linhagens tropicais usando as sondas planejadas a partir de germoplasma norte-americano foi incerta. NLRs também têm uma variação presença-ausência elevada ao longo do germoplasma. Para avaliar a eficácia, o genoma de uma linhagem tropical interna foi totalmente sequenciado via PacBio. NLRs foram mineradas para fora do genoma completo como descrito no Exemplo 1, e as sequências NLR foram pesquisadas contra contigs montados a partir do "pulldown" via BLAST. No total, 92% das NLRs presentes na sequência do genoma PacBio da linhagem tropical interna também estavam presentes no "pulldown" com 100% de cobertura. 6% estavam presentes com um ligeiro truncamento na extremidade 5' ou 3', e 2% não conseguiram efetuar o "pull down". Exemplo 3 Colocação genômica por agrupamento
[0162] Uma vez que as linhagens de milho inicialmente utilizadas tinham resistência a doenças mapeada em intervalos específicos, o conhecimento acerca da localização de genes capturados foi crítico para estabelecer prioridades de genes funcionais potenciais para testes transgênicos. No entanto, NLRs têm variação presença-ausência (PAV) especialmente elevada, o que dificulta a determinação da sua localização genômica (Bush et al., Mol Biol Evol, 2014). Se crê que NLRs evoluem através de duplicação dentro de agrupamentos genômicos físicos, seguida de divergência rápida para visar novos patógenos e efetores (Jacob et al., Front Immunol, 2013). Esta divergência rápida pode ser medida como uma razão positiva entre mutações não sinônimas e sinônimas (Ka/Ks). Foi notado que, apesar de NLRs terem globalmente Ka/Ks anormalmente elevada, a sua taxa de alteração não está distribuída uniformemente ao longo de suas regiões codificadoras (Meyers et al., Plant Cell, 1998). Domínios LRR, que estão provavelmente envolvidos em interações proteína-proteína, divergem muito rapidamente após duplicação (Ka/Ks elevada). Por outro lado, domínios NB-ARC, que tipicamente atuam no controle da ativação, estão sob pressão evolutiva para permanecerem inalterados (Ka/Ks baixa).
[0163] Dada a natureza conservada da região NB-ARC de NLRs, as suas localizações em genomas sequenciados foram usadas como "âncoras" para colocar novos NLRs em "pulldowns". Domínios NB-ARC, que foram encontrados através de pesquisas anteriores com HMMer de genomas de milho sequenciados, foram utilizados para esta abordagem. Usando "scripts" Python customizados, os acertos de HMMer para domínios NB-ARC foram traduzidos de modo reverso de novo para os ~900 nucleotídeos de DNA que os codificam. Sequências NB- ARC das linhagens de milho B73, PH1V69 e Mo17, que tinham genomas totalmente sequenciados, foram então reunidas e agrupadas de um modo agnóstico quanto à localização usando um algoritmo de união de vizinhos mais próximos (Saitou e Nei, Mol Biol Evol, 1987). A árvore resultante demonstrou claramente que sequências NB-ARC se agrupam de um modo dependente da localização (FIG. 2). A mesma análise também foi conduzida usando os domínios de cinase de WAKs, com eficácia similar.
[0164] A linhagem tropical sequenciada que fazia parte do "pulldown" inicial foi usada para avaliar a eficácia da abordagem de agrupamento em germoplasma tropical. As regiões de DNA codificando todos os NB-ARCs da linhagem tropical no seu genoma foram agrupadas com NB-ARCs de três Linhagens norte-americanas: B73, Mo17 e PH1V69. No total, cerca de 98% dos domínios NB-ARC da linhagem tropical se agruparam próximo da localização genômica correta. Adicionalmente, os três genes que não foram colocados corretamente não originaram falsos positivos, ao invés existiram em agrupamentos separados.
[0165] Como comparação, uma análise similar foi efetuada correndo um BLAST das sequências genéticas completas da linhagem tropical contra B73. Métodos anteriores se basearam somente em correr um BLAST, sem nenhuma abordagem de agrupamento. Tal originou uma taxa de 25% de falsos positivos, em que o acerto de topo foi no cromossomo errado ou na localização errada de um cromossomo. Exemplo 4 Seleção de genes para testes transgênicos
[0166] Todas as linhagens de milho selecionadas para "pulldown" incluíram múltiplas regiões de melhoramento direto relacionadas com doença (regiões do genoma que cultivadores notaram que estavam positivamente correlacionadas com resistência a doenças) e QTLs para resistência a doenças. Após agrupamento dos domínios conservados de genes montados destas linhagens com genomas já sequenciados, a informação da posição provável foi inferida. Um total de 14 QTLs diferentes de 9 linhagens de milho diferentes foi selecionado para validação transgênica. O QTL médio continha 2,3 NLRs, totalizando 32 genes diferentes testados na validação transgênica. 1 dos 32 genes testados exibiu resistência aumentada em uma planta transgênica como descrito no Exemplo 8. A abordagem de agrupamento de Genes R ajudou a identificar o gene causal em 1 de 14 sítios de QTL em significativamente menos tempo do que uma abordagem normal de mapeamento fino de QTLs. Os genes testados provieram predominantemente de regiões de melhoramento direto na primeira ronda do rastreio, mas será de esperar uma taxa de validação transgênica mais elevada ao utilizar QTLs que estão ativamente sendo mapeados de modo fino, pois estes tenderão a ser intervalos menores com sinal genético mais forte. Exemplo 5 Transformação Mediada por Agrobacterium de Maís e Regeneração de Plantas Transgênicas
[0167] Para transformação mediada por Agrobacterium de maís com uma sequência de elementos reguladores da revelação, o método de Zhao foi empregue (Patente nº US 5,981,840, e publicação de patente nº PCT WO98/32326; cujo conteúdo é incorporado ao presente documento, a título de referência). Brevemente, os embriões imaturos foram isolados de maís e os embriões fizeram contato com uma suspensão de Agrobacterium sob condições pelas quais as bactérias tiveram capacidade para transferir a sequência de elementos reguladores da revelação para pelo menos uma célula de pelo menos um dos embriões imaturos (etapa 1: a etapa de infecção). Nessa etapa, os embriões imaturos foram imersos em uma suspensão de Agrobacterium para a iniciação de inoculação. Os embriões foram cocultivados durante um tempo com Agrobacterium (etapa 2: a etapa de cocultivo). Os embriões imaturos foram cultivados em meio sólido após a etapa de infecção. Após o período de cocultivo, uma etapa de "repouso" opcional foi realizada. Nessa etapa de repouso, os embriões foram incubados na presença de pelo menos um antibiótico conhecido por inibir o crescimento de Agrobacterium sem a adição de um agente seletivo para transformantes de planta (etapa 3: etapa de repouso). A seguir, os embriões inoculados foram cultivados em meio que contém um agente seletivo e os calos transformados por crescimento foram recuperados (etapa 4: a etapa de seleção). As plântulas foram regeneradas dos calos (etapa 5: a etapa de regeneração) antes da transferência para a estufa. Exemplo 6 Edição de Genes R Via Substituição de Alelos Seleção de sítio-alvo
[0168] O sistema de nucleases dirigidas a Sítios gRNA/Cas9, descrito em WO2015026885, WO20158026887, WO2015026883 e WO2015026886 (cada um incorporado aqui a título de referência), tem como propósito editar o gene R por substituição de um alelo nativo por um alelo resistente. Pares de sítios-alvo são usados para remover a totalidade do alelo R da linhagem-alvo, incluindo o promotor presumido, a sequência codificadora, e 1 kb da 3' UTR. O modelo de reparo de DNA é codistribuído com plasmídeos de Cas9 e RNA-guia. Construção de vetor Cas9
[0169] Um gene Cas9 de Streptococcus pyogenes M1 GAS (SF370) é otimizado quanto a códons de milho por técnicas comuns conhecidas na técnica, e o íntron ST-LS1 de batata é introduzido para eliminar a sua expressão em E.coli e Agrobacterium. Para facilitar a localização nuclear da proteína Cas9 em células de milho, o sinal da localização nuclear amino-terminal monopartida do vírus Símio 40 (SV40) é incorporado no terminal amino do quadro de leitura aberto de Cas9. O gene de Cas9 otimizado para milho é operativamente ligado a um promotor de Ubiquitina de milho com o uso de técnicas biológicas moleculares padrão. Adicionalmente ao sinal de localização nuclear de terminal amino de SV40, um sinal de localização nuclear bipartida de terminal C da endonuclease VirD2 de Agrobacterium tumefaciens foi fundido na extremidade do éxon 2. A sequência resultante inclui o promotor de ubiquitina de Zea mays, a 5′UTR do gene de ubiquitina ZM, íntron 1 do gene de ubiquitina ZM, o sinal de localização nuclear do SV40, éxon 1 de Cas9 (ST1), o íntron de LS1 batata, éxon 2 de Cas9 (ST1), o sinal de localização nuclear de endonuclease VirD2 e o terminador pinII. Construção de vetor de RNA-guia
[0170] Para direcionar nuclease Cas9 para os sítios- alvo genômicos designados, um promotor de polimerase III U6 de milho (consultar WO2015026885, WO20158026887, WO2015026883 e WO2015026886) e suas sequências de terminação de polimerase III U6 cognatas (TTTTTTTT) são usados para direcionar a iniciação e terminação da expressão de gRNA. Domínios visando nucleotídeos variáveis de RNA-guia para edição de genes R são identificados, que correspondem aos sítios-alvo genômicos. Oligos contendo o DNA codificando cada um dos domínios visando nucleotídeos variáveis são sintetizados e clonados em um cassete de expressão de gRNA. Cada cassete de expressão de RNA-guia consiste no promotor de polimerase III U6 de milho operacionalmente ligado a uma das versões de DNA do RNA-guia seguido da sequência de terminação de polimerase III U6 cognata. A versão do DNA do RNA-guia consiste no respectivo domínio de alvejamento de nucleotídeos variáveis seguido por uma sequência de polinucleotídeo que tem capacidade para interagir com a endonuclease de indução de quebra de fita dupla.
Construção de vetor de modelo de reparo
[0171] O modelo de substituição/reposição para CR6/CR9 contém o alelo resistente do gene R, e o modelo de substituição contém o mesmo alelo resistente do gene R e as sequências de homologia flanqueando 5' e 3' na linhagem-alvo. As sequências de braço de homologia são sintetizadas e então clonadas com sequências genômicas de genes R substitutivas por meio de um método de clonagem Gibson ininterrupta padrão. Entrega do DNA de sistema de RNA-guia/endonuclease Cas9 ao maís
[0172] Plasmídeos que contêm os cassetes de expressão de RNA-guia e Cas9 descritos acima são cobombardeados com plasmídeos que contêm o marcador selecionável de transformação NPTII e os genes de desenvolvimento de intensificação da transformação ODP2 (fator de transcrição de domínio AP2 ODP2 (Proteína de desenvolvimento de óvulo 2)) e Wuschel (20151030-6752 USPSP) em genomas das linhagens de milho de elite. A transformação de embriões imaturos de milho pode ser realizada com o uso de qualquer método conhecido na técnica ou o método descrito abaixo.
[0173] Em um método de transformação, as espigas são descascadas e a superfície esterilizada em lixívia Clorox 30-50% mais detergente Micro 0,5% por 10 minutos e, então, enxaguadas duas vezes com água esterilizada. Os embriões imaturos são isolados e colocados com o eixo geométrico do embrião invertido (escutelo para cima), com 25 embriões por placa, em meio 13224E por 2 a 4 horas e, então, alinhados dentro da zona alvo de 2,5 cm em preparação para bombardeamento.
[0174] DNA de plasmídeos é aderido a pelotas de ouro de 0,6 µm (diâmetro médio) com o uso de uma mistura de lipídio e polímero própria de TransIT®-2020 (nº de Cat MIR 5404, Mirus Bio LLC, Madison, WI 5371). Uma solução de DNA foi preparada com o uso de 1 µg de DNA plasmídico e opcionalmente, outros construtos foram preparados para cobombardeamento com o uso de 10 ng (0,5 µL) de cada plasmídeo. Ao DNA pré-misturado, 50 µL de partículas de ouro preparadas (30 mg/mL) e 1 µL de TransIT®-2020 são adicionados e misturados com cuidado. A mistura final é deixada em incubação sob vortexação constante em velocidade baixa durante 10 minutos. Após o período de precipitação, os tubos são centrifugados brevemente e o líquido é removido. As partículas de ouro são peletizadas em uma microcentrífuga a 10.000 rpm por 1 min e o sobrenadante aquoso é removido. 120 µL de EtOH 100% são adicionados, e as partículas são ressuspensas por sonicação breve. Então, 10 µL são colocados em forma de ponto no centro de cada macrotransportador e deixados secar cerca de 2 minutos antes do bombardeamento, com um total de dez alíquotas tomadas de cada tubo de partículas preparadas/DNA.
[0175] As placas de amostra são bombardeadas com um PDA-1000/He biolístico (Bio-Rad). Embriões estão a 6 cm do macrotransportador, com um intervalo de 1/8o de polegada entre o disco de ruptura de 200 psi e o macrotransportador. Todas as amostras recebem uma única dose.
[0176] Após o bombardeamento, os embriões são incubados na placa de bombardeamento durante ~20 horas, então, transferidos para 13266L (meio de repouso/indução) durante 7 a 9 dias em temperaturas que se situam na faixa de 26 a 30 °C. Os embriões são, então, transferidos para o meio de maturação 289H durante ~ 21 dias. Os embriões somáticos maduros são, então, transferidos para o meio de germinação 272G e movidos para a luz. Em cerca de 1 a 2 semanas, as plântulas que contêm brotos e raízes viáveis são amostradas para análise e enviadas para a estufa onde são transferidas para elementos planos (equivalente a um vaso de 2,5 polegadas) que contêm terra para envasamento. Após 1 a 2 semanas, as plantas são transferidas para vasos Classic 600 (1,6 galões) e cultivadas até a maturidade. Meio:
[0177] O meio de bombardeamento (13224E) compreende 4,0 g/L de sais basais N6 (SIGMA C-1416), 1,0 mL/L de Mistura de Vitaminas de Eriksson (1000X SIGMA-1511), 0,5 mg/L de tiamina HCl, 190,0 g/L de sacarose, 1,0 mg/L de 2,4-D e 2,88 g/L de L-prolina (levada até o volume com D-I H2O após o ajuste para pH 5,8 com KOH); 6,3 g/L de ágar Sigma (adicionado após levado até o volume com D-I H2O); e 8,5 mg/L de nitrato de prata (adicionado após esterilização do meio e resfriamento até a temperatura ambiente).
[0178] O meio de seleção (13266L) compreende 1650 mg/L de Nitrato de amônio, 277,8 mg/L de sulfato de Amônio, 5278 mg/L de nitrato de potássio, cloreto de cálcio, anidro, 407,4 mg/L de cloreto de cálcio, anidro, 234,92 mg/L de sulfato de magnésio, anidro, 410 mg/L de fosfato de potássio, monobásico, 8 mg/L de ácido bórico, 8,6 mg/L, sulfato de zinco•7H2O, 1,28 mg/L de iodeto de potássio, 44,54 mg/L de sulfato ferroso•7H2O, 59,46 mg/L de Na2EDTA•2H2O, 0,025 mg/L de cloreto de cobalto•6H2O, 0,4 mg/L de ácido molíbdico (sal sódico)•2H2O, 0,025 mg/L de sulfato cúprico•5H2O, 6 mg/L de mono-hidrato de sulfato de manganês, 2 mg/L de tiamina, 0,6 mL/L de sais menores b5h 1000x, 0,4 mL/L de vitaminas de Eriksson 1000x, 6 mL/L de estoque de vitaminas s&h 100x, 1,98 g/L de l-prolina, 3,4 mg/L de nitrato de prata, 0,3 g/L de hidrolisado de caseína (ácido), 20 g/L de sacarose, 0,6 g/L de glicose, 0,8 mg/L de 2,4-d, 1,2 mg/L de dicamba, 6 g/L de ágar tc, 100 mg/L de carbenicilina AgriBio, 25 mg/L de cefotaxima e 150 mg/L de geneticina (g418).
[0179] O meio de regeneração de plantas (289H) compreende 4,3 g/L de sais MS (GIBCO 11117-074), 5,0 mL/L de solução de estoque de vitaminas MS (0,100 g de ácido nicotínico, 0,02 g/L de tiamina HCL, 0,10 g/L de piridoxina HCL e 0,40 g/L de glicina levada ao volume com D-I H2O filtrada) (Murashige e Skoog (1962) Physiol. Plant. 15:473), 100 mg/L de mio-inositol, 0,5 mg/L de zeatina, 60 g/L de sacarose e 1,0 mL/L de ácido abscísico 0,1 mM (levado ao volume com D-I H2O filtrada após ajuste para pH 5,6); 8,0 g/L de ágar Sigma (adicionado após levar até o volume com D-I H2O); e 1,0 mg/L de ácido indolacético e 150 mg/L de Geneticina (G418) (adicionado após esterilização do meio e resfriamento para 60 °C).
[0180] O meio sem hormônio (272G) compreende 4,3 g/L de sais MS (GIBCO 11117-074), 5,0 mL/L de solução de estoque de vitaminas MS (0,100 g/L de ácido nicotínico, 0,02 g/L de tiamina HCL, 0,10 g/L de piridoxina HCL e 0,40 g/L de glicina levado ao volume com D-I H2O filtrada), 0,1 g/L de mio-inositol e 40,0 g/L de sacarose (levado ao volume com D-I H2O filtrada após ajustar o pH para 5,6); e 0,5 mg/L de IBA e 150 mg/L de Geneticina (G418) 6 g/L de bacto-ágar (adicionado após levar ao volume com D-I H2O filtrada), esterilizado e resfriado para 60 °C. Triagem de plantas T0 e caracterização de eventos
[0181] Para identificar eventos positivos de troca, PCR é realizada com o uso de mistura pronta de PCR Sigma Extract- N-Amp. PCR é realizada para avaliar a junção 5' usando um par de iniciadores do gene R, enquanto PCR primária com par de iniciadores foi combinada com qPCR secundária de diferenciação de alelos para rastrear a junção 3' devido à alta homologia das variantes editadas pretendidas e à sequência genômica não modificada. Análise de T1
[0182] As variantes de troca de alelos são transferidas para um ambiente controlado. Pólen de plantas T0 é transferido para plantas paternas recorrentes para produzir sementes. Plantas T1 são submetidas a caracterização molecular mais abrangente não só para confirmar que as trocas observadas em planta T0 são estavelmente herdadas, mas também para verificar que as plantas T1 ou plantas de gerações posteriores estão isentas de quaisquer elementos de DNA estranhos usados durante o processo de transformação. Em primeiro lugar, qPCR é realizada em todos os genes auxiliadores incluindo Cas9, os RNAs-guia, o marcador de seleção de transformação (NPTII) e os genes intensificadores da transformação ODP2 e WUS2 para assegurar que os genes segregaram na direção oposta à dos alelos mutantes gerados. As plantas T1 são submetidas a amostragem com o uso de Southern por análise de Sequenciamento (SbS) para demonstrar adicionalmente que as plantas estão desprovidas de qualquer DNA estranho.
Exemplo 7 Rastreio de Plantas quanto a Resistência a Doenças Mancha Foliar Cinzenta
[0183] As plantas são inoculadas com Cercospora zeae- maydis na estufa e/ou campo. O escore da doença é realizado classificando as plantas em uma escala de 1-9 com 1 como o pior e 9 como o melhor. Endogâmicas e/ou híbridos verificados com resposta à doença conhecida são usados como guia quanto ao melhor momento para pontuar e quanto à calibração da classificação. Os dados de florescimento também são recolhidos observando a data em que 50% de cada planta mostrou sedas e convertendo esta em um escore de unidades de calor do grau de crescimento (GDUSLK) com base em dados meteorológicos nessa localização. Podridão do Caule de Antracnose
[0184] As plantas são cultivadas e avaliadas quanto à resposta a Cg (Colletotrichum graminicola). As plantas são avaliadas quanto a resistência a Cg na estufa e/ou por inoculação com Cg. Tardiamente no estágio de crescimento, os caules são fendidos e a progressão da doença é pontuada por observação da cor negra característica do fungo à medida que sobe no caule. As classificações da doença são conduzidas como descrito por Jung et al. (1994) Theoretical and Applied Genetics, 89:413 a 418). O número total de internodos com descoloração maior do que 75% (antgr75) é registrado nos primeiros cinco internodos (Ver a Figura 20). Tal proporcionou um escore da doença variando desde 0 até 5, com zero indicando nenhuns internodos mais do que 75% descoloridos e 5 indicando descoloração completa dos primeiros cinco internodos.
As duas porções de terreno centrais são recolhidas via combinação na maturidade fisiológica e o rendimento de grãos em kg/ha foi determinado. Helmintosporiose
[0185] Plantas são testadas em experiências de estufa e/ou campo quanto a eficácia contra o patógeno da helmintosporiose (Exserohilum turcicum). As plantas são provocadas com o patógeno contra o qual se crê que os genes R conferem resistência. As plantas são classificadas como resistentes ou suscetíveis com base em sintomas da doença; no campo, plantas serão pontuadas em uma escala de 1-9 em que 9 é muito resistente e 1 é muito suscetível. Carvão do Pendão
[0186] Os soros contendo teliósporos de S. reliana são recolhidos do campo na estação de crescimento anterior e armazenados em um saco de pano em um ambiente seco e bem ventilado. Antes do plantio, esporos são removidos dos soros, filtrados, e então misturados com solo a uma razão de 1:1000. A mistura de solo e teliósporos é usada para tapar grãos de milho aquando da semeadura de sementes para conduzir inoculação artificial. Plantas no estágio da maturidade são classificadas quanto à presença/ausência de soro em espigas ou pendões como indicador da suscetibilidade/resistência. Exemplo 8 Descoberta de um novo gene de resistência a Helmintosporiose
[0187] PH8CW é uma linhagem de milho resistente a Helmintosporiose com uma região de melhoramento direto para NLB no cromossomo 1. Genes R desta linhagem foram capturados e sequenciados como descrito no Exemplo 2. O agrupamento de domínios NB-ARC revelou um gene candidato, NLR01 (SEQ ID NO: 2), que se previu estar localizado dentro da região de resistência a Helmintosporiose do cromossomo 1 como descrito no Exemplo 3. Plantas transgênicas contendo estes dois genes foram criadas e subsequentemente testadas na estufa quanto a resistência a NLB. Dos dois genes NLR testados quanto a resistência a NLB neste QTL de melhoramento direto identificados pelo agrupamento de genes R, NLR01 foi validado como tendo resistência aumentada a Helmintosporiose relativamente a plantas nulas transgênicas como descrito nos Exemplos 4, 5, e 7. Das 22 plantas nulas, 21 tinham um fenótipo suscetível e 12/13 plantas resistentes expressaram a CDS do transgene NLR01 (SEQ ID NO: 1). Exemplo 9 Descoberta de um novo gene de resistência a Ferrugem do Sul
[0188] CML496 é uma linhagem de milho resistente a Ferrugem do Sul. A resistência foi mapeada de modo fino em uma pequena região do cromossomo 10. Genes R de CML496 foram capturados e sequenciados como descrito no Exemplo 2. O agrupamento de domínios NB-ARC revelou um gene candidato, NLR03 (SEQ ID NO: 4), que se previu estar localizado dentro do intervalo de mapeamento fino do cromossomo 10 como descrito no Exemplo 3. É esperado que este gene confira resistência à Ferrugem do Sul em plantas transgênicas relativamente a nulas quando a CDS de NLR03 é transgenicamente expressa (SEQ ID NO: 3).
[0189] A sequência genômica do gene NLR03 (incluindo a região promotora) é sintetizada e clonada em um vetor binário para transformação em HC69. Eventos de qualidade de uma única cópia são cruzados com PHR03 para gerar sementes T1 com segregação. Plantas T1 são inoculadas com os urediósporos de Puccinia polysora e mantidas na estufa durante 10 dias. A classificação da doença na estufa é efetuada visualmente como suscetível (S) ou resistente (R) com base na presença ou ausência de urédios em erupção (uma pústula em esporulação), respectivamente. Cerca de 30 plantas T1 com uma única cópia do transgene e 30 plantas T1 sem o transgene, todas provenientes dos mesmos 6 eventos, são testadas quanto a resistência a SCR na estufa. É esperado que todas as 30 plantas positivas para o transgene deem origem ao fenótipo resistente, ao passo que é esperado que todas as plantas negativas para o transgene sejam classificadas como suscetíveis.
[0190] Foi efetuado mapeamento fino e sequenciamento do genoma em paralelo e levaram à identificação do mesmo gene mapeado no cromossomo 10.

Claims (34)

REIVINDICAÇÕES
1. Método para identificar um gene R em uma planta caracterizado pelo fato de que compreende: a. obter uma planta ou linhagem de planta exibindo resistência a doenças; b. efetuar um "pull down" à base de sondas a partir da planta ou linhagem de planta exibindo resistência a doenças usando uma pluralidade de sondas, em que cada sonda é gerada a partir de pelo menos um genoma sequenciado e visa um gene R; c. sequenciar a sequência capturada; d. montar as leituras do sequenciamento a partir da pluralidade de sondas para gerar uma sequência montada; e. aplicar uma abordagem de agrupamento a domínios conservados do gene R da sequência montada; e f. selecionar novos genes R.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a seleção de novos genes R compreende adicionalmente comparar a localização genômica de sequências identificadas com a região QTL conhecida ou região de melhoramento direto.
3. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende adicionalmente transformar uma planta com o novo gene R, em que a planta transformada exibe resistência aumentada a uma doença em comparação com uma planta de controle não transformada.
4. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende adicionalmente editar o genoma de uma planta, em que a edição compreende introduzir o gene R ou alelo do gene R ou haplótipo do gene R selecionado na planta e em que a planta editada exibe resistência aumentada a uma doença.
5. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende adicionalmente cruzar a planta exibindo resistência a doenças com uma segunda planta, em que a progênie tem resistência aumentada a doenças em comparação com a segunda planta paterna usando marcadores identificados dentro de um gene do novo gene R selecionado.
6. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que a segunda planta paterna compreende germoplasma de elite.
7. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a planta exibe resistência contra helmintosporiose, Mancha foliar cinzenta, podridão do caule de antracnose, estria bacteriana da folha do milho, podridão bacteriana do caule, murcha de Goss, murcha de Stewart, podridão do caule e manchas da espiga de Fusarium e Gibberella, mancha da espiga de Aspergillus, podridão do caule de Stenocarpella, carvão do pendão, carvão do pendão falso, ferrugem do sul, ferrugem comum, podridão do caule de Botrydiplodia, Podridão de carvão, murcha do milho e murcha tardia ou doença de tombamento de mudas pré- e pós- emergência.
8. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a planta ou linhagem de planta é uma dicotiledônea.
9. Método, de acordo com a reivindicação 8, caracterizado pelo fato de que a dicotiledônea é soja, canola, alfafa, girassol, cártamo, tabaco, Arabidopsis ou algodão.
10. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a planta ou linhagem de planta é uma monocotiledônea.
11. Método, de acordo com a reivindicação 10, caracterizado pelo fato de que a monocotiledônea é milho, cevada, milhete, trigo ou arroz.
12. Método para identificar um gene R em uma planta de milho, caracterizado pelo fato de que compreende: a. obter uma linhagem de milho resistente a doenças; b. efetuar um "pull down" à base de sondas a partir da linhagem de milho resistente a doenças usando uma pluralidade de sondas, em que cada sonda é gerada a partir de pelo menos um genoma sequenciado e visa um gene R; c. sequenciar a sequência capturada; d. montar as leituras do sequenciamento a partir da pluralidade de sondas; e. aplicar uma abordagem de agrupamento aos domínios conservados do gene R da sequência montada; e f. selecionar novos genes R.
13. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que a seleção de novos genes R compreende adicionalmente comparar a localização genômica de sequências identificadas com a região QTL conhecida ou região de melhoramento direto.
14. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que compreende adicionalmente transformar uma planta de milho com o novo gene R, em que a planta de milho transformada exibe resistência aumentada a uma doença em comparação com uma planta de milho de controle não transformada.
15. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que compreende adicionalmente editar o genoma de uma planta de milho, em que a edição compreende introduzir o gene R ou alelo do gene R ou haplótipo do gene R selecionado na planta de milho e em que a planta de milho editada exibe resistência aumentada a uma doença.
16. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que compreende adicionalmente cruzar uma planta de milho da linhagem de milho resistente a doenças com uma segunda planta de milho, em que a progênie tem resistência aumentada a doenças em comparação com a segunda planta de milho paterna usando marcadores identificados dentro de um gene do novo gene R selecionado.
17. Método, de acordo com a reivindicação 16, caracterizado pelo fato de que a segunda planta de milho paterna compreende germoplasma de elite.
18. Método para obter uma planta resistente a doenças, caracterizado pelo fato de que compreende:
a. obter uma planta ou linhagem de planta exibindo resistência a doenças; b. efetuar um "pull down" à base de sondas a partir da planta ou linhagem de planta exibindo resistência a doenças usando uma pluralidade de sondas, em que cada sonda é gerada a partir de pelo menos um genoma sequenciado e visa um gene R; c. sequenciar a sequência capturada; d. montar as leituras do sequenciamento a partir da pluralidade de sondas; e. aplicar uma abordagem de agrupamento a domínios conservados do gene R da sequência montada; f. selecionar novos genes R; e g. introduzir o gene R ou alelo do gene R ou haplótipo do gene R selecionado na planta através de transformação, edição do genoma, ou melhoramento da planta.
19. Método, de acordo com a reivindicação 18, caracterizado pelo fato de que a planta exibe resistência contra helmintosporiose, Mancha foliar cinzenta, podridão do caule de antracnose, estria bacteriana da folha do milho, podridão bacteriana do caule, murcha de Goss, murcha de Stewart, podridão do caule e manchas da espiga de Fusarium e Gibberella, mancha da espiga de Aspergillus, podridão do caule de Stenocarpella, carvão do pendão, carvão do pendão falso, ferrugem do sul, ferrugem comum, podridão do caule de Botrydiplodia, Podridão de carvão, murcha do milho e murcha tardia, doença de tombamento de mudas pré- e pós- emergência.
20. Método, de acordo com a reivindicação 18, caracterizado pelo fato de que a planta ou linhagem de planta é uma dicotiledônea.
21. Método, de acordo com a reivindicação 20, caracterizado pelo fato de que a dicotiledônea é soja, canola, alfafa, girassol, cártamo, tabaco, Arabidopsis ou algodão.
22. Método, de acordo com a reivindicação 18, caracterizado pelo fato de que a planta ou linhagem de planta é uma monocotiledônea.
23. Método, de acordo com a reivindicação 22, caracterizado pelo fato de que a monocotiledônea é milho, cevada, milhete, trigo ou arroz.
24. Planta modificada tendo resistência aumentada a uma doença, caracterizada pelo fato de que o alelo causador da resistência a doença aumentada é um novo gene R, e em que o novo gene R se agrupa com uma pluralidade de genes R em um QTL conhecido de uma planta tendo resistência à doença.
25. Planta modificada, de acordo com a reivindicação 24, caracterizada pelo fato de que a planta modificada é produzida por um processo compreendendo: a. Obter uma planta ou linhagem de planta exibindo resistência a doenças; b. efetuar um "pull down" à base de sondas a partir da planta ou linhagem de planta exibindo resistência a doenças usando uma pluralidade de sondas, em que cada sonda é gerada a partir de pelo menos um genoma sequenciado e visa genes R; c. sequenciar a sequência capturada;
d. montar as leituras do sequenciamento a partir da pluralidade de sondas; e. aplicar uma abordagem de agrupamento a domínios conservados do gene R da sequência montada; f. selecionar novos genes R; e g. introduzir o gene R ou alelo do gene R ou haplótipo do gene R selecionado na planta através de transformação, edição do genoma, ou melhoramento da planta produzindo a planta modificada.
26. Planta modificada, de acordo com a reivindicação 24, caracterizada pelo fato de que a pluralidade de genes R consiste em genes R conhecidos.
27. Planta modificada, de acordo com a reivindicação 24, caracterizada pelo fato de que a pluralidade de genes R consiste em genes R novos.
28. Planta modificada, de acordo com a reivindicação 24, caracterizada pelo fato de que o alelo causador da resistência aumentada a doenças é introduzido na planta modificada através de transformação, edição do genoma ou melhoramento da planta produzindo a planta modificada.
29. Método para introduzir uma variante alélica de um gene NLR01 em que a referida variante alélica está associada a resistência aumentada a ferrugem polissora do sul, caracterizado pelo fato de que o método compreende introduzir uma mutação no gene NLR01 endógeno de modo que a variante alélica compreende uma sequência polinucleotídica codificando uma proteína que é pelo menos 90% idêntica à SEQ ID NO: 2, usando nuclease dedos de zinco,
Nuclease Efetora do Tipo Ativador da Transcrição (TALEN), o sistema CRISPR/Cas, ou meganuclease.
30. Construto de DNA recombinante, caracterizado pelo fato de que compreende um polinucleotídeo operativamente ligado a pelo menos uma sequência reguladora, em que o referido polinucleotídeo compreende uma sequência de ácido nucleico codificando uma sequência de aminoácidos com pelo menos 90% de identidade de sequência, em comparação com a SEQ ID NO: 2.
31. Construto de DNA recombinante, de acordo com a reivindicação 17, caracterizado pelo fato de que a referida pelo menos uma sequência reguladora é um promotor funcional em uma célula de planta.
32. Construto de DNA recombinante, de acordo com a reivindicação 17, caracterizado pelo fato de que o polinucleotídeo compreende uma sequência de ácido nucleico tendo pelo menos 95% de identidade de sequência com a SEQ ID NO: 1.
33. Célula de planta transgênica caracterizada pelo fato de que compreende o construto de DNA recombinante, conforme definido na reivindicação 17.
34. Planta transgênica caracterizada pelo fato de que compreende a célula de planta transgênica, conforme definida na reivindicação 20.
BR112020019198-1A 2018-03-23 2019-03-15 método para identificar um gene r em uma planta, método para obter uma planta resistente a doenças, planta modificada tendo resistência aumentada a uma doença, método para introduzir uma variante alélica de um gene nlr01, construto de dna recombinante, célula de planta transgênica e planta transgênica BR112020019198A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862646972P 2018-03-23 2018-03-23
US62/646,972 2018-03-23
PCT/US2019/022432 WO2019182884A1 (en) 2018-03-23 2019-03-15 Methods of identifying, selecting, and producing disease resistant crops

Publications (1)

Publication Number Publication Date
BR112020019198A2 true BR112020019198A2 (pt) 2021-02-17

Family

ID=65952181

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020019198-1A BR112020019198A2 (pt) 2018-03-23 2019-03-15 método para identificar um gene r em uma planta, método para obter uma planta resistente a doenças, planta modificada tendo resistência aumentada a uma doença, método para introduzir uma variante alélica de um gene nlr01, construto de dna recombinante, célula de planta transgênica e planta transgênica

Country Status (6)

Country Link
US (1) US20210040569A1 (pt)
EP (1) EP3768845A1 (pt)
CN (1) CN111902547B (pt)
BR (1) BR112020019198A2 (pt)
CA (1) CA3093000A1 (pt)
WO (1) WO2019182884A1 (pt)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113631722B (zh) * 2019-03-11 2024-05-28 先锋国际良种公司 鉴定、选择和生产南方玉米锈病抗性作物的方法
CN110592259A (zh) * 2019-10-09 2019-12-20 广西壮族自治区农业科学院玉米研究所 用于检测抗玉米南方锈病基因rpps313的分子标记及应用
CN110564888A (zh) * 2019-10-09 2019-12-13 广西壮族自治区农业科学院玉米研究所 一个影响玉米南方锈病抗性的主效qtl及其应用
MX2022005447A (es) * 2019-11-06 2022-08-10 Pioneer Hi Bred Int Metodos para identificar, seleccionar y producir cultivos resistentes a la roya del maiz del sur.
CN111436344A (zh) * 2020-04-24 2020-07-24 云南省烟草农业科学研究院 一种苗期叶片催熟筛选抗烟草赤星病育种材料的方法
CN112359043B (zh) * 2020-11-17 2022-05-10 广东省微生物研究所(广东省微生物分析检测中心) 一种适用于拟茎点霉FS508的CRISPR/Cas9载体及其构建方法和应用
CN112852829B (zh) * 2020-12-19 2022-07-08 河南农业大学 小麦茎基腐病相关基因TaDIR-B1及其应用
CN113061171B (zh) * 2021-04-13 2022-10-04 四川农业大学 抗稻瘟病蛋白和基因、分离的核酸及其应用
CN113278729B (zh) * 2021-07-26 2021-10-01 广东省农业科学院作物研究所 一种烟草青枯病的snp分子标记、其获得方法及其应用
CN113628687A (zh) * 2021-08-13 2021-11-09 南京大学 一种植物成对nlr抗性基因数据库的构建方法及其多物种成对nlr基因数据库
CN116376929A (zh) * 2023-03-21 2023-07-04 安徽农业大学 Cs-miR397a靶定CsLAC1基因在调控茶树轮斑病菌敏感性中的应用

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4945050A (en) 1984-11-13 1990-07-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
US5990387A (en) 1988-06-10 1999-11-23 Pioneer Hi-Bred International, Inc. Stable transformation of plant cells
US5879918A (en) 1989-05-12 1999-03-09 Pioneer Hi-Bred International, Inc. Pretreatment of microprojectiles prior to using in a particle gun
US5240855A (en) 1989-05-12 1993-08-31 Pioneer Hi-Bred International, Inc. Particle gun
US5322783A (en) 1989-10-17 1994-06-21 Pioneer Hi-Bred International, Inc. Soybean transformation by microparticle bombardment
US5932782A (en) 1990-11-14 1999-08-03 Pioneer Hi-Bred International, Inc. Plant transformation method using agrobacterium species adhered to microprojectiles
US5324646A (en) 1992-01-06 1994-06-28 Pioneer Hi-Bred International, Inc. Methods of regeneration of Medicago sativa and expressing foreign DNA in same
CA2140910C (en) 1992-07-27 1999-03-23 Jeffrey A. Townsend An improved method of agrobacterium-mediated transformation of cultured soybean cells
US5736369A (en) 1994-07-29 1998-04-07 Pioneer Hi-Bred International, Inc. Method for producing transgenic cereal plants
US5981840A (en) 1997-01-24 1999-11-09 Pioneer Hi-Bred International, Inc. Methods for agrobacterium-mediated transformation
JP2002529096A (ja) 1998-11-09 2002-09-10 パイオニア ハイ−ブレッド インターナショナル, インコーポレイテッド 転写アクチベータlec1核酸、ポリペプチドおよびそれらの使用
FR2833615A1 (fr) 2001-12-14 2003-06-20 Genoplante Valor POLYMORPHISMES DU GENE CCoAOMT2 DE MAIS, ET LEURS UTILISATIONS POUR AMELIORER LA DIGESTIBILITE DES PLANTES
US7601887B2 (en) * 2003-09-25 2009-10-13 Queensland University Of Technology Banana resistance genes and uses thereof
FR2878532B1 (fr) * 2004-11-26 2007-03-02 Genoplante Valor Soc Par Actio Methode d'adressage d'acides nucleiques vers des plastes
CA2599405A1 (en) 2005-03-08 2006-09-14 Basf Plant Science Gmbh Expression enhancing intron sequences
TW200730625A (en) 2005-08-24 2007-08-16 Pioneer Hi Bred Int Compositions providing tolerance to multiple herbicides and methods of use thereof
ES2531882T3 (es) 2006-01-12 2015-03-20 Cibus Europe B.V. EPSPS mutantes
US8362325B2 (en) * 2007-10-03 2013-01-29 Ceres, Inc. Nucleotide sequences and corresponding polypeptides conferring modulated plant characteristics
EP2716763A3 (en) * 2008-04-29 2014-07-02 Monsanto Technology LLC Genes and uses for plant enhancement
CN103805595A (zh) * 2012-11-13 2014-05-21 南京大学 高通量克隆植物抗病基因的方法
US10462994B2 (en) * 2013-01-29 2019-11-05 Basf Plant Science Company Gmbh Fungal resistant plants expressing HCP7
CA3221516A1 (en) 2013-08-22 2015-02-26 E. I. Du Pont De Nemours And Company Plant genome modification using guide rna/cas endonuclease systems and methods of use
US20150315605A1 (en) * 2014-02-21 2015-11-05 E I Du Pont De Nemours And Company Novel transcripts and uses thereof for improvement of agronomic characteristics in crop plants
CN106636181B (zh) * 2016-10-12 2019-07-26 中国农业科学院作物科学研究所 OsSAPK9蛋白及其编码基因在提高水稻白叶枯病抗性中的应用

Also Published As

Publication number Publication date
CN111902547A (zh) 2020-11-06
WO2019182884A1 (en) 2019-09-26
CN111902547B (zh) 2024-06-14
CA3093000A1 (en) 2019-09-26
US20210040569A1 (en) 2021-02-11
EP3768845A1 (en) 2021-01-27

Similar Documents

Publication Publication Date Title
BR112020025031A2 (pt) molécula que tem utilidade pesticida, composições e processos relacionados à mesma
CN111902547B (zh) 鉴定、选择和产生疾病抗性作物的方法
US20240093223A1 (en) Methods of identifying, selecting, and producing southern corn rust resistant crops
US20040025202A1 (en) Nucleic acid molecules associated with oil in plants
WO2021143587A1 (en) Methods of identifying, selecting, and producing disease resistant crops
US11473101B2 (en) Methods of identifying, selecting, and producing southern corn rust resistant crops
CN111988988A (zh) 鉴定、选择和产生抗白叶枯病水稻的方法
US20240191249A1 (en) Plant pathogen effector and disease resistance gene identification, compositions, and methods of use
US20220282338A1 (en) Methods of identifying, selecting, and producing anthracnose stalk rot resistant crops
US20210222189A1 (en) Methods of identifying, selecting, and producing southern corn rust resistant crops
US20230151382A1 (en) Plant pathogen effector and disease resistance gene identification, compositions, and methods of use
US11661609B2 (en) Methods of identifying, selecting, and producing disease resistant crops
WO2023023499A1 (en) Compositions and methods for gray leaf spot resistance
EP4387436A1 (en) Compositions and methods for gray leaf spot resistance
EP4387435A1 (en) Methods of identifying, selecting, and producing anthracnose stalk rot resistant crops

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]