BRPI0413253B1 - Método para identificar uma sublinhagem de soja com aumento de produtividade e conjunto de marcadores úteis para a identificação de uma planta de soja com aumento de produtividade - Google Patents

Método para identificar uma sublinhagem de soja com aumento de produtividade e conjunto de marcadores úteis para a identificação de uma planta de soja com aumento de produtividade Download PDF

Info

Publication number
BRPI0413253B1
BRPI0413253B1 BRPI0413253-0B1A BRPI0413253A BRPI0413253B1 BR PI0413253 B1 BRPI0413253 B1 BR PI0413253B1 BR PI0413253 A BRPI0413253 A BR PI0413253A BR PI0413253 B1 BRPI0413253 B1 BR PI0413253B1
Authority
BR
Brazil
Prior art keywords
sat
marker
soybean
markers
plant
Prior art date
Application number
BRPI0413253-0B1A
Other languages
English (en)
Inventor
Scott Sebastian
Original Assignee
Pioneer Hi Bred Int
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Hi Bred Int filed Critical Pioneer Hi Bred Int
Publication of BRPI0413253A publication Critical patent/BRPI0413253A/pt
Publication of BRPI0413253B1 publication Critical patent/BRPI0413253B1/pt

Links

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/04Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection
    • A01H1/045Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection using molecular markers
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/54Leguminosae or Fabaceae, e.g. soybean, alfalfa or peanut
    • A01H6/542Glycine max [soybean]
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/10Seeds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Botany (AREA)
  • Genetics & Genomics (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Physiology (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Mycology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Natural Medicines & Medicinal Plants (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)

Description

MÉTODO PARA IDENTIFICAR UMA SUBLINHAGEM DE SOJA COM AUMENTO DE PRODUTIVIDADE E CONJUNTO DE MARCADORES ÚTEIS PARA A IDENTIFICAÇÃO DE UMA PLANTA DE SOJA COM AUMENTO DE PRODUTIVIDADE
Campo da Invenção A invenção relaciona-se ao campo da biotecnologia agrícola e, mais especificamente, à seleção assistida por marcador molecular e ao melhoramento de plantas de soja.
Fundamentos da Invenção Um dos aspectos mais desafiadores dos programas de melhoramento é a identificação de variedades de plantas que sejam superiores às variedades correntemente disponíveis usadas no comércio. Aqui, o termo "variedade" e "genótipo" será usado intercambiavelmente, já que as diferenças genéticas são as responsáveis pela unicidade de cada variedade e o que faz uma variedade superior à outra em termos de valor comercial.
Para culturas do tipo commoditíes, tais como soja e milho, a medida mais universal de valor comercial é a produtividade do grão por área unitária ou "produtividade" ("rendimento"). Tendo em vista que um fazendeiro é pago de acordo com a quantidade (peso) de grão expedido em um elevador, tipicamente um fazendeiro deseja plantar uma variedade que produza a maioria de grãos por acre.
Embora a produtividade seja o mais importante caractere com o qual um melhorista está preocupado, ele é o menos entendido geneticamente. Existem vários caracteres de plantas diferentes que controlam a eficiência da conversão de nutrientes e de luz para um grão. O rendimento é, portanto, o ponto alto de vários caracteres diferentes que contribuem para a produtividade ao longo da estação de crescimento. Isto incluiría o vigor de surgimento de muda, capacidade de fotossíntese, resistência a doença, capacidade de extrair nutrientes do solo, capacidade de produzir flores e capacidade de transportar fotosintato para o grão, etc. São desconhecidas as bases genéticas desses caracteres individuais que contribuem para a produtividade. Cada caractere que contribui para a produtividade podería ser controlado por alguns ou muitos lócus genéticos. Logo, é sem dúvida bastante complexa a base genética global para a produtividade. Este é apenas um dos motivos pelos quais não têm sido bem sucedidos os métodos tradicionais de determinação das bases genéticas de produtividade. Para realizar melhorias incrementais no potencial de produtividade, os melhoristas, em sua maioria, ainda estão usando os mesmos métodos recurso-intensivos que têm sido usados pelos últimos 80 anos ou mais. Variedades existentes são cruzadas para produzir um conjunto de novos genótipos que, sem seguida, são exaustivamente testados por muitas localizações e replicações, de forma a obter-se dados de produtividade suficientes para diferenciar os poucos genótipos consistentemente superiores. Esse é um dos aspectos mais dispendiosos do melhoramento de plantas em termos de custos e tempo.
Durante os anos 90, emergiram os marcadores genéticos ligados aos genes que contribuem para a produtividade, como meio para aperfeiçoar a eficiência em certos aspectos do processo de melhoramento. Essas histórias de sucesso têm sido limitadas aos caracteres controlados por relativamente poucos genes que são altamente hereditários. Nesse caso, é rotina razoável a realização de uma associação confiável entre uma seqüência de DNA e um fenótipo que possa ser confirmada com uma casa de vegetação ou um teste de campo. Entretanto, até recentemente, tem sido bastante difícil fazer associações confiáveis entre sequências de DNA específicas e um caractere quantitativo muito complexo tal como a produtividade. 0 viés de melhoramento ("breeding bias") descrito na patente US 5.437.697, aqui incorporada em sua totalidade para todos os fins, é o único meio para determinar quais lócus genéticos têm sido afetados por períodos estendidos de seleção recorrente para a produtividade. Pela comparação dos perfis de marcadores genéticos de variedades modernas de alta produtividade aos seus ancestrais mais distantes, o viés de melhoramento pode alavancar rapidamente um século inteiro de dados sobre produtividade, de forma a determinar quais alelos específicos, de que marcadores genéticos, aumentaram em frequência ao longo do tempo devido à seleção. Considerando que a produtividade aumentada tem sido o principal critério para seleção, esses marcadores são aqueles mais prováveis de serem associados com o progresso da produtividade ao longo do tempo. A presente invenção provê marcadores genéticos que são associados com o desempenho de produtividade em uma variedade de regiões geográficas, bem como métodos para utilizar esses marcadores na identificação eficiente de linhagens e sub-linhagens de soja com produtividade aumentada.
Sumário Da Invenção A presente invenção provê marcadores representativos que correspondem aos, e identificam os, segmentos cromossômicos importantes para o desempenho agronômico superior em uma variedade de regiões geográficas e condições de crescimento. Os marcadores aqui descritos são associados com elementos genéticos contribuindo para a produtividade aumentada em soja. Os marcadores e seus métodos de uso aqui descritos fornecem os meios para identificar e definir plantas de soja com produtividade aperfeiçoada em relação às linhagens elites existentes. Usando os marcadores e métodos aqui descritos, é possível a identificação de variações residuais de alelos entre linhagens segregantes de soja derivada de linhagens elite, de forma a serem usadas para aumentar a eficiência dos programas de melhoramento, desenvolvendo novas sub- linhagens de soja com produtividade aumentada em relação às linhagens elites existentes.
Em um primeiro aspecto, a invenção provê métodos para identificar sub-linhagens de soja com produtividade aumentada em relação às linhagens elites de soja existentes. Os métodos da invenção envolvem a detecção de ao menos uma forma alélica de uma pluralidade de segmentos cromossômicos, cada um dos quais: (a) inclui um elemento genético contribuindo para a produtividade aumentada e (b) inclui ou é proximal a um lócus de marcador mostrado como sendo associado com produtividade aumentada em soja.
Por exemplo, a detecção de uma forma alélica envolve a identificação de pelo menos uma forma alélica favorável de um segmento cromossômico, onde o segmento cromossômico identificado inclui um elemento genético contribuindo com a produtividade aumentada e também inclui ou é próxima a (ligado a) um marcador selecionado do conjunto especificado de marcadores, que têm sido associados com a produtividade. A forma alélica favorável de um segmento polimórfico pode ser confirmada pela identificação de um lócus de marcador polimórfico selecionado do conjunto, que é segregante era várias sub-linhagens de progênie derivadas de um progenitor de soja. A produtividade é avaliada em, ao menos, duas sub-linhagens de progênie com diferentes formas alélicas do lócus marcador, e é identificada uma sub-linhagem de progênie com produtividade aumentada em relação ao progenitor de soja.
Exemplares de lócus de marcadores, mostrados por análise de tendência de melhoramento a serem associados com elementos genéticos que contribuem com a produtividade aumentada em uma ou mais regiões geográficas de crescimento, estão incluídos no seguinte conjunto de marcadores: Satt684, Sattl65, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, Satt385, Satt225, Satt236, SattSll, P12390B-1, Satt480, Satt632-TB, Satt233, Satt327, Satt329, Satt508, P10635A-1, Satt409, Satt228, Satt429, Satt426, Satt509, SAT_261, Sattl97, Satt519, Satt597, SCT_026, Satt415, Satt583, Satt430, P12198A-1, P8584A-1, Satt359, P10648A-1, P12105A-1, P10641A-1, Sattl68, Satt556, Satt272, S'att020, Satt066, Satt534, P10638B-2, Satt399, Satt361, P10639A-1, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt227, Satt640-TB, Satt422/ Satt457, Satt457, Satt557, Satt319, SAT_142-DB, Satt460, P13073A-1, Satt307, SCT_028, Satt433, Satt357, Satt321, Satt267, Satt383, Satt295, Satt203, Satt507, SAT_11Q, P10620A-1, Sattl29, Sattl47, Satt216, SAT_351, P10621B-2, Satt701, Satt634, Satt558, Satt266, Satt282, Satt537, Satt506, Satt546, P13072A-1, Satt582, Satt389, Satt461, Satt311, Satt514, Satt464r Satt662, Satt543, Sattl86, 3att413, Satt672, P13074A-1, P10624A-1, Satt573, Satt598, Satt204, Satt263, Satt491, Satt602, SattlSl, Satt355, Satt452, SAT_273-DB, Sattl46, Sattl93, Satt569, Satt343, Satt586, Satt040, Satt423, Satt348, Satt595, P10782A-1, P3436A-1, P10598A-1, Satt334, Satt510, Satt510, Sattl44, Satt522, Satt522, P9026A-1, P10646A-1, P5219A-1, P7659A-2, Satt570, Satt356, Sattl30, Sattll5, Satt594, Satt533, Satt303, Satt352, Satt566, Sattl99, Satt503, Satt517, Sattl91, SAT_117, Satt353, Satt442, Satt279, Satt314, Sattl42, Sattl81, Satt367, Sattl27, SCTT012, Satt270, Satt292, Satt440, P10640A-1, Satt249, SAG1223, SACI699, SCT_065, Satt596, Satt280, Satt406, Satt380, Sattl83, Satt529, Satt431, Satt242f Sattl02, Satt441, Satt544, Satt617, Satt240, P10618A-1, Satt475, Sattl96, SAT_3 01, Satt523, Satt418, Satt418, Satt398, Satt497, Satt284, Sattl66, Satt448, Satt373, Satt513, P12394A-1, Satt590, Satt567, Satt220, SAG1048, Satt536, Sattl75, Satt677, Satt680, P10615A-1, SattSSl, Satt250f Satt346, Satt336, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, Satt584, SAT_084, P3050A-2, SAT_275-DB, Satt387, Satt549, Satt660, Satt339, Satt255, Satt257, Satt358, P12396A-1, Satt487, Satt259, Satt259, Satt347, Satt420, Satt576, Satt550, Satt633, Satt262, Satt473, Satt477, Satt581, P11070A-1, Sattl53# Satt243, P8230A-1, P10623A-1, P10632A-1, P10793A-1, P12391A-1, P13560A-1, P13561A-1, P13561A-1, P2481A-1, S60021-TB, S60048-TB, S60076-TB, S60148-TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S60505-TB, S60513-TB, S60519-TB, S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812-TB, SAC1677, SAC1724, SAG1055, Satt040, Sattl08, Sattl09, Sattlll, Sattl76f Sattl76, Satt219f Satt299, e Satt512. Como tal, lócus de marcadores do conjunto identificara segmentos cromossômicos contribuindo para a produtividade superior. Pode ser identificado qualquer número de lócus de marcadores adicionais ligados a um lócus de marcador selecionado do conjunto, e irá funcionar como equivalentes nos métodos da invenção.
Por exemplo, em algumas concretizações, a forma alélica favorável de ao menos um segmento cromossômico, i.e., a forma alélica associada com produtividade superior, é determinada pela: a) identificação de ao menos um lócus de marcador polimórfico selecionado do conjunto em uma pluralidade de sub-linhagens de progênie de um progenitor de soja e b) avaliação da produtividade em ao menos duas sub-linhagens de progênie possuindo formas alélicas diferentes do lócus de marcador.
Em outras concretizações, os métodos de identificação de uma sub-linhagem de soja com produtividade superior envolvem detectar ao menos um alelo de um lócus de marcador segregante dentre progênies de um progenitor de soja. 0 lócus de marcador inclui ao menos dois alelos, um dos quais se correlaciona com produtividade superior, enquanto o(s) outro(s) alelo(s) não se correlaciona(m) com a produtividade superior. 0 aumento na produtividade é medido em relação à produtividade média da progênie. Opcionalmente, é avaliado mais de um lócus de marcador. Os lócus de marcadores são selecionados do conjunto de lócus selecionados de: Satt684, Sattl65, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, Satt385, Satt225, Satt236, SattSll, P12390B-1, Satt480, Satt632-TB, Satt233, Satt327, Satt329, Satt508, P10635A-1, Satt409, Satt228, Satt429, Satt426, Satt509, SAT_261, Sattl97, Satt519, Satt597, SCT_026, Satt415, Satt583, Satt430, P12198A-1, P8584A-1, Satt359, P10648A-1, P12105A-1, P10641A-1, Sattl68, Satt556, Satt272, Satt020, Satt066, Satt534, P10638B-2, Satt399, Satt361, P10639A-1, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt227, Satt640-TB, Satt422, Satt457, Satt457, Satt557, Satt319, SAT_142-DB, Satt460, P13073A-1, Satt307, SCT_028, Satt433, Satt357, Satt321, Satt267, Satt383, Satt295, Satt203, Satt507, SAT_110, P10620A-1, Sattl29, Sattl47, Satt216, SAT_351, P10621B-2, Satt701, Satt634, Satt558, Satt266, Satt282, Satt537, Satt506, Satt546, P13072A-1, Satt582, Satt389, Satt461, Satt311, Satt514, Satt464, Satt662, Satt543, Sattl86, Satt413, Satt672, P13074A-1, P10624A-1, Satt573, Satt598, Satt204, Satt263, Satt491, Satt602, Sattl51, Satt355, Satt452, SAT_273-DB, Sattl46, Sattl93, Satt569, Satt343, .Satt586, Satt040, Satt423, Satt348, Satt595, P10782A-1, P3436A-1, P10598A-1, Satt334, SattSlO, Satt510, Sattl44, Satt522, Satt522, P9026A-1, P10646A-1, P5219A-1, P7659A-2, Satt570, Satt356, Sattl30, SattllS, Satt594, Satt533, Satt303, Satt352, Satt566, Sattl99, Satt503, Satt517, Sattl91, SAT_117, Satt353, Satt442, Satt279, Satt314, Sattl42, Sattl81, Satt367, Sattl27, SCTT012, Satt270, Satt292, Satt44Q, P10640A-1, Satt249, SAG1223, SAC1699, SCT_065, Satt596, Satt280, Satt406, Satt380, Sattl83, Satt529, Satt431, Satt242, Sattl02, Satt441, Satt544, Satt617, Satt240, P10618A-1, Satt475, Sattl96, SAT_3 01, Satt523, Satt418, Satt418, Satt398, Satt497, Satt284, Sattl66, Satt448, Satt373, Satt513, P12394A-1, Satt590, Satt567, Satt220, SAG1048, Satt536, Sattl75, Satt677, Satt680, P10615A-1, Satt551, Satt250, Satt346, Satt336, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, Satt584, SAT_0 8 4, P3050A-2, SAT_275-DB, Satt387, Satt549, Satt660, Satt339, Satt255, Satt257, Satt358, P12396A-1, Satt487, Satt259, Satt259, Satt347, Satt420, Satt576, Satt550, Satt633, Satt262, Satt473, Satt477, Satt581, P11070A-1, Sattl53, Satt243, P8230A-1, P10623A-1, P10632A-1, P10793A-1, P12391A-1, P13560A-1, P13561A-1, P13561A-1, P2481A-1, S60021-TB, S60048-TB, S60076-TB, S60148-TB, S6Q149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S605Q5-TB, S60513-TB, S60519-TB, S60536-TB, S60552-TB, S60585-TB, S60 630-TB, S60728-TB, S60812-TB, SAC1677, SAC1724, SAG1055, Satt040, Sattl08, Sattl09, Sattlll, Sattl76, Sattl76, Satt219, Satt299, e Satt512.
Em algumas concretizações, são determinadas as formas alélicas dentre cerca de 10% a cerca de 100% dos segmentos cromossômicos no conjunto ou em um subconjunto especificado dos marcadores relevantes em uma região geográfica particular, como enumerados nas tabelas 3 a 12. Usualmente, são determinadas as formas alélicas dentre cerca de 10% a cerca de 90% dos segmentos cromossômicos relevantes em uma região geográfica particular. Normalmente, é determinada a maioria das formas alélicas. Em uma concretização, são determinadas as formas alélicas de, essencialmente, todos os segmentos cromossômicos.
Por exemplo, em um programa de melhoramento com o objetivo de desenvolver soja com produtividade superior na região central de crescimento {Por exemplo, Iowa), são determinadas as formas alélicas de cerca de 10% a cerca de 100% dos segmentos cromossômicos incluindo ou proximais aos marcadores do conjunto incluindo: Satt642, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, SattSll, P12390B-1, Satt632-TB, Satt429, SAT_261, Sattl97, P10641A-1, Satt556, Satt534, P10638B-2, Satt399. Satt361, P10639A-1, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt640-TB, Satt557, Satt319, SAT_142-DB, Satt460, Satt433, Satt357, Satt321, Satt295, Satt203, Satt507, Sattl29, Sattl47, SAT_351, P10621B-2, Satt558, Satt701, Satt634, Satt582, Satt389, Satt464, Satt662, Satt672, Satt573, Satt598, Satt263, Satt602, Sattlôl, SAT_273-DB, Sattl46, Sattl93, Satt569, Sattl76, Satt343, Satt586, Satt040, Satt595, P10782A-1, Satt334, Sattl44, Satt522, Satt570, Satt356, Satt533, Sattl99, Satt517, Sattl91, SAT_117, Satt279, Sattl81, Sattl27, Satt270, Satt292, SAG1223, SACI 699, SAT_065, Satt596, Satt406, Satt380, Sattl83, Satt529, Satt242, Satt617, Satt240, SAT_301, Satt418, Satt398, Satt497, Sattl66, Satt448, Satt373, Satt513, P12394A-1, SAG1048, Satt536, Sattl75, Satt677, Satt680, P10615A-1, Satt551, Satt346, Satt336, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, SAT_084, SAT_275-DB, Satt660, Satt339, P12396A-1, Satt358, Satt487, Satt259, Satt420, Satt576, Satt633, Satt477, Satt581, Sattl53, Satt243, P10793A-1, P12391A-1, P12392A-1, P13560A-1, P13561A-1, S60021-TB, S60048-TB, S60076-TB, S60148-TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S60505-TB, S60513-TB, S60519-TB, S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812-TB, SAC1677, SAC1724, SAG1055, Satt040, Sattlll, Sattl76, Satt219 e Satt299. Em uma concretização, o conjunto de marcadores determinados inclui Satt684, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, SattlSS, Satt385, Satt632-TB, Satt429, SAT-_261, P10641A-1, Satt556, P10638B-2, Satt399, Satt361, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt640-TB, Satt557, Satt319, SAT_142-DB, Satt321, Satt203, Sattl29, Sattl47, SAT_351, P10621B-2, Satt701, Satt634, Satt582, Satt389, Satt464, Satt662, Satt672, Satt573, Satt598, Satt263, SattlSl, SAT_273-DB, Sattl46, Sattl93, Satt569, Satt343, Satt586, Satt040, Satt595, Satt334, Sattl44, Satt522, Satt570, Satt356, Sattl99, Satt517, Sattl91, Sat_117, Satt279, Sattl81, Sattl27, Satt270, Satt292, SAG1223, SAC1699, Sat_065, Satt596, Satt406, Satt380, Sattl83, Satt529, Satt242, Satt617, Satt240, SAT_301, Satt418, Satt398, Satt497, Sattl66, Satt448, Satt373, Satt513, P12394A-1, SAG1048, Satt536, Sattl75, Satt677, Satt680, P10615A-1, Satt551, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, SATJD84, SAT_275-DB, Satt660, Satt339, Satt358, Satt487, Satt487, Satt420, Satt576, Satt633, Satt581, Sattl53, Satt243, P10793A-1, P13560A-1, P13561A-1, S60021-TB, S60048-TB, S60076-TB, S60148-TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S60505-TB, S60513-TB, S60519-TB, S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812-TB, SAC1677, SAC1724, SAG1055, Sattlll, Satt219 e Satt299. Em uma concretização, o conjunto de marcadores inclui Satt684, Satt526, Satt591, Satt385, Satt632-TB, Satt429, SAT-_261, P10641A-1, Satt556, P10638B-2, Sattl90, SAT_311-DB, Satt338, Satt64 0-TB, Satt557, SAT_142-DB, Satt321, Satt203, Sattl29, SAT_351, SattVOl, Satt582, Satt389, Satt464, Satt672, Satt598, Satt343, Satt595, Satt334, Sattl44, Satt522, Satt570, Satt356, Sattl99, Sat_117, Satt279, Sattl81, Sattl27, Satt270, Satt292, SAG1223, Sat_065, Satt529, Satt242, Satt617, SAT_301, Satt398, Satt497, Sattl66, Satt373, SAG1048, Satt680, P10615A-1, SAT_330-DB, P13069A-1, SAT_275-DB, Satt339, Satt487, Satt420, Satt581 e Sattl53.
Em outras concretizações, os métodos de identificação de uma sub-linhagem de soja com produtividade superior envolvem a detecção de ao menos um alelo de um lócus de marcador segregante dentre a progênie de um progenitor de soja. Os lócus de marcador incluem ao menos dois alelos, um dos quais se correlaciona com a produtividade aumentada, enquanto que o (s) outro(s) alelo(s) não se correlaciona(m) com produtividade superior. Aumento na produtividade é medido em relação à media de produtividade da progênie. Opcionalmente, é avaliado mais de um lócus de marcador. Os lócus de marcadores são selecionados do conjunto de lócus consistindo de: Satt684, Sattl65, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, Satt385, Satt225, Satt236, SattSll, P12390B-1, Satt480, Satt632-TB, Satt233, Satt327, Satt329, Satt508, P10635A-1, Satt409, Satt228, Satt429, Satt426, Satt509, SAT_261, Sattl97, Satt519, Satt597, SCT_026, Satt415, Satt583, Satt430, P12198A-1, P8584A-1, Satt359, P10648A-1, P12105A-1, P10641A-1, Sattl68, Satt556, Satt272, Satt020, Satt066, Satt534, P10638B-2, Satt399, Satt361, P10639A-1, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt227, Satt640-TB, Satt422, Satt457, Satt457, Satt557, Satt319, SAT_142-DB, Satt460, P13073A-1, Satt307, SCT_028, Satt433, Satt357, Satt321, Satt267, Satt383, Satt295, Satt203, Satt507, SAT_110, P10620A-1, Sattl29, Sattl47, Satt216, SAT_351, P10621B-2, Satt7 01, Satt634, Satt558, Satt266, Satt282, Satt537, Satt506, Satt546, P13072A-1, Satt582, Satt389, Satt461, Satt311, Satt514, Satt464, Satt662, Satt543, Sattl86, Satt413, Satt672, P13074A-1, P10624A-1, Satt573, Satt598, Satt204, Satt263, Satt491, Satt602, SattlSl, Satt355, Satt452, SAT_273-DB, Sattl46, Sattl93, Satt569, Satt343, Satt586, Satt040, Satt423, Satt348, Satt595, P10782A-1, P3436A-1, P10598A-1, Satt334, Satt510, SattõlO, Sattl44, Satt522, Satt522, P9026A-1, P10646A-1, P5219A-1, P7659A-2, Satt570, Satt356, Sattl30, Sattll5, Satt594, Satt533, Satt303, Satt352, Satt566, Sattl99, Satt503, Satt517, Sattl91, SAT_117, Satt353, Satt442, Satt279, Satt314, Sattl42, Sattl81, Satt367, Sattl27, SCTT012, Satt270, Satt292, Satt440, P10640A-1, Satt249, SAG1223, SAC1699, SGT_065, Satt596, Satt280, Satt406, Satt380, Sattl83, Satt529, Satt431, Satt242, Sattl02, Satt441, Satt544, Satt617 , Satt240, P10618A-1, Satt475, Sattl96, SAT_301, Satt523, Satt418, Satt418, Satt398, Satt497, Satt284, Satt166, Satt448, Satt373, Satt513, P12394A-1, Satt590, Satt567, Satt220, SAG1048, Satt536, Sattl75, Satt677, Satt680, P10615A-1, Satt551, Satt250, Satt346, Satt336, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, Satt584, SAT_084 , P3050A-2, SAT_275-DB, Satt387, Satt549, Satt660, Satt339, Satt255, Satt257, Satt358, P12396A-1, Satt487, Satt259, Satt259, Satt347, Satt420, Satt576, Satt550, Satt633, Satt262, Satt473, Satt477, Satt581, P11070A-1, Satt153, Satt243, P8230A-1, P10623A-1, P10632A-1, P10793A-1, P12391A-1, P13560A-1, P13561A-1, P13561A-1, P2481A-1, S6Q021-TB, S60048-TB, S60076-TB, S60148-TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S60505-TB, S60513-TB, Ξ60519-ΤΒ, S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812-TB, SAC1677, SAC1724, SAG1055, Satt040, Sattl08, Sattl09, Sattlll, Sattl76, Sattl76, Satt219, Satt299, e Satt512.
Em algumas concretizações, são detectados ao menos um alelo dentre cerca de 10% a cerca de 100% dos marcadores no conjunto, ou em um subconjunto especificado dos marcadores relevantes em uma região geográfica particular, como enumerado nas tabelas 3 a 12. Usualmente, são determinados ao menos um alelo dentre cerca de 10% a cerca de 90% dos lócus de marcadores relevantes em uma região geográfica particular. Normalmente, é avaliada a maioria dos lócus de marcadores. Em uma concretização, sâo avaliados essencialmente todos os lócus de marcadores.
Por exemplo, em um programa de melhoramento com o objetivo de desenvolver soja com produtividade superior na região central de crescimento {por exemplo, Iowa), são determinadas ao menos um alelo dentre cerca de 10% a cerca de 100% dos lócus de marcadores do conjunto incluindo Satt642, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, SattSll, P12390B-1, Satt632-TB, Satt429, SAT_261, Sattl97, P10641A-1, Satt556, Satt534, P10638B-2, Satt399. Satt361, P10639A-1, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt640-TB, Satt557, Satt319, SAT_142-DB, Satt460, Satt433, Satt357, Satt321, Satt295, Satt203, Satt507, Sattl29, Sattl47, SAT_351, P10621B-2, Satt558, Satt701, Satt634, Satt582, Satt389, Satt464, Satt662, Satt672, Satt573, Satt598, Satt263, Satt602, SattlSl, SAT_273-DB, Sattl46, Sattl93, Satt569, Sattl76, Satt343, Satt586, Satt040, Satt595, P10782A-1, Satt334, Satt144, Satt522, Satt570, Satt356, Satt533, Sattl99, Satt517, Sattl91, SAT_117, Satt279, Sattl81, Sattl27, Satt270, Satt292, SAG1223, SAC1699, SAT_065, Satt596, Satt406, Satt380, Sattl83, Satt529, Satt242, Satt617, Satt240, SAT_3 01, Satt418, Satt398, Satt497, Sattl66, Satt448, Satt373, Satt513, P12394A-1, SAG1048, Satt536, Sattl75, Satt677, Satt680, P10615A-1, Satt551, Satt346, Satt336, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, SAT_084, SAT_275-DB, Satt660, Satt339, P12396A-1, Satt358, Satt487, Satt259, Satt420, Satt576, Satt633, Satt477, Satt581, Sattl53, Satt243, P10793A-1, P12391A-1, P12392A-1, P13560A-1, P13561A-1, S60021-TB, S60048-TB, S60076-TB, S60148-TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S60505-TB, S60513-TB, S60519-TB, S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812-TB, SACI677, SACI724, SAG1055, Satt040, Sattlll, Sattl76, Satt219 e Satt299. Em outra concretização, o conjunto de marcadores inclui Satt684, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, Satt632-TB, Satt429, SAT-_261, P10641A-1, Satt556, P10638B-2, Satt399, Satt361, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt640-TB, Satt557, Satt319, SATJL42-DB, Satt321, Satt203, Sattl29, Sattl47, SAT_351, P10621B-2, Satt701, Satt634, Satt582, Satt389, Satt464, Satt662, Satt672, Satt573, Satt598, Satt263, Sattlõl, SAT_273-DB, Sattl46, Sattl93, Satt569, Satt343, Satt586, Satt040, Satt595, Satt334, Sattl44, Satt522, Satt570, Satt356, Sattl99, Satt517, Sattl91, Sat_117, Satt279, Sattl81, Sattl27, Satt270, Satt292, SAG1223, SAC1699, Sat_065, Satt596, Satt406, Satt380, Sattl83, Satt529, Satt242, Satt617, Satt240, SAT__301f Satt418, Satt398, Satt497, Sattl66, Satt448, Satt373, Satt513, P12394A-1, SAG1048, Satt536, Sattl75, Satt677, Satt680, P10615A-1, Satt551, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, SAT_084, SAT_275-DB, Satt660, Satt339, Satt358, Satt487, Satt487, Satt420, Satt576, Satt633, Satt581, Sattl53, Satt243, P10793A-1, P13560A-1, P13561A-1, S60021-TB, S60048-TB, S60076-TB, S60148-TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S60505-TB, S60513-TB, S60519-TB, S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812-TB, SAC1677, SAC1724, SAG1055, Sattlll, Satt219 e Satt299. Em uma concretização, o conjunto de marcadores inclui Satt684, Satt52 6, Satt591, Satt385, Satt632-TB, Satt429, SAT-_261, P10641A-1, Satt556, P10638B-2, Sattl90, SAT_311-DB, Satt338, Satt640-TB, Satt557, SAT_142-DB, Satt321, Satt203, Sattl29, SAT_351, Satt701, Satt582, Satt389, Satt464, Satt672, Satt598, Satt343, Satt595, Satt334, Sattl44, Satt522, Satt570, Satt356, Sattl99, Sat_117, Satt279, Sattl81, Sattl27, Satt270, Satt292, SAG1223, Sat_065, Satt529, Satt242, Satt617, SAT_301, Satt398, Satt497, Sattl66, Satt373, SAG1048, Satt680, P10615A-1, SAT_330-DB, P13069A-1, SAT_275-DB, Satt339, Satt487, Satt420, Satt581 e Sattl53.
Em algumas concretizações, são determinados os alelos correlacionados com a produtividade aumentada e, de modo oposto, os alelos não correlacionados com produtividade aumentada, conforme a seguir. É selecionado ao menos um lócus de marcador polimórfico possuindo ao menos dois alelos segregantes em uma pluralidade de sub-linhagens de progênie de planta de soja. A produtividade é avaliada em ao menos duas sub-linhagens de progênie com diferentes alelos do marcador. É então identificada uma sub-línhagem com produtividade elevada em relação à produtividade media das sub-linhagens, confirmando uma correlação entre um dos alelos segregantes e a produtividade aumentada.
Os métodos para a identificação de sub-linhagens de soja com produtividade aumentada envolvem a detecção de ao menos uma forma alélica de lócus de marcadores múltiplos. Tipicamente, o numero de lócus de marcadores é maior do que dois, e tipicamente, está entre 10% e 100% do conjunto de lócus de marcadores incluindo: Satt684, Sattl65, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, Satt385, Satt225, Satt236, Satt511, P12390B-1, Satt480, Satt632-TB, Satt233, Satt327, Satt329, Satt508, P10635A-1, Satt409, Satt228, Satt429, Satt426, Satt509, SAT_2 61, Sattl97, Satt519, Satt597, SCT_026, Satt415, Satt583, Satt430, P12198A-1, P8584A-1, Satt359, P10648A-1, P12105A-1, P10641A-1, Sattl68, Satt556, Satt272, Satt020, Satt066, Satt534, P10638B-2, Satt399, Satt361, P10639A-1, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt227, Satt640-TB, Satt422, Satt457, Satt457, Satt557, Satt319, SAT_142-DB, Satt460, P13073A-1, Satt307, SCT_028, Satt433, Satt357, Satt321, Satt267, Satt383, Satt295, Satt203, Satt507, SAT_110, P10620A-1, Sattl29, Sattl47, Satt216, SAT_351, P10621B-2, Satt701, Satt634, Satt558, Satt266, Satt282, Satt537, Satt506, Satt546, P13072A-1, Satt582, Satt389, Satt461, Satt311, Satt514, Satt464, Satt662, Satt543, Sattl86, Satt413, Satt672, P13074A-1, P10624A-1, Satt573, Satt598, Satt204, Satt263, Satt491, Satt602, Sattl51, Satt355, Satt452, SAT_273-DB, Sattl46, Sattl93, Satt569, Satt343, Satt586, Satt040, Satt423, Satt348, Satt595, Ρ10782Α-1, Ρ3436Α-1, Ρ10598Α-1, Satt334, SattSlO, SattSlO, Sattl44, Satt522, Satt522, P9026A-1, P10646A-1, P5219A-1, P7659A-2, Satt570, Satt356, Sattl30, SattllS, Satt594, Satt533, Satt303, Satt352, Satt566, Satt.199, Satt503, Satt517, Sattl91, SAT_117, Satt353, Satt442, Satt279, Satt314, Sattl42, Sattl81, Satt367, Sattl27, SCTT012, Satt270, Satt292, Satt440, P10640A-1, Satt249, SAG1223, SAC1699, SCT_065, Satt596, Satt280, Satt406, Satt380, Sattl83, Satt529, Satt431, Satt242, Sattl02, Satt441, Satt544, Satt617, Satt240, P10618A-1, Satt475, .Sattl96, SAT_301, Satt523, Satt418, Satt418, Satt398, Satt497, Satt28 4, Sattl66, Satt448, Satt373, Satt513, P12394A-1, Satt590, Satt567, Satt220, SAG1048, Satt536, Sattl75, Satt677, Satt680, P10615A-1, Satt551, Satt250, Satt346, Satt336, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, Satt584, SAT_084, P3050A-2, SAT_275-DB, Satt387, Satt549, Satt660, Satt339, Satt255, Satt257, Satt358, P12396A-1, Satt487, Satt259, Satt259, Satt347, Satt420, Satt576, Satt550, Satt633, Satt262, Satt473, Satt477, Satt581, P11070A-1, Sattl53, Satt243, P8230A-1, P10623A-1, P10632A-1, P10793A-1, P12391A-1, P13560A-1, P13561A-1, P13561A-1, P2481A-1, S60021-TB, S60048-TB, S60076-TB, S60148-TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S60505-TB, S60513-TB, S60519-TB, S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812-TB, SAC1677, SAC1724, SAG1055, Satt040, Sattl08, Sattl09, Sattlll, Sattl76, Sattl76, Satt219, Satt299, e Satt512, ou um subconjunto geograficamente relevante do mesmo, como indicado nas tabelas 3 a 12. Usualmente, o método envolve a detecção de cerca de 10% a cerca de 90% dos marcadores do conjunto. Freqüentemente, são detectados ao menos 50% dos marcadores, isto é, a maioria dos marcadores do conjunto. Em algumas ocasiões, são detectados essencialmente todos os marcadores do conjunto. Cada um dos lócus de marcadores detectado identifica um segmento cromossômico, mostrado como incluindo um elemento genético que contribui para a produtividade aumentada em ao menos uma região de crescimento geográfico. Assim, através da identificação de alelos dos marcadores associados com a produtividade aumentada, são identificadas as sub-linhagens de soja com produtividade elevada. A população de progênie de soja usada pode ser obtida pelo cruzamento de um primeiro progenitor de soja com um segundo progenitor de soja. Alternativamente, a população de progênie pode ser obtida pela autofecundação de um único progenitor de soja. Em algumas concretizações, as sub-linhagens de progênie avaliadas incluem sub-linhagens randômicas. Em algumas concretizações, as sub-linhagens incluem sub-linhagens isogênicas próximas.
Tipicamente, o progenitor de soja é selecionado de uma linhagem elite de germoplasma. Dito progenitor pode ser auto-fertilizado para gerar a progênie. Mais usualmente, nos métodos da invenção, o progenitor de soja é cruzado com uma segunda soja selecionada de uma linhagem elite de germoplasma diferente. Alternativamente, o progenitor de soja pode ser cruzado com uma soja com uma linhagem exótica de germoplasma. A linhagem elite de germoplasma é tipicamente selecionada dentre as seguintes linhagens de germoplasma: 90A07, 90B11, 90B31, 90B43, 90B72, 90B73, 91B01, 91B12, 91B33, 91B52, 91B53, 91B64, 91B91, 91B92, 92B05, 92B12, 92B23, 92B38, 92B52, 92B63, 92B74, 92B75, 92B84, 92B95, 92M30, 92M31, 92M70, 92M71, 92M72, 92M80, 92M91, 93B01, 93B09, 93B11, 93B15, 93B25, 93B26, 93B36, 93B41, 93B45, 93B46, 93B66, 93B67, 93B68, 93B72, 93B82, 93B84, 93B85, 93B86, 93B87, 93M10, 93M30, 93M40, 93M50, 93M60, 93M80, 93M90, 93M92, 93M93, 94B01, 94B23, 94B24, 94B53, 94B54, 94B73, 95B32, 95B33, 95B34, 95B53, 95B95, 95B96, 95B97, 96B21, 96B51, 97B52, 97B61, A1395, A2722, A2835, A2943, A3127, A3237, A3242, A3322, A3431, A4009, A4138, A4415, A4595, A4715, A5403, A5560, A5843, A5885, A5979, A5980, A6297, BEDFORD, CM428, CX105, CX232, CX253, CX289, CX394C, CX469C, D00566D362, ESSEX, EX04C00, EX06AOO, EX10F01, EX13P01, EX13Q01, EX15N01, EX16N00, EX16P01, EX22Y01, EX22Z01, EX23B03, EX34T03, EX35F03, EX36Y01, EX39E00, EX40T03, EX44V03, FORREST, G3362, HS93-4118, HUTCHESON, JIM, KORADA, M015733, M0400644-02, M0413735-11-52, M0501577-27-23, MO505469-61-89, MP39009, P1677, P9007, P9008, P9041, P9042, P9061, P9062, P9063, P9071, P9092, P9132, P9141, P9151, P9163, P9182, P9203, P9233, P9244, P9273, P9281, P9305, P9306, P9321, P9341, P9392, P9395, P9481, P9482, P9492, P9521, P9552, P9561, P9584, P9591, P9592, P9594, P9631, P9641, PHARAOH, RA451, R01154R002, S0066, S03W4, S0880, S1550, S1990, S19T9, S20F8, S22C3, S24L2, S25J5, S32Z3, S33N1, S38T8, S3911, S4250, S42H1, S43B5, S5960, S6189, S6262, ST0653, ST1073, ST1090, ST1570, ST1690, ST1970, ST2250, ST2488, ST2660, ST2686, ST2688, ST2788, ST2870, ST3171, ST3380, ST3630, ST3660, ST3870, ST3883, TRACY, TRAILL, X9916, YB03E00, XB03F01, XB07E01, XBlODOl, XB15M01, XB19U04, XB20M01, XB22C04, XB22R01, XB23W03, XB23Y02, XB25E02, XB25L04, XB25X04, XB25W01, XB26L04, XB27P04., XB29A04, XB29D01, XB29K04, XB29L04, XB30E04, XB31C01, XB31R04, XB33B, XB34D04, XB34F01, XB35D, XB35L04, XB35W00, ΧΒ38Δ01, XB41M01, XB42J00, XB42M01, XB48H01, XB54K01, XB55J01, XB58P99, XB63D00, XB67A00, YB03G01, YB08D01, YB09F01, YB09G01, YBIOEOI, YB11D01, YB14H01, YB15K99, YB21F01, YB21G01, YB22S00, YB22V01, YB22W01, YB22X01, YB24Z01, YB25R03, YB25R99, YB25X00, YB25Y01, YB25Z01, YB27L03, YB27S00, YB27X01, YB27Y01, YB28A03, YB28N01, YB29H01, YB29J01, YB29T04, YB30J01, YB30N01, YB30P01, YB31E01, YB32K01, YB33K01, YB34H01, YB34R03, YB34S03, YB35C01, YB36E03, YB36V00, YB38E03, YB38G03, YB39M01, YB39V03, YB40M01, YB40N01, YB41Q01, YB48L01, YB52J00, YB53E00, YB54HOO, YB54J00, YB54L00, YB55H00, YB56E00, YB60N01, e YOUNG.
Em algumas concretizações, os métodos incluem a transmissão eletrônica ou o armazenamento eletrônico de dados representando os alelos de marcadores, ou formas alélicas ou segmentos cromossômicos determinados em um meio de leitura computacional. Dessa forma, outro aspecto da invenção inclui sistemas computacionais, incluindo dispositivos de entrada de dados para a inserção de dados genotipicos e um meio de leitura computacional incorporando os dados genotipicos correspondendo aos marcadores da invenção. São também uma característica da invenção os meios de leitura computacionais incluindo os dados genotipicos.
Em algumas concretizações, os métodos incluem, adicionalmente, a seleção de ao menos uma planta das sub-linhagens de soja identificadas. A planta selecionada pode ser uma planta inteira, um órgão de planta, uma semente de planta, uma célula de planta, uma cultura de tecido de planta ou semelhantes. Opcionalmente, a planta de soja selecionada ou sua progênie é cruzada com uma segunda planta de soja. Tipicamente, a segunda planta de soja não possui o alelo do lócus de marcador determinado (ou a forma alélica do segmento cromossômico). Em algumas concretizações, a segunda planta de soja é de uma linhagem elite de germoplasma. Em outras concretizações, a segunda planta de soja é de uma linhagem exótica de germoplasma. São também uma característica da invenção plantsa de soja com produtividade aumentada produzidas de acordo com os métodos da invenção.
Em outro aspecto, a invenção inclui conjuntos de marcadores úteis para a identificação de plantas de soja com produtividade aumentada. Os conjuntos de marcadores incluem marcadores selecionados do conjunto de marcadores incluindo: Satt684, Sattl65, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, Satt385, Satt225, Satt236, SattSll, P12390B-1, Satt480, Satt632-TB, Satt233, Satt327, Satt329, Satt508, P10635A-1, Satt409, Satt228, Satt429, Satt426, Satt509, SAT_261, Sattl97, Satt519, Satt597, SCT_026, Satt415, Satt583, Satt430, P12198A-1, P8584A-1, Satt359, P10648A-1, P12105A-1, Ρ10641Α-1, Sattl68, Satt556, Satt272, Satt020, Satt066, Satt534, P10638B-2, Satt399, Satt361, P10639A-1, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt227, Satt640-TB, Satt422, Satt457, Satt457, Satt557, Satt319r SAT_142-DB, Satt460, P13073A-1, Satt307, SCT_028, Satt433, Satt357, Satt321, Satt267, Satt383, Satt295, Satt203, Satt507, SAT__110, Ρ10620Ά-1, Sattl29, Sattl47, Satt216, SAT_351, P10621B-2, Satt701, Satt634, Satt558, Satt266, Satt282, Satt537, Satt506, Satt546, P13072A-1, Satt582, Satt389, Satt461, Satt311, Satt514, Satt464, Satt662, Satt543, Sattl86, Satt413, Satt672, P13074A-1, P10624A-1, Satt573, Satt598, Satt204, Satt263, Satt491, Satt602, Sattl51, Satt355, Satt452, SAT_273-DB, Sattl46, Sattl93, Satt569, Satt343, Satt586, Satt040, Satt423, Satt348, Satt595, P10782A-1, Ρ3436Ά-1, P10598A-1, Satt334, SattSlO, SattSlO, Sattl4 4, Satt522, Satt522, P9026A-1, P10646A-1, P5219A-1, P7659A-2, Satt570, Satt356, Sattl30, Sattllõ, Satt594, Satt533, Satt303, Satt352, Satt566, Sattl99, Satt503, Satt517, Sattl91, SAT_117, Satt353, Satt442, Satt279, Satt314, Sattl42, Sattl81, Satt367, Sattl27, SCTT012, Satt270, Satt292, Satt440, P10640A-1, Satt249, SAG1223, SAC1699, SCT_065, Satt596, Satt280, Satt406, Satt380, Sattl83, Satt529, Satt431, Satt242, Sattl02, Satt441, Satt544, Satt617, Satt240, P10618A-1, Satt475, Sattl96, SAT_3 01, Satt523, Satt418, Satt418, Satt398, Satt497, Satt284, Satt166, Satt448, Satt373, Satt513, P12394A-1, Satt590, Satt567, Satt220, SAG1048, Satt536, Sattl75, Satt677, Satt680, P10615A-1, Satt551, Satt250, Satt346, Satt336, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, Satt584, SAT_084, P3050A-2, SAT_275-DB, Satt387, Satt549, Satt660, Satt339, Satt255, Satt257, Satt358, P12396A-1, Satt487, Satt259, Satt259, Satt347, Satt420, Satt576, Satt550, Satt633, Satt262, Satt473, Satt477, Satt581, P11070A-1, Sattl53, Satt243, P8230A-1, P10623A-1, P10632A-1, P107 93A-1, P12391A-1, P13560A-1, P13561A-1, P13561A-1, P2481A-1, S60021-TB, S60048-TB, S60076-TB, S60148-TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S60505-TB, S60513-TB, S60519-TB, S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812-TB, SAC1677, SAC1724, SAG1055, Satt040, Sattl08, Sattl09, Sattlll, Sattl76, Sattl76, Satt219, Satt299, e Satt512. Tipicamente, é selecionado um subconjunto de marcadores mostrados como sendo relevantes em uma região de crescimento geográfico, como indicado nas tabelas 3 a 12. Por exemplo, em um programa de melhoramento projetado para desenvolver linhagens de soja com produtividade aumentada na Região Central {por exemplo, lowa), é preferido um conjunto de marcadores selecionado dentre o seguinte conjunto de marcadores: Satt642, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, SattSll, P12390B-1, Satt632-TB, Satt429, SAT_261, Sattl97, P10641A-1, Satt556, Satt534, P10638B-2, Satt399. Satt361, P10639A-1, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt640-TB, Satt557, Satt319, SAT_142-DB, Satt460, Satt433, Satt357, Satt321, Satt295, Satt203, Satt507, Sattl29, Sattl47, SAT_351, P10621B-2, Satt558, Satt701, Satt634, Satt582, Satt389, Satt464, Satt662, Satt672, Satt573, Satt598, Satt263, .Satt602, SattlSl, SAT_273-DB, Sattl46, Sattl93, Satt569, Sattl76f Satt343, Satt586, Satt040, Satt595, P10782A-1, Satt334, Sattl44, Satt522, Satt570, Satt356, Satt533, Sattl99, Satt517, Sattl91, SAT_117, Satt279, SattlSl, Sattl27, Satt270, Satt292, SAG1223, SAC1699, SAT_065, Satt596, Satt406, Satt380, Sattl83, Satt529, Satt242, Satt617, Satt240, SAT_301, Satt418, Satt398, Satt497, Sattl66, Satt448, Satt373, Satt513, P12394A-1, SAG1048, Satt536, Sattl75, Satt677, Satt680, P10615A-1, SattSSl, Satt346, Satt336, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, SAT_084, SAT_275-DB, Satt660, Satt339, P12396A-1, Satt358, Satt487, Satt259, Satt420, Satt576, Satt633, Satt477, Satt581, Sattl53, Satt243, P10793A-1, P12391A-1, P12392A-1, P13560A-1, P13561A-1, S60021-TB, S60048-TB, S60076-TB, S60148-TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S60505-TB, S60513-TB, S60519-TB, S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812-TB, SAC1677, SAC1724, SAG1055, Satt040, Sattlll, Sattl76, Satt219 e Satt299. Em algumas concretizações, os marcadores do conjunto sâo selecionados dentre: Satt684, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, Satt632-TB, Satt429, SAT-_261, P10641A-1, Satt556, P10638B-2, Satt399, Satt361, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt640-TB, Satt557, Satt319, SAT_142-DB, Satt321, Satt203, Sattl29, Sattl47, SAT_351, P10621B-2, Satt701, Satt634, Satt582, Satt389, Satt464, Satt662, Satt672, Satt573, Satt598, Satt263, SattlSl, SAT_273-DB, Sattl46, Sattl93, Satt569, Satt343, Satt586, Satt040, Satt595, Satt334, Sattl44, Satt522, Satt570, Satt356, Sattl99, Satt517, Sattl91, Sat_117, Satt279, Sattl81f Sattl27, Satt270, Satt292, SAG1223, SAC1699, Sat_0 65, Satt596, Satt406, Satt380, Sattl83, Satt529, Satt242, Satt617, Satt240, SAT_301, Satt418, Satt398, Satt497, Sattl66, Satt448, Satt373, Satt513, P12394A-1, SAG1048, Satt536, Sattl75, Satt677, Satt680, P10615A-1, Satt551, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, SAT_084, SAT__275-DB, Satt660, Satt339, Satt358, Satt487, Satt487, Satt420, Satt576, Satt633, Satt58l, Sattl53, Satt243, P10793A-1, P13560A-1, P13561A-1, S60021-TB, S60048-TB, S60076-TB, S60148-TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S60505-TB, S60513-TB, S60519-TB, S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812-TB, SACI 677, SAC1724, SAG1055, Sattlll, Satt219 e Satt299. Em certas concretizações, os marcadores são selecionados do conjunto incluindo: Satt684, Satt526, Satt591, Satt385, Satt632-TB, Satt429, SAT-_261, P10641A-1, Satt556, P10638B-2, Sattl90, SAT_311-DB, Satt338, Satt640-TB, Satt557, SAT_142-DB, Satt321, Satt203, Sattl29, SAT_351, Satt701, Satt582, Satt389, Satt464, Satt672, Satt598, Satt343, Satt595, Satt334, Sattl44, Satt522, Satt570, Satt356, Sattl99, Sat_117, Satt279, Sattl81, Sattl27, Satt270, Satt292, SAG1223, Sat_065, Satt529, Satt242, Satt617, SAT_301, Satt398, Satt497, Sattl66, Satt373, SAG1048, Satt680, P10615A-1, SATJ330-DB, P13069A-1, SAT_275-DB, Satt339, Satt487, Satt420, Satt581 e Sattl53.
Tipicamente, o conjunto de marcadores inclui ente cerca de 10% a cerca de 100% dos marcadores mostrados como sendo relevantes em uma região geográfica selecionada. Usualmente, o conjunto inclui entre cerca de 10% a cerca de 90% dos marcadores relevantes. Freqüentemente, o conjunto inclui a maioria dos marcadores relevantes. Em algumas concretizações, o conjunto inclui essencialmente todos os marcadores mostrados como sendo relevantes em uma região geográfica particular.
Breve Descrição das Figuras Figuras IA - E: Ilustração esquemática do mapa genético indicando posições dos marcadores.
Figura 2: Apresentação do mapa genético indicando a posição dos lócus de marcadores associados com a produtividade em Iowa.
Descrição Detalhada Da Invenção A presente invenção provê marcadores de soja associados com lócus importantes para a produtividade de soja. Usando os métodos descritos na patente US 5.437.697, aqui incorporada em sua totalidade para todos os fins, foram conduzidas uma série de tendências de melhoramento para identificar marcadores genéticos que definam regiões do genoma de soja que são importantes para a produtividade. Cada análise identificou lócus que eram afetados pela seleção em uma de sete regiões de crescimento de soja diferentes na América do Norte. Para cada região geográfica, foi escolhida, por um melhorista experiente, uma "população elite" dentre 38 e 86 linhagens elites representativas. Cada linhagem elite foi avaliada por até 309 marcadores moleculares, para determinar seu genótipo alélico em cada um dos 309 lócus genéticos diferentes espalhados pelo genoma da soja.
Adicionalmente, para a determinação dos genótipos dos marcadores para essas linhagens elite, foram genotipados com os mesmos 309 marcadores genéticos os ancestrais "leaf" mais relevantes para cada linhagem elite representativa. Um ancestral "leaf" é um ancestral para o qual são desconhecidos os parentais, onde o pedigree de cada linhagem elite representa um ponto final. A análise de tendência ou viés de melhoramento usa a simulação computacional e a estrutura do pedigree conhecido entre as linhagens elite e os ancestrais "leaf" para determinar a freqüência "esperada" de cada alelo de marcador, dentro de uma população elite que não assuma tendência devido à seleção. A freqüência esperada é meramente a freqüência média com a qual um dado alelo seria esperado na população elite, devido às regras de segregação randômica Mendeliana. A simulação usa os pedigrees atuais de cada linhagem elite, para determinar o percurso que cada alelo deve tomar durante o processo simulado de hereditariedade. Por exemplo, para um cruzamento diplóide biparental ao longo de um pedigree, a simulação assume uma chance de 50 -50 de que um dado alelo parental seja repassado a uma dada progênie a partir daquele cruzamento. Pelo conhecimento dos genótipos dos ancestrais e do pedigree de uma dada linhagem elite, é possível simular a habilidade de cada alelo em herdar características de um outro alelo através de uma estrutura do pedigree, a fim de determinar com que freqüência aquele alelo seria esperado na linhagem elite de acordo com um processo puramente randômico.
Entretanto, o melhoramento de planta não é um processo randômico; os melhoristas selecionam de forma proposital as características que oferecem adaptação e elevada produtividade do grão em regiões geográficas específicas. Os melhoristas indiretamente tendencionam o pool de genes na direção dos alelos que oferecem a melhor produtividade do grão naquela localidade, através da realização de vários ciclos de recombinação genética e seleção dos melhores genótipos para a dada região. Usando essa lógica, qualquer alelo de marcador que tenha sido transmitido de forma hereditária significativamente mais freqüente do que esperado por simulação randômica, deve ocupar uma região genômica (segmento cromossômico) que contribui diretamente ou indiretamente para a elevada produtividade de grão.
Após a identificação de regiões do genoma de soja importantes para a produtividade, usando a análise de Tendência de Melhoramento ("Breeding Bias"), é possível identificar, em linhagens e sub-linhagens de soja dentro de um programa de melhoramento, alelos de marcadores específicos associados com produtividade superior. Na medida em que formas alélicas favoráveis de segmentos cromossômicos estão ligadas aos ou definidas por marcadores genéticos, a seleção acurada baseada no genótipo pode substituir a seleção ineficiente baseada apenas no fenótipo. 0 resultado final é um progresso mais eficiente na direção de um genótipo com formas alélicas favoráveis, no que se refere à produtividade sendo fixada no pool de genes elite.
DEFINIÇÕES
Antes de descrever a presente invenção em detalhes, deve ser entendido que esta invenção não está limitada a sistemas biológicos particulares, por exemplo, linhagens de soja, ou reagentes tais como marcadores particulares, que podem certamente variar. Deve ser, também, entendido que a terminologia aqui usada tem apenas a finalidade de descrever concretizações particulares, não tendo a intenção de ser limitante. Como usado nesta descrição e nas reivindicações anexas, a forma singular "um", "uma" e "o", "a" inclui o plural relacionado, a menos que o contexto nitidamente determine de outro modo. 0 termo pluralidade é usado para indicar "dois ou mais". Assim, por exemplo, referência a "um marcador" inclui um marcador único bem como uma pluralidade de marcadores, tais como dois ou mais marcadores e semelhantes. A menos que seja definido de outra forma, todos os termos técnicos e cientificos usados aqui têm o mesmo significado como comumente entendido por um técnico no assunto à qual a invenção pertence. São descritos aqui métodos e materiais exemplificativos, apesar de quaisquer métodos e materiais similares ou equivalentes àqueles descritos aqui poderem ser usados na prática da presente invenção, tal como marcadores alternativos ou adicionais, ligados fisicamente ou geneticamente aos marcadores (e alelos). Ao descrever e reivindicar a presente invenção, a seguinte terminologia será usada de acordo com as definições apresentadas a seguir. 0 termo germoplasma se refere a um indivíduo, um grupo de indivíduos ou um clone representando um genótipo, uma variedade, espécies ou culturas ou o seu material genético.
No contexto dessa descrição, o termo "produtividade" se refere à produtividade por área unitária de uma planta particular de significado comercial. Por exemplo, a produtividade de soja é usualmente medida em bushels de semente por acre ou toneladas métricas de semente por hectare por estação. A produtividade é afetada por fatores genéticos e ambientais. "Agronômicos", "caracteres agronômicos", e "performance agronômica" se refere aos caracteres (e elementos genéticos no em torno) de uma dada variedade de planta que contribui para a produtividade durante o curso da estação de crescimento. Caracteres agronômicos individuais incluem vigor de emergência, vigor vegetativo, tolerância ao stress, resistência a doenças, resistência a herbicidas, ramificação, frutificação, florescência, conjunto de sementes, tamanhos das sementes, densidade das sementes, percentagem de acamamento de plantas, debulhamento (threshability) e semelhantes. A produtividade é, portanto, o ápice final de todos os caracteres agronômicos. 0 termo "elemento genético" ou "gene" se refere a uma seqüência de DNA hereditária, i.e., uma seqüência genômica com significado funcional. 0 termo "gene" pode ser usado para se referir a, por exemplo, cDNA e/ou mRNA codificado por uma seqüência genômica, bem como àquela seqüência genômica. 0 termo "lócus" se refere a uma localização cromossômica específica no genoma de uma espécie, onde um gene específico pode ser encontrado. O termo "lócus de caractere quantitativo" ou "QTL" se refere a um lócus genético com pelo menos dois alelos que afetam diferencialmente a expressão de um caractere fenotípico em pelo menos um background genético, por exemplo, em pelo menos uma população de melhoramento ou amostra de progênie. O termo segmento cromossômico designa um espalhamento linear contínuo de DNA genômico que reside in planta em um cromossomo único. Estão fisicamente ligados os elementos genéticos ou genes localizados em um segmento cromossômico único. No contexto da presente invenção, os elementos genéticos localizados dentro de um segmento cromossômico estão também geneticamente ligados, tipicamente dentro de uma distância de recombinação genética de menos que ou igual a 10 centimorgans (CM) . Isto é, dois elementos genéticos dentro de um segmento cromossômico sofrem recombinação um com o outro, durante a meiose, a uma freqüência de menos que ou igual a cerca de 10%. "Alelos" se referem a uma dentre duas ou mais seqüências diferentes de DNA em um lócus específico. No exemplo de um lócus específico, onde é localizado um gene para hábito de crescimento, um alelo é uma seqüência de DNA específica que, por exemplo, codifica determinado hábito de crescimento, enquanto o outro alelo é uma seqüência diferente de DNA que codifica hábitos indeterminados de crescimento. Um "alelo favorável" é o alelo de um lócus particular que confere, ou contribui para, um fenótipo agronomicamente desejável, por exemplo, produtividade aumentada. Uma forma alélica favorável de um segmento cromossômico é um segmento cromossômico incluindo uma seqüência de DNA que contribui para performance agronômica superior em um ou mais lócus, fisicamente localizados no segmento cromossômico. "Freqüência alélica" se refere à freqüência (proporção ou percentagem) na qual um alelo está presente em um lócus dentro de um indivíduo, de uma linhagem ou de uma população de linhagens. Por exemplo, em relação ao alelo "A," indivíduos diplóides de genótipo "AA," "Aa," ou "aa" possuem freqüências alélicas de 1,0; 0,5 ou 0, respectívamente. É possível estimar a freqüência de alelos dentro de uma linhagem, através da média das freqüências de alelo em uma amostra de indivíduos da dita linhagem. De maneira similar, é possível calcular a freqüência alélica dentro de uma população de linhagens, pela média de freqüência de alelos das linhagens que fazem a população. Para uma população com um número finito de indivíduos ou linhagens, uma freqüência de alelos pode ser expressa pela contagem de indivíduos ou linhagens contendo o alelo.
Um marcador genético é qualquer fenótipo qualitativamente (discreto) hereditário que possa ser usado para monitorar a segregação de alelos em lócus que são geneticamente ligados ao marcador. Marcadores genéticos incluem características visíveis tais como cor da flor, variantes de enzimas tais como isoenzimas e marcadores moleculares tais como repetições de seqüências simples (SSRs), polimorfismo de nucleotideo único (SNPs), por exemplo, hibridização alelo-especifica (ASH), polimorfismo de comprimento de fragmento de restrição (RFLPs) ou DNA polimórfico amplificado randomicamente (RAPDs), etc. Assim, um "alelo de marcador" ou alternativamente um "alelo de um lócus de marcador" é um dentre uma pluralidade de seqüências nucleotidicas polimórficas de um lócus de marcador. "Marcadores codominantes" revelam a presença de cada alelo (dois por indivíduo diplóide) em um lócus, por exemplo, marcadores SSR, SNP (por exemplo, ASH), RFLP, AFLP. "Marcadores Dominantes" revelam a presença de apenas um alelo único por lócus, por exemplo, marcadores RAPD. A presença do fenótipo de marcador dominante (por exemplo, uma banda de DNA) é uma indicação de que um alelo está presente tanto na condição homozigota quanto heterozigota. A ausência do fenótipo de marcador dominante (por exemplo, ausência de banda de DNA) é uma mera evidência da presença de algum outro alelo indefinido. São igualmente valiosos os marcadores dominantes e codominantes, no caso de populações onde indivíduos são predominantemente homozigotos e os lócus são predominantemente dimórficos. Conforme os indivíduos dentro de uma população se tornam mais heterozigotos e multi-alélicos, os marcadores codominantes tornam-se mais informativos do genótipo do que os marcadores dominantes.
Um conjunto de "marcadores" se refere a uma coleção ou grupo de marcadores, ou aos dados derivados dos mesmos, usados para fins usuais, por exemplo, identificação de plantas de soja com produtividade aumentada.
Frequentemente, os dados são armazenados em um meio eletrônico. Enquanto cada um dos membros do conjunto tem mostrado possuir utilidade com relação ao fim especifico, marcadores individuais selecionados do conjunto bem como dos subconjuntos incluindo alguns, mas não todos os marcadores, são também eficazes no alcance do fim especifico.
Um "mapa genético" é uma descrição das relações de ligação genética entre os lócus em um ou mais cromossomos {ou grupos de ligação) dentro de uma dada espécie, geralmente ilustrado em uma forma diagramática ou tabular. "Mapeamento" é o processo de definição das relações de ligação dos lócus através do uso de marcadores genéticos, populações segregantes para os marcadores e principios genéticos padrões de freqüência de recombinação. Um "mapa de localização" é uma localização designada em um mapa genético, com relação a marcadores genéticos ligados, onde é possível encontrar um marcador específico em uma dada espécie.
Um "genótipo" é a constituição genética de um indivíduo (ou grupo de indivíduos) em um ou mais lócus genéticos. Genótipo é definido pelo(s) alelo(s) de um ou mais lócus que o indivíduo possui hereditariamente de seus parentais. Um "haplotipo" é o genótipo de um indivíduo em uma pluralidade de lócus genéticos. Tipicamente, os lócus genéticos descritos por um haplotipo são fisicamente e geneticamente ligados, isto é, no mesmo segmento cromossômico.
Um indivíduo é "homozigoto" caso ele tenha apenas um tipo de alelo em um dado lócus (por exemplo, um indivíduo diplóide com duas cópias do mesmo alelo em um lócus) . Um indivíduo é "heterozigoto" se mais de um tipo de alelo está presente em um dado lócus (por exemplo, um indivíduo diplóide com uma cópia cada de dois alelos diferentes). 0 termo "homogeneidade" indica que os membros de um grupo possuem o mesmo genótipo em um ou mais lócus específicos. Ao contrário, o termo "heterogeneidade" é usado para indicar que indivíduos em um grupo diferem no genótipo em um ou mais lócus específicos.
Uma "linhagem" ou "cepa" é um grupo de indivíduos de parentesco idêntico que são geralmente endogâmicos em certo grau e são, geralmente, homozigotos e homogêneos na maioria dos lócus.
Uma "linhagem elite" ou "cepa elite" é uma linhagem geneticamente superior que resultou de muitos ciclos de melhoramento e seleção para performance agronômica superior. Estão disponíveis numerosas linhagens elite que são conhecidas daqueles versados na técnica de melhoramento de soja. Uma "população elite" é uma variedade de linhagens elite que pode ser usada para representar o estado da técnica em termos de genótipos agronomicamente superiores de uma dada espécie de cultura, tal como soja. De maneira similar, "um germoplasma elite" ou linhagem elite de germoplasma é uma variedade de germoplasma geneticamente superior, tipicamente derivada de e/ou capaz de levar a uma planta com performance agronômica superior, tal como uma linhagem elite de soja existente ou originalmente desenvolvida.
Em contraste, um "germoplasma exótico" é um germoplasma derivado de uma soja que não pertença a uma linhagem ou cepa elite de germoplasma de soja disponível. No contexto de um cruzamento entre duas plantas de soja ou linhagens de germoplasma, um germoplasma exótico não está relacionado pelo descendente ao germoplasma elite com o qual ele é cruzado. Mais usualmente, o germoplasma exótico não é derivado de qualquer linhagem elite de soja conhecida, mas é selecionado para introduzir novos elementos genéticos (novos alelos) em um programa de melhoramento.
Uma "linhagem ancestral" é uma parental usada como uma fonte de genes para o desenvolvimento de linhagens elite. Uma "população ancestral" é um grupo de ancestrais que tenha contribuído para o volume de variação genética que foi usado para desenvolver as linhagens elite. "Descendentes" são a progênie de ancestrais e podem estar separados de seus ancestrais por muitas gerações de melhoramento. Por exemplo, as linhagens elite são as descendentes de seus ancestrais. Uma "estrutura de .pedigree" define a relação entre um descendente e cada um ancestral que deu origem àquele descendente. Uma estrutura de pedigree pode se estender por uma ou mais gerações, descrevendo relações entre o descendente e seus parentais, avós, bisavós, etc. 0 termo "sub-linhagem" se refere a um subconjunto endogâmico de descendentes que se distinguem geneticamente de outros subconjuntos similarmente endogâmicos que descenderam do mesmo progenitor. Tradicionalmente, uma "sub-linhagem" foi derivada por melhoramento endogâmico da semente oriunda de uma planta de soja individual selecionada e, nas gerações F3 a F5, até que a segregação residual dos lócus seja "fixada" ou fique homozigota através da maioria ou de todos os lócus. As variedades comerciais de soja (ou linhagens) são tipicamente produzidas por agregação ("conjugação") de progênies auto-polinizadas de uma única planta de F3 a F5 a partir de um cruzamento controlado entre 2 parentais geneticamente diferentes. Apesar de a variedade tipicamente parecer uniforme, a variedade de auto-polinização derivada da planta selecionada eventualmente (por exemplo, F8) se torna uma mistura de plantas homozigotas que podem variar em genótipo em qualquer lócus que foi heterozigoto na planta F3 a F5 originalmente selecionada. No contexto da invenção, as sub-linhagens baseadas em marcador, que diferem uma da outra com base no polimorfismo qualitativo ao nível de DNA em um ou mais lócus de marcador específico, são derivados por genotipagem de uma amostra de semente derivada de progênie auto-polinizada individual a partir de uma planta F3-F5 selecionada. A amostra de semente pode ser genotipada diretamente como semente, ou como tecido de planta crescido a partir de tal amostra de semente. Opcionalmente, sementes que compartilham um genótipo comum no lócus especificado (ou mais de um lócus) são conjugadas para prover uma sub- linhagem que é geneticamente homogênea nos lócus identificados como importantes para a produtividade aumentada. 0 termo linhagens "aproximadamente isogênicas" se refere a linhagens que são geneticamente similares uma à outra exceto em um ou em um pequeno número de lócus (por exemplo, em 1, 2, ou cerca de 5 a cerca de 10 lócus genéticos especificados}. Esses podem ser criados como descrito para sub-linhagens baseadas em marcador ou baseadas em diferenças com relação a qualquer um caractere qualitativo que pode servir como um marcador genético eficaz. A similaridade percentual entre linhagens aproximadamente-isogênicas é uma função da similaridade dos parentais do cruzamento original e da geração na qual a auto-polinização é realizada. Na média, a relatividade entre membros de uma dada linhagem endogâmica aumenta 50% com cada ciclo de melhoramento endogâmico, devido a. um aumento de 50% em homozigozidade em cada ciclo de melhoramento endogâmico. A similaridade percentual pode ser mais precisamente determinada com marcadores genéticos que se estendem ao longo do genoma. Nos mesmos casos, linhagens aproximadamente-isogênicas diferem uma da outra em um lócus genético definido. "Segregação transgressiva" é um padrão de hereditariedade que resulta em um fenótipo (por exemplo, desempenho agronômico) de um indivíduo que é mais restrito que qualquer um dos parentais. Por exemplo, com relação ao desempenho agronômico, a segregação transgressiva resulta em uma progênie com produtividade que é maior do que o melhor parental ou menos pior do que um pior parental. A segregação transgressiva desejável é o caso em que a progênie é melhor do que qualquer um parental. A segregação transgressiva também pode ser medida em termos do número de alelos favoráveis que um individuo herda em relação ao número de alelos favoráveis de cada um dos seus parentais. Um "segregante alvo" é uma progênie de um cruzamento especifico que inclui somente alelos favoráveis em cada lócus definido que segrega no cruzamento. 0 segregante alvo, portanto, possui o melhor genótipo possível que pode resultar de um cruzamento entre parentais que diferem em genótipo em lócus conhecidos. 0 "genótipo alvo" se refere a um indivíduo que contém as formas alélicas favoráveis em todos os segmentos de cromossomo ou lócus conhecidos por afetar um caractere ou fenótipo particular, tal como desempenho agronômico. Com relação ao desempenho agronômico, o genótipo alvo é aquele do segregante alvo a partir de um cruzamento entre parentais que se complementam em termos de alelos favoráveis em todos os lócus definidos que afetam o desempenho agronômico.
Uma "avaliação" ou "avaliação genética" ou "avaliação de marcador genético" é o processo de determinar e registrar o genótipo de indivíduos ou linhagens (por exemplo, linhagens ancestral ou elite), em qualquer número de lócus definidos, com o uso de marcadores genéticos. 0 termo "associado com" ou "associado", quando se referir a um ácido nucléico (por exemplo, um marcador genético) e um fenótipo no contexto da presente invenção, se referem a um ácido nucléico e a um caractere fenotípico que estão em desequilíbrio de fase de ligação. 0 termo "desequilíbrio de fase de ligação" ou "desequilíbrio de ligação" se refere a uma segregação não-aleatória de lócus genéticos. Isto implica em que tais lócus estão em suficiente proximidade física ao longo do comprimento de um cromossomo de modo que eles tendem a segregar juntos com uma frequência maior do que a aleatória. 0 termo "geneticamente ligado" se refere a lócus genéticos (incluindo lócus de marcador genético) que estão fisicamente próximos um do outro o suficiente no mesmo cromossomo de modo que eles possuem uma freqüência de recombinação de menos que 0,5. Quando se referir à relação entre dois elementos genéticos, tal como um elemento genético que contribui para a produtividade e um marcador próximo, o "Acoplamento" de ligação de fase indica o estado em que o alelo "favorável" no lócus de produtividade está fisicamente associado na mesma fita de cromossomo em que está o alelo "favorável" do respectivo lócus de marcador ligado. Na fase de acoplamento, ambos os alelos favoráveis são herdados juntos pela progênie que herda aquela fita de cromossomo. Na "repulsão" de ligação de fase, o alelo "favorável" no lócus de produtividade está fisicamente ligado com um alelo "desfavorável" no lócus de marcador próximo, e os dois alelos "favoráveis" não são herdados juntos (ou seja, os dois lócus estão "fora de fase" um em relação ao outro). O termo "fisicamente ligado" é usado para indicar que dois lócus genéticos, por exemplo, dois lócus de marcador, um lócus de marcador e um lócus que contribui para a variação em um fenótipo, estão fisicamente presentes no mesmo cromossomo. Tipicamente, os dois lócus estão localizados em estreita proximidade, de modo que a recombinação entre pares de cromossomos homólogos nâo ocorra entre os dois lócus com alta freqüência. Isto quer dizer que a recombinação entre dois lócus fisicamente ligados tipicamente ocorre com uma freqüência de menos que cerca de 10%, favoravelmente com uma freqüência de menos que 5%, mais favoravelmente com uma freqüência de 2% ou menos ou uma freqüência de 1% ou menos. Portanto, dois lócus que estão localizados no mesmo cromossomo, e a uma distância tal que a recombinação entre os dois lócus ocorre a uma freqüência de menos que 10%, são ditos como "próximos a" um do outro. "Seleção Assistida por Marcador" ou "MAS" se refere à prática de selecionar os fenótipos desejados entre membros de uma população de melhoramento usando marcadores genéticos. A frase "plantas híbridas" se refere a plantas que resultam de um cruzamento entre indivíduos geneticamente diferentes. 0 termo "cruzado" ou "cruzamento", no contexto desta invenção, significa a fusão de gametas, por exemplo, via polinização para produzir a progênie (ou seja, células, sementes, ou plantas] no caso de plantas. O termo engloba ambos cruzamentos sexuados (a polinização de uma planta pela outra) e, no caso de plantas, autofecundação (auto-polinização, ou seja, quando o pólen e o óvulo são da mesma planta). "Acasalamento aleatório" é o acasalamento de indivíduos dentro de uma população de uma maneira que assegure a probabilidade igual de quaisquer dois indivíduos se acasalarem independente do genótipo. "Acasalamento não-aleatório" é qualquer desvio de acasalamento aleatório no qual cruzamentos específicos entre indivíduos ocorrem com maior freqüência do que outros. 0 termo "introgressâo" se refere a transmissão de um desejado alelo de um lócus genético a partir de um background genético para um outro. Por exemplo, a introgressão de um desejado alelo em um lócus especificado pode ser transmitido para pelo menos uma progênie via um cruzamento sexuado entre dois parentais da mesma espécie, onde pelo menos um dos parentais possui o alelo desejado no seu genoma. Alternativamente, por exemplo, a transmissão de um alelo pode ocorrer por recombinação entre dois genomas doadores, por exemplo, em um protoplasto fundido, onde pelo menos um dos protoplastos doadores possui o alelo desejado em seu genoma. O alelo desejado pode ser, por exemplo, um alelo selecionado de um marcador ou QTL ou de um transgene. 0 termo "ácido nucléico", "polinucleotídeo", "sequência de polinucleotídeo" e "seqüêncía de ácido nucléico" se refere a polímeros de desoxirribonucleotídeos ou ribonucleo.tídeos de simples-fita ou de dupla-fita ou quimeras dos mesmos. Como aqui usado, o termo pode adicionalmente ou alternatívamente incluir análogos de nucleotídeos de ocorrência natural tendo a natureza essencial de nucleotídeos naturais e que hibridizam com ácidos nucléicos de simples-fita de uma maneira similar àquela dos nucleotideos de ocorrência natural {por exemplo, ácidos nucléicos de peptideo). A menos que seja indicado de outra forma, uma seqüência particular de ácido nucléico desta invenção opcionalmente engloba seqüências complementares, em adição às seqüências explicitamente indicadas. O termo "homólogo" se refere a seqüências de ácido nucléico que são derivadas de um gene ancestral comum através de processos naturais ou artificiais (por exemplo, são membros da mesma família de genes) e, portanto, tipicamente, compartilham similaridade de seqüências. Tipicamente, ácidos nucléicos homólogos possuem suficiente identidade de seqüência de modo que uma das seqüências ou seu complemento é capaz de seletivamente hibridizar com o outro sob condições seletivas de hibridização. O termo "hibridiza seletivamente" inclui referência à hibridização, sob condições estringentes de hibridização, de uma seqüência de ácido nucléico com uma seqüência alvo de ácido nucléico especificada com um grau detectavelmente maior (por exemplo, pelo menos 2 vezes maior com relação ao background) do que sua hibridização com seqüências de ácido nucléico não-alvo e com a substancial exclusão de ácidos nucléicos não-alvo. Seqüências que hibridizam seletivamente possuem cerca de pelo menos 80% de identidade de seqüência, preferencialmente pelo menos 90% de identidade de seqüência, e mais preferivelmente 95%, 97%, 99%, ou 100% de identidade de seqüência entre si. Um ácido nucléico que apresenta pelo menos algum grau de homologia com um ácido nucléico de referência pode ser único ou idêntico ao ácido nucléico de referência ou sua sequência complementar. O termo "isolado" se refere ao material, tal como um ácido nucléico ou uma proteína, que está parcialmente ou substancialmente isenta de componentes que normalmente o acompanham ou interagem com ele no seu ambiente de ocorrência natural. O material isolado opcionalmente compreende material não encontrado com o material no seu ambiente natural, por exemplo, uma célula. Adicíonalmente, compreende o material que estiver no seu ambiente natural, tal como uma célula, mas tenha sido colocado em um local na célula (por exemplo, genoma ou organela sub-celular) não nativo para um material encontrado naquele ambiente. Por exemplo, um ácido nucléico de ocorrência natural (por exemplo, um promotor) é considerado como isolado se ele estiver introduzido por meios de ocorrência não-natural em um lócus do genoma não nativo para aquele ácido nucléico. Ácidos nucléicos que são "isolados" como aqui definido, são também referenciados como ácidos nucléicos "heterólogos". 0 termo "recombinante", quando se referir a uma espécie molecular, tal como um ácido nucléico ou proteína, indica que o material (por exemplo, um ácido nucléico ou proteina) foi alterado sinteticamente (não-naturalmente) por intervenção humana. A alteração para produzir o material sintético pode ser realizada no material dentro de ou removido do seu ambiente ou estado natural. Por exemplo, um ácido nucléico de ocorrência natural é considerado um ácido nucléico recombinante se ele estiver alterado, ou se ele for transcrito a partir de DNA que tenha sido alterado, por meio de intervenção humana, por exemplo, recombinação realizada na célula da qual ele se origina- Quando o termo "recombinante" é usado no sentido genético clássico, ele se refere a um indivíduo com um dos muitos rearranjos possíveis de genes devido a uma recombinação sexuada natural. Por exemplo, "linhagens endogâmicas recombinantes" ou "RILs" são meramente a variedade de progênie endogâmica oriunda de cruzamentos específicos de parentais divergentes. A maneira na qual o termo recombinante é empregado ficará auto-evidente a partir do contexto de seu uso. 0 termo "introduzido", quando se referir a um ácido nucléico heterólogo ou isolado, se refere à incorporação de um ácido nucléico em uma célula de eucarioto ou procarioto onde o ácido nucléico pode ser incorporado no genoma da célula (por exemplo, cromossomo, plasmídeo, plastídeo ou DNA mitocondrial), convertido era um replicon autônomo, ou expressado transientemente {por exemplo, mRNA transfectado). O termo que inclui tal introdução de ácido nucléico tem o significado como "transfecção", "transformação" e "transdução". 0 termo "célula hospedeira" significa uma célula que contém um ácido nucléico heterólogo, tal como um vetor, e sustenta a replicaçâo e/ou expressão do ácido nucléico. As células hospedeiras podem ser células procaríótícas, tal como E. coli, ou células eucarióticas, tal como células de levedura, de inseto, de anfíbio ou de mamífero. No contexto da presente invenção, uma célula hospedeira eucariótica é mais comumente uma célula de soja. 0 termo planta (ou animal) "transgênica" se refere a uma planta (ou animal) que compreende dentro de seu genoma um polinucleotídeo heterólogo. Geralmente, o polinucleotídeo heterólogo está estavelmente integrado dentro do genoma de modo que o polinucleotídeo é passado para as gerações sucessivas. 0 polinucleotídeo heterólogo pode estar integrado no genoma sozinho ou como parte de um cassete recombinante. "Transgênico" é aqui usado para se referir a qualquer célula, linhagem de célula, tecido, parte ou organismos, o genótipo do qual foi alterado pela presença de ácido nucléico heterólogo incluindo aqueles organismos ou células transgênicas inicialmente assim alteradas, bem como aquelas criadas por cruzamentos ' ou propagação assexuada a partir do organismo ou célula transgênica inicial. 0 termo "transgênico", como aqui usado, nâo engloba a alteração do genoma (cromossômico ou extra-cromossômico) por métodos convencionais de melhoramento (ou seja, cruzamentos) ou por eventos de ocorrência natural, tal como cruzamento-fertilização aleatória, infecção viral com ácidos nucléicos não-recombinantes, transformação bacteriana com ácidos nucléicos não-recombinantes, transposição com ácidos nucléicos não-recombínantes, ou mutação espontânea. Exemplos de processos pelos quais um organismo transgênico pode ser produzido estão descritos mais adiante, e incluem eletroporação, microinjeção, transformação Agrobacterium-mediada, métodos de biobalística, técnicas in planta, e semelhantes. 0 termo "planta" inclui qualquer dentre: plantas completas, órgãos de planta (por exemplo, folhas, caules, raizes, etc), tecidos, sementes, células de planta, e/ou progênie da mesma. Semelhantemente, "célula de planta", como aqui usado, inclui, sem limitação, sementes, culturas em suspensão, embriões, regiões meristemáticas, tecido de calo, folhas, raizes, brotações, gametófitos, esporófitos, pólen e micrósporos. Adicionalmente, o termo "planta" engloba representações in silico de parte ou o todo de uma constituição genética de planta.
INTRODUÇÃO A presente invenção é direcionada para a necessidade de, no campo da agricultura, desenvolver mais eficientemente plantas de soja tendo desempenho agronômico superior. Desempenho agronômico superior, como medido por produtividade aumentada de soja, é uma função de diversos fatores, tais como vigor de surgimento de muda, resistência ao estresse ambiental, resistência a pragas, resistência a inseto, resistência a doença, capacidade de extrair nutrientes do solo, capacidade de produzir flores, capacidade de fotossíntese, e capacidade de transportar fotosíntato para o grão, etc. Como aqui descrito, os lócus genéticos associados a desempenho agronômico superior têm sido identificados por meio de análise de uma pluralidade de programas de melhoramento de soja (alguns dos quais jã duram mais de 70 anos) em uma diversidade de zonas geográficas nos Estados Unidos e Canadá. 0 germoplasma de soja que possui desempenho agronômico superior (com relação a seus parentais e irmãos germanos desenvolvidos nesses mesmos programas de melhoramento) apresenta uma retenção estatisticamente significativa de formas alélicas particulares (alternativamente, "alelos") englobadas dentro dos segmentos cromossômicos da presente invenção. Esta associação estatística altamente significativa demonstra que os lócus dentro desses segmentos cromossômicos estão ligados (geneticamente e fisicamente) a elementos genéticos associados com os vários caracteres envolvidos na determinação da produtividade de soja no contexto de modernas práticas agrícolas.
Coletivamente, os atributos favoráveis correspondentes a tais caracteres estão descritivamente referidos como "desempenho agronômico superior" e contribuem para uma produtividade aumentada. Conseqüentemente, os marcadores moleculares localizados dentro desses segmentos cromossômicos podem ser usados para definir (e identificar) plantas de soja com desempenho agronômico superior, e em seleção assistida por marcador ("MAS") e estratégias de melhoramento assistidas por marcador {alternativamente referidas como "melhoramento molecular") para criar plantas de soja com desempenho agronômico superior. Além disso, os segmentos cromossômicos englobando os elementos genéticos associados com o fenótipo de desempenho agronômico superior podem ser isolados e transformados em soja ou outras espécies de plantas monocotiledôneas ou dicotiledôneas. A metodologia usada para identificar esses segmentos cromossômicos, referidos como "Tendência de Melhoramento - Breeding Bias" é discutida na patente US 5.437.697 de Sebastian et al., referência que é aqui incorporada em sua integralidade para todas as finalidades.
Em resumo, os lócus (por exemplo, marcadores e segmentos cromossômicos englobando elementos genéticos que contribuem para o desempenho agronômico superior) que foram afetados pela seleção para desempenho agronômico, são identificados pela comparação do genótipo de modernas linhagens elite com aquelas de seus ancestrais. Em razão de ser conhecido o fato de que a soja domesticada possui um pool de genes suficientemente estreito e ter sido selecionada para padrões razoavelmente estringentes, um número relativamente pequeno de linhagens elite é adequado para identificar regiões cromossômicas relevantes associadas com desempenho agronômico superior. A identidade de linhagens elite usadas para cada região geográfica é indirada na Tabela 1. <1 Com base na seleção de linhagens elite, é identificada a população ancestral relevante, por exemplo, ancestrais que foram usados mais freqüentemente pelos melhoristas para desenvolver a população elite. É obtido um pedigree que rastreia a relação entre cada linhagem elite e seus ancestrais conhecidos mais iniciais, e a contribuição genética de cada ancestral é convertida em uma representação proporcional ou percentagem, presumindo que na média 50% do genoma de cada parental é passado para cada progênie como um resultado de um cruzamento duplo com um outro parental. Pelo rastreamento do pedigree, no sentido para o início, até que nenhum ponto de ramificação seja encontrado, os ancestrais conhecidos mais iniciais podem ser identificados e pode ser calculada sua contribuição para cada linhagem elite. Os cálculos são realizados, geralmente, em um formato computadorizado, para cada uma das linhagens elite incluída na pesquisa genética.
Uma vez que a elite apropriada e linhagens ancestrais tenham sido escolhidas, o genótipo de cada linhagem é determinado através do uso de marcadores genéticos. Os marcadores genéticos incluem qualquer fenótipo qualitativo que tenha sido usado como uma medida direta do genótipo em um lócus específico. Os marcadores incluem caracteres visuais tais como cor de flor, variantes de enzima tais como isozimas, e marcadores moleculares que possam ser detectados por uma variedade de meios tais como repetições de seqüência simples {SSR), polimorfismo de nucleotídeo simples (SNP), hibridização específica de alelo (ASH), polimorfismo de comprimento de fragmento de restrição (RFLP), seqüências variáveis amplificadas, polimorfismo de conformação de simples fita (SSCP), polimorfismo de comprimento de fragmento amplificado (AFLP) e DNA polimórfico aleatoriamente amplificado (RAPD).
Independentemente de que marcadores são usados para monitorar o genótipo, o resultado final é um genótipo de marcador para cada uma entre elite e linhagens de ancestral. 0 genótipo de cada linhagem é meramente uma indicação de quais alelos a linhagem possui em qualquer número de lócus definido pelos marcadores genéticos.
Uma vez que tenham sido determinados os genótipos das linhagens ancestral e elite, são usadas análises estatísticas para se determinar se a seleção para desempenho agronômico superior favoreceu alelos particulares em certos lócus. A primeira estatística para se calcular é a probabilidade de se encontrar cada alelo dentro da população elite, supondo que a seleção não tenha efeito na freqüência de alelos. Esta freqüência de alelos esperada dentro da população elite serve como base para comparação com a freqüência de alelos observada. A freqüência de alelos esperada dentro da população elite é uma função do genótipo de cada ancestral e dos pedigrees das linhagens representativas da população elite. Em uma população de igualdade aleatória, a freqüência de alelos entre os descendentes deve ser semelhante à freqüência de alelos entre os ancestrais, a menos que o melhoramento e a seleção tenham favorecido alelos particulares. No entanto, na medida que o melhoramento de muitas culturas {incluindo soja} não é feita através de igualdade aleatória, pode-se usar o pedigree de cada descendente (por exemplo, linhagem elite) para calcular a probabilidade de herdar um dado alelo de seus ancestrais. Dentro de populações de igualdade nâo-aleatória, a freqüência de alelos esperada pode ser obtida pelo cálculo da média das probabilidades individuais de herdar um alelo ao longo de qualquer número de descendentes (que podem diferir muito em pedigree).
Pela comparação da freqüência observada de um dado alelo na população elite para a probabilidade média de herdar aquele alelo (ou seja, comparando a contagem observada com a contagem esperada), pode-se determinar quais lócus foram afetados pela seleção histórica de caracteres agronômicos. Os alelos favoráveis são identificados como aqueles que foram herdados mais freqüentemente do que o que seria esperado (ou seja, foram favorecidos por seleção). Os alelos desfavoráveis são aqueles herdados menos freqüentemente do que o que seria esperado (ou seja, selecionados contra). Um teste estatístico é, então usado, por exemplo, como descrito em detalhe na patente US 5.437.697, para determinar a significância de uma diferença entre a freqüência de alelos observada e esperada.
De acordo cora esses métodos, foram identificados os lócus e alelos com desvios significativos a partir da freqüência de alelos esperada correlacionada com o desempenho agronômico superior, em diferentes ambientes de crescimento. Esses lócus podem ser usados para definir e identificar, bem como selecionar, soja com desempenho agronômico superior. Por exemplo, os marcadores aqui revelados podem ser usados para: (1) identificar germoplasma de soja com desempenho agronômico superior e/ou aperfeiçoado, por exemplo, com relação às linhagens de soja presentemente existentes ou as parentais; (2) identificar parentais que produzirão segregantes transgressivos superiores; (3) selecionar linhagens superiores a partir de cruzamentos que são segregantes em lócus (por exemplo, lócus QTL) os quais contribuem para o desempenho agronômico superior; (4} selecionar parentais que produzirão os melhores híbridos;· (5) purificar linhagens heterogêneas, ou seja, pela seleção de somente aqueles indivíduos que incluem o{s) alelo(s) favorável(eis) em lócus que são ainda segregantes dentro da linhagem; (6) selecionar e manter a heterogeneidade desejável; (7) manter os alelos favoráveis em lócus múltiplos que foram reunidos por muitos anos de seleção enquanto se incorporam alelos exóticos a partir de novo germoplasma em outros lócus; (8) testar os efeitos da substituição por alelo exótico em lócus que provaram ser importantes para a domesticação, por exemplo, no evento em que um alelo exótico provê melhor desempenho agronômico no lócus identificado por tendência de melhoramento; e, (9) em qualquer processo, onde é necessário priorizar quais lócus são mais importantes para a adaptação agronômica do que os lócus aleatórios dentro do genoma.
MARCADORES E ALELOS CORRELACIONADOS COM DESEMPENHO AGRONÔMICO SUPERIOR EM SOJA
Em ura aspecto, a presente invenção provê lócus de marcador correlacionados com desempenho agronômico superior em soja. Espera-se que cada um dos marcadores identificados esteja em estreita proximidade física e genética (ou seja, ligados fisicamente e geneticamente) a um elemento genético, por exemplo, ou lócus de caractere quantitativo ou QTL, que contribui para o desempenho agronômico superior. Se um marcador particular não estiver próximo a um QTL importante, o período estendido de seleção recorrente (anos 70+ para soja) deve ter provido muitas oportunidades para o Crossing over (permuta) entre o marcador e o QTL. Isto deve resultar em dissociação entre o alelo de marcador e o alelo de QTL, resultando em "equilíbrio de ligação" e estimativas estatisticamente não-significativas de correlação entre o marcador e a produtividade, ou seja, LOD ou escores de probabilidade. A Tendência de Melhoramento não detecta marcadores fracamente ligados, quer dizer, marcadores que estão distantes de lócus importantes, mesmo se ambos, marcador e elemento genético {por exemplo, QTL) que contribuem para a produtividade, forem encontrados no mesmo cromossomo. Adicionalmente, na medida que milhares de diferentes ambientes foram amostrados para testar a performance durante cada ciclo de seleção, os alelos que provêem adaptação para uma ampla faixa de ambientes serão mais facilmente identificados. Os alelos que são somente favoráveis sob raras condições ambientais não aumentarão consistentemente em freqüência devido à seleção em diferentes ambientes e, portanto, não serão detectados pela análise de tendência de melhoramento. Além disso, o estreito pool de genes e a elevada correlação dentre o germoplasma de soja elite compartilhado por ambas instituições pública e privada (Delanney et al, 1983, Crop Science 23:944-949) atuam para homogeneizar o pool de genes e tornar as associações marcador-QTL mais confiáveis. Considerados em conjunto, esses aspectos, em combinação com o grande conjugado de dados analisados pelo método de tendência de melhoramento, asseguram que o QTL com uma contribuição substancial para a produtividade esteja localizado em estreita proximidade com relação aos marcadores aqui revelados.
Conseqüentemente, cada um dos marcadores revelados define um segmento de cromossomo associado com um elemento genético, por exemplo, um QTL que contribui para o desempenho agronômico superior. Os especialistas na técnica saberão reconhecer que para cada um dos segmentos cromossômicos que engloba o QTL relacionado com produtividade, a identificação e/ou seleção do QTL é otimizado por meio do uso de um marcador genético que está tão próximo quanto possível do lócus de QTL real que é responsável pelo fenótipo em questão. Portanto, um marcador "perfeito" deve ser aquele que está localizado dentro do elemento genético ou QTL em si, e corresponde ao polimorfismo de DNA que é responsável pelo fenótipo superior. Quer dizer, o polimorfismo de marcador é a mutação que ressalta o melhoramento em produtividade. Entretanto, na medida que a maioria dos marcadores genéticos disponível para soja consiste de RFLPs, SSRs, RAPDs e SNPs de função desconhecida, seria altamente improvável que um dado marcador oriundo daqueles correntemente disponíveis já fosse "perfeito". Apesar disso, os marcadores aqui descritos constituem um conjunto de ferramentas para detectar importantes segmentos cromossômicos compreendendo QTL associado com produtividade. Esses marcadores estão suficientemente perto do seu respectivo QTL ligado para detectar uma mudança estatisticamente significativa na freqüência de alelos (devido à seleção) durante 70 anos de seleção recorrente para produtividade, portanto, são utilizáveis para os propósitos de identificar germoplasma desejável e para a MAS. Adicionalmente, esses marcadores são úteis para identificar marcadores adicionais, por exemplo, incluindo um marcador "perfeito" dentro do gene de QTL de interesse.
As Tabelas de 3 a 12 revelam moléculas exemplificativas, as quais definem os segmentos cromossômicos que são concretizações da presente invenção. Cada uma das Tabelas de 3 a 12 provê lócus de marcador e alelos favoráveis, identificados por Tendência de Melhoramento, relevantes em um ambiente de crescimento especificado distinguido por região geográfica.
Os marcadores exemplificativos providos nas Tabelas de 3 a 12 identificam segmentos cromossômicos incluindo elementos genéticos (genes) importantes para produtividade em soja. Os segmentos cromossômicos da presente invenção são comprimentos contíguos de cromossomo delimitado por uma freqüência de crossover especificada ou distância de mapa (centimorgans ou CM) a partir de um marcador molecular da presente invenção. Os segmentos cromossômicos da presente invenção estão delimitados por uma freqüência de crossover de até cerca de 10%, ou seja, 10 CM, a partir de um lócus de marcador conhecido como estando associado a desempenho agronômico superior, por exemplo, Sattl65; Satt042; Satt364; Satt454; Satt526; Satt300; Satt591; Sattl55; Satt385; Satt5U; P12390B-1; Satt327; Satt329; Satt508; P10635A-1; Satt409; Satt228; Satt429; Satt509; Sattl97; SCT_026; Satt415; Satt583; Satt430; P12198A-1; P8584A-1; Satt359; P10648A-1; P10641A-1; Sattl68; Satt556; Satt272; Satt020; Satt534; P10638B-2; Satt399; Satt361; P10639A-1; Sattl90; Satt338; Satt227; Satt457; Satt557; Satt319; Satt460; Satt307; SCT_028; Satt433; Satt357; Satt321; Satt267; Satt295; Satt203; Satt507; SAT_110; P10620A-1; Sattl29; Sattl47; Satt216; P10621B-2; Satt558; Satt266; Satt282; Satt537; Satt506; P13072A-1; Satt582; Satt389; Satt461; Satt514; Satt464; Satt543; P13074A-1; P10624A-1; Satt573; Satt598; Satt204; Satt263; Satt491; Satt602; SattlSl; Satt355; Satt452; Sattl46; Sattl93; Satt569; Satt343; Satt586; Satt423; Satt348; Satt595; P10782A-1; P3436A-1; Satt334; Satt510; Sattl44; Satt522; P9026A-1; P10646A-1; P5219A-1; P7659A-2; Satt570; Satt356; Sattl30; SattllS; Satt594; Satt533; Satt303; Satt352; Satt566; Sattl99; Satt503; Satt517; Sattl91; SATJL17; Satt353; Satt442; Satt279; Satt314; Sattl81; Satt367; Sattl27; Satt270; Satt440; P10640A-1; Satt249; SCT_065; Satt596; Satt280; Satt406; Satt380; Sattl83; Satt529; Satt431; Satt242; Sattl02; Satt240; P10618A-1; Satt523; Satt398; Satt497; Sattl66; Satt448; Satt373; Satt513; P12394A-1; Satt590; Satt220; Satt536; Sattl75; P10615A-1; Satt250; Satt346; Satt336; P13069A-1; P5467A-1; Satt584; SAT_084; Satt387; Satt339; P12396A-1; Satt487; Satt259; Satt347; Satt420; Satt576; Satt550; Satt262; Satt473; Satt477; Satt581; P11070A-1; Sattl53; Satt243; P8230A-1; P10623A-1; P10632A-1; P12391A-1; P12392A-1; P13560A-1; P13561A-1; p2481A-l; SAC1677; Satt040; Sattl09; Sattlll; Sattl76; Satt219; Satt299; e Satt512. O elemento genético que contribui para a produtividade pode estar localizado em qualquer porção do segmento cromossômico definido por esses marcadores moleculares. Por exemplo, um gene codificante de uma função que conduz à produtividade aperfeiçoada pode residir dentro do segmento cromossômico que fica a uma distância de menos que 1 CM (a uma distância que resulta em recombinação de menos que 1% de eventos mitóticos), ou a qualquer distância entre cerca de 1 CM e 10 CM, por exemplo, valores de aproximadamente 2 CM, 3 CM, 4 CM, 5 CM, 6 CM, 7 CM, 8 CM, ou 9 CM, ou qualquer valor entre cerca de 0 CM e cerca de 10CM. Portanto, um segmento cromossômico é definido como comprimento contíguo do cromossomo que se estende até 10 CM em qualquer das direções a partir de um designado marcador, e incluindo a porção do cromossomo que sofre crossover com o lócus de marcador a uma freqüência de não mais que 10%. Em muitos casos, o segmento cromossômico de interesse é de fato um comprimento contínuo que se estende menos do que 10 CM, ou seja, um comprimento de cromossomo que sofre crossover com o marcador a uma freqüência de menos que 10%, por exemplo, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1% ou menos, ou qualquer valor entre esses. Alternativamente, as distâncias físicas podem ser utilizadas para determinar os segmentos cromossômicos acima mencionados usando um fator de conversão de 1 (um) Mpb (um milhão de pares de bases) para 1 (um) CM de distância de mapa ou 1% (um por cento) de freqüência de crossover. O fator de conversão real de soja varia de cerca de 100 Kpb até próximo de 1 Mpb dependendo da região cromossômica. Conseqüentemente, o fator de conversão arbitrário, mas razoável, de 1 Mpb deve ser entendido no contexto da presente invenção.
Foi demonstrado, por exemplo, por análise de tendência de melhoramento, que os alelos favoráveis exemplificativos de lócus de marcador aqui enumerados estão associados a elementos genéticos que contribuem para a produtividade aperfeiçoada em várias linhagens de soja. Os especialistas na técnica saberão apreciar que esta é uma associação empírica, e que um lócus particular de marcador (e os alelos favoráveis designados do mesmo) são usados para identificar um segmento cromossômico correspondente tendo um elemento genético que contribui para a produtividade. Entretanto, em virtude de um lócus de marcador não ser necessariamente, ou mesmo tipicamente, idêntico ao elemento genético que resulta em produtividade melhorada, em alguma percentagem de cruzamentos, a recombinaçâo genética ocorrerá entre o alelo favorável enumerado e o elemento genético que contribui para a produtividade. Isto não nega a importância tanto do elemento genético como a identificação do lócus de marcador e alelos favoráveis exemplificativos. Quaisquer eventos de recombinaçâo dessa ordem podem ser detectados e a subsequente seleção assistida por marcador pode ser realizada usando o alelo determinado como estando em fase de ligação de acoplamento com o elemento genético favorável como discutido em maiores detalhes no EXEMPLO 4: SEGREGAÇÃO PARA PRODUTIVIDADE EM SUB-LINHAGENS ISO-GÊNICAS PRÓXIMAS, no contexto de detectar polimorfismos residuais associados com produtividade em sub-linhagens iso-gênicas próximas, e no EXEMPLO 5: CONFIRMAÇÃO DE ALELOS USANDO CRUZAMENTOS ALEATÓRIOS.
No contexto da presente invenção, é determinada a forma alélica de múltiplos segmentos cromossômicos, independentemente de o propósito ser para definir o genótipo de uma soja ou para a seleção assistida por marcador (MAS). Na maioria das circunstâncias, é desejável averiguar a forma alélica para uma grande proporção, por exemplo, todos, dos segmentos cromossômicos conhecidos como contribuintes para a produtividade em uma região geográfica particular. Entretanto, em algumas circunstâncias, particularmente quando é sabido que os parentais compartilham alelos favoráveis particulares, pode ser empregado um subconjunto dos segmentos cromossômicos, reduzindo tempo e custos, sem perda de eficiência.
Portanto, no contexto da presente invenção é comum avaliar pelo menos 10%, tipicamente entre pelo menos 10% e cerca de 90% dos segmentos cromossômicos relevantes, por exemplo, para determinar a forma alélica dos lócus de marcador especificados nas Tabelas 3 a 12. Comumente, são determinadas pelo menos cerca de 25%, freqüentemente pelo menos cerca de 50%, com freqüência pelo menos cerca de 75% ou mais das formas alélicas. Por exemplo, pelo menos cerca de 80%, 85%, 90%, 95%, 97%, 98%, 99%. Consequentemente, é geralmente desejável determinar o alelo em uma maioria dos lócus que se mostram relevantes para o desempenho agronômico em uma região geográfica particular ou ambiente de crescimento. Em uma concretização favorável, é determinada a forma alélica de um conjunto de marcadores definindo um conjunto de segmentos cromossômicos que consiste essencialmente dos marcadores que se mostram relevantes para o desempenho agronômico em uma região particular. Um conjunto de marcadores é suposto como consistindo essencialmente dos marcadores relevantes em uma região particular se ele inclui um número suficiente de marcadores para prevenir uma diminuição do fenótipo de produtividade ou para prevenir um decréscimo em eficiência de seleção quando o conjunto de marcadores for usado na seleção marcador assistida. Tipicamente um tal conjunto incluirá pelo menos cerca de 90%, 95%, 97%, 98%, 99% ou mais dos marcadores. Quer dizer, não mais do que 10% dos marcadores que se mostram como relevantes em uma região particular será omitido, por exemplo, não mais do que 5%, 3%, 2%, ou 1% das formas alélicas dos marcadores relevantes será deixado indeterminado.
Tipicamente, os lócus de marcador avaliados mostraram estar correlacionados com o desempenho agronômico superior com uma significância maior que 95%. Freqüentemente, os lócus de marcador são seleciondos de modo que apresentem uma significância maior que 99% dentro de uma região geográfica de interesse. Se desejado, pode ser determinada a forma alélica dos lócus de marcador múltiplos dentro do mesmo segmento cromossômico. Freqüentemente, é determinada a forma alélica de um marcador simples representante do segmento cromossômico.
IDENTIFICAÇÃO DE PQLIMORFISMO RESIDUAL
Os lócus de marcador identificado por Tendência de Melhoramento estão associados com elementos genéticos que contribuem para a produtividade aumentada em soja. Apesar de ter sido verificado que alelos particulares dos lócus de marcador estão estatisticamente correlacionados com produtividade aumentada de acordo com a análise de Tendência de Melhoramento, os alelos em um ou mais lócus de marcador são tipicamente não fixados dentro de uma linhagem elite ou dentre a progênie derivada de um progenitor de soja selecionado de uma estirpe elite de germoplasma. De fato, tais polimorfismos residuais fornecem variação genética valiosa a partir da qual podem ser selecionadas as sub-linhagens melhoradas. Pela identificação de lócus de marcador particulares oriundos do conjunto que mostra estar associado com elementos genéticos que contribuem para a produtividade, pode ser aperfeiçoada a eficiência de seleção.
Para esta finalidade, os lócus de marcador com um ou mais alelos segregantes em uma população de progênie derivada de um progenitor de elite são avaliados para identificar o alelo especifico correlacionado com a produtividade aumentada na população da progênie. Descrições detalhadas de métodos exemplificativos para confirmar o alelo favorável em uma população de progênie são fornecidas nos EXEMPLOS 4 e 5.
DEFINIÇÃO E IDENTIFICAÇÃO DO GERMOPLASMA ALVO
Os lócus de marcador da presente invenção podem ser usados como representantes dos lócus que contribuem para melhorar a produtividade para definir o genótipo de soja teoricamente ótimo ou "alvo". Conseqüentemente, os alelos de lócus de marcador identificados por Tendência de Melhoramento, e confirmados como sendo correlacionados com produtividade aumentada em um dado ambiente ou contexto geográfico podem ser usados para definir ou identificar uma planta de soja com desempenho agronômico superior. Apesar de as linhagens elite existentes incluírem alelos favoráveis em numerosos lócus de marcador (e correspondentes lócus funcionais que contribuem para a produtividade) , nenhuma das linhagens elite existentes ainda incorpora todos os elementos genéticos que contribuem para o genótipo de soja ideal. De fato, antes dos marcadores da presente invenção, não teria sido possível predizer o genótipo de soja ideal (ou definir um genótipo alvo) com relação à produtividade. Portanto, um aspecto da invenção é a definição de um genótipo de soja alvo para o desempenho agronômico superior. Qualquer planta de soja que tenha um número aumentado de formas alélicas favoráveis dos segmentos cromossômicos definidos de acordo com os marcadores da invenção, ou seja, que mais estreitamente se aproximam do genótipo de soja alvo em comparação com as linhagens elite existentes, constitui um aspecto da presente invenção.
Os marcadores e métodos aqui descritos fornecem os meios para identificar e desenvolver plantas de soja tendo o genótipo de soja alvo para o desempenho agronômico superior e genomas tendo quantidades aumentadas de formas alélicas favoráveis dos segmentos cromossômicos relevantes com relação às linhagens elite existentes, e, ou, com relação a qualquer parental que dá origem ao genoma de planta de soja. Consequentemente, os métodos da invenção podem ser usados para produzir composições, incluindo plantas completas, órgãos de planta, sementes, e constituintes genéticos isolados, por exemplo, incluindo o complemento cromossômico inteiro do genoma, ou um subconjunto do mesmo, tal como um cromossomo individual ou fragmento de cromossomo (todos esses que são coletivamente descritos pelo termo "genoma de planta de soja") com um número aumentado de elementos genéticos que contribuem para a produtividade. Os métodos para separar e isolar genomas ou cromossomos individuais são bem conhecidos da técnica e incluem, por exemplo, citometria de escoamento e eletroforese em gel de campo de pulso. Os replicados do genoma de planta de soja estão também englobados dentro do significado do termo genoma de planta de soja. Os replicados são idênticos ou substancialmente idênticos (ou seja, um mutante que surge de divisão mitótica da mesma célula progenitora) ao genoma da planta de soja inicial. Os replicados podem ser criados, por exemplo, por meio de cromossomos artificiais de levedura ou de bactéria ou qualquer um dentre uma variedade de vetores de ácido nucléico ou métodos de replicação tal como PCR (reação em cadeia da polimerase).
Genoma(s) de planta de soja da presente invenção pode(m) ser oriundo(s) de uma planta de soja individual. Como aqui usado, o termo "planta" inclui plantas completas, órgãos de planta (por exemplo, folhas, caules, raizes, etc), sementes, culturas em suspensão, embriões, regiões meristemáticas, tecidos de calo, folhas, raízes, brotações, gametófitos, esporófitos, pólen e mícrósporos. SELEÇÃO e melhoramento marcador assistidos A meta final de qualquer programa de melhoramento é combinar tantos alelos favoráveis quanto possível em variedades elite de germoplasma que sejam geneticamente superiores (com relação a um ou mais caracteres agronômicos) aos seus ancestrais. Os marcadores aqui providos identificam segmentos cromossômicos, ou seja, regiões genômicas, e alelos (formas alélicas) que tenham sido favorecidos por seleção de longo-prazo para produtividade. Conseqüentemente, esses marcadores podem ser usados para seleção marcador assistida de plantas de soja com desempenho agronômico superior. Por exemplo, em um cruzamento entre parentais que complementam alelos favoráveis nos lócus alvo, pode ser selecionada a progênie que inclui alelos mais favoráveis do que ambos os parentais. Tal progênie é predita como sendo fenotipicamente superior a ambos os parentais como ilustrado na Tabela 2. A seleção marcador-assistida (MAS), empregando os marcadores da presente invenção, e os segmentos cromossômicos que eles identificam são utilizáveis no contexto de um programa de melhoramento de soja para aumentar a eficiência em melhoramentos de produtividade. 0 screening fenotípico para um caractere de interesse, tal como a produtividade, para um grande número de amostras pode ser caro, assim como consumir tempo. Adicionalmente, o screening sozinho é freqüententemente não-confiável devido aos efetores de epistase e contribuições não-genéticas (por exemplo, ambiental) para o fenótipo. A MAS oferece a vantagem, em comparação com a avaliação em campo, de que ela pode ser realizada a qualquer tempo do ano independente da estação de crescimento ou estágio de desenvolvimento. Adicionalmente, a MAS facilita a avaliação de organismos crescidos em regiões desiguais ou sob condições diferentes.
Um melhorista de conhecimento comum na técnica, desejando melhorar plantas de soja com produtividade aumentada, pode aplicar os métodos de MAS aqui descritos, usando, por exemplo, os marcadores exemplificativos aqui providos ou os marcadores ligados localizados nos segmentos cromossômicos identificados por marcadores providos nas Tabelas 3 a 12, para derivar linhagens de soja com desempenho agronômico superior.
Os alelos de marcador, por exemplo, os marcadores exemplificativos providos nas Tabelas 3a 12, marcadores ligados, QTL, que identificam os segmentos cromossômicos englobando elementos genéticos que são importantes para a produtividade, são usados para identificar plantas que contêm um genótipo desejado em um ou mais lócus, e que se espera que transfiram o genótipo desejado, em um ou mais lócus, juntamente com um fenótipo desejado, para sua progênie. Os alelos de marcador (ou alelos de QTL) podem ser usados para identificar plantas que contêm um genótipo desejado em um lócus, ou em diversos lócus não-ligados ou ligados (por exemplo, um haplotipo), e que seria esperado transferir o genótipo desejado, juntamente com um fenótipo desejado para sua progênie. De modo semelhante, para identificar plantas com ausência do alelo desejado, as plantas com um fenótipo indesejado, por exemplo, plantas com baixa produtividade, podem ser identificadas, e, por exemplo, eliminadas dos cruzamentos subseqüentes. Deve ficar evidente que para os propósitos da MAS, o termo marcador pode englobar ambos marcador e lócus de QTL na medida que ambos podem ser usados para identificar plantas com um fenótipo desejado.
Por exemplo, a MAS pode ser usada para desenvolver linhagens ou estirpes de soja e germoplasma de soja com desempenho agronômico superior pela identificação de formas alélicas favoráveis de segmentos cromossômicos mostrando ser importantes, por exemplo, que incluem um elemento genético para a produtividade. Alelos favoráveis de marcadores definindo os segmentos cromossômicos de interesse, por exemplo, Satt684, Sattl65, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, Satt385, Satt225, Satt236, Satt511, P12390B-1, Satt480, Satt632-TB, Satt233, Satt327, Satt329, Satt508, P10635A-1, Satt409, Satt228, Satt429, Satt426, Satt509, SAT_261, Sattl97, Satt519, Satt597, SCT_026, Satt415r Satt583, Satt430, P12198A-1,. P8584A-1, Satt359, P10648A-1, P12105A-1, P10641A-1, Sattl68, Satt556, Satt272, Satt020, Satt066, Satt534, PIO 638B-2, Satt399, Satt361, P10639A-1, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt227, Satt640-TB, Satt422, Satt457, Satt457, Satt557, Satt319, SAT_142-DB, Satt460', P13073A-1, Satt307, SCT_028, Satt433, Satt357, Satt321, Satt2 67, Satt383, Satt295, Satt203, Satt507, SAT_110, P10620A-1, Sattl29, Sattl47, Satt216, SAT_351, P10621B-2, Satt701, Satt634, Satt558, Satt266, Satt282, Satt537, Satt506, Satt546, P13072A-1, Satt582, Satt389, Satt461, Satt311, Satt514, Satt464, Satt662, Satt543, Sattl86, Satt413, Satt672, P13074A-1, P10624A-1, Satt573, Satt598, Satt204, Satt263, Satt491, Satt602, Sattl51, Satt355, Satt452, SAT_273-DB, Sattl46, Sattl93, Satt.569, Satt343, Satt586, Satt040, Satt423, Satt348, Satt595, P10782A-1, P3436A-1, P10598A-1, Satt334, SattSlO, Satt510, Sattl44, Satt522, Satt522, P9026A-1, P10646A-1, P5219A-1, P7659A-2, Satt570, Satt356, Sattl30, SattllS, Satt594, Satt533, Satt303, Satt352, Satt566, Sattl99, Satt503, Satt517, Sattl91, SAT_117, Satt353, Satt442, Satt279, Satt314, Satt142, Sattl81, Satt367, Sattl27, SCTT012, Satt270, Satt292, Satt440, P10640A-1, Satt249, SAG1223, SACI 699, SCT_065, Satt596, Satt280, Satt406, Satt380, Satt183, Satt529, Satt431, Satt242, Sattl02, Satt441, Satt544, Satt617, Satt240, P10618A-1, Satt475, Sattl96, SAT_301, Satt523, Satt418, Satt418, Satt398, Satt497, Satt284, Sattl66, Satt448, Satt373, Satt513, Ρ12394Δ-1, Satt590, Satt567, Satt220, SAG1048, Satt536, Sattl75, Satt677, Satt680, P10615A-1, SattSSl, Satt250, Satt346, Satt336, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, Satt584, SAT_0 84, P3050A-2, SAT_275-DB, Satt387, Satt549, Satt660, Satt339, Satt255, Satt257, Satt358, P12396A-1, Satt487, Satt259, Satt259, Satt347, Satt420, Satt576, Satt550, Satt633, Satt262, Satt473, Satt477, Satt581, P11070A-1, Sattl53, Satt243, P8230A-1, P10623A-1, P10632A-1, P10793A-1, P12391A-1, P13560A-1, P13561A-1, P13561A-1, P2481A-1, S60021-TB, S60048-TB, S60076-TB, S60148-TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S60505-TB, S60513-TB, S60519-TB, S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812-TB, SAC1677, SACI724, SAG1055, Satt040, Sattl08, Sattl09, Sattlll, Sattl76, Sattl76, Satt219, Satt299, e Satt512, como enumerados nas Tabelas 3 a 12, são detectados em uma amostra genômica de uma planta de soja.
Por exemplo, em um programa de melhoramento para produzir soja com produtividade aumentada na região de crescimento Central dos Estados Unidos (por exemplo, exemplificado pelas condições de crescimento em Iowa), os marcadores podem ser selecionados do seguinte conjunto de marcadores: Satt642, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, SattSll, P12390B-1, Satt632-TB, Satt429, SAT_261, Sattl97, P10641A-1, Satt556, Satt534, P10638B-2, Satt399. Satt361, P10639A-1, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt640-TB, Satt557, Satt319, SAT_142-DB, Satt460, Satt433, Satt357, Satt321, Satt295, Satt203, Satt507, Sattl29, Sattl47, SAT_351, P10621B-2, Satt558, Satt701, Satt634, Satt582, Satt389, Satt4 64, Satt662, Satt672, Satt573, Satt598, Satt263, Satt602, SattlSl, SAT_273-DB, Sattl46, Sattl93, Satt569, Sattl76, Satt343, Satt586, Satt040, Satt595, P10782A-1, Satt334 f Sattl44, Satt522, Satt570, Satt356, Satt533, Sattl99, Satt517, Sattl91, SATJ.17, Satt279, Sattl81, Sattl27, Satt270, Satt292, SAG1223, SAC1699, SAT_065, Satt596, Satt406, Satt380, Sattl83, Satt529, Satt242, Satt617, Satt240, SAT_301, Satt418, Satt398, Satt497, Sattl66, Satt448, Satt373, Satt513, P12394A-1, SAG1048, Satt536, Sattl75, Satt677, Satt680, P10615A-1, Satt551, Satt346, Satt336, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, SAT_084, SAT_27 5-DB, Satt660, Satt339, P12396A-1, Satt358, Satt487, Satt259, Satt420, Satt576, Satt633, Satt477, Satt581, Sattl53, Satt243, P10793A-1, P12391A-1, P12392A-1, P13560A-1, P13561A-1, S60021-TB, S60048-TB, S60076-TB, S60148-TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S60505-TB, S60513-TB, S60519-TB, S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812-TB, SACI 677, SAC1724, SAG1055, Satt040, Sattlll, Sattl76, Satt219 and Satt299, such as: Satt684, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, Satt632-TB, Satt429, SAT-_261, P10641A-1, Satt556, P10638B-2, Satt399, Satt361, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt640-TB, Satt557, Satt319, SAT_142-DB, Satt321, Satt203, Sattl29, Sattl47, SAT_351, P10621B-2, Satt701, Satt634, Satt582, Satt389, Satt464, Satt662, Satt672, Satt573, Satt598, Satt263, SattlSl, SAT_273-DB, Sattl4 6, Sattl93, Satt569, Satt343, Satt586, Satt040, Satt595, Satt334, Sattl44, Satt522, Satt570, Satt356, Sattl99, Satt517, Sattl91, Sat_117, Satt279, Sattl81, Sattl27, Satt270, Satt292, SAG1223, SAC1699, Sat_065, Satt596, Satt406, Satt380, Sattl83, Satt529, Satt242, Satt617, Satt240, SATJ301, Satt418, Satt398, Satt497, Sattl66, Satt448, Satt373f Satt513, P12394A-1, SAG1048, Satt536, Satt 175, Satt677, Satt680, P10615A-1, Satt551, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, SAT_084, SAT_275-DB, Satt660, Satt339, Satt358, Satt487, Satt487, Satt420, Satt57 6, Satt633, Satt581, Sattl53, Satt243, P10793A-1, P13560A-1, P13561A-1, S60021-TB, S60048-TB, S6007 6-TB, S60148-TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S60505-TB, S60513-TB, S60519-TB, S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812-TB, SAC1677, SAC1724, SAG1055, Sattlll, Satt219 e Satt299. Os marcadores exemplificativos a seguir representam os melhores marcadores para seleção de produtividade na Região Central em cada região de cromossomo: Satt684, Satt526, Satt591, Satt385, Satt632-TB, Satt429, SAT-_2 61, P10641A-1, Satt556, P10638B-2, Sattl90, SAT_311-DB, Satt338, Satt640-TB, Satt557, SAT_142-DB, Satt321, Satt203, Sattl29, SAT_351, Satt701, Satt582, Satt389, Satt464, Satt672, Satt598, Satt343, Satt595, Satt334, Sattl44, Satt522, Satt570, Satt356, Sattl99, Sat_117, Satt27 9, Sattl81, Sattl27, Satt270, Satt292, SAG1223, Sat_065, Satt529, Satt242, Satt617, SAT_301, Satt398, Satt497, Sattl66, Satt373, SAG1048, Satt680, P10615A-1, SAT_330-DB, P13069A-1, SAT_275-DB, Satt339, Satt487, Satt420, Satt581 e Sattl53. Listas de comparação de marcadores podem ser compiladas a partir das Tabelas 3 a 12 ao arbítrio do praticante baseado na região de crescimento desejada.
Uma planta de soja assim identificada pode ser utilizada em um programa de melhoramento de plantas para desenvolver linhagens com produtividade aperfeiçoada. De modo semelhante, a detecção de formas alélicas favoráveis (ou de modo oposto, não-favoráveis) dos segmentos cromossômicos podem ser usados para rastrear o fluxo de alelos era um pedigree de planta de soja para assegurar que o complemento desejado de alelos está incluído ou excluído na(s) planta(s) de soja resultante(s).
Após um desejado fenótipo e um lócus cromossômico polimórfico, por exemplo, um lócus de marcador ou QTL, serem determinados para segregarem juntos (ou seja, são determinados como estando em desequilíbrio de ligação), são selecionados os alelos correspondentes ao fenótipo desejado. Em resumo, um ácido nucléico correspondente a um ácido nucléico de marcador é detectado em uma amostra biológica a partir de uma planta a ser selecionada. Esta detecção pode ter a forma de hibridização de um ácido nucléico de sonda para um marcador, por exemplo, usando hibridização alelo-especifica, análise Southern, análise northern, hibridização in situ, hibridização de primers seguida por amplificação por PCR de um produto incluindo o marcador, ou semelhante. Uma variedade de procedimentos para detectar marcadores é aqui descrita, por exemplo, na seção intitulada "DETECÇÃO DE LÓCUS DE MARCADOR". Após ser verificada a presença (ou ausência} de um marcador particular em uma amostra biológica, a planta é selecionada e, opcionalmente, cruzada para produzir plantas de progênie.
Quando uma população é segregante para múltiplos lócus que afetam um ou múltiplos caracteres, por exemplo, múltiplos lócus envolvidos com resistência a doença única, ou múltiplos lócus envolvidos, cada um envolvido com resistência a diferentes doenças, a eficiência da MAS comparada com o screening fenotipico torna-se ainda maior pelo fato de que todos os lócus podem ser processados juntos no laboratório a partir de uma única amostra de DNA. Portanto, é facilitado o uso da informação de marcador para cada um dos caracteres no processo de melhoramento.
Deve ser considerado o fato de que as plantas positivas para um marcador da invenção podem ser selecionadas e cruzadas de acordo com qualquer protocolo de melhoramento relevante para o programa de melhoramento particular. Consequentemente, a progênie pode ser gerada, a partir de uma planta selecionada, pelo cruzamento da planta selecionada com uma ou mais plantas adicionais selecionadas com base no mesmo marcador ou em um marcador diferente, por exemplo, um marcador diferente correlacionado com desempenho agronômico superior, ou um fenótipo diferente de interesse, por exemplo, resistência a uma doença em particular. Alternativamente, uma planta selecionada pode ser retro-cruzada com um ou ambos parentais. 0 retrocruzamento é usualmente feito com o propósito de realizar a introgressão de um ou uns poucos lócus a partir de um parental doador, por exemplo, um parental doador compreendendo germoplasma exótico, em um background genético de outra forma desejável a partir do parental recorrente (tipicamente, um elite). Quanto mais ciclos de retrocruzamento forem realizados, maior a contribuição genética do parental recorrente para a variedade resultante. Uma planta selecionada pode ser cruzada por alogamia, por exemplo, com uma planta ou linhagem não presente na sua genealogia. Uma tal planta pode ser selecionada dentre uma população submetida a uma rodada prévia de análise, ou pode ser introduzida no programa de melhoramento de novo. Uma planta positiva para um marcador desejado também pode ser auto-cruzada ("autofecundada") para criar uma verdadeira linhagem de melhoramento com o mesmo genótipo.
Nas mesmas circunstâncias, mesmo que o marcador esteja próximo o suficiente de um QTL para detectar tendência de melhoramento, o marcador pode não estar suficientemente próximo para uma MAS confiável. Se um tal marcador estiver suficientemente afastado do QTL de interesse, pode haver Crossing over entre o marcador e o QTL que conduz a ligações de fase de repulsão (na população elite) entre o alelo de marcador, que estava originalmente ligado em acoplamento, com o alelo de QTL favorável. Com o tempo, o lócus de marcador e o lócus de QTL ligado podem alcançar "equilíbrio de ligação" e isto evitará o uso daquele marcador para seleção confiável do alelo de QTL favorável. Para caracteres altamente hereditários, a fase de ligação entre o marcador e o QTL em um dado parental pode ser facilmente determinado através de MAS seguida por caracterização fenotípica. Entretanto, a determinação de fase de ligação para caracteres de baixa hereditariedade {por exemplo, produtividade) é muito mais difícil. De fato, os efeitos de lócus simples na produtividade podem ser extremamente difíceis de medir, mesmo com testes de campo altamente replicados. Adicionalmente, se os genes de produtividade forem altamente hereditários, a seleção contínua para este caractere deve ter "fixado" todos os alelos favoráveis rapidamente e o progresso de produtividade deve ter previamente alcançado um platô. Na medida que o progresso de produtividade estacionário continua na soja, não parece que um "platô de produtividade" tenha ainda sido alcançado (Specht et al., 1999, Crop Science 39:1560-1570). Portanto, muitos dos alelos favoráveis, na maioria dos lócus de produtividade em soja, ainda não estão fixados dentro da população elite. Permanece a questão se os lócus de marcador existentes ainda estão em fase de ligação original com os lócus de QTL. Afortunadamente, os resultados de tendência de melhoramento (breeding bias) aqui discutidos podem ser usados para resolver, de diversas maneiras, o problema de marcadores de gene de produtividade "imperfeitos": a) fase de ligação e determinação do efeito de QTL dentro de cruzamentos específicos antes da MAS, b) uso de marcadores de flanqueamento para predizer quais marcadores ainda estão ligados em acoplamento, e c) ciclos alternantes de MAS e seleção fenotípica.
Fase de ligação e determinação do efeito de QTL dentro de cruzamentos específicos: Em razão de as linhagens de soja elite serem altamente relacionadas, um conjunto relativamente pequeno de linhagens elite contém a maioria dos alelos favoráveis que existem dentro da população elite completa. Portanto, a determinação da fase de ligação entre o marcador e os alelos de QTL nos lócus identificados como importantes para a produtividade pode ser realizada para adicionalmente aumentar a eficiência da MAS no contexto de um programa de melhoramento de soja. A progênie oriunda de parentais que são ambos altamente produtivos e polimórficos para muitos dos lócus de marcador alvo são avaliados com relação à produtividade em um pequeno número de localizações de campo. Usando comparações ortogonais, um lócus por vez, podem ser feitas as predições concernentes às correlações entre alelos de marcador e fenótipo. Por exemplo, se 40 progênies homozigotas aleatórias oriundas de um cruzamento que é segregante em 10 dos lócus alvo forem testadas em campo, na média, 20 das progênies serão homozigotas com relação aos alelos de um parental e 20 serão homozigotas com relação ao alelo do outro parental. Pode-se, então, conjugar os dados de produtividade replicados para linhagens contendo o mesmo alelo de marcador e determinar se a produtividade de dito grupo é estatisticamente diferente da produtividade de linhagens contendo o alelo de marcador alternado. Se assim for, então este marcador deve ser eficaz para seleção dentro daquele cruzamento. Esta comparação é então feita separadamente para cada um dos 10 lócus de marcador segregante para determinar qual conjunto daqueles 10 marcadores deve ser eficaz para seleção dentro daquele cruzamento.
Opcionalmente, os marcadores de flanqueamento podem ser usados para predizer quais marcadores estão ligados em acoplamento. Pela comparação do genótipo de marcadores de flanqueamento que estão ligados ao marcador alvo em ambas linhagens elite e ancestrais, é possível predizer quais haplotipos foram mais conservados durante a seleção ao longo de muitos ciclos. Na eventualidade de ter ocorrido recombinação entre o marcador alvo e o elemento genético que contribui para a produtividade, de modo que o elemento genético desejado e o lócus de marcador alvo ligado não estejam mais em fase de ligação de acoplamento, os marcadores de flanqueamento podem ser utilizados para identificar a progênie com desempenho agronômico superior.
Adicionalmente, a MAS e a seleção fenotípica podem ser alternadas para assegurar que o alelo em fase de acoplamento seja detectado. Os marcadores identificados por tendência de melhoramento (breeding bias) são empregados para a MAS como descrito acima (com ou sem as vantagens da determinação de fase de ligação dentro de cruzamentos específicos) e o teste de produtividade replicado é realizado na progênie selecionada. Se suficientes replicados e ambientes forem amostrados, pode ser obtida uma medida razoável do fenótipo de produtividade. A progênie que é confirmada como de alta produtividade pode ser usada como parentais no próximo ciclo de seleção MAS. Pelo screening de populações relacionadas de acordo com este método, a população se moverá em direção à fixação dos alelos de QTL favoráveis mesmo se o alelo de marcador favorável não estiver sempre em acoplamento com o alelo de QTL. Alternativamente, os polimorfismos residuais nos lócus de marcador aqui descritos podem ser detectados em linhagens iso-gênicas próximas, e o alelo de marcador em correspondência com a produtividade aumentada pode ser validado.
INTROGRESSÃO DE ALELOS FAVORÁVEIS
Retrocruzamento mais Eficiente de Genes Específicos em Linhagens Elite Uma aplicação da MAS, no contexto da presente invenção, é usar os marcadores de "gene de produtividade" para aumentar a eficiência de uma introgressâo ou esforço de retrocruzamento. Em um típico retrocruzamento assistido por marcador de gene(s) específico(s) a partir de uma fonte doadora para um background genético elite, seleciona-se entre a progênie de retrocruzamento com relação ao caractere do doador e depois se usam marcadores para reconstituir tanto quanto possível o genoma do background elite. Anteriormente à presente invenção, os marcadores usados para identificar o background elite eram de função desconhecida, e muitos dos marcadores comumente usados podiam estar selecionando partes do genoma elite que realmente não contribuem para uma elevada produtividade. De modo semelhante, anteriormente à presente invenção, os lócus majoritários que contribuem para a produtividade eram amplamente desconhecidos, de modo que o genoma elite completo do parental recorrente era selecionado na esperança de incluir todos os alelos favoráveis que eles contivessem. Entretanto, os marcadores identificados pela tendência de melhoramento (breeding bias) podem ser usados para identificar somente aquelas partes do genoma elite que são mais significativos com relação à produtividade. Esses marcadores podem ser usados para concentrar os esforços de retrocruzamento da maioria das partes importantes do genoma elite. Quanto menos marcadores forem necessários, maior será a probabilidade de recapturar rapidamente o fenótipo elite.
Portanto, os marcadores e métodos da presente invenção podem ser utilizados para dirigir a seleção ou o melhoramento marcador assistido de variedades de soja com o complemento desejado (ou seja, conjunto) de formas alélicas de segmentos cromossômicos associados com desempenho agronômico superior. Cada um dos alelos revelados pode ser introduzido em uma linhagem de soja via introgressão, ou seja, por meio de melhoramento tradicional (ou introduzido via transformação, ou ambos) para produzir uma planta de soja com desempenho agronômico superior. 0 número de alelos associados com desempenho agronômico superior que podem ser introduzidos ou estar presentes em uma planta de soja da presente invenção varia de 1 até o número de alelos aqui revelados, cada um sendo um número inteiro, o qual é aqui incorporado como se fosse explicitamente citado.
As linhagens de soja exemplificativas que incluem pelo menos uma {e tipicamente diversas ou muitas) das formas alélicas favoráveis dos segmentos cromossômicos relevantes são providas na Tabela 1. Sem se ter a intenção de limitar a invenção, elas incluem as linhagens de soja elite: 90A07, 90B11, 90B31, 90B43, 90B72, 90B73, 91B01, 91B12, 91B33, 91B52, 91B53, 91B64, 91B91, 91B92, 92B05, 92B12, 92B23, 92B38, 92B63, 92B74, 92B75, 92B84, 92B95, 93B01, 93B11, 93B15, 93B25, 93B26, 93B41, 93B45, 93B46, 93B66, 93B67, 93B72, 93B82, 93B84, 93B85, 93B86, 93B87, 94B01, 94B23, 94B24, 94B53, 94B54, 94B73, 95B32, 95B33, 95B34, 95B53, 95B95, 95B96, 95B97, 96B21, 96B51, 97B52, 97B61, A1395, A2835, A2943, A3127, A3242, A3431, A4009, A4138, A4415, A4595, A4715, A5403, A5560, A5843, A5885, A5979, A5980, A6297, BEDFORD, CM428, CX105, CX232, CX253, CX289, CX394C, CX469C, D00566D362, ESSEX, EX04COO, EX06A00, EX10F01, EX13P01, EX13Q01, EX15N01, EX16N00, EX16P01, EX22Y01, EX22Z01, EX39E00, FORREST, G3362, HS93-4118, HUTCHESON, JIM, KORADA, M015733, M0400644-02, M0413735-11-52, M0501577-27-23, MO505469-61-89, MP39009, P1677, P9007, P9008, P9041, P9042, P9061, P9062, P9063, P9071, P9092, P9132, P9141, P9151, P9163, P9182, P9203, P9233, P9244, P9273, P9281, P9305, P9306, P9321, P9341, P9392, P9395, P9481, P9482, P9492, P9521, P9552, P9561, P9584, P9591, Ρ9592, Ρ9594, Ρ9631, Ρ9641, PHARAOH, RA451, R01154R002, S0066, S03W4, S0880, S1550, S1990, S19T9, S20F8, S22C3, S24L2, S25J5, S32Z3, S33N1, S38T8, S3911, S4260, S42H1, S43B5, S5960, S6189, S6262, ST0653, ST1073, ST1090, ST1970, ST2250, ST2488, ST2660, ST2688, ST2870, ST3171, ST3380, ST3630, ST3870, ST3883, TRACY, TRAILL, X9916, YB03E00, XB03F01, XB07E01, XB10D01, XB15M01, XB20M01, XB22R01, XB25W01, XB31C01, XB33B, XB34F01, XB35D, XB35W00, XB38A01, XB41M01, XB42J00, XB42M01, XB48H01, XB54K01, XB55J01, XB58P99, XB63D00, XB67A00, YB03G01, YB08D01, YB09F01, YB09G01, YB10E01, YB11D01, YB14H01, YB15K99, YB21F01, YB21G01, YB22S00, YB22V01, YB22W01, YB22X01, YB24Z01, YB25R99, YB25X00, YB25Y01, YB25Z01, YB27X01, YB27Y01, YB28N01, YB29H01, YB29J01, YB30J01, YB30N01, YB30P01, YB31E01, YB32K01, YB33K01, YB34H01, YB35C01, YB36V00, YB39M01, YB40M01, YB40N01, YB41Q01, YB48L01, YB52J00, YB53E00, YB54H00, YB54J00, YB54L00, YB55H00, YB56E00, YB60N01, e YOUNG. Estas linhagens e a progênie derivada das mesmas, bem como numerosas linhagens elite adicionais, são convenientemente utilizadas como material de melhoramento para desenvolver novas linhagens com número aumentado de formas alélicas favoráveis de segmentos cromossômicos envolvidos com produtividade. A presente invenção também se estende a um método para fazer uma planta de soja de progênie e a essas plantas de soja de progênie, per se. 0 método compreende o cruzamento de uma primeira planta de soja parental com uma segunda planta de soja e crescimento das plantas de soja fêmeas sob condições de crescimento de planta para produzir progênie de planta de soja. Os métodos de cruzar e crescer plantas de soja são bem conhecidos no âmbito da capacidade daqueles especialistas na técnica. Tal progênie de planta de soja pode ser analisada com relação aos alelos associados com desempenho agronômico superior e, portanto, com a progênie desejada selecionada. Tais plantas ou semente de progênie podem ser vendidas comercialmente para produção de soja, usadas como alimento, processadas para obter um constituinte desejado da soja, ou ainda utilizadas em rodadas subseqüentes de melhoramento. Pelo menos uma entre a primeira e a segunda planta de soja é uma planta de soja da presente invenção, pelo fato de que ela compreende pelo menos uma das formas alélicas da presente invenção de modo que a progênie seja capaz de herdar o alelo. Convenientemente, a primeira ou segunda linhagem de planta de soja pode ser uma entre as linhagens elite da Tabela 1, ou uma derivada de uma tal linhagem (ou seja, uma descendente ou progenitora naquele pedigree da linhagem), ou qualquer parente dessas linhagens elite (tal como a linhagem elite que foi derivada dos ancestrais dessas linhagens elite) que retenha a mesma forma alélica como sendo aquela associada ao desempenho agronômico superior. Entretanto, será prontamente reconhecido por aqueles especialistas na técnica que, a seguir à caracterização, essencialmente qualquer linhagem elite pode ser utilizada.
Freqüentemente, um método da presente invenção é aplicado a pelo menos uma planta de soja relacionada, tal como oriunda de linhagens de progenitor ou de descendente no pedigree das plantas de soja objeto de modo que a hereditariedade do alelo desejado seja rastreado. 0 número de geração que separa as plantas de soja que estão sendo submetidas ao método da presente invenção será geralmente de 1 a 20, comumente de 1 a 5, e tipicamente 1, 2, ou 3 gerações de separação, e bem freqüentemente um descendente direto ou parental da planta de soja que está sendo submetida ao método (ou seja, 1 geração de separação).
Incorporação de Germoplasma "Exótico" enquanto o Progresso Histórico é Mantido A diversidade genética é importante para o ganho genético a longo-prazo em qualquer programa de melhoramento. Com diversidade genética limitada, o ganho genético, eventualmente, alcançará um platô quando todos os alelos favoráveis tiverem sido fixados dentro da população elite. 0 desafio é incorporar diversidade no conjunto elite sem perder o ganho genético que já tenha sido alcançado e com o mínimo investimento possível. Os resultados da tendência de melhoramento fornecem uma indicação de quais regiões genômicas e quais alelos favoráveis dos ancestrais originais foram selecionados e conservados ao longo do tempo, facilitando os esforços para incorporar variação favorável a partir de fontes de germoplasma exóticas (parentais que são não-relacionados com o pool de genes elite) na esperança de encontrar alelos favoráveis que não existem correntemente no pool de genes elite.
Por exemplo, os marcadores da presente invenção podem ser usados para a MAS de cruzamentos envolvendo linhagens de soja elite x exótica por meio de submeter a progênie segregante à MAS para manter a maioria dos alelos de produtividade que já tenham sido "fixados" por décadas de seleção e deixar o restante do genoma aberto para a contribuição das fontes exóticas. Este seria um sistema muito, mais eficiente do que a seleção convencional ou seleção MAS de alelos elite dos quais nós não temos informação anterior.
Se o parental doador também tiver alelos polimórficos nos lócus alvo elite, o melhorista igualmente pode abrandar a intensidade da seleção de retrocruzamento para permitir que seja transportada a variação desses lócus. Isto provê a oportunidade de observar se uma linhagem exótica possui algo ainda mais favorável do que o que havia no pool de genes elite nos lócus alvo elite.
Os métodos da presente invenção também se dirigem a uma outra limitação de retrocruzamento convencional: quer dizer, como o parental recorrente é reconstituído com ciclos aumentados de retrocruzamento, os alelos potencialmente favoráveis oriundos do parental doador são excluídos juntamente com os alelos desfavoráveis do parental doador. Pela reconstituição seletiva do genótipo do parental recorrente nos lócus que foram mostrados como importantes por meio da tendência de melhoramento, permite-se que alelos favoráveis sejam introduzidos a partir do parental doador em outros locais. Isto possibilita que o parental doador contribua com alelos favoráveis exóticos em lócus que não fazem parte do "genótipo alvo" elite. Isto aumenta as chances de segregação transgressiva enquanto ainda se retém a maioria das partes críticas do genoma do parental recorrente. Se o parental doador também possui alelos polimórficos nos lócus alvo elite, o melhorista pode igualmente abrandar a intensidade de seleção de retrocruzamento para permitir que a variação desses lócus seja transportada e seja testada no contexto de um genoma que é representativo do pool de genes elite.
DETECÇÃO DOS LÓCUS DE MARCADOR
As Tabelas 3 a 12 fornecem um conjunto de marcadores e alelos favoráveis associados com desempenho agronômico superior em uma diversidade de regiões geográficas com uma gama de diferentes ambientes de crescimento. Cada um dos marcadores identifica um segmento cromossômico que inclui um ou mais elementos genéticos, ou seja, genes que influenciam a produtividade em soja. 0 especialista na técnica saberá apreciar o fato de que os marcadores aqui providos e discutidos são meramente exemplificativos e que numerosos outros marcadores ligados podem ser identificados com base na ligação genética e/ou proximidade fisica em um cromossomo, com relação aos marcadores aqui providos. Portanto, as composições e métodos da presente invenção aqui descrita não têm intenção de ficarem limitados somente aos marcadores providos nas Tabelas 3 a 12, mas também incluem marcadores adicionais ligados aos mesmos. Adicionalmente, apesar de os alelos favoráveis dos lócus de marcador exemplificativos serem aqui discutidos, será prontamente avaliado, pelos especialistas na técnica, que os alelos favoráveis dos lócus adicionais ligados aos lócus de marcador aqui descritos podem ser determinados sem a necessidade de grande experimentação e empregados nas composições e métodos da pressente invenção. Correspondentemente, qualquer lócus de marcador ligado aos marcadores aqui descritos, e localizados com relação a um segmento cromossômico identificado pelos marcadores da invenção, pode também ser usado para identificar aquele segmento cromossômico e para definir o genótipo de uma planta de soja, ou para selecionar as formas alélicas favoráveis de um segmento cromossômico correlacionado com desempenho agronômico superior.
Apesar de as seqüências específicas de DNA que codificam proteínas serem, em geral, bem conservadas através de uma espécie, as regiões de DNA que são não-codificantes, ou que codificam proteínas ou porções de proteínas com ausência de função crítica, tendem a acumular mutações e, portanto, de serem variáveis entre membros da mesma espécie. Tais regiões fornecem a base para numerosos marcadores genéticos moleculares. Os marcadores identificam alterações no genoma, as quais podem ser inserções, deleções, mutações pontuais, eventos de recombinação ou a presença de seqüência de elementos de transposição. Muitos marcadores moleculares ou genéticos têm sido caracterizados em espécies de planta de interesse, incluindo soja, e são conhecidos daqueles especialistas na técnica. Por exemplo, uma coleção de marcadores genéticos para soja está publicamente disponível a partir da Linkage Genetics (151 West 2200 South, Suite C, Salt Lake City, Utah 84119, 801-975-1188).
Os marcadores moleculares podem ser detectados por numerosos métodos, bem estabelecidos na técnica (por exemplo, hibridização especifica de alelo (ASH) ou outros métodos para detectar polimorfismos de nucleotideo simples (SNP), polimorfismos de comprimento de fragmento amplificado (AFLP), seqüências variáveis amplificadas, DNA polimórfico amplificado aleatoriamente (RAPD), polimorfismos de comprimento de fragmento de restrição (RFLP), replicação de seqüência auto-sustentada, repetição de seqüência simples (SSR), polimorfismos de conformação de simples-fita (SSCP), e marcadores de isozima). Apesar dos marcadores exemplificativos providos nas Tabelas 3 a 12 serem marcadores . tanto de SSR como de SNP (ASH) , qualquer um dos tipos de marcador acima mencionados pode ser empregado no contexto da invenção para identificar segmentos cromossômicos englobando elemento genético que contribui para o desempenho agronômico superior. A maioria dos marcadores genéticos conta com uma ou mais propriedades de ácidos nucléicos para sua detecção. Por exemplo, algumas técnicas para detectar marcadores genéticos utilizam a hibridização de um ácido nucléico de sonda para os ácidos nucléicos que correspondem ao marcador genético. Os formatos de hibridização incluem, mas não estão limitados a, fase de solução, fase sólida, fase mista ou ensaios de hibridização in situ. Entre os primitivos marcadores detectados, os polimorfismos de comprimento de fragmento de restrição (RFLP) são detectados por hibridização de uma sonda que é tipicamente um sub-fragmento (ou um oligonucleotideo sintético correspondente a um sub-fragmento) do ácido nucléico a ser detectado para restrição do DNA genômico digerido. A enzima de restrição é selecionada para prover segmentos de restrição de pelo menos dois comprimentos alternativas (ou polimórficos) em diferentes indivíduos, e freqüentemente variarão de uma linhagem para outra. A determinação de uma (uma ou mais) enzima de restrição que produz fragmentos informativos para cada cruzamento é um procedimento simples e bem conhecido do· estado da técnica. Após a separação por comprimento em uma matriz apropriada (por exemplo, agarose) e transferência para uma membrana (por exemplo, de nitrocelulose, nylon), a sonda marcada é hibridizada sob condições que resultam em ligação de equilíbrio da sonda com o alvo, seguida de remoção da sonda em excesso por lavagem.
As sondas de ácido nucléico para os lócus de marcador podem ser clonadas e/ou sintetizadas. As marcações (labeis) detectáveis apropriadas para uso com sondas de ácido nucléico incluem qualquer composição detectável por espectroscopia, radioisótopos, meios fotoquímicos, bioquímicos, imuno-químicos, elétricos, ópticos ou químicos. Marcações utilizáveis incluem biotina para coloração com conjugado de estreptavidina marcada, contas magnéticas, corantes fluorescentes, radiomarcações, enzimas e marcações colorimétricas. Outras marcações incluem ligantes que se ligam a anticorpos marcados com fluoróforos, agentes químio-luminescentes e enzimas. Os marcadores com marcação (labeling markers) são prontamente alcançados, tal como pelo uso de primers de PCR com marcação (labeled PCR primers) para lócus de marcador. A sonda hibridizada é depois, mais tipicamente, detectada pelo uso de auto-radiografia ou outra técnica de detecção similar (por exemplo, fluorografia, contador de cintilação liquida (liquid scintillation counter), etc) . Exemplos de protocolos de hibridização especifica estão amplamente disponíveis no estado da técnica, ver, por exemplo, Berger, Sambrook, Ausubel, citados na seção intitulada "REFERÊNCIAS GERAIS DE BIOLOGIA MOLECULAR".
Mais especificamente, com relação a certos marcadores exemplificativos da presente invenção, a tecnologia de hibridização alelo-específica (ASH) é baseada no anelamento estável de uma sonda curta de oligonucleotídeo de simples-fita com um ácido nucléico alvo de simples-fita completamente complementar. A detecção é feita via uma marcação isotópica ou não-isotópica presa à sonda.
Para cada polimorfismo, são desenhadas duas ou mais sondas de ASH diferentes para possuírem seqüências de. DNA idênticas exceto nos nucleotídeos polimórficos de marcadores compreendendo um polimorfismo de nucleotideo simples (SNP). Cada sonda terá exata homologia com uma seqüência de alelo de modo que a faixa de sondas pode distinguir todas as seqüências de alelos alternativos conhecidas. Cada sonda é hibridizada com o DNA alvo. Com desenho apropriado de sonda e condições apropriadas de hibridização, um pareamento incorreto de base-simples entre a sonda e o DNA alvo evitará a hibridização. Desta maneira, somente uma das sondas alternativas hibridizará com uma amostra alvo que é homozigota ou homogênea para o alelo. As amostras que são heterozigotas ou heterogêneas para dois alelos hibridizarão com ambas as sondas alternativas.
Os marcadores de ASH são usados como marcadores dominantes quando a presença ou ausência de somente um alelo é determinada a partir da hibridização ou ausência de hibridização por meio de somente uma sonda. 0 alelo alternativo pode ser inferido a partir da ausência de hibridização. A sonda de ASH e as moléculas alvo são opcionalmente RNA ou DNA; as moléculas alvo são qualquer comprimento de nucleotideos além da seqiiência que é complementar à sonda; a sonda é desenhada para hibridizar com ambas fitas de um alvo de DNA; a sonda varia em tamanho para se conformar a condições de hibridização variavelmente estringentes etc. A PCR permite que a seqüência alvo para ASH seja amplificada a partir de baixas concentrações de ácido nucléico em volumes relativamente pequenos. De outro modo, a seqüência alvo oriunda de DNA genômico é digerida com uma endonuclease de restrição e separada por tamanho por meio de eletroforese em gel. As hibridizações tipicamente ocorrem com a seqüência alvo ligada à superficie de uma membrana ou, como descrito na patente US 5.468.613, a seqüência da sonda de ASH pode estar unida a uma membrana.
Em uma concretização, os dados de ASH são obtidos por meio de amplificação de fragmentos de ácido nucléico (amplicons) oriundos de DNA genômico usando PCR, transferindo o DNA alvo de amplicon para uma membrana em um formato dot-blot, hibridizando uma sonda de oligonucleotídeo marcada com o alvo de amplicon, e observando os dots de hibridização por auto-radiografia.
Outros marcadores moleculares exemplificativos aqui providos são repetições de seqüência simples (SSR). Os marcadores de SSR têm a vantagem de possuir altos niveis de repetições di-, tri-, ou tetra-nucleotideos em tandem dentro de um genoma. As repetições de di-nucleotideos têm sido relatadas como ocorrendo no genoma humano tanto quanto 50.000 vezes com n variando de 10 a 60 ou mais (Jacob et al. (1991) Cell 67:213). As repetições de di-nucleotideos também têm sido encontradas em plantas superiores (Condit e Hubbell (1991) Genome 34:66).
Em resumo, os dados de SSR são gerados por hibridização de primers com regiões conservadas do genoma da planta, os quais flanqueiam a seqüência de SSR. A PCR é depois usada para amplificar as repetições de di-nucleotideos entre os primers. As seqüências amplificadas são depois submetidas a eletroforese para determinar o tamanho e, portanto, o número de repetições de di-, tri-, e tetra-nucleotideos.
As seqüências variáveis amplificadas se referem a seqüências do genoma da planta que apresentam alta variabilidade de resíduos de ácido nucléico entre membros da mesma espécie, por exemplo, seqüências de micro-satélite. Todos os organismos possuem seqüências genômicas variáveis e cada organismo (com exceção de um clone) possui um conjunto diferente de seqüências variáveis. Uma vez identificada, a presença de seqüências variáveis específicas pode ser usada para predizer caracteres fenotipicos. Preferencialmente, o DNA da planta serve como um template para amplificação com primers que flanqueiam uma seqüência variável de DNA. A seqüência variável é amplificada e depois seqüenciada.
Marcadores de DNA polimórfico aleatoriamente amplificado (RAPD) são seqüências genômicas amplificadas por PCR usando um único primer curto de seqüência arbitrária a baixa estringência. Durante a amplificação a baixa estringência, são gerados inúmeros produtos de PCR, alguns dos quais diferem em comprimento (e seqüência) entre os indivíduos, a partir de localizações aleatórias ao longo do genoma. Diferentemente de seqüências variáveis· amplificadas, nenhuma informação anterior de seqüência é requerida para identificar os marcadores de RAPD.
As técnicas de amplificação in vitro são bem conhecidas da técnica. Exemplos de técnicas suficientes para orientar os especialistas através de tais métodos in vitro, incluindo a reação em cadeia da polimerase (PCR), a reação em cadeia da ligase (LCR), a amplificação da ζ)β-replicase e outras técnicas mediadas por RNA polimerase (por exemplo, NASBA), são encontradas em Berger, Sambrook e Ausubel bem como em Mullis et al. (1987), patente US 4.683.202; PCR Protocols, A Guide to Methods and Applications (Innis et al., eds.) Academic Press Inc., San Diego Academic Press Inc. San Diego, CA (1990) (Innis); Arnheim & Levinson (1 de outubro de 1990) C&EN 36-47; The Journal Of NIH Research (1991) 3, 81-94; (Kwoh et al. (1989) Proc. Natl. Acad. Sei. USA 86, 1173; Guatelli et al. (1990) Proc. Natl. Acad. Sei. USA 87, 1874; Lomell et al. (1989) J. Clin. Chem 35, 1826; Landegren et al., (1988) Science 241, 1077-1080; Van Brunt (1990) Biotechnoloqy 8, 291-294; Wu e Wallace, (1989) Gene 4, 560; Barringer et al. (1990) Gene 89, 117, e Sooknanan e Malek (1995) Biotechnology 13: 563-564. Métodos aperfeiçoados de clonagem in vitro de ácidos nucléicos amplificados são descritos em Wallace et al., patente US 5.426.039. Métodos aperfeiçoados de amplificar grandes ácidos nucléicos por PCR estão resumidos em Cheng et al. (1994) Nature 369: 684, e nas referências aqui citadas, nas quais amplicons de PCR de até 40kb são gerados. Aqueles especialistas na técnica saberão avaliar o fato de que essencialmente qualquer RNA pode ser convertido em um DNA de dupla fita apropriado para digestão de restrição, expansão por PCR e seqüenciamento usando transcriptase reversa e uma polimerase. Ver Ausubel, Sambrook e Berger.
Os oligonucleotideos para uso como primeres, por exemplo, em reações de amplificação e para uso como sondas de seqüência de ácido nucléico são tipicamente sintetizadas quimicamente de acordo com o método de triéster de fosforamidita de fase sólida descrito por Beaucage e Caruthers (1981) Tetrahedron Lett. 22:1859, ou simplesmente podem ser encomendados comercialmente.
Alternativamente, a replicação de seqüência automantida pode ser usada para identificar marcadores genéticos. A replicação de seqüência automantida se refere a um método de amplificação de ácido nucléico usando seqüências de ácido nucléico alvo que são replicadas exponencialmente in vitro sob condições substancialmente isotérmicas pelo uso de três atividades enzimátícas envolvidas em replicaçâo retroviral: (1) transcriptase reversa, (2) Rnase H, e (3) uma polimerase de RNA DNA-dependente (Guatelli et al. (1990) Proc Natl Acad Sei USA 87:1874). Através da imitação da estratégia retroviral de replicaçâo de RNA por meio de intermediários de cDNA, esta reação acumula cópias de cDNA e RNA do alvo original.
Polimorfismos de fragmento de restrição amplificado ou polimorfismos de comprimento de fragmento amplificado (AFLP) também podem ser usados como marcadores genéticos (Vos et al. (1995) Nucl Acids Res 23:4407). A frase "polimorfismo de fragmento de restrição amplificado" se refere a fragmentos de restrição selecionados, os quais são amplificados antes ou após a divagem por uma endonuclease de restrição. A etapa de amplificação permite a detecção mais fácil de fragmentos de restrição específicos. 0 AFLP permite a detecção de grande quantidade de marcadores polimórficos e tem sido usado no mapeamento genético de plantas (Becker et al. (1995) Mol Gen Genet 249:65; e Meksem et al. (1995) Mol Gen Genet 249:74).
Polimorfismos de nucleotídeo simples (SNP) são marcadores que consistem de uma seqüência compartilhada diferenciada com base em um único nucleotídeo. Tipicamente, esta distinção é detectada por padrões de migração diferencial de um amplicon compreendendo o SNP em, por exemplo, um gel de acrilamida. Em tais casos, o marcador também pode ser referido como um polimorfismo de conformação de simples-fita ou SSCP. No entanto, modos alternativos de detecção, tal como hibridização, por exemplo, análise de ASH ou de RFLP, não estão excluídos.
Alternativamente, marcadores de isozima são empregados como marcadores genéticos. As isozimas são formas múltiplas de enzimas que diferem uma da outra em seus aminoácidos, e, portanto, em suas seqüências de ácido .nucléico. Algumas isozimas são multiméricas contendo subunidades ligeiramente diferentes. Outras isozimas são tanto multiméricas como monoméricas, mas foram clivadas a partir da pró-enzima em sítios diferentes na sequência de aminoácidos. As isozimas podem ser caracterizadas e analisadas no nível de proteína, ou, alternativamente, podem ser determinadas as isozimas que diferem no nível de ácido nucléico. Em tais casos, qualquer um dos métodos baseados em ácido nucléico aqui descritos pode ser usado para analisar os marcadores de isozima.
Em concretizações alternativas, podem ser usados métodos in silico para detectar os lócus de marcador. Por exemplo, a seqüência de um ácido nucléico compreendendo o marcador pode ser armazenada em um computador. A seqüência de lócus de marcador desejada ou seu homólogo pode ser identificada usando um algoritmo de busca de ácido nucléico apropriado, como provido em, por exemplo, programas prontamente disponíveis, como o BLAST.
MÉTODOS ASSISTIDOS POR SISTEMAS INTEGRADOS/COMPUTADOR
Em algumas concretizações, a presente invenção inclui um "sistema integrado" incluindo meios eletrônicos de armazenagem ou transmissão de dados lidos por computador, representando ou desenhando as formas alélicas determinadas pelo método da presente invenção. Os meios de leitura por computador incluem memória de cache, principal e de armazenamento para armazenar códigos de computador. Os dados que representam as formas alélicas determinadas pelo método da presente invenção também podem ser transmitidos eletronicamente em um sinal de dados de computador concretizado em um meio de transmissão ao longo de uma rede tal como uma intranet ou internet ou combinações das mesmas. A frase "sistema integrado", no contexto desta invenção se refere a um sistema no qual os dados que entrara em um computador correspondem aos objetos físicos ou processos externos ao computador, por exemplo, um alelo de marcador, e um processo que, dentro de um computador, ocasiona uma transformação física dos sinais de input para sinais de output diferentes. Em outras palavras, os dados de input, por exemplo, a amplificação de um alelo de marcador particular é transformada em dados de output, por exemplo, em identificação da forma alélica de um segmento cromossômico. 0 processo dentro do computador é um conjunto de instruções, ou "programa", pelo qual os sinais de amplificação ou hibridização positiva são reconhecidos pelo sistema integrado e atribuídos a amostras individuais como um genótipo. Programas adicionais correlacionam a identidade de amostras individuais com valores fenotípicos ou alelos de marcador, por exemplo, métodos estatísticos. Adicionalmente, há numerosos programas, por exemplo, programas C/C++ para computação, programas Delphi e/ou Java para interfaces GUI, e ferramentas de produtividade (por exemplo, Microsoft Excel e/ou SigmaPlot) para formação de mapas. Outras ferramentas de software utilizáveis no contexto dos sistemas integrados da invenção incluem pacotes estatísticos, tais como SAS, Genstat, Matlab, Mathematica, e S-Plus e pacotes de modelagem genética, tal como QU-GENE. Além disso, são também, apropriadamente, empregadas linguagens adicionais de programação, tal como Fortran e semelhantes nos sistemas integrados da invenção.
Por exemplo, os valores de alelo de marcador designados para uma população de progênie descendente de cruzamentos entre linhagens elite são registrados em um meio de leitura por computador, estabelecendo, portanto, uma base de dados correspondente às formas alélicas com identificadores únicos para cada membro da população da progênie. Qualquer arquivo ou pasta, independente de ser individualizado ou comercialmente disponível (por exemplo, a partir de Oracle ou Sybase) apropriado para registrar dados em um meio de leitura por computador é aceitável como uma base de dados no contexto da presente invenção. Os dados relativos ao genótipo para um ou mais marcadores moleculares, por exemplo, ASH, SSR, RFLP, RAPD, AFLP, SNP, marcadores de isozima ou outros marcadores como aqui descrito, são igualmente registráveis em uma base de dados acessível por computador. Opcionalmente, os dados de marcador são obtidos usando um sistema integrado que automatiza um ou mais aspectos do ensaio (ou ensaios) para determinar o genótipo do(s) marcador(es). Em um tal sistema, os dados de entrada correspondentes aos genótipos para marcadores moleculares são transmitidos a partir de um dispositivo, por exemplo, uma matriz, um digitalizador, um CCD, ou outro dispositivo de detecção diretamente para os arquivos em um meio de leitura por computador acessível a uma unidade de processamento central, Um conjunto de instruções (concretizado em um ou mais programas) englobando os modelos estatísticos da invenção é então executado por meio do dispositivo computacional para identificar correlações entre dados de produtividade e genótipos de marcador. Tipicamente, o sistema integrado também inclui um dispositivo de entrada para o usuário, tal como um teclado, um mouse, uma tela sensível ao toque, ou semelhantes, por exemplo, para selecionar arquivos, restaurar dados, etc, e um dispositivo de saída (por exemplo, um monitor, uma impressora, etc) para visualizar ou recuperar o produto da análise estatística.
Portanto, em um aspecto, a invenção provê um sistema integrado compreendendo um computador ou um meio de leitura por computador compreendendo conjunto de arquivos e/ou uma base de dados com pelo menos um conjunto de dados que corresponde aos genótipos para os marcadores genéticos. 0 sistema também inclui uma interface para o usuário para seletivamente visualizar uma ou mais bases de dados. Adícionalmente, o software de manipulação de texto padrão, tal como o software de processamento de palavra (por exemplo, Microsoft Word™ ou Corel WordPerfect™) e a base de dados ou o software de planilha eletrônica (por exemplo, software de planilha eletrônica tal como Microsoft Excel™, Corel Quattro Pro™, ou programas de base de dados, tal como Microsoft Access™ ou Paradox™) podem ser usados em conjunção com uma interface para o usuário (por exemplo, um GUI em um sistema de operação padrão, tal como um Windows, Macintosh, Unix ou sistema Linux) para manipular strings de caracteres. A invenção também provê sistemas integrados para manipulação de amostra incorporando dispositivos de robótica como anteriormente descrito. Uma armadura robótica de controle de liquido para transferir soluções (por exemplo, extratos de células de planta) a partir de uma fonte para um destino, por exemplo, a partir de uma placa de microtitulaçâo para um substrato de matriz, é, de maneira opcional, operacionalmente ligado ao computador digital (ou a um computador adicional no sistema integrado). É comumente um aspecto do sistema integrado, um dispositivo de input que entra com os dados para o computador digital para controlar a transferência de liquido de alta produção por meio da armadura robótica de controle de liquido e, opcionalmente, para controlar a transferência, pela armadura, para o suporte sólido.
Os sistemas integrados para a análise de marcador molecular da presente invenção tipicamente incluem um computador digital com um ou mais softwares de controle de liquido de alta-produção, software de análise de imagem, software de interpretação de dados, uma armadura robótica de controle de liquido para transferir soluções de uma fonte para um destino operacionalmente ligado a um computador digital, um dispositivo de input (por exemplo, um teclado de computador) para entrar com os dados no computador digital para controlar a transferência de liquido de alta-produção por meio da armadura robótica de transferência de liquido e, opcionalmente, um digitalizador de imagem para digitalizar os sinais de marcação a partir de sondas marcadas hibridizadas, por exemplo, para a expressão de produtos em um suporte sólido operacionalmente ligado ao computador digital. 0 digitalizador de imagem faz interface com o software de análise de imagem para prover uma medida de, por exemplo, diferenciação de intensidade de marcação de sonda de ácido nucléico sob hibridização para uma ordenada população de ácido nucléico de amostra, onde a medida de intensidade de marcação de sonda é interpretada por meio do software de interpretação de dados para mostrar se, e em que grau, a sonda marcada hibridiza com a marcação {labei). Os dados assim derivados são depois correlacionados com identidade de amostra, para determinar a identidade de uma planta com genótipo(s) particular(es) para marcadores genéticos, por exemplo, para facilitar a seleção marcador assistida de plantas de soja com formas alélicas favoráveis de segmentos cromossômicos envolvidos em desempenho agronômico.
As imagens ópticas, por exemplo, padrões de hibridização visualizados (e, opcionalmente, registrados) por uma câmera ou outro dispositivo de registro (por exemplo, um fotodiodo e dispositivo de armazenamento de dados) são opcionalmente processados posteriormente em qualquer uma das concretizações aqui descritas, por exemplo, por meio de digitalização da imagem e/ou armazenamento e análise da imagem em um computador. Uma diversidade de equipamentos periféricos comercialmente acessíveis e softwares estão disponíveis para digitalizar, armazenar e analisar um vídeo digitalizado ou imagem óptica digitalizada, por exemplo, usando PC (Intel x86 ou máquinas baseadas em pentium chip-compatível DOS™, 0S2™ WINDOWS™, WINDOWS NT™ ou WINDOWS95™), MACINTOSH™, LINUX, ou computadores baseados em UNIX (por exemplo, estação de trabalho SUN™).
IDENTIFICAÇÃO DE MARCADORES ADICIONAIS E QTL ASSOCIADO COM
PRODUTIVIDADE
Os ácidos nucléicos isolados a partir dos segmentos cromossômicos da presente invenção, por exemplo, ácidos nucléicos correspondentes a lócus de marcador adicionais, e ácidos nucléicos correspondentes a elementos genéticos que contribuem para o desempenho agronômico superior estão dentro do escopo da presente invenção. Por exemplo, em raras circunstâncias nas quais os marcadores e alelos da presente invenção não forem bem adaptados à MAS, os marcadores podem, entretanto, ser usados para identificar marcadores adicionais ligados que estão, por exemplo, próximos ao, ou dentro do, QTL de interesse. Com base nos marcadores aqui revelados, o aperfeiçoamento na eficiência da MAS pode ser obtido pela saturação dos segmentos cromossômicos relevantes com numerosos marcadores ligados. A análise de tendência de melhoramento (breeding bias) pode ser repetida em todos os marcadores dentro da região para identificar aqueles que possuem a significância estatística mais elevada. A MAS pode ser praticada com todos os marcadores na região seguida pela caracterização fenotípica (ou seja, de produtividade) para determinar quais marcadores são mais eficientes.
Os marcadores adicionais podem ser identificados por uma diversidade de maneiras. Por exemplo, os marcadores adicionais podem ser identificados por avaliação de marcadores disponíveis publicamente ou privadamente que tenham sido mapeados com relação à(s) região(ões) de interesse, incluindo marcadores candidatos conhecidos por codificar proteínas que são, pelo menos teoricamente, provavelmente relacionadas com produtividade. Alternativamente, os marcadores não-mapeados podem ser avaliados para determinar quais marcadores se relacionam com a mesma região genômica via estudos independentes de mapeamento.
Um marcador teoricamente ótimo pode ser obtido por isolamento de elementos genéticos que contribuem para o desempenho agronômico superior, tal como as regiões codificantes que dão origem a produtos de expressão que influenciam a produtividade. A identificação de um QTL que ressalta o desempenho agronômico superior pode ser acompanhada pela fundamentação do marcador em um mapa físico de DNA que depois avança a montante e a jusante para identificar seqüências codificantes, ou seja, por meio de "clonagem de gene posicionai". A clonagem de gene posicionai usa a proximidade física de um marcador genético (tal como um marcador provido nas Tabelas 3 a 12) para identificar um fragmento cromossômico clonado que inclui um ácido nucléico de interesse, por exemplo, um QTL que contribui para o desempenho agronômico superior. Os clones de ácidos nucléicos ligados aos marcadores da invenção possuem uma variedade de usos, incluindo o de marcadores genéticos adicionais para definir os segmentos cromossômicos da invenção e para uso em seleção marcador assistida (MAS). Os marcadores que são adjacentes a um quadro aberto de leitura (ORF) podem hibridizar com um clone de DNA, identificando, portanto, um clone no qual é localizado um ORF associado com um caractere que contribui para a produtividade. Se o marcador está mais distante, é identificado um fragmento contendo o quadro aberto de leitura por sucessivas rodadas de screening e é feito o isolamento de clones que juntos compreendem uma seqüência contígua de DNA, um "contigOs protocolos suficientes para orientar os especialistas na técnica de isolamento de clones associados com marcadores ligados são encontrados, por exemplo, nas referências citadas na seção intitulada "REFERÊNCIAS GERAIS DE BIOLOGIA MOLECULAR", mais adiante.
Um fragmento cromossômico isolado pode ser produzido por tais métodos bem conhecidos como digestão de DNA cromossômico com uma ou mais enzimas de restrição, ou por amplificação da região cromossômica em uma reação em cadeia da polimerase (PCR), ou reação de amplificação alternativa. 0 fragmento digerido ou amplificado é tipicamente ligado a um vetor apropriado para replicação, por exemplo, um plasmídeo, um cosmídeo, um fago, um cromossomo artificial, ou semelhantes, e, opcionalmente a expressão do fragmento inserido.
Tais segmentos cromossômicos podem ser utilizados para identificar ácidos nucléicos homólogos, por exemplo, em outras linhagens ou espécies, e/ou podem ser usados na produção de plantas transgênicas com atributos fenotipicos desejáveis relacionados com o desempenho agronômico. Um segmento cromossômico compreendendo um ácido nucléico que contribui para a produtividade aumentada é isolado, por exemplo, clonado via os métodos de clonagem posicionai acima esboçados. Um segmento cromossômico pode conter um ou mais ORFs associados com o caractere fenotípico desejado, e pode ser clonado em um ou mais vetores individuais, por exemplo, dependendo do tamanho do intervalo cromossômico.
Deve ser considerado o fato de que numerosos vetores estão disponíveis no estado da técnica para isolamento e replicação de ácidos nucléicos da invenção. Por exemplo, vetores de plasmídeos, cosmídeos e fago são bem conhecidos da técnica e são suficientes para muitas aplicações (por exemplo, em aplicações envolvendo a inserção de ácidos nucléicos variando de menos de 1 a cerca de 20 quilobases (kb)). Em certas aplicações, é vantajoso fazer ou clonar ácidos nucléicos grandes para identificar ácidos nucléicos mais distantemente ligados a um dado marcador, ou para isolar ácidos nucléicos que excedem 10-20 kb, por exemplo, até diversas centenas de quilobases ou mais, tal como o intervalo completo entre dois marcadores ligados, ou seja, até, e incluindo, um ou mais centimorgans (CM), ligados a marcadores como aqui identificados. Em tais casos, inúmeros vetores capazes de acomodar ácidos nucléicos grandes estão disponíveis no estado da técnica, e eles incluem cromossomos artificiais de levedura (YACs), cromossomos artificiais bacterianos (BACs), cromossomos artificiais de planta (PACs) e semelhantes. Para uma introdução geral com relação aos YACs, BACs, PACs e MACs como cromossomos artificiais, ver, por exemplo, Monaco e Larin (1994) Trends Biotechnol 12:280. Adicionalmente, os métodos para a amplificação in vitro de ácidos nucléicos grandes ligados a marcadores genéticos estão amplamente disponíveis (por exemplo, Cheng et al. (1994) Nature 369:684, e referências aqui citadas). Os sistemas de clonagem podem ser criados ou obtidos a partir de fontes comerciais; ver, por exmplo, Stratagene (La Jolla, CA).
Vetores, Promotores e Sistemas de Expressão A presente invenção inclui os constructos recombinantes que incorporam uma ou mais seqüências de ácido nucléico descritas acima. Tais constructos incluem um vetor, por exemplo, um plasmídeo, um cosmídeo, um fago, um vírus, um cromossomo artificial bacteriano (BAC), um cromossomo artificial de levedura (YAC), etc, no qual uma ou mais seqüências de polinucleotídeo de interesse (por exemplo, um marcador ou elemento genético que contribui para a produtividade) tenha sido inserido, em uma orientação forward ou reversa. Por exemplo, o ácido nucléico inserido pode incluir uma seqüência cromossômica ou cDNA incluindo o todo ou parte de pelo menos um elemento genético ou quadro aberto de leitura ("ORF") associado com produtividade. Em uma concretização preferida, o constructo adicionalmente compreende seqüências de regulação, incluindo, por exemplo, um promotor operacionalmente ligado à seqüência. Uma grande quantidade de vetores e promotores é conhecida dos especialistas na técnica, e estão comercialmente disponíveis.
Quando desejado, os polinucleotídeos da presente invenção, por exemplo, um elemento genético que contribui para o desempenho agronômico superior identificado de acordo com os métodos aqui descritos, pode estar incluído em qualquer um de uma diversidade de vetores apropriados para gerar RNA sense ou antisense, e, opcionalmente, produtos de expressão de polipeptídeo. Tais vetores incluem seqüências de DNA cromossômico, não-cromossômico e sintético, por exemplo, derivados de SV40; plasmídeos bacterianos; DNA de fago; baculovirus; plasmídeos de levedura; vetores derivados de combinações de plasmídeos e DNA de fago, DNA viral, tal como vaccinia, adenovirus, vírus de pox aviário, pseudo-raiva, adenovirus, vírus adeno-associado, retrovírus e muitos outros. Pode ser usado qualquer vetor que tenha a capacidade de introduzir material genético em uma célula, e, se a replicação for desejável, que seja replicável no hospedeiro relevante.
Em um vetor de expressão ou cassete de expressão, a seqüência de polinucleotídeo de interesse está fisicamente disposta em proximidade e orientação com relação a uma seqüência de controle de transcrição apropriada (promotor, e, opcionalmente, um ou mais enhancers) para dirigir a síntese direta de mRNA. Quer dizer, a seqüência de polinucleotídeo de interesse está "operacionalmente ligada" a uma seqüência de controle de transcrição apropriada. Exemplos de tais promotores incluem: promotor LTR ou SV40, promotor lac ou trp de E. coli, promotor PL de fago lambda, e outros promotores conhecidos por controlar a expressão de genes em células de procariotes ou eucariotes ou seus vírus. 0 vetor de expressão também contém um sítio de ligação a ribossomo para a iniciação da tradução, e um terminador de transcrição. O vetor opcionalmente inclui sequências apropriadas para amplificar a expressão. Adicionalmente, os vetores de expressão opcionalmente compreendem um ou mais genes de marcador selecionável para prover um caractere fenotípico para seleção de células de hospedeiro transformado, tais como diidrofolato redutase ou resistência a neomicina para cultura de células eucarióticas, ou tal como resistência a tetraciclina ou ampicilina em E. coli.
Elementos Adicionais de Expressão Quando a tradução de peptídeo codificado por um ácido nucléico compreendendo uma seqüência de polinucleotídeo da invenção for desejada, sinais adicionais de iniciação específica de tradução podem melhorar a eficiência da tradução. Esses sinais podem incluir, por exemplo, um códon de iniciação ATG e seqüências adjacentes. Em alguns casos, por exemplo, moléculas de cDNA completo ou segmentos cromossômicos incluindo uma seqüência codificante que incorpora, por exemplo, um QTL ou marcador de QTL, um códon de iniciação de tradução e elementos de seqüência associados são inseridos no vetor de expressão apropriado simultaneamente com a seqüência de polinucleotídeo de interesse. Em tais casos, não são requeridos sinais adicionais de controle de tradução. Entretanto, nos casos em que somente é inserida uma seqüência codificante de polipeptideo ou uma porção da mesma, devem ser providos sinais exógenos de controle de tradução, incluindo um códon de iniciação ATG. Além disso, o códon de iniciação precisa estar no quadro aberto de leitura correto para assegurar a transcrição da seqüência de polinucleotídeo de interesse. Os elementos exógenos de transcrição e os códons de iniciação podem ser de origens variáveis, tanto natural como sintética. A eficiência de expressão, pode ser melhorada pela inclusão de enhancers apropriados ao sistema de célula em uso (Scharf D et al. (1994) Results Probl Cell Differ 20:125-62; Bittner et al. (1987) Methods in Enzymol 153:516-544}.
GERAÇÃO DE PLAUTAS E CÉLULAS TRANSGÊNICAS A presente invenção também se refere a células e organismos de hospedeiro que são transformados com ácidos nucléicos correspondentes a elementos genéticos que contribuem para o desempenho agronômico superior e outros genes identificados de acordo com os métodos da invenção. Por exemplo, tais ácidos nucléicos incluem segmentos cromossômicos, ORFs, e/ou cDNAs ou correspondentes a uma seqüência ou sub-seqüência incluída dentro do segmento cromossômico identificado ou ORF. Adicionalmente, a invenção provê a produção de polipeptídeos correspondentes a tais elementos genéticos por meio de técnicas de ácido nucléico recombinante (e expressão). As células do hospedeiro são obtidas por engenharia genética (ou seja, transduzidas, transfectadas ou transformadas) com os vetores desta invenção (ou seja, vetores incorporando elementos genéticos que contribuem para a produtividade aumentada, ou outros ácidos nucléicos identificados de acordo com os métodos da invenção e como acima descrito) os quais são, por exemplo, um vetor de clonagem ou um vetor de expressão. Tais vetores incluem, em adição àqueles descritos acima, por exemplo, uma agrobatéria, um virus (tal como um virus de planta), um polinucleotideo livre, ou um polinucleotideo conjugado. Os vetores são introduzidos nos tecidos de planta, células de planta cultivadas, ou protoplastos de planta por uma diversidade de métodos padrão, incluindo eletroporação (From et al. (1985) Proc. Natl. Acad. Sei. USA 82;5824), infecção por vetores virais tais como virus do mosaico da couve-flor (CaMVj (Hohn et al. (1982) Molecular Biology of Plant Tumors (Academic Press, New York, pp. 549-560; patente US 4.407.956 de Howell), penetração balística de alta velocidade por meio de pequenas partículas com o ácido nucléico tanto dentro como na superfície da matriz de pequenas contas ou partículas (Klein et al. (1987) Nature 327;70), uso de pólen como vetor (WO 85/01856), ou uso de Agrobacterium tumefaciens ou A. rhizogenes portando um plasmídeo de T-DNA no qual os fragmentos de DNA estão clonados. 0 plasmídeo de T-DNA é transmitido às células de planta sob infecção por Agrobacterium tumefaciens, e uma porção é estavelmente integrada no genoma da planta (Horsch et al. (1984) Science 233;496; Fraley et al. (1983) Proc. Natl. Acad. Sei. USA 80;4803}. O método de introdução de um ácido nucléico da presente invenção em uma célula hospedeira não é crítico para esta invenção. Portanto, pode ser empregado qualquer método, por exemplo, incluindo, mas não estando limitado aos exemplos acima, que permita a introdução eficaz de um ácido nucléico em uma célula ou protoplasto.
As células hospedeiras engenheiradas podem ser cultivadas em meio nutriente convencional, modificado como apropriado para tais atividades como, por exemplo, ativar promotores ou selecionar transformantes. Essas células opcionalmente podem ser cultivadas para obter plantas transgênicas. A regeneração de planta a partir de protoplastos cultivados é descrita em Evans et al. (1983) "Protoplast Isolation and Culture", Handbook of Plant Cell Cultures 1, 124-176 (MacMillan Publishing Co., New York; Davey (1983) "Recent Developments in the Culture and Regeneration of Plant Protoplasts," Protoplasts, pp. 12-29, (Birkhauser, Basel); Dale (1983) "Protoplast Culture and Plant Regeneration of Cereais and Other Recalcitrant Crops," Protoplasts pp. 31-41, (Birkhauser, Basel); Binding (1985) "Regeneration of Plants," Plant Protoplasts, pp. 21-73, (CRC Press, Boca Raton). A presente invenção também se refere à produção de organismos transgênicos, os quais podem ser bactérias, leveduras, fungos, ou plantas, transduzidos com os ácidos nucléicos, por exemplo, QTL clonado da invenção. Uma completa discussão das técnicas relevantes para bactérias, eucariotes unicelulares de cultura de células pode ser encontrada nas referências enumeradas acima e são resumidamente esboçadas como a seguir. Diversos métodos bem conhecidos para introduzir ácidos nucléicos alvo em células bacterianas estão disponíveis, qualquer um dos quais pode ser usado na presente invenção. Eles incluem: a fusão das células receptoras com protoplastos bacterianos contendo o DNA, tratamento das células com lipossomos contendo o DNA, eletroporação, bombardeamento com projétil (biobalística), entrega em fibra de carbono, e infecção com vetores virais (discutidos adicionalmente, a seguir), etc. As células bacterianas podem ser usadas para amplificar o número de plasmídeos contendo os constructos de DNA desta invenção. As bactérias são crescidas até a fase log e os plasmideos dentro da bactéria podem ser isolados por uma diversidade de métodos conhecidos da técnica (ver, por exemplo, Sambrook). Adicionalmente, numerosos kits estão disponíveis comercialmente e podem ser empregados de acordo com as instruções dos fabricantes para a purificação de plasmideos a partir de bactérias (e outras células). Para o seu uso apropriado, seguir as instruções do fabricante (ver, por exemplo, EasyPrep™, FlexiPrep™, ambos da Pharmacia Biotech; StrataClean™, da Stratagene; e, QIAprep™ da Qiagen). Os plasmideos isolados e purificados são depois ainda manipulados para produzir outros plasmideos, usados para transfectar células de planta ou incorporados em vetores relacionados com Agrobacterium tumefaciens para infectar plantas. Vetores típicos contêm terminadores de transcrição e tradução, seqüências de iniciação de transcrição e tradução, e promotores utilizáveis na regulação da expressão do ácido nucléico alvo particular. Os vetores opcionalmente compreendem cassetes genéricos de expressão contendo pelo menos uma seqüência de terminador independente, seqüências que permitem a replicação do cassete em eucariotes, ou procariotes, ou ambos, {por exemplo, vetores shuttle) e marcadores de seleção para ambos os sistemas procariótico e eucariótico. Os vetores são apropriados para replicação e integração em procariotes, eucariotes, ou preferencialmente em ambos. Ver Giliman & Smith (1979) Gene 8:81; Roberts et al. (1987) Nature 328:731; Schneider et al. (1995) Protein Expr. Purif. 6435:10; Ausubel, Sambrook, Berger (todos acima mencionados). Um catálogo de Bactérias e Bacteriófagos, utilizáveis em clonagem, é provido, por exemplo, pela ATCC, por exemplo, The ATCC Catalogue of Bactéria and Bacteriophage (1992) Gherna et al. (eds) publicado pela ATCC. Procedimentos básicos adicionais para seqüenciamento, clonagem e outros aspectos de biologia molecular e que ressaltara considerações teóricas também são encontrados em Watson et al. (1992) Recombinant DNA, Segunda Edição, Scientific American Books, NY.
Transformação de Ácidos Nucléicos em Plantas As concretizações da presente invenção são pertinentes à produção de plantas transgênicas compreendendo os ácidos nucléicos clonados, por exemplo, segmentos cromossômicos, ORFs isolados, e cDNAs associados com elementos genéticos identificados por sua proximidade com marcadores da invenção. As técnicas de transformação de células de planta com ácidos nucléicos estão, em geral, disponíveis e podem ser adaptadas à invenção pelo uso de ácidos nucléicos codificantes de ou correspondentes a segmentos cromossômicos, por exemplo, ORFs, e semelhantes. Em adição a Berger, Ausubel e Sambrook (abaixo mencionados), referências úteis em geral para a clonagem de célula de planta, cultivo e regeneração incluem Jones (ed) (1995) Plant Gene Transfer and Expression Protocols - Methods in Molecular Biology, Volume 49 Humana Press Towata NJ; Payne et al. (1992) Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons, Inc. New York, NY (Payne) ; e Gamborg e Phillips (eds) (1995) Plant Cell, Tissue and Organ Culture; Fundamental Methods Springer Lab Manual, Springer-Verlag (Berlin Heidelberg New York) (Gamborg). Uma diversidade de meios de cultura estão descritos em Atlas e Parks (eds) The Handbook of Microbiological Media (1993) CRC Press, Boca Raton, FL (Atlas). Informação adicional para cultura de célula de planta é encontrada em literatura disponível comercialmente, tal como o Life Science Research Cell Culture Catalogue (1998) da Sigma-Aldrich, Inc (St Louis, MO) (Sigma-LSRCCC) e, por exemplo, o Plant Culture Catalogue e suplemento (1997) também da Sigma-Aldrich, Inc (St Louis, MO) (Sigma-PCCS). Detalhes adicionais relativos a cultura de célula de planta são encontrados em Croy, (ed.) (1993) Plant Molecular Biology Bios Scientific Publishers, Oxford, U.K.
Os constructos de ácido nucléico da invenção, por exemplo, plasmídeos, cosmídeos, cromossomos artificiais, polinucleotídeos de DNA e RNA, são introduzidos em células de planta, tanto em cultura como nos órgãos de uma planta por uma variedade de técnicas convencionais. Quando a seqüência é expressada, ela opcionalmente é combinada com seqüências de regulação de iniciação de transcrição e de tradução, as quais dirigem a transcrição ou tradução da seqüência a partir do DNA exógeno nos tecidos intencionados da planta transformada. Ácidos nucléicos isolados podem ser introduzidos em plantas de acordo com qualquer uma de uma variedade de técnicas conhecidas do estado da arte. Técnicas para transformar uma ampla variedade de espécies de plantas superiores são bem conhecidas e estão descritas na literatura técnica, científica e de patentes. Ver, por exemplo, Weising et al. (1988) Ann. Rev. Genet. 22:421-477.
Por exemplo, plasmideos, cosmídeos, fago, polinucleotídeos livre ou diversamente DNA-conjugado (por exemplo, polilisina-DNA conjugado, peptídeo-DNA conjugado, lipossomo-DNA conjugado, etc), ou cromossomos artificiais podem ser introduzidos diretamente no DNA genômico da célula de planta usando técnicas tais como eletroporação e micro-injeção de protoplastos de célula de planta, ou os constructos de DNA podem ser introduzidos diretamente nas células de planta usando métodos de balística, tais como bombardeamento de partícula com DNA.
As técnicas de micro-injeção, para injetar em, por exemplo, células, embriões, calo e protoplastos, são bem conhecidas do estado da arte e bem descritas em literatura científica e de patentes. Por exemplo, inúmeros métodos são descritos em Jones (ed) (1995) Plant Gene Transfer and Expression Protocols - Methods in Molecular Biology, Volume 49 Humana Press Towata NJ, bem como em outras referências aqui observadas e disponíveis na literatura.
Por exemplo, a introdução de DNA usando precipitação com polietileno glicol é descrita em em Paszkowski, et al., EMBO J. 3:2717 (1984). As técnicas de eletroporação são descritas em Fromm, et al·., Proc. Nat'l. Acad. Sei. USA 82:5824 (1985). As técnicas de transformação por balística são descritas em Klein, et al., Nature 327:70-73 (1987).
Detalhes adicionais são encontrados em Jones (1995) e Gamborg e Phillips (1995) , acima citado, e na patente US 5.990.387.
Alternativamente, e em alguns casos preferivelmente, a transformação mediada por Agrobacterium é empregada para gerar plantas transgênicas. As técnicas de transformação Agrobacterium-mediadas, incluindo o desarme e uso de vetores binários, também são bem descritos na literatura científica. Ver, por exemplo, Horsch, et al. (1984) Science 233:496; e Fraley et al. (1984) Proc. Nat'l. Acad. Sei. USA 80:4803 e a revisão recente em Hansen e Chilton (1998) Current Topics in Microbiology 240:22 e Das (1998) Subcellular Biochemistry 29: Plant Microbe Interactions pp. 343-363.
Os constructos de DNA podem ser combinados com regiões flanqueadoras de T-DNA apropriadas e introduzidos em um vetor hospedeiro convencional de Agrobacterium tumefaciens. . As funções de virulência do hospedeiro Agrobacterium tumefaciens dirigirão a inserção do constructo e marcador adjacente no DNA da célula de planta quando a célula é infectada pela bactéria. Ver, patente US 5.591.616. Apesar de a Agrobacterium ser utilizada primordialmente em dicotiledôneas, certas monocotiledôneas podem ser transformadas por Agrobacterium. Por exemplo, a transformação de milho por Agrobacterium está descrita na patente US 5.550.318.
Outros métodos de transfecção ou transformação incluem: (1) transformação Agrobacterium rhízogenes-mediada (ver, por exemplo, Lichtenstein e Fuller (1987) In: Genetic Engineering, vol. 6, PWJ Rigby, Ed., London, Academic Press; e Lichtenstein; C. P., e Draper (1985) In: DNA Cloning, Vol. II, D. M. Glover, Ed., Oxford, IRI Press; WO 88/02405, publicado em 7 de abril de 1988, descreve o uso da linhagem A4 de A. rhizogenes e seu plasmídeo Ri juntamente com vetores A. tumefaciens pARC8 ou pARC16; (2) captação de DNA lipossomo-mediada (ver, por exemplo, Freeman et al. (1984) Plant Cell Physiol. 25:1353); (3) o método de vorteamento (ver, por exemplo, Kindle (1990) Proc. Natl. Acad. Sei., (USA) 87:1228. 0 DNA também pode ser introduzido em plantas por transferência direta de DNA no pólen, como descrito por Zhou et al. (1983) Methods in Enzymology, 101:433; D. Hess (1987) Intern Rev. Cytol. 107:367; Luo et al. (1988) Plant Mol. Biol. Repórter 6:165. A expressão de genes codificantes de polipeptideo podem ser obtidos por injeção do DNA nos órgãos reprodutivos de uma planta como descrito por Pena et al. (1987) Nature 325:274. 0 DNA também pode ser injetado diretamente nas células de embriões imaturos e os embriões são dessecados e re-hidratados como descrito por Neuhaus et al. (1987) Theor. Appl. Genet. 75:30; e Benbrook et al.(1986) em Proceedings Bio Expo Butterworth, Stoneham, Mass., pp. 27-54. Adicionalmente, uma variedade de vírus de planta que pode ser empregada como vetores é conhecida do estado da técnica e inclui vírus de mosaico de couve-flor (CaMV), geminivirus, vírus de mosaico de bromo, e vírus de mosaico de tabaco.
REGENERAÇÃO DE PLANTAS TRANSGÊNICAS
As células de planta transformadas que são derivadas por qualquer uma das técnicas de transformação citadas acima podem ser cultivadas para regenerar a planta completa que possui o genótipo transformado e, portanto, o fenótipo desejado. Tais técnicas de regeneração se baseiam na manipulação de certos fito-hormônios em um meio de crescimento de cultura de tecido, tipicamente, elas se baseiam em um marcador biocida e/ou herbicida que tenha sido introduzido juntamente com as seqüências de nucleotídeos desejadas. A regeneração de planta a partir de protoplastos cultivados está descrita em Evans et al. (1983) Protoplasts Isolation and Culture, Handbook of Plant Cell Culture pp. 124-176, Macmillian Publishing Company, New York; e Binding (1985) Regeneration of Plants, Plant Protoplasts pp. 21-73, CRC Press, Boca Raton. A regeneração também pode ser obtida a partir de calo de planta, explantes, embriões somáticos (Dandekar et al. (1989) J. Tissue Cult. Meth. 12:145; McGranahan, et al. (1990) Plant Cell Rep. 8:512) órgãos, ou partes dos mesmos. Tais técnicas de regeneração estão descritas, em geral, em Klee et al. (1987), Ann. Rev. of Plant Phys. 38:467-486. Detalhes adicionais são encontrados em Payne (1992) e Jones (1995), ambos acima mencionados, e Weissbach e Weissbach, eds. (1988) Methods for Plant Molecular Biology Academic Press, Inc., San Diego, CA. Esta regeneração e processo de crescimento incluem as etapas de seleção de células transformantes e brotações, enraizamento das brotações transformantes e crescimento das plântulas no solo. Esses métodos são adaptados à invenção para produzir plantas transgênicas portando QTLs e outros genes isolados de acordo com os métodos da invenção.
Adicionalmente, a regeneração de plantas contendo o polinucleotídeo da presente invenção e que foi introduzido por Agrobacterium em células de explantes de folha pode ser alcançada como descrito por Horsch et al. (1985) Science 227:1229-1231. Neste procedimento, os transformantes são crescidos na presença de um agente de seleção e em um meio que induz a regeneração de brotações na espécie de planta que está sendo transformada, como descrito por Fraley et al. (1983) Proc. Natl. Acad. Sei. (U.S.A.) 80:4803. Este procedimento tipicamente produz brotações dentro de duas a quatro semanas e essas brotações transformantes são depois transferidas para um meio apropriado raiz-indutor contendo o agente de seleção e um antibiótico para evitar o crescimento bacteriano. As plantas transgênicas da presente invenção podem ser férteis ou estéreis.
Na construção de cassetes de expressão recombinantes da invenção, os quais incluem, por exemplo, um ORF associado com um marcador ou elemento genético que contribui para a produtividade, é, opcionalmente, empregado um fragmento de promotor de planta que dirige a expressão de um ácido nucléico em qualquer um ou em todos os tecidos de uma planta regenerada. Exemplos de promotores constitutivos incluem a região de iniciação de transcrição 35S do virus de mosaico de couve-flor (CaMV), o promotor 1'- ou 2'- derivado de T-DNA de Agrobacterium tumefaciens, e outras regiões de iniciação de transcrição oriundas de vários genes de planta conhecidos daqueles especialistas na técnica. Alternativamente, o promotor de planta pode dirigir a expressão direta do polinucleotídeo da invenção em um tecido específico (promotores tecido-específicos) ou pode, de outra forma, sob o controle ambiental mais preciso (promotores induzíveis). Exemplos de promotores tecido-específicos sob controle de desenvolvimento incluem promotores que iniciam a transcrição somente em certos tecidos, tais como, fruta, sementes ou flores.
Qualquer um dentre inúmeros promotores que dirigem a transcrição direta em células de planta pode ser apropriado. 0 promotor pode ser tanto constitutivo como induzível. Em adição aos promotores observados acima, os promotores de origem bacteriana que operam em plantas incluem o promotor de octopina sintase, o promotor de nopalina sintase e outros promotores derivados de plasmídeos Ti nativos. Ver Herrara-Estrella et al. (1983), Nature, 303:209. Os promotores virais incluem os promotores de RNA 35S e 19S de vírus de mosaico de couve-flor. Ver Odell et al. (1985) Nature, 313:810. Outros promotores de planta incluem o promotor da pequena subunidade de ribulose-1,3-bisfosfato carboxilase e o promotor de faseolina. A seqüência do promotor do gene E8 e de outros genes também pode ser usada. 0 isolamento e seqüência do promotor E8 estão descritos em detalhe em Deikman e Fischer (1988) EMBO J. 7:3315. Muitos outros promotores estão em corrente uso e podem ser acoplados a uma seqüência de DNA exógeno para dirigir a expressão do ácido nucléico.
Se for desejada a expressão de um polipeptídeo, incluindo aquele codificado por QTL ou outro ácido nucléico, é tipicamente incluída uma região de poliadenilação na extremidade 3' da região codificante. A região de poliadenilação pode ser derivada de um gene natural, de uma diversidade de outros genes de planta, ou de, por exemplo, T-DNA. 0 vetor compreendendo as seqüências (por exemplo, promotores ou regiões codificantes) de genes que codificam produtos de expressão e transgenes da invenção tipicamente incluirá uma sub-seqüência de ácido nucléico, um gene de marcador que confere um fenótipo selecionável,' ou, alternativamente, passível de screening em células de planta. Por exemplo, o marcador pode codificar tolerância a biocida, particularmente tolerância a antibiótico, tal como tolerância a canamicina, G418, bleomicina, higromicina, ou tolerância a herbicida, tal como tolerância a clorosulforon, ou fosfinotricina (o ingrediente ativo dos herbicidas bialafos ou Basta). Ver, por exemplo, Padgette et al. (1996) In: Herbicide-Resistant Crops (Duke, ed.), pp 53-84, CRC Lewis Publishers, Boca Raton ("Padgette, 1996"). Por exemplo, a seletividade de culturas a herbicidas específicos pode ser conferida pelo engenheiramento de genes em culturas que codificam enzimas metabolizantes de herbicida apropriado a partir de outros organismos, tais como micróbios. Ver Vasil (1996) In: Herbicide-Resistant Crops (Duke, ed.), pp 85-91, CRC Lewis Publishers, Boca Raton) ("Vasil", 1996).
Os especialistas na técnica saberão reconhecer que após o cassete de expressão recombinante ser estavelmente incorporado em plantas transgênicas e confirmado ser operável, ele pode ser introduzido em outras plantas por cruzamento sexual. Qualquer uma de inúmeras técnicas padrão de melhoramento pode ser usada, dependendo da espécie a ser cruzada. Em culturas propagadas vegetativamente, as plantas transgênicas maduras podem ser propagadas pela retirada de cortes ou por técnicas de cultura de tecido para produzir múltiplas plantas idênticas. É feita a seleção de transgênicas desejáveis e novas variedades são obtidas e propagadas vegetativamente para uso comercial. Em culturas propagadas por semente, as plantas transgênicas maduras podem ser autocruzadas para produzir uma planta endogâmica homozigota. A planta endogâmica produz semente contendo o ácido nucléico heterólogo recentemente introduzido. Essas sementes podem ser crescidas para obter plantas que devem produzir o fenótipo selecionado. As partes obtidas da planta regenerada, tais como flores, sementes, folhas, ramos, fruta, e semelhantes estão incluídas na invenção, desde que essas partes compreendam células englobando o ácido nucléico isolado da presente invenção. A progênie e variantes, e mutantes das plantas regeneradas também estão incluídas dentro do escopo da invenção, desde que essas partes compreendam as seqüências de ácido nucléico introduzidas.
As plantas transgênicas expressando um polinucleotídeo da presente invenção podem ser submetidas a screening para transmissão do ácido nucléico da presente invenção por, por exemplo, técnicas padrão de imunoblot de detecção de DNA. A expressão no nivel de RNA pode ser determinada inicialmente para identificar e quantificar plantas de expressão positiva. Técnicas padrão podem ser empregadas para análise de RNA, incluindo ensaios de amplificação por PCR usando primers de oligonucleotídeo desenhados para amplificar somente os templates de RNA heterólogo e ensaios de hibridização em solução usando sondas ácido nucléico heterólogo-específicas. As plantas RNA-positivas depois podem ser analisadas com relação à expressão de proteína por análise de imunoblot Western usando os anticorpos especificamente reativos da presente invenção. Adicionalmente, podem ser feitas hibridização in situ e imunocito-química de acordo com protocolos padrão usando sondas de polinucleotídeo específicas para ácido nucléico heterólogo e anticorpos, respectivamente, para localizar sítios de expressão dentro do tecido transgênico. Geralmente, inúmeras linhagens transgênicas são usualmente submetidas a secreening com relação ao ácido nucléico incorporado para identificar e selecionar plantas com os perfis de expressão mais apropriados.
Uma concretização preferida é a planta transgênica que é homozigota com relação ao ácido nucléico heterólogo adicionado, ou seja, uma planta transgênica que contém duas seqüências de ácido nucléico adicionadas, um gene no mesmo lócus em cada cromossomo de um par de cromossomos. Uma planta transgênica homozigota pode ser obtida por combinação sexual (autofecundação) de uma planta transgênica heterozigota que contém um único ácido nucléico heterólogo adicionado, germinação de algumas das sementes produzidas e análise das plantas resultantes produzidas por expressão alterada de um polinucleotídeo da presente invenção com relação a uma planta controle (ou seja, nativa, não-transgênica). 0 retrocruzamento com uma planta parental e alogamia com uma planta não-transgênica também são contemplados. REFERÊNCIAS GERAIS DE BIOLOGIA molecular No contexto da invenção, por exemplo, identificação, monitoramento e/ou clonagem de marcadores moleculares e/ou outros lócus, ácidos nucléicos e/ou proteínas são manipulados de acordo com técnicas de biologia molecular bem conhecidas. Protocolos detalhados para numerosos procedimentos estão descritos em, por exemplo, Ausubel et al. Current Protocols in Molecular Biology (suplementado ao longo de 2000) John Wiley & Sons, New York ("Ausubel"}; Sambrook et al. Molecular Cloning - A Laboratory Manual (2a Ed.), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, 1989 ("Sambrook"), e Berger e Kimmel Guide to Molecular Cloning Techniques, Methods in Enzymology volume 152 Academic Press, Inc., San Diego, CA ("Berger").
Em adição às referências acima mencionadas, os protocolos para as técnicas de amplificação in vítro, tais como a reação em cadeia da polimerase (PCR) , a reação em cadeia da ligase (LCR), amplificação de Qp-replicase, e outras técnicas mediadas por RNA polimerase (por exemplo, NASBA), utilizáveis, por exemplo, na amplificação de sondas de cDNA da invenção, são encontradas em Mullis et al. (1987) , patente US 4.683.202; PCR Protocols A Guide to Methods and Applications (Innis et al. eds) Academic Press Inc. San Diego, CA (1990) ("Innis"); Arnheim e Levinson (1990} C&EN 36; The Journal Of NIH Research (1991) 3:81;
Kwoh et al. (1989} Proc Natl Acad Sei USA 86, 1173; Guatelli et al. (1990) Proc Natl Acad Sei USA 87:1874; Lomell et al. (1989) J Clin Chem 35:1826; Landegren et al. (1988) Science 241:1077; Van Brunt (1990) Biotechnology 8:291; Wu e Wallace (1989) Gene 4 : 560; Barringer et al. (1990) Gene 89:117, e Sooknanan e Malek (1995) Biotechnology 13:563. Métodos adicionais, utilizáveis em clonagem de ácidos nucléicos no contexto da presente invenção, incluem o descrito por Wallace et al. na patente US 5.426.039. Métodos aperfeiçoados de amplificação de grandes ácidos nucléicos por PCR estão resumidos em Cheng et al. (1994) Nature 369: 684 e as referências aqui mencionadas.
Certos polinucleotídeos da invenção, por exemplo, os oligonucleotídeos podem ser sintetizados utilizando várias estratégias de fase sólida envolvendo quimica de acoplamento de fosforamidita mononucleotídeo e/ou trinucleotídeo-baseado. Por exemplo, sequências de ácido nucléico podem ser sintetizadas pela adição seqüencial de monômeros e/ou trímeros ativados para uma cadeia de polinucleotideo alongada. Ver, por exemplo, Caruthers, M.H. et al. (1992) Meth Enzymol 211:3.
No âmbito de síntese de seqüências desejadas, essencialmente qualquer ácido nucléico pode ser encomendado de modo individualizado a partir de qualquer uma de uma variedade de fontes comerciais, tal como The Midland Certified Reagent Company (mcrcQoligos.com), The Great American Gene Company (www.genco.com), ExpressGen, Inc. (www.expressgen.com), Operon Technologies, Inc. (www.operon.com), e muitos outros.
Semelhantemente, estão disponíveis fontes comerciais de microsséries de ácido nucléico e proteína, e incluem, por exemplo, Affymetrix, Santa Clara, CA (http://www.affymetrix.com/); e Incyte, Paio Alto, CA (na world wide web em incyte.com); e Ciphergen Biosciences, Fremont, CA (em ciphergen.com).
Screening de Alta Produção Em um aspecto da invenção, a determinação de alelos de marcador genético é realizada por meio de screening de alta produção (high throughput screening). 0 screening de alta produção envolve o provimento de uma biblioteca de marcadores genéticos, por exemplo, primers de SSR, primers e sondas de ASH, RFLPs, AFLPs, isozimas, seqüências de alelos específicos e variáveis, incluindo SSR, RAPD e semelhantes. Tais bibliotecas são depois submetidas a screening contra genomas de planta para gerar um "fingerprint" para cada planta que está sendo considerada. Em alguns casos, um fingerprint parcial compreendendo uma sub-porção dos marcadores é gerada em uma área de interesse. Uma vez que os alelos de marcador genético de uma planta tenham sido identificados, a correspondência entre um ou diversos dos alelos de marcador e um desejado caractere fenotípico é determinado através de associações estatísticas baseadas nos métodos da invenção. 0 screening de alta produção pode ser realizado em muitos formatos diferentes. A hibridização pode acontecer em um formato de 96-, 324-, ou 1524-poços ou em uma matriz em um chip de silício ou outro formato.
Inúmeros sistemas robóticos bem conhecidos foram desenvolvidos para o screening de alta produção, principalmente um formato de 96 poços. Esses sistemas incluem estações de trabalho automatizadas, como o aparelho de síntese automatizada desenvolvido por Takeda Chemical Industries, LTD. (Osaka, Japan) e muitos sistemas robóticos utilizando braços robóticos (Zymate II, Zymark Corporation, Hopkinton, MA. ; ORCA™, Beckman Coulter, Fullerton CA). Qualquer um dos dispositivos acima mencionados é apropriado para uso na presente invenção. Será evidente para os especialistas na técnica relevante que a natureza e implementação de modificações nesses dispositivos (se houver) é feita de modo que eles possam operar como discutido aqui.
Adicionalmente, os sistemas de screening de alta produção, em si, estão comercialmente disponíveis (ver, por exemplo, Zymark Corp., Hopkinton, MA; Air Technical Industries, Mentor, OH; Beckman Instruments, Inc. Fullerton, CA; Precision Systems, Inc., Natick, MA, etc.).
Esses sistemas tipicamente automatizam os procedimentos completos, incluindo a pipetagem de todas as amostras e reagentes, a distribuição de líquidos, tempo de incubações, e leituras finais da microplaca ou membrana em detectores apropriados para o ensaio. Esses sistemas configuráveis fornecem alta produção e rápido start up assim como um elevado grau de flexibilidade e individualização. Os fabricantes de tais sistemas fornecem protocolos detalhados para o uso de seus produtos em aplicações de alta produção.
Em uma variação da invenção, matrizes de fase sólida são adaptadas para a detecção rápida e específica de nucleotídeos múltiplos polimórficos. Tipicamente, uma sonda de ácido nucléico é ligada a um suporte sólido e um ácido nucléico alvo é hibridizado com a sonda. Tanto a sonda, como o alvo, ou ambos, pode ser marcada, tipicamente com um fluoróforo. Se o alvo for marcado, a hibridização é avaliada para detectar fluorescência ligada. Se a sonda for marcada, a hibridização é tipicamente detectada por quenching da marcação {labei) pelo ácido nucléico ligado. Se ambos forem marcados, a sonda e o alvo, a detecção da hibridização é tipicamente realizada por monitoramento da mudança de cor resultante da proximidade das duas marcações ligadas.
Em uma concretização, uma série de sondas é sintetizada sobre um suporte sólido. Usando tecnologias de mascaramento em chip e química fotoprotetora, é possível gerar séries ordenadas de sondas de ácido nucléico. Essas séries, que são conhecidas, por exemplo, como "chips de DNA" ou como matrizes de polímero imobilizado de muito larga escala (séries VLSIPS™) podem incluir milhões de regiões definidas de sonda em um substrato tendo uma área de cerca de 1 cm2 a diversos cm2.
Em uma outra concretização, é usada eletroforese capilar para analisar polimorfismo. Esta técnica funciona melhor quando o polimorfismo é baseado em tamanho, por exemplo, SSR e AFLP. Esta técnica é descrita em detalhes nas patentes US 5.534.123 e US 5.728.282. Em resumo, tubos de eletroforese capilar são preenchidos com a matriz de separação. A matriz de separação contém hidroxietil celulose, uréia e opcionalmente formamida. As amostras de SSR e AFLP são alimentadas ao tubo capilar e submetidas a eletroforese. Em razão da pequena quantidade de amostra e matriz de separação requerida na eletroforese capilar, os tempos de corrida são muito curtos. Os tamanhos moleculares, e, portanto, o número de nucleotídeos presente na amostra de ácido nucléico, são determinados por técnicas aqui descritas. Em um formato de alta produção, muitos tubos capilares são colocados em um aparelho de eletroforese capilar. As amostras são carregadas nos tubos e a eletroforese das amostras é corrida simultaneamente. Ver Mathies e Huang, (1992) Nature 359:167.
EXEMPLOS
Deve ser entendido que os exemplos e concretizações aqui descritos são fornecidos com finalidade ilustrativa somente e que várias modificações ou mudanças à luz das mesmas será sugerido àqueles especialistas na técnica e devem ser incluídas dentro do espírito e limite desta descrição e escopo das reivindicações em anexo.
EXEMPLO 1: RESUMO DAS FORMAS ALÉLICAS FAVORÁVEIS PELOS
DADOS DE TENDÊNCIA DE MELHORAMENTO, POR REGIÃO GEOGRÁFICA
Nas Tabelas 3 a 9 são enumeradas as formas alélicas favoráveis de segmentos cromossômicos que contribuem para o desempenho agronômico superior em diferentes regiões geográficas e ambientes de crescimento. Nas Tabelas, * indica 95% de nível de significância, enquanto que ** indica um nível de significância de 99%. UM indica um lócus não-mapeado. Os detalhes com relação aos marcadores e alelos de SSR e ASH são providos Apêndices I a IV. As regiões geográficas são definidas com relação aos seguintes pontos de referência.
Região Central: Meio-oeste do centro dos Estados Unidos, centrado em torno de Des Moines, Iowa.
Região do Canadá: Canadá oriental, centrado em torno de Chatham, Ontario.
Região Norte: Meio oeste do norte dos Estados Unidos, centrado em torno de Redwood Falis, MN.
Região de Illinois: Norte e centro de Illinois, centrado em torno de Champaign, IL.
Região do Oriente: Meio-oeste oriental dos Estados Unidos, centrado em torno de Napoleon, Ohio.
Região meio meridional: Meio meridional dos Estados Unidos, centrado em torno de Hamil, IL.
Região Sui: Sul dos Estados Unidos, centrado em torno Memphis, TN. EXEMPLO 2: ALELOS FAVORÁVEIS DE SOJA E "GENÓTIPO(S) ALVO(S) " PARA ADAPTAÇÃO A AMBIENTES SIMILARES ÀQUELES ENCONTRADOS EM IOWA, EUA (REGIÃO CENTRAL) Três análises separadas de tendência de melhoramento foram conduzidas para identificar alelos favoráveis que forneceram adaptação a regiões geográficas que são típicas de Iowa, EUA. A primeira análise usou 41 linhagens elite como a "população elite" adaptada ao Iowa, a segunda análise incluiu uma amostra maior de 71 linhagens elite (Tabela 1, Região Central) e a terceira análise, realizada seguindo a estação de crescimento de 2003, usou 86 linhagens elite (Tabela 1, Região Central 2003). Em todos os casos, a população elite foi escolhida como uma amostra representativa de linhagens elite que produzem bem em Iowa e/ou são boas parentais para desenvolver linhagens elite adaptadas a Iowa. Cada análise sucessiva foi realizada após estarem disponíveis mais dados de marcador de linhagem elite e, portanto, tais análises sendo consideradas mais rigorosas. Apesar deste fato, os resultados da primeira análise foram muito similares e demonstraram que o método de tendência de melhoramento é utilizável mesmo com conjuntos menores de dados. Aqui, os resultados da segunda (A) e terceira análises (B) estão relatados devido ao tamanho de amostra maior da população elite.
Foi usado um programa de computador descrito na patente US 5.437.697 que simula o fluxo dos alelos dos ancestrais para as linhagens elite em cada lócus de marcador para determinar qual a percentagem de linhagens elite que se esperaria terem tido a chance de herdar cada alelo de marcador. Fazendo interações múltiplas do processo de simulação (10.000 interações neste caso), foi obtida uma medida estatística de. variação aleatória do resultado. A freqüência média de cada alelo na população elite simulada (das 10.000 interações) é aqui referida como a "freqüência esperada" (EXP) de cada alelo de marcador. A freqüência esperada foi depois comparada com a "freqüência observada" (OBS) a qual é simplesmente uma contagem de quantas linhagens dentro da população elite realmente contêm um dado alelo dividido pelo número total de linhagens elite examinadas. Pela comparação dos resultados observados para os resultados do processo de simulação, pode-se determinar com que freqüência seria esperada, em termos de chance, a ocorrência dos resultados observados. Se os .resultados observados fossem esperados somente em 5% das vezes ou menos, devido à chance (ou seja, um escore LOD de 1,3 ou maior), é seguro presumir que os resultados observados não ocorrem somente em termos de chance. Neste caso, a seleção para o rendimento de grãos precisa ter uma seleção induzida para um ou mais alelos nos lócus em questão. 0(s) alelo (s) que ocorrem com mais alta freqüência do que a esperada foram, portanto, marcados como "alelos favoráveis" e aqueles que ocorrem a uma freqüência mais baixa do que a esperada foram marcados como "alelos desfavoráveis". Os alelos favoráveis são aqueles que precisam ter contribuído tanto diretamente como indiretamente para uma produtividade I de grão mais alta.
Os resultados estatisticamente significantes da análise de Iowa (A) são mostrados na Tabela 10. Na medida que somente a maioria dos ancestrais foi genotipada na análise, ocasionalmente um alelo que foi detectado na população elite não foi sempre encontrado na população ancestral. Isto resultou em um escore de LOD não usualmente alto em razão da freqüência do alelo na população ancestral ter sido assumida como zero. É também razoável presumir que o alelo favorável deve ser aumentado em freqüência por alguma percentagem limiar antes que o alelo deva ser considerado geralmente "favorável" ao longo da ampla faixa de ambientes encontrados pelos melhoristas de soja durante o século passado. Por estas razões, um alelo com um escore de LOD de mais que ou igual a 1,3 {95% de confiança) e uma freqüência observada de pelo menos 25% mais alta que a esperada foi considerado ser "favorável"1 e "significante" sob ambos pontos de vista, o prático e o estatístico. Os alelos com esses critérios mais um escore LOD de 2,0 ou maior (99% de confiança), foram considerados como sendo "favoráveis" e "altamente ■significantes". Os alelos com escores LOD maiores que 1,3,' mas que não aumentaram em freqüência por pelo menos 25% durante o século passado foram considerados estatisticamente significantes mas não suficientes para serem considerados geralmente favoráveis ao longo da maioria dos ambientes. 0 termo escore "LOD" refere-se à probabilidade de log inverso negativo (base 10) com que a freqüência observada de um alelo na população elite pode ser atribuída em termos de chance somente. Mais especificamente, o escore LOD é uma medida do número de rodadas que a simulação de tendência de melhoramento (breeding bias) gerou uma freqüência de alelo pelo menos tão estrito quanto aquele observado na população elite real de linhagens de soja. A fórmula para um escore LOD de um alelo "favorável" é: -1.0 x loglO (f) onde: f = (número de rodadas de simulação em que a frequência de alelo observada na população elite foi maior do que aquela gerada por uma freqüência de alelo simulada) dividido por (número total de rodadas de simulação).
Por exemplo, um escore LOD >1,30 é análogo a uma probabilidade <0,05 de que a freqüência de alelo observada na população elite foi devida a chance somente; um escore LOD >2,00 é análogo a uma probabilidade <0,01 de que a freqüência de alelo observada na população elite foi devida a chance somente; um escore LOD >3,00 é análogo a uma probabilidade <0,001 de que a freqüência de alelo observada na população elite foi devida a chance somente; um escore LOD de 4,00 é análogo a uma probabilidade de 0,0001 de que a freqüência de alelo observada na população elite foi devida a chance somente. Na medida que foram conduzidas somente 10.000 rodadas de simulação, o escore LOD máximo observado não foi nenhum mais alto que 4,00.
Com base na. análise de Iowa, dos 1540 alelos ao longo de 309 lócus de marcador genético, um total de 94 alelos mostrou evidência de ser favorável de. acordo com a acima mencionada definição: um escore LOD de pelo menos 1,30 (95% de nivel de confiança) e um aumento em freqüência de alelos de pelo menos 25% mais do que o esperado por herança aleatória. Na medida que alguns desses alelos favoráveis estão estreitamente ligados (ou seja, menos do que 10 CM de afastamento de acordo com estudos independentes de mapeamento), nem todos os 94 alelos são diagnóstico de lócus únicos de QTL. Portanto, os marcadores foram divididos em regiões genômicas com a suposição de que aqueles marcadores no mesmo cromossomo que estão aproximadamente 10 CM ou mais afastados são provavelmente diagnóstico de lócus diferentes de QTL.
Em adição à lista de alelos favoráveis que se estende pelo genoma, a Tabela 10 indica o alelo favorável com o melhor escore estatístico e/ou a maioria dos dados de marcador dentro de cada região genômica predefinida. O "melhor" alelo de marcador para usar para cada região pode também ser escolhido baseado em qual marcador funciona melhor no laboratório. Na maioria dos casos, o marcador, com o mais alto escore LOD e a mais alta diferença % entre a freqüência observada de alelos e a freqüência esperada, foi considerado o "melhor" marcador na sua região genômica. Por exemplo, no cromossomo Cl, há 4 marcadores que correspondem no mapa às posições 95,8 até 99,0 - Satt399, Satt361, P10639A-1, e Sattl90. Estes estão todos dentro da distância de 10 CM de um em relação ao outro e, portanto, foram assinalados como a mesma região genômica #29. Dentre esses 4 marcadores, os marcadores Satt399 e Sattl90 tiveram o escore LOD mais alto possível de 4,0 quando foram feitas 10.000 interações de uma simulação. Isto significa que mesmo após 10.000 interações terem sido feitas, não houve sequer 1 interação onde a simulação produziu resultados mais estritos do que os observados na população elite real. üm escore LOD de 4,0 é meramente o log inverso da probabilidade (1 em 10.000) de que os resultados obtidos nesses lócus seja devido somente à chance. A partir disso, pode-se decidir qual desses 2 lócus seria o melhor marcador para identificar o alelo favorável naquela região. Neste caso, o Sattl90 foi escolhido como o melhor marcador naquela região porque os resultados foram baseados nos dados de 65 em oposição às 61 linhagens elite. Apesar de um total de 71 linhagens elite terem sido genotipadas para este marcador, 6 linhagens elite tiveram dados com falta deste lócus.
Uma vez que o marcador desejável seja identificado e o alelo favorável daquele marcador seja determinado, a seleção para aquele alelo favorável em um ensaio de laboratório pode depois ser usado na MAS para identificar plantas que tenham o alelo favorável. 0 processo de MAS pode ser feito em múltiplos lócus simultaneamente para plantas que contêm o número máximo de alelos favoráveis que se estendem pelo genoma. Este grupo de todo-genoma de alelos favoráveis nos quais a seleção é baseada é aqui referido como o "Genótipo Alvo". A Tabela 11 mostra o Genótipo Alvo de todo-genoma para o melhor lócus a partir de cada região genômica que atende aos critérios de "significante" - ou seja, escore LOD de pelo menos 1,3 e um aumento na freqüência de alelo de pelo menos 25% maior do que a esperada em termos de chance somente. Um total de 57 alelos favoráveis, cada um representando o que foi favorecido por seleção em uma região genômica diferente, se ajustou a esses critérios para fazer o Genótipo Alvo no LOD 1,3 {Tabela 11, *). Se se elevar o cutoff estatístico para um LOD de 2,0, o Genótipo Alvo é focado nos 30 alelos favoráveis (Tabela 11, **). Para finalidade de MAS, pode-se desejar selecionar primeiramente os alelos favoráveis com a significância estatística mais alta. Portanto, o caminho lógico para finalidade de melhoramento seria selecionar primeiramente, entre a progênie segregante, o Genótipo Alvo dos 30 lócus. Uma vez que esses lócus sejam fixados para os alelos mais favoráveis, os outros 27 lócus no Genótipo Alvo de 57-lócus podem ser o foco da seleção. Se os recursos forem ■ ilimitados, pode-se presumivelmente trabalhar com todos os 57 lócus. Os lócus também podem ser estimados com base na sua significância estatística para propósitos de seleção. A seguir à estação de crescimento de 2003, uma análise adicional (B) foi realizada auraentando-se o número de linhagens parentais elite de 71 para 86, e avaliando 265 marcadores adicionais de SSR. As linhagens elite usadas nesta análise são dadas na Tabela 1.
Os alelos significantes favoráveis são dados na Tabela 12. Em razão de mais linhagens elite terem sido usadas para definir a população, e porque alguns dados antes ausentes foram obtidos para os marcadores previamente empregados, algumas diferenças estatísticas dos escores LOD foram observadas para os marcadores na Análise B em comparação com a anterior Análise A. Quase todos os marcadores previamente identificados foram confirmados na análise expandida, e foram encontrados diversos novos marcadores nas mesmas regiões genômicas para ter escores LOD mais altos. Conseqüentemente, esses novos marcadores são também considerados como utilizáveis na definição de genótipo alvo e para identificar e rastrear alelos favoráveis em germoplasma de soja. 0 Genótipo Alvo é realmente um genótipo de marcador consenso que a população elite tinha movido na direção do resultado da seleção. Na medida que este genótipo é agora definido por marcadores específicos e alelos favoráveis específicos, é possível praticar a seleção por meio de genótipo ao invés do ineficiente e vagaroso processo de seleção baseado em fenótipo. A resolução do genótipo de consenso é limitado somente pela cobertura genômica provida pelos marcadores genéticos que está disponíveis para a MAS. EXEMPLO 3: STATUS DE ALELOS FAVORÁVEIS NA VARIEDADE DE SOJA A3127 0 exemplo a seguir é dado para ilustrar como os alelos favoráveis identificados no exemplo anterior se juntaram no famoso segregante transgressivo na história de melhoramento da soja. A maioria das novas variedades de soja representa um pequeno aperfeiçoamento com relação a ambos os seus parentais em termos de produtividade. 0 progresso na produtividade por ciclo (5 a 6 anos) de melhoramento é comumente pouco, em termos percentuais, melhor do que ambos os parentais. No entanto, no início dos anos 1980, foi desenvolvida uma variedade chamada A3127 que era muito melhor do que ambos parentais {~10% melhor do que ambos parentais). De fato, a A3127 é provavelmente uma das poucas linhagens com a qual todos os melhoristas de soja se familiarizam porque ela foi famosa por ser a variedade de mais alta produtividade de seu tempo (início dos anos 1980). Antes da comercialização, a A3127 provou ser de muito maior produtividade do que ambas as parentais Williams e Essex. A A3127 ficou tão popular que ela se tornou a parental mais frequentemente usada na história de melhoramento de soja. Na medida que a A3127 é adaptada ao Iowa, nós estudamos os perfis de marcador de Williams, Essex, e A3127 nos 30 lócus preferidos de "gene de produtividade" para a zona geográfica do Iowa. Nós descobrimos que Williams e Essex diferem em 23 de 30 desses lócus (Tabela 13). Dos 23 lócus segregantes, Williams forneceu 13 dos alelos favoráveis e Essex forneceu os outros 10 alelos favoráveis. Se esses realmente forem os lócus majoritários de produtividade, esperar-se-ia que a A3127 teria significativamente mais alelos favoráveis do que ambos os parentais. Admiravelmente, a A3127 tinha todos os 23 alelos favoráveis. Um tal segregante somente seria esperado acontecer, em termos de chance, em 1 dentre >8 milhões de progênies (0,523} a menos que esses lócus realmente sejam diagnóstico de produtividade e a A3127 seja verdadeiramente a segregante única. 0 genótipo de marcador da A3127 é, portanto, consistente com a hipótese de que esses 30 lócus de marcador são diagnóstico de produtividade.
EXEMPLO 4: SEGREGAÇÃO PARA PRODUTIVIDADE EM SUB-LINHAGENS
APROXIMADAMENTE-ISOGÊNICAS
Tipicamente, as modernas variedades de soja se originaram de uma única planta selecionada a partir de uma população parcialmente endogâmica (comumente F3) que foi gerada a partir de um acasalamento controlado entre parentais geneticamente diferentes. A semente da nova variedade é depois multiplicada por subsequente conjugação {pooling) (ou "bulking") de sementes a partir da progênie de autofecundação da planta selecionada F3. Para alguns lócus na planta original F3 que era heterozigota, a variedade endogâmica resultante se tornará eventualmente uma mistura das duas homozigotas nos ditos lócus. Para finalidades comerciais, as variedades de soja são purificadas com relação a caracteres visuais óbvios (por exemplo, cor de flor, cor do hilo, maturidade, e outros caracteres visuais que são altamente hereditários e controlados por um ou uns poucos genes), mas freqüentemente abriga variação genética que não é óbvia a olho nu. Os marcadores genéticos podem ser usados para detectar lócus que contribuem para aquela variação que são ainda segregantes dentro da assim chamada "linhagem pura". Na medida que a análise de tendência de melhoramento (breeding bias) identifica quais lócus de marcador foram afetados pela seleção em relação à produtividade de semente, esses marcadores são ferramentas ideais para identificar diferenças genéticas entre plantas dentro da variedade heterogênea original que pode se traduzir em melhoramento de produtividade de semente. Estes marcadores podem ser usados para separar a variedade heterogênea original em sub-linhagens "aproximadamente-isogênicas" que diferem em lócus genéticos específicos.
Por exemplo, amostras de semente a partir de progênie individual auto-polinizada oriundas da variedade são genotipadas, e a semente que compartilha um alelo comum em um ou mais lócus de marcador identificados é conjugada para produzir uma sub-linhagem. Tais sub-linhagens são geneticamente distintas uma da outra. Na determinação da sub-linhagem "cega" (ou seja, determinação da sub-linhagem nâo-assitida por meio de dados de marcador) não há garantia de que as sub-linhagens geradas sejam geneticamente distintas. Suficiente número de sementes para experiências replicadas controladas pode ser obtido em uma geração por meio da conjugação de sementes de muitas plantas com um genótipo homogêneo de marcador. Isto é preferível em relação à determinação de sub-linhagem cega de várias maneiras. Primeiramente, a única maneira de tentar a homogeneidade genética sem marcadores é conjugar as sementes de uma única planta que pode ou não ser geneticamente distinta das sementes de outras plantas únicas. Segundo, uma única planta pode somente fornecer suficientes sementes para um teste de produtividade de fieíra curta em um ambiente. Portanto, a determinação de sub-linhagem requer gerações subseqüentes de aumento de sementes para se obter suficientes sementes para experiências de produtividade altamente replicadas que são necessárias para comparações confiáveis de produtividade. Terceiro, mesmo que diferenças fenotípicas sejam observadas com determinação de sub-linhagem cega, nenhuma informação genética é ganha para uso futuro. Pela comparação do desempenho em campo de tais sub-linhagens baseadas em marcador, em experimentos controlados, pode-se determinar o efeito fenotípico (por exemplo, com relação à produtividade) de cada alelo (e a correspondente região genômica, se o marcador está mapeado) em um dado background genético. Isto é particularmente útil para caracteres, tal como produtividade, nos quais as interações gene-com-gene e gene-com-ambiente desempenham um papel substancial no fenótipo. Se uma sub-linhagem tiver performance significativamente melhor do que a outra, a sub-linhagem melhor pode ser multiplicada e liberada como uma versão melhorada da variedade original.
Pelo fato de que a seleção que é baseada em genótipo (por exemplo, polimorfismo qualitativo de DNA) e depois confirmada com uma diferença fenotípica seja mais confiável e hereditária do que a seleção baseada no fenótipo somente (ou seja, determinação cega de sub-linhagem), o aperfeiçoamento no fenótipo em uma sub-linhagem cega é provavelmente menos hereditária e de modo improvável será repetida em gerações subseqüentes. Em contraste, a sub-linhagem baseada em marcador não somente provê informação genômica útil, mas ela também melhora a hereditariedade e reprodutibilidade de caracteres selecionados. Portanto, a "sub-linhagem" baseada em marcador pode ser uma ferramenta poderosa tanto para o desenvolvimento de produto como para determinar o efeito fenotípico de lócus individuais em um dado background genético.
De acordo com este método, os marcadores genéticos identificados através de tendência de melhoramento (breeding bias) se mostraram ferramentas eficazes para selecionar dentro de linhagens elite o ganho de produtividade residual. Quando se realiza a genotipagem de linhagens elite com marcadores genéticos, 8 plantas ao acaso de cada linhagem elite são rotineiramente amostradas e reunidas. Se a linhagem elite for uma mistura 50:50 de dois homozigotos em um dado lócus, uma amostra de 8 plantas aleatórias detectará ambos os alelos >99% do tempo. Usando este procedimento de amostragem, a segregação dentro de linhagens comerciais de soja é detectada em uma média de cerca de 4% dos lócus de marcador examinados (por exemplo, quando se analisam os "melhores" lócus de marcador para cada região cromossômica).
Na experimentação a seguir foram examinadas seis linhagens elite. Duas dessas linhagens elite (91B91 e 92M70) se mostraram segregantes em dois lócus de marcador, cada uma, enquanto que as outras 4 linhagens elite (92B05, 93B01, 93M80, e 93M90) foram segregantes em um lócus de marcador como indicado na Tabela 14.
Para desenvolver as sub-linhagens, o tecido de folha para plantas individuais de cada uma das linhagens elite acima mencionadas foi genotipada com os marcadores segregantes em cada linhagem originária. Sementes da progênie oriunda de plantas homozigotas individuais do mesmo genótipo de marcador foram então conjugadas para obter sementes suficientes de cada sub-linhagem para conduzir experimentações de produtividade replicadas. 0 número de plantas usado para criar cada sub-linhagem é mostrado na Tabela 15.
Para se determinar a produtividade relativa de sementes, as sub-linhagens derivadas da mesma linhagem elite foram plantadas em um desenho de campo de parcelas subdivididas (split plot field design) entre 5 e 14 localizações, tratando-se cada localização como uma replicação individual. As localizações foram escolhidas para estender a região de crescimento de soja de zona de maturidade apropriada para as linhagens que estão sendo testadas no meio-oeste dos Estados Unidos. As sub-linhagens derivadas de uma dada linhagem elite foram aleatoriamente marcadas para parcelas subdivididas (split plots) dentro de cada parcela principal (main plot). Cada parcela subdividida consistiu de duas fileiras de 12 pés de comprimento de dadas sub-linhagens que foram espaçadas por 30 polegadas uma da outra. A produtividade de semente foi medida na maturidade e convertida para bushels por acre (1 bushel-60 libras).
Diferenças significativas de produtividade entre iso-linhagens foram detectadas em 3 dos 6 testes de iso-linhagem. Na medida que as iso-linhagens acima testadas foram derivadas da reunião de muitas plantas de genótipo similar, pode-se, com razoável segurança, presumir que a possibilidade de segregação residual em outros lócus independentes aconteceu ao acaso e não foi a fonte de diferença de produtividade entre as iso-linhagens. A magnitude das diferenças significativas de produtividade (de 5,4 a 6,2% entre sub-linhagens ou de 2,7 a 3,1% melhor do que a variedade original misturada) é de grandeza semelhante aos aperfeiçoamentos de produtividade que tipicamente são obtidos usando esforços de melhoramento muito mais exaustivos. As novas variedades de soja desenvolvidas sem a ajuda de marcadores de genes de produtividade pode facilmente requerer centenas de milhares de paercelas de protutividade (yield plots} para identificar uma nova variedade que seja 2 ou 3% melhor o que a sua melhor parental. Este método pode ser usado para identificar ganhos de produtividade de grandeza semelhante com recursos muito limitados (2 iso-linhagens x 14 replicações = 28 parcelas (plots) por teste). Adicionalmente, para basear a seleção em uma diferença genética verdadeira em um lócus mostrando a tendência de melhoramento histórico, é substancialmente aumentada a segurança de que as diferenças de produtividade detectadas estão geneticamente baseadas (em oposição ao erro ambiental ou experimental).
Adicionalmente, esses resultados confirmam o fato de que os efeitos de epistase, interações gene-com-ambiente e/ou recombinaçâo entre o alelo de marcador identificado pela tendência de melhoramento e o elemento genético que sustentam os aperfeiçoamentos genéticos, quando predominante, não prejudicam a seleção de variedades de soja melhoradas, especialmente se for tomado cuidado para identificar variação residual e selecionar sub-linhagens apropriadas. Por exemplo, a Satt591 foi usada para selecionar sub-linhagens oriundas de duas linhagens elite diferentes (93B01 e 93M90). A análise de tendência de melhoramento sozinha indicou que o alelo 3 da Satt591 foi o único preferido dos melhoristas durante o período. No caso da 93B01, o alelo 3 foi o alelo favorável na medida que foi o genótipo da sub-linhagem de melhor produtividade. Em contraste, no caso da 93M90, o alelo 1 de marcador foi o alelo favorável.
Por exemplo, apesar de a análise de tendência de melhoramento ter identificado lócus ligados aos elementos genéticos que tinham sido favoráveis na maioria dos backgrounds genéticos em uma diversidade de ambientes de crescimento, a epistase e outras interações não-aditivas influem na observação de qual alelo é "favorável" dentro de populações especificas, ou para ambientes particulares. Adicionalmente, os genes de resistência a doença, que contribuem para a produtividade relativamente alta quando a doença é predominante, têm sido documentados como resultando em produtividade mais baixa na ausência de pressão de doença. A recombinação entre lócus de marcador e o elemento genético ligado que contribui para a produtividade melhorada pode também reduzir a eficiência do marcador assistido. Um princípio genético que é aceito e provado é o de que a freqüência de Crossing over entre dois lócus genéticos, por exemplo, um lócus de marcador e um lócus de caractere quantitativo, é uma função da distância genética entre os dois lócus. A única maneira de evitar tais inversões de fase é desenvolver marcadores "perfeitos" que são o diagnóstico do polimorfismo de DNA que é responsável pela diferença fenotípica controlada pelo QTL. Quer dizer, a recombinação só pode ser eliminada pela clonagem do QTL, e identificação da mutação casualmente determinante da diferença em fenótipo. 0 desenvolvimento de marcadores perfeitos é possível, mas não é um exercício trivial. Ele requer o seqüenciamento de DNA da região genômica circunvizinha e a associação enfraquecida seqüência- fenótipo para se determinar conclusivamente qual polimorfismo de DNA está sempre associado com o fenótipo desejado. Este é um esforço dispendioso e que consome tempo, cujos benefícios podem, em grande parte, ser alcançados usando os métodos e os lócus de marcador da presente invenção, sem dispêndio e demora com clonagem de cada um dos QTL significativos associados com um lócus de marcador identificado usando a tendência de melhoramento. Através da confirmação periódica da associação de marcador e fenótipo, usando os métodos da presente invenção, os melhoristas podem ainda colher os benefícios de marcadores ligados (mas não-perfeitos). A Tendência de Melhoramento é um método eficaz para identificar regiões genômicas que tenham sofrido seleção direcional. Se um marcador está próximo suficientemente (tipicamente dentro de cerca de 10 CM) de um QTL importante em um dado ancestral, o alelo de marcador, originalmente ligado em acoplamento com o alelo de QTL favorável, permanecerá em fase de acoplamento por um período suficiente de seleção sob procedimentos padrão de melhoramento para detectar aquela seleção que está ocorrendo na região genômica que inclui o marcador. Portanto, os lócus de marcador aqui enumerados estão associados com, e agem como substitutos de, QTL que contribuem para produtividade aumentada. Apesar de que, com ciclos repetidos de recombinação entre membros de um dado pool de genes, os crossovers genéticos entre o lócus de marcador e o QTL tenderão a se acumular e eventualmente resultar em um estado de "equilíbrio de ligação" entre os alelos de marcador e o QTL, a reavaliação periódica usando os procedimentos de sub-linhagem aproximadamente isogênica aqui descritos podem garantir que a seleção prossiga para o alelo em fase de ligação com o desejado alelo de QTL, apesar do potencial para a recombinação.
Os experimentos de sub-linhagem acima mencionados indicam que a realização de sub-linhagem marcador-baseada é um método eficaz para a purificação e melhoramento de linhagens elite de soja. Se o número de marcadores segregantes dentro de uma dada linhagem ou população for pequeno, os efeitos não-aditivos e fase de ligação (acoplamento ou repulsão} não representam um problema, na medida em que é razoavelmente barato testar em campo todos os recombinantes possíveis e identificar aqueles com o fenótipo ótimo.
EXEMPLO 5: CONFIRMAÇÃO DE ALELO USANDO CRUZAMENTOS ALEATÓRIOS
Para aumentar a eficiência da seleção marcador-assistida para produtividade melhorada usando, por exemplo, os lócus de marcador aqui enumerados, pode ser confirmado o alelo do lócus de marcador segregante com a produtividade. Em seguida à identificação dos lócus de marcador pela Tendência de Melhoramento, é realizado um número limitado de cruzamentos entre os parentais elite de mais alta produtividade para uma zona geográfica particular ou ambiente de crescimento. Preferencialmente, os parentais devem ser tão polimórficos quanto possível nos lócus de marcador identificados. A progênie (Fl) oriunda dessa elite por meio de cruzamentos de elite é endogâmica para gerar uma grande população (por exemplo, entre cerca de 200-5000, tipicamente pelo menos cerca de 1000) de linhagens F3-derivadas. Se desejado, a endogamia para gerações posteriores também pode ser feita para aumentar a variação genética entre linhagens.
Um subconjunto de "linhagens testadoras" é selecionado aleatoriamente dentre as linhagens endogâmicas derivadas de cada cruzamento. Por exemplo, podem ser selecionadas entre cerca de 10 e 500 linhagens. Tipicamente, entre cerca de 50 e 100 linhagens endogâmicas são aleatoriamente selecionadas e são produzidas sementes suficientes para conduzir uma experimentação de produtividade confiável. Diversas, (ou seja, entre pelo menos 5 e 12, por exemplo, 8) plantas oriundas de cada linhagem endogâmica são genotipadas nos lócus de marcador segregantes nos parentais elite a partir dos quais a linhagem foi encontrada, para determinar se a linhagem é segregante ou fixada (homozigota) com relação ao marcador relevante. As linhagens remanescentes ("população remanescente") podem ser armazenadas sob condições que preservem a viabilidade da semente. Se desejado, as linhagens adicionais podem ser selecionadas para teste, ou genotipadas, com relação à presença dos alelos confirmados como estando em fase de acoplamento de ligação.
Para cada cruzamento, é realizada uma experimentação de produtividade replicada. O teste é replicado em ambientes suficientes para amostrar adequadamente a região geográfica de interesse e para se obter uma medida confiável de fenótipo. 0 efeito na produtividade para cada lócus de marcador dentro de cada cruzamento é determinado por comparação da produtividade média de linhagens com um primeiro alelo com relação à produtividade média de linhagens com o alelo alternado. Se a diferença em produtividade não for significativa, o marcador pode ser eliminado naquele cruzamento. Em contraste com isso, se a diferença em produtividade for significativa, o alelo "favorável" é confirmado e o lócus é usado para subseqüente seleção assistida por marcador para produtividade. A confirmação dos alelos favoráveis também permite a identificação de um "genótipo alvo" incluindo todos os alelos favoráveis ao longo dos lócus segregantes em uma elite particular por cruzamento de elites. Como indicado acima, a população remanescente completa pode ser submetida a screening com o subconjunto de marcadores confirmados para identificar aqueles segregantes que tenham o maior número de alelos favoráveis. Tipicamente, será selecionado pelo menos 5% das linhagens remanescentes que mais se aproximam do genótipo alvo, apesar de que linhagens adicionais podem ser incluídas de acordo com o arbítrio do melhorista. As linhagens selecionadas podem depois ser avaliadas em testes de produtividade altamente replicadas para identificar quais cruzamentos possuem melhor desempenho com relação a ambos os parentais elite sob uma diversidade de ambientes e condições de crescimento.
Apesar de a invenção precedente ter sido descrita em alguns detalhes para finalidades de clareza e entendimento, ficará evidente para aqueles especialistas na técnica, a partir da leitura desta descrição, que várias mudanças na forma e detalhe podem ser feitas sem se afastar do verdadeiro escopo da invenção. Por exemplo, todas as técnicas e aparelhos descritos acima podem ser usados em várias combinações. Todas as publicações, patentes, pedidos de patente e/ou outros documentos citados neste pedido são incorporados a titulo de referência em sua integridade para todos os propósitos na mesma extensão como se cada publicação individual, patente, pedido de patente e/ou outro documento fosse individualmente indicado para ser incorporado a titulo de referência para todos os propósitos.
LISTAGEM DE SEQÜÊNCIAS 1) INFORMAÇÕES GERAIS: I.a) Requerente: PIONEER HI-BRED INTERNATIONAL INC. I.b) Endereço: 7100 NW, 62ND Ave. - P.O. Box 1014, Johnston, IA, 50131-101 (US) II) Dados de Prioridade Unionista: US - No. 60/492.074 de 01/08/2003 US - No. 60/547.811 de 25/02/2004 US - No. 60/582.241 de 22/06/2004 III) Titulo da Invenção: Método para identificar uma sublinhagem de soja, conjunto de marcadores úteis para a identificação de uma planta de soja, sistema e meio computacional de leitura. IV) Número de Seqüências: 819 (oitocentos e dezenove) V) Formato para leitura em computador: V.a) Meio utilizado: disquete de 3,5 polegadas V.b) Computador utilizado: compativel com IBM
PC

Claims (35)

1. Método para identificar uma sublinhagem de soja com aumento de produtividade caracterizado pelo fato de compreender: (i) determinar em um genoma de cada uma de uma pluralidade de progênies de um progenitor de soja, ao menos uma forma alélica de uma pluralidade de segmentos cromossômicos, cada compreendendo um elemento genético contribuindo para o aumento de produtividade e cada compreendendo, ou próximo a, entre 10% e 100% de um conjunto de loci marcadores consistindo em: Satt684, Sattl65, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, Satt225, Satt236, Satt511, P12390B-1, Satt480, Satt632-TB, Satt233, Satt327, Satt329, Satt508, P10635A-1, Satt409, Satt228, Satt429, Satt426, Satt509, SAT_261, Sattl97, Satt519, Satt597, SCT_026, Satt415, Satt583, Satt430, P12198A-1, P8584A-1, Satt359, P10648A-1, P12105A-1, P10641A-1, P10638B-2, Satt399, Satt361, P10639A-1, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt227, Satt640-TB, Satt422, Satt457, Satt557, Satt319, SAT_142-DB, Satt460, P13073A-1, Satt307, SCT_028, Satt433, Satt357, 'Satt321, Satt2 67, Satt383, Satt295, Satt203, Satt507, SAT_110, P10620A-1, Sattl29, Sattl47, Satt216, SAT_351, P10621B-2, Satt701, Satt634, Satt558, Satt266, Satt282, Satt537, Satt506, Satt546, P13072A-1, Satt582, Satt389, Satt461, Satt311, Satt514, Satt4 64, Satt662, Satt543, Sattl86, Satt413, Satt672, P13074A-1, P10624A-1, Satt573, Satt598, Satt204, Satt263, Satt491, Satt602, Sattlól, Satt355, Satt452, SAT_273-DB, Sattl46, Satt193, Satt569, Satt343, Satt586, Satt040, Satt423, Satt348, Satt595, P10782A-1, P3436A-1, P10598A-1, Satt334, Satt510, Satt522, P9026A-1, P10646A-1, P5219A-1, P7659A-2, Satt570, Satt356, Sattl30, Sattll5, Satt594, Satt533, Satt303, Satt352, Satt566, Sattl99, Satt503, Satt517, Sattl91, SAT_117, Satt353, Satt442, Satt279, Satt314, Sattl42, Sattl81, Satt367, Sattl27, SCTT012, Satt270, Satt292, P10640A-1, Satt249, SCT_065, Satt596, Satt280, Satt406, Satt380, Sattl83, Satt529, Satt431, Satt242, Sattl02, Satt441, Satt544, Satt617, Satt240, P10618A-1, Satt475, Sattl96, SAT_301, Satt523, Satt418, Satt398, Satt4 97, Satt284, Sattl66, Satt448, Satt373, Satt513, P12394A- 1, Satt590, Satt567, Satt220, Satt536, Sattl75, Satt677, Satt680, P10615A-1, Satt551, Satt250, Satt346, Satt336, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, Satt584, SAT_084, P3050A-2, SAT_275-DB, Satt387, Satt549, Satt660, Satt339, Satt255, Satt257, Satt358, P12396A-1, Satt487, Satt259, Satt347, Satt420, Satt576, Satt550, Satt633, Satt262, Satt473, Satt477, Satt581, P11070A-1, Sattl53, Satt243, P8230A-1, P10623A-1, P10632A-1, P10793A-1, P12391A-1, P13560A-1, P13561A-1, P2481A-1, S60021-TB, S60048-TB, S60076-TB, S60148-TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S60505-TB, S60513-TB, S60519-TB, S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812-TB, Satt040, Sattl08, Sattl09, Sattlll, Satt176, Satt219, Satt299, e Satt512; (ii) identificar uma sublinhagem com aumento de produtividade.
2. Método de acordo com a reivindicação 1, caracterizado por compreender determinar a forma alélica de entre 50% e 100% dos segmentos cromossômicos compreendendo, ou próximos a, marcadores do conjunto: Satt684, Sattl65, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, Satt225, Satt236, Satt511, P12390B-1, Satt480, Satt632-TB, Satt233, Satt327, Satt329, Satt508, PIO 635A-1, Satt409, Satt228, Satt429, Satt426, Satt50 9, SAT_2 61, Sattl97, Satt519, Satt597, SCT_026, Satt415, Satt583, Satt430, P12198A-1, P8584A-1, Satt359, P10648A-1, P12105A-1, P10641A-1, P10638B-2, Satt399, Satt361, P10639A-1, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt227, Satt640-TB, Satt422, Satt457, Satt557, Satt319, SAT_142-DB, Satt460, P13073A-1, Satt307, SCT_028, Satt433, Satt357, Satt321, Satt267, Satt383, Satt295, Satt203, Satt507, SAT_110, P10620A-1, Sattl29, Sattl47, Satt216, SAT_351, P10621B-2, Satt701, Satt634, Satt558, Satt266, Satt282, Satt537, Satt506, Satt546, P13072A-1, Satt582, Satt389, Satt461, Satt311, Satt514, Satt464, Satt662, Satt543, Sattl86, Satt413, Satt672, P13074A-1, P10624A-1, Satt573, Satt598, Satt204, Satt263, Satt491, Satt602, Sattl51, Satt355, Satt452, SAT_273-DB, Sattl46, Sattl93, Satt569, Satt343, Satt586, Satt040, Satt423, Satt348, Satt595, P10782A-1, P3436A-1, P10598A-1, Satt334, Satt510, Satt522, P9026A-1, P10646A-1, P5219A-1, P7659A-2, Satt570, Satt356, Sattl30, SattllS, Satt594, Satt533, Satt303, Satt352, Satt566, Sattl99, Satt503, Satt517, Sattl91, SAT_117, Satt353, Satt4 42, Satt27 9, Satt314, Sattl42, Sattl81, Satt367, Sattl27, SCTT012, Satt270, Satt292, P10640A-1, Satt249, SCT_065, Satt596, Satt280, Satt406, Satt380, Sattl83, Satt529, Satt431, Satt242, Satt102, Satt441, Satt544, Satt617, Satt240, P10618A-1, Satt475, Sattl96, SAT_301, Satt523, Satt418, Satt398, Satt4 97, Satt28 4, Sattl66, Satt448, Satt373, Satt513, P12394A-1, Satt590, Satt567, Satt220, Satt536, Sattl75, Satt677, Satt680, P10615A-1, Satt551, Satt250, Satt346, Satt336, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, Satt584, SAT_084, P3050A-2, SAT_2 7 5-DB, Satt387, Satt549, Satt660, Satt339, Satt255, Satt257, Satt358, P12396A-1, Satt487, Satt259, Satt347, Satt420, Satt576, Satt550, Satt633, Satt262, Satt473, Satt477, Satt581, P11070A-1, Sattl53, Satt243, P8230A-1, PIO 623A-1, P10632A-1, P10793A-1, P12391A-1, P13560A-1, P13561A-1, P2481A-1, S60021-TB, S60048-TB, S60076-TB, S60148-TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S60505-TB, S60513-TB, S60519-TB, S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812-TB, Satt040, Sattl08, Sattl09, Sattlll, Sattl76, Satt219, Satt299, e Satt512.
3. Método de acordo com a reivindicação 1, caracterizado por compreender determinar a forma alélica dos segmentos cromossômicos compreendendo, ou próximos a, o conjunto de marcadores consistindo em: Satt684, Sattl65, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, Satt225, Satt236, Satt511, P12390B-1, Satt480, Satt632-TB, Satt233, Satt327, Satt329, Satt508, P10635A-1, Satt409, Satt228, Satt429, Satt426, Satt509, SAT_2 61, Sattl97, Satt519, Satt597, SCT_026, Satt415, Satt583, Satt430, P12198A-1, P8584A-1, Satt359, P10648A-1, P12105A-1, P10641A-1, P10638B-2, Satt399, Satt361, P10639A-1, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt227, Satt640-TB, Satt422, Satt4 57, Satt557, Satt319, SAT_142-DB, Satt460, P13073A-1, Satt307, SCT_028, Satt433, Satt357, Satt321, Satt267, Satt383, Satt295, Satt203, Satt507, SAT_110, P10620A-1, Sattl29, Sattl47, Satt216, SAT_351, P10621B-2, Satt701, Satt634, Satt558, Satt266, Satt282, Satt537, Satt506, Satt546, P13072A-1, Satt582, Satt389, Satt461, Satt311, Satt514, Satt4 64, Satt662, Satt543, Sattl86, Satt413, Satt672, P13074A-1, P10624A-1, Satt573, Satt598, Satt204, Satt263, Satt491, Satt602, Sattl51, Satt355, Satt452, SAT_273-DB, Sattl46, Sattl93, Satt569, Satt343, Satt586, Satt040, Sátt423, Satt348, Satt595, P10782A-1, P3436A-1, P10598A-1, Satt334, SattõlO, Satt522, P9026A-1, P10646A-1, P5219A-1, P7659A-2, Satt570, Satt356, Sattl30, Sattll5, Satt594, Satt533, Satt303, Satt352, Satt566, Sattl99, Satt503, Satt517, Sattl91, SAT_117, Satt353, Satt442, Satt279, Satt314, Sattl42, Sattl81, Satt367, Sattl27, SCTT012, Satt270, Satt292, P10640A-1, Satt249, SCT_065, Satt596, Satt280, Satt406, Satt380, Sattl83, Satt529, Satt431, Satt242, Satt102, Satt441, Satt544, Satt617, Satt240, P10618A-, 1, Satt475, Sattl96, SAT_301, Satt523, Satt418, Satt398, Satt4 97, Satt284, Sattl66, Satt448, Satt373, Satt513, P12394A- 1, Satt590, Satt567, Satt220, Satt536, Sattl75, Satt677, Satt680, P10615A-1, Satt551, Satt250, Satt346, Satt336, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, Satt584, SAT_084, P3050A-2, SAT_275-DB, Satt387, Satt549, Satt660, Satt339, Satt255, Satt257, Satt358, P12396A-1, Satt487, Satt259, Satt347, Satt420, Satt576, Satt550, Satt633, Satt262, Satt473, Satt477, Satt581, P11070A-1, Sattl53, Satt243, P8230A-1, P10623A-1, P10632A-1, P10793A-1, P12391A-1, P13560A-1, P13561A-1, P2481A-1, S60021-TB, S60048-TB, S60076-TB, S60148- TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S60505- TB, S60513-TB, S60519-TB, S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812-TB, Satt040, Sattl08, Sattl09, Sattlll, Satt176, Satt219, Satt299, e Satt512.
4. Método de acordo com a reivindicação 1, caracterizado pelo fato de compreender determinar a forma alélica favorável de ao menos um segmento cromossômico, onde a forma alélica favorável de ao menos um segmento cromossômico é determinada pela: a) identificação de ao menos um locus marcador polimórfico selecionado do conjunto em uma pluralidade de sublinhagens de progênie de uma soja progenitora; b) avaliação da produtividade em ao menos duas sublinhagens de progênie, cujas sublinhagens de progênie possuem formas alélicas diferentes de ao menos um locus marcador; e c) identificação da sublinhagem de progênie com aumento de produtividade relativo ao progenitor de soja.
5. Método para identificar uma sublinhagem de soja com aumento de produtividade caracterizado pelo fato de compreender: (i) determinar em um genoma de uma progênie de um progenitor de soja, ao menos um alelo de um ou mais loci marcadores segregando em uma pluralidade de progênies do progenitor de soja, cada um dos loci marcadores segregantes compreendendo um primeiro alelo e um segundo alelo, cujo primeiro alelo correlaciona-se com aumento de produtividade e cujo segundo alelo não se correlaciona com o aumento de produtividade em relação à produtividade média da pluralidade de progênies da soja progenitora, onde os ditos um ou mais loci marcadores compreendem 10% a 100% dos loci marcadores selecionados de um grupo consistindo em: Satt684, Sattl65, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, Satt225, Satt236, Satt511, P12390B-1, Satt480, Satt632-TB, Satt233, Satt327, Satt329, Satt508, P10635A-1, Satt409, Satt228, Satt429, Satt426, Satt509, SAT_2 61, Sattl97, Satt519, Satt597, SCT_026, Satt415, Satt583, Satt430, P12198A-1, P8584A-1, Satt359, P10648A-1, P12105A-1, P10641A-1, P10638B-2, Satt399, Satt361, P10639A-1, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt227, Satt640-TB, Satt422, Satt457, Satt557, Satt319, SAT_142-DB, Satt460, P13073A-1, Satt307, SCT_028, Satt433, Satt357, Satt321, Satt267, Satt383, Satt295, Satt203, Satt507, SAT_110, P10620A-1, Sattl29, Sattl47, Satt216, SAT_351, P10621B-2, Satt701, Satt634, Satt558, Satt266, Satt282, Satt537, Satt506, Satt546, P13072A-1, Satt582, Satt389, Satt461, Satt311, Satt514, Satt4 64, Satt662, Satt543, Sattl86, Satt413, Satt672, P13074A-1, P10624A-1, Satt573, Satt598, Satt204, Satt263, Satt491, Satt602, Sattl51, Satt355, Satt452, SAT_273-DB, Sattl46, Sattl93, Satt569, Satt343, Satt586, Satt040, Satt423, Satt348, Satt595, P10782A-1, P3436A-1, P10598A-1, Satt334, Satt510, Satt522, P9026A-1, P10646A-1, P5219A-1, P7659A-2, Satt570, Satt356, Sattl30, Sattll5, Satt594, Satt533, Satt303, Satt352, Satt566, Sattl99, Satt503, Satt517, Sattl91, SAT_117, Satt353, Satt442, Satt27 9, Satt314, Sattl42, Sattl81, Satt367, Sattl27, SCTT012, Satt270, Satt292, P10640A-1, Satt249, SCT_065, Satt596, Satt280, Satt406, Satt380, Sattl83, Satt529, Satt431, Satt242, Satt102, Satt441, Satt544, Satt617, Satt240, P10618A-1, Satt475, Sattl96, SAT_301, Satt523, Satt418, Satt398, Satt4 97, Satt284, Sattl66, Satt448, Satt373, Satt513, P12394A-1, Satt590, Satt567, Satt220, Satt536, Sattl75, Satt677, Satt680, P10615A-1, Satt551, Satt250, Satt346, Satt336, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, Satt584, SAT_084, P3050A-2, SAT_275-DB, Satt387, Satt549, Satt660, Satt339, Satt255, Satt257, Satt358, P12396A-1, Satt487, Satt259, Satt347, Satt420, Satt576, Satt550, Satt633, Satt262, Satt473, Satt477, Satt581, P11070A-1, Sattl53, Satt243, P8230A-1, P10623A-1, PIO 632A-1, P10793A-1, P12391A-1, P13560A-1, P13561A-1, P2481A-1, S60021-TB, S60048-TB, S60076-TB, S60148-TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S60505-TB, S60513-TB, S60519-TB, S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812-TB, Satt040, Sattl08, Sattl09, Sattlll, Sattl76, Satt219, Satt299, e Satt512.
6. Método de acordo com a reivindicação 5, caracterizado pelo fato de o primeiro alelo que se correlaciona com o aumento de produtividade e o segundo alelo que não se correlaciona com o aumento de produtividade serem determinados por: a) identificação de ao menos um locus marcador selecionado do grupo, cujo locus marcador polimórfico compreende ao menos dois alelos segregando em uma pluralidade de sublinhagens de progênie de uma soja progenitora; b) avaliação da produtividade em ao menos duas sublinhagens de progênie, cujas sublinhagens de progênie possuem diferentes alelos do ao menos um locus marcador polimórfico; e c) identificação da sublinhagem de progênie com aumento de produtividade em relação ao rendimento médio da pluralidade de sublinhagens.
7. Método de acordo com a reivindicação 1 ou 5, caracterizado pelo fato das ao menos duas sublinhagens de progênie serem sublinhagens quase isogênicas.
8. Método de acordo com a reivindicação 1 ou 5, caracterizado pelo fato das ao menos duas sublinhagens de progênie serem sublinhagens randômicas.
9. Método de acordo com a reivindicação 1 ou 5, caracterizado pelo fato da pluralidade de progênies serem obtidas por autofecundação de uma soja progenitora.
10. Método de acordo com a reivindicação 1 ou 5 caracterizado pelo fato da pluralidade de progênies serem obtidas pelo cruzamento de um primeiro progenitor de soja e um segundo progenitor de soja.
11. Método de acordo com a reivindicação 10, caracterizado pelo fato de o primeiro progenitor de soja compreendendo uma linhagem de germoplasma elite ser cruzado com uma segunda soja progenitora compreendendo uma linhagem diferente de germoplasma elite, de forma a gerar uma população de plantas de soja, a partir da qual a progênie é selecionada.
12. Método de acordo com a reivindicação 10, caracterizado pelo fato de o primeiro progenitor de soja compreendendo uma linhagem de germoplasma elite ser cruzado com uma segunda soja progenitora compreendendo uma linhagem de germoplasma exótico, de forma a gerar uma população de plantas de soja, a partir da qual a progênie é selecionada.
13. Método de acordo com a reivindicação 11 ou 12, caracterizado pelo fato de as linhagens de germoplasmas elite serem selecionadas do grupo que consiste em: 90A07, 90B11, 90B31, 90B43, 90B72, 90B73, 91B01, 91B12, 91B33, 91B52, 91B53, 91B64, 91B91, 91B92, 92B05, 92B12, 92B23,92B38, 92B52, 92B63, 92B74,92B75, 92B84, 92B95, 92M30,92M31, 92M70,92M71, 92M72, 92M80,92M91, 93B01, 93B09, 93B11, 93B15, 93B25,93B26, 93B36,93B41, 93B45, 93B46,93B66, 93B67,93B68, 93B72,93B82, 93B84,93B85, 93Β8β,93Β87, 93M10, 93M30,93M40, 93M50,93M60, 93M80,93M90, 93M92,93M93, 94B01, 94B23,94B24, 94B53, 94B54, 9£B73, 95B32, 95B33, 95B34, 95B53, 95B95, 95B96,95B97, 96B21, 96B51, 97B52, 97B61, BEDFORD, CX105, CX232, CX253, CX289, CX394C, CX469C, ESSEX, FORREST, HS93-4118, HUTCHESON, JIM, KORADA, PHARAOH, S0066, S0880, S1990, S19T9, S20F8, S25J5, S32Z3, S33N1, S38T8, S3911, S4260, S42H1, S43B5, S5960, S6262, ST0653, ST1073, ST1090, ST1570, ST1690, ST1970, ST2250, ST2488, ST2660, ST2686, ST2688, ST2788, ST2870, ST3171, ST3630, ST3660, ST3870, ST3883, TRACY, TRAILL, e YOUNG.
14. Método de acordo com a reivindicação 1 ou 5, caracterizado pelo fato de o conjunto de loci marcadores compreender entre 10% e 100% do conjunto de marcadores consistindo em: Satt642, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, Satt511, P12390B-1, Satt632-TB, Satt429, SAT_261, Sattl97, P10641A-1, P10638B-2, Satt399, Satt361, P10639A-1, Satt661- TB, Sattl90, SAT_311-DB,. Satt338, Satt640-TB, Satt557, Satt319, SAT_142-DB, Satt460, Satt433, Satt357, Satt321, Satt295, Satt203, Satt507, Sattl29, Sattl47, SAT_3 51, P10621B- 2, Satt558, Satt701, Satt634, Satt582, Satt389, Satt464, Satt662, Satt672, Satt573, Satt598, Satt263, Satt602, Sattl51, SAT_273-DB, Sattl46, Sattl93, Satt569, Sattl76, Satt343, Satt586, Satt040, Satt595, P10782A-1, Satt334, Satt522, Satt570, Satt356, Satt533, Sattl99, Satt517, Satt191, SAT_117, Satt279, Sattl81, Sattl27, Satt270, Satt292, SAT_065, Satt596, Satt406, Satt380, Sattl83, Satt529, Satt242, Satt617, Satt24 0, SAT_301, Satt418, Satt398, Satt497, Sattl66, Satt448, Satt373, Satt513, P12394A-1, Satt536, Sattl75, Satt677, Satt680, P10615A-1, Satt551, Satt346, Satt336, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, SAT_084, SAT_275- DB, Satt660, Satt339, P12396A-1, Satt358, Satt487, Satt259, Satt420, Satt57 6, Satt633, Satt477, Satt581, Sattl53, Satt243, P10793A-1, P12391A-1, P12392A-1, P13560A-1, P13561A-1, S60021- TB, S60048-TB, S60076-TB, S60148-TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422- TB, S60440-TB, S60446-TB, S60505-TB, S60513-TB, S60519-TB, - S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812- TB, Satt040, Sattlll, Sattl76, Satt219 e Satt299.
15. Método de acordo com a reivindicação 1 ou 5, caracterizado pelo fato de o conjunto de loci marcadores compreender entre 10% e 100% do conjunto de marcadores consistindo em: Satt684, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, Satt632-TB, Satt429, SAT_261, P10641A-1, P10638B-2, Satt399, Satt361, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt640-TB, Satt557, Satt319, SAT_142-DB, Satt321, Satt203, Sattl29, Sattl47, SAT_351, P10621B-2, Satt701, Satt634, Satt582, Satt389, Satt464, Satt662, Satt672, Satt573, Satt598, Satt263, Sattl51, SAT_273-DB, Sattl46, Sattl93, Satt569, Satt343, Satt586, Satt040, Satt595, Satt334, Satt522, Satt570, Satt356, Sattl99, Satt517, Sattl91, Sat_117, Satt27 9, Sattl81, Sattl27, Satt270, Satt292, Sat_065, Satt596, Satt406, Satt380, Sattl83, Satt529, Satt242, Satt617, Satt240, SAT_3 01, Satt418, Satt398, Satt497, Sattl66, Satt448, Satt373, Satt513, P12394A-1, Satt536, Sattl75, Satt677, Satt680, P10615A-1, Satt551, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, SAT_0 8 4, SAT_275-DB, Satt660, Satt339, Satt358, Satt487, Satt420, Satt576, Satt633, Satt581, Sattl53, Satt243, P10793A-1, P13560A-1, P13561A-1, S60021-TB, S60048-TB, S60076-TB, S60148-TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S60505-TB, S60513-TB, S60519-TB, S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812-TB, Sattlll, Satt219 e Satt299.
16. Método de acordo com a reivindicação 1 ou 5, caracterizado pelo fato de o conjunto de loci marcadores compreender entre 10% e 100% do conjunto de marcadores consistindo em: Satt684, Satt526, Satt591, Satt385, Satt632-TB, Satt429, SAT_261, P10641A-1, P10638B-2, Sattl90, SAT_311-DB, Satt338, Satt640-TB, Satt557, SAT_142-DB, Satt321, Satt203, Sattl29, SAT_3 51, Satt701, Satt582, Satt389, Satt464, Satt672, Satt598, Satt343, Satt595, Satt334, Satt522, Satt570, Satt356, Sattl99, Sat_117, Satt279, Sattl81, Sattl27, Satt270, Satt292, Sat_065, Satt529, Satt242, Satt617, SAT_301, Satt398, Satt497, Sattl66, Satt373, Satt680, P10615A-1, SAT_330-DB, P13069A-1, SAT_275-DB, Satt339, Satt487, Satt420, Satt581 e Sattl53.
17. Método de acordo com a reivindicação 1 ou 5, caracterizado pelo fato de o conjunto de loci marcadores consistir em: Satt684, Satt526, Satt591, Satt385, Satt632-TB, Satt429, S AT_2 61, P10641A-1, P10638B-2, Sattl90, SAT_311-DB, Satt338, Satt640-TB, Satt557, SAT_142-DB, Satt321, Satt203, Sattl29, SAT_351, Satt701, Satt582, Satt389, Satt464, Satt672, Satt598, Satt343, Satt595, Satt334, Satt522, Satt570, Satt356, Sattl99, Sat_117, Satt279, Sattl81, Sattl27, Satt270, Satt292, Sat_065, Satt529, Satt242, Satt617, SAT_301, Satt398, Satt497, Sattl66, Satt373, Satt680, P10615A-1, SAT_330-DB, P13069A-1, SAT_275-DB, Satt339, Satt487, Satt420, Satt581 e Sattl53.
18. Método de acordo com a reivindicação 1 ou 5, caracterizado pelo fato de o conjunto de loci marcadores compreender entre 10% e 100% do conjunto de marcadores consistindo em: Satt526, Satt591, Satt429, SAT_261, P10641A-1, Sattl90, Satt557, SAT_142-DB, Sattl29, SAT_351, Satt464, Satt343, Satt595, Satt570, Sattl81, Sattl27, Satt270, SAT_065, Satt529, Satt242, Satt398, Sattl66, Satt373, Satt680, SAT_330-DB, P13069A-1, Satt339, Satt487, Satt581 e Sattl53.
19. Método de acordo com a reivindicação 1 ou 5, caracterizado pelo fato de o conjunto de loci marcadores consistir em: Satt526, Satt591, Satt429, SAT-261, P10641A-1, Sattl90, Satt557, SAT_142-DB, Sattl29, SAT_351, Satt464, Satt343, Satt595, Satt570, Sattl81, Sattl27, Satt270, Sat_065, Satt529, Satt242, Satt398, Sattl66, Satt373, Satt680, SAT_330-DB, P13069A-1, Satt339, Satt487, Satt581 e Sattl53.
20. Método de acordo com a reivindicação 1 ou 5, caracterizado pelo fato de que compreende, adicionalmente, transmitir ou armazenar eletronicamente, em um meio de leitura por computador, dados representando as formas alélicas determinadas.
21. Método de acordo com a reivindicação 1 ou 5, caracterizado pelo fato de que compreende, adicionalmente, selecionar ao menos uma planta da sublinhagem de soja identificada.
22. Método de acordo com a reivindicação 21, caracterizado pelo fato de a planta de soja selecionada compreender uma planta inteira, um órgão da planta, uma semente da planta, uma célula da planta ou uma cultura de tecido de planta.
23. Método de acordo com a reivindicação 21, caracterizado pelo fato de a planta de soja selecionada ou sua progênie ser cruzada com uma segunda planta de soja, cuja segunda planta de soja não apresenta os alelos determinados dos loci marcadores ou as formas alélicas determinadas da pluralidade de segmentos cromossômicos.
24. Método de acordo com a reivindicação 23, caracterizado pelo fato de a segunda planta de soja compreender uma linhagem elite de germoplasma.
25. Método de acordo com a reivindicação 23, caracterizado pelo fato de a segunda planta de soja compreender um germoplasma exótico.
26. Método de acordo com a reivindicação 1 ou 5, caracterizado pelo fato de a forma alélica de cada um de uma pluralidade de loci marcadores ser determinada em um genoma de uma primeira planta de soja e em ao menos um genoma de uma segunda planta de soja, onde a primeira planta de soja compreende uma planta de soja parental e a ao menos uma segunda planta de soja compreende ao menos uma progênie da primeira planta de soja.
27. Conjunto de marcadores úteis para a identificação de uma planta de soja com aumento de produtividade caracterizado pelo fato de o conjunto de marcadores compreender entre 10% e 100% do conjunto de locí marcadores consistindo em: Satt684, Sattl65, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, Satt225, Satt236, Satt511, P12390B-1, Satt480, Satt632-TB, Satt233, Satt327, Satt329, Satt508, P10635A-1, Satt409, Satt228, Satt429, Satt426, Satt509, SAT_2 61, Sattl97, Satt519, Satt597, SCT_026, Satt415, Satt58 3, Satt430, P12198A-1, P8584A-1, Satt359, P10648A-1, P12105A-1, P10641A-1, P10638B-2, Satt399, Satt361, P10639A-1, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt227, Satt640-TB, Satt422, Satt457, Satt557, Satt319, SAT_142-DB, Satt460, P13073A-1, Satt307, SCT_028, Satt433, Satt357, Satt321, Satt2 67, Satt383, Satt295, Satt203, Satt507, SAT_110, P10620A-1, Sattl29, Satt147, Satt216, SAT_351, P10621B-2, Satt701, Satt634, Satt558, Satt266, Satt282, Satt537, Satt506, Satt546, P13072A-1, Satt582, Satt389, Satt461, Satt311, Satt514, Satt464, Satt662, Satt543, Sattl86, Satt413, Satt672, P13074A-1, P10624A-1, Satt573, Satt598, Satt204, Satt263, Satt491, Satt602, Sattl51, Satt355, Satt452, SAT_273-DB, Sattl46, Sattl93, Satt569, Satt343, Satt586, Satt040, Satt423, Satt348, Satt595, P10782A-1, P3436A-1, P10598A-1, Satt334, SattõlO, Satt522, P9026A-1, P10646A-1, P5219A-1, P7659A-2, Satt570, Satt356, Sattl30, Sattll5, Satt594, Satt533, Satt303, Satt352, Satt566, Sattl99, Satt503, Satt517, Sattl91, SAT_117, Satt353, Satt442, Satt279, Satt314, Sattl42, Sattl81, Satt367, Sattl27, SCTT012, Satt270, Satt292, P10640A-1, Satt249, SCT_065, Satt596, Satt280, Satt406, Satt380, Sattl83, Satt529, Satt431, Satt242, Sattl02, Satt441, Satt544, Satt617, Satt240, P10618A-1, Satt475, Sattl96, SAT_301, Satt523, Satt418, Satt398, Satt4 97, Satt284, Sattl66, Satt448, Satt373, Satt513, P12394A-1, Satt590, Satt567, Satt220, Satt536, Sattl75, Satt677, Satt680, P10615A-1, Satt551, Satt250, Satt346, Satt336, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, Satt584, SAT_084, P3050A-2, SAT_275-DB, Satt387, Satt549, Satt660, Satt339, Satt255, Satt257, Satt358, P12396A-1, Satt487, Satt259, Satt347, Satt420, Satt576, Satt550, Satt633, Satt262, Satt473, Satt477, Satt581, P11070A-1, Sattl53, Satt243, P8230A-1, P10623A-1, P10632A-1, P10793A-1, P12391A-1, P13560A-1, P13561A-1, P13561A-1, P2481A-1, S60021-TB, S60048-TB, S60076-TB, S60148-TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S60505-TB, S60513-TB, S60519-TB, S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812-TB, Satt040, Sattl08, Sattl09, Sattlll, Sattl76, Satt219, Satt299, e Satt512.
28. Conjunto de marcadores úteis' para a identificação de uma planta de soja com aumento de produtividade caracterizado pelo fato de o conjunto de marcadores compreender os marcadores: Satt684, Sattl65, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, Satt225, Satt236, Satt511, P12390B-1, Satt480, Satt632-TB, Satt233, Satt327, Satt329, Satt508, P10635A-1, Satt409, Satt228, Satt429, Satt426, Satt50 9, SAT_2 61, Sattl97, Satt519, Satt597, SCT_026, Satt415, Satt583, Satt430, P12198A-1, P8584A-1, Satt359, P10648A-1, P12105A-1, P10641A-1, P10638B-2, Satt399, Satt361, P10639A-1, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt227, Satt640-TB, Satt422, Satt457, Satt557, Satt319, SAT_142-DB, Satt460, P13073A-1, Satt307, SCT_028, Satt433, Satt357, Satt321, Satt267, Satt383, Satt295, Satt203, Satt507, SAT_110, P10620A-1, Sattl29, Sattl47, Satt216, SAT_351, P10621B-2, Satt701, Satt634, Satt558, Satt266, Satt282, Satt537, Satt506, Satt546, P13072A-1, Satt582, Satt389, Satt461, Satt311, Satt514, Satt4 64, Satt662, Satt543, Sattl86, Satt413, Satt672, P13074A-1, P10624A-1, Satt573, Satt598, Satt204, Satt263, Satt491, Satt602, Sattl51, Satt355, Satt452, SAT_273-DB, Sattl46, Sattl93, Satt569, Satt343, Satt586, Satt040, Satt423, Satt348, Satt595, P10782A-1, P3436A-1, P10598A-1, Satt334, Satt510, Satt522, P9026A-1, P10646A-1, P5219A-1, P7659A-2, Satt570, Satt356, Sattl30, Sattll5, Satt594, Satt533, Satt303, Satt352, Satt566, Sattl99, Satt503, Satt517, Sattl91, SAT_117, Satt353, Satt442, Satt279, Satt314, Sattl42, Sattl81, Satt367, Sattl27, SCTT012, Satt270, Satt292, P10640A-1, Satt249, SCT_065, Satt596, Satt280, Satt406, Satt380, Sattl83, Satt529, Satt431, Satt242, Sattl02, Satt441, Satt544, Satt617, Satt240, P10618A-1, Satt475, Sattl96, SAT_301, Satt523, Satt418, Satt398, Satt4 97, Satt284, Sattl66, Satt448, Satt373, Satt513, ΡΪ2394Α-1, Satt590, Satt567, Satt220, Satt536, Sattl75, Satt677, Satt680, P10615A-1, Satt551, Satt250, Satt346, Satt336, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, Satt584, SAT_084, P3050A-2, SAT_275-DB, Satt387, Satt549, Satt660, Satt339, Satt255, Satt257, Satt358, P12396A-1, Satt487, Satt259, Satt347, Satt420, Satt576, Satt550, Satt633, Satt262, Satt473, Satt477, Satt581, P11070A-1, Sattl53, Satt243, P8230A-1, P10623A-1, P10632A-1, P10793A-1, P12391A-1, P13560A-1, P13561A-1, P2481A-1, S60021-TB, S60048-TB, S60076-TB, S60148-TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S60505-TB, S60513-TB, S60519-TB, S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812-TB, Satt040, Sattl08, Sattl09, Sattlll, Sattl76, Satt219, Satt299, e Satt512.
29. Conj.unto de marcadores úteis para a identificação de uma planta de soja com aumento de produtividade caracterizado pelo fato de o conjunto de marcadores consistir em: Satt684, Sattl65, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, Satt225, Satt236, SattSll, P12390B-1, Satt480, Satt632-TB, Satt233, Satt327, Satt329, Satt508, P10635A-1, Satt409, Satt228, Satt429, Satt426, Satt509, SAT_261, Sattl97, Satt519, Satt597, SCT_026, Satt415, Satt583, Satt430, P12198A-1, P8584A-1, Satt359, P10648A-1, P12105A-1, P10641A-1, P10638B-2, Satt399, Satt361, P10639A-1, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt227, Satt640-TB, Satt422, Satt457, Satt557, Satt319, SAT_142-DB, Satt460, P13073A-1, Satt307, SCT_028, Satt433, Satt357, Satt321, Satt2 57, Satt383, Satt295, Satt203, Satt507, SAT_110, P10620A-1, Satt12 9, Sattl47, Satt216, SAT_351, P10621B-2, Satt701, Satt634, Satt558, Satt266, Satt282, Satt537, Satt506, Satt546, P13072A-1, Satt582, Satt389, Satt461, Satt311, Satt514, Satt4 64, Satt662, Satt543, Sattl86, Satt413, Satt672, P13074A-1, P10624A-1, Satt573, Satt598, Satt204, Satt263, Satt491, Satt602, Sattl51, Satt355, Satt452, SAT_273-DB, Sattl46, Sattl93, Satt569, Satt343, Satt586, Satt040, Satt423, Satt348, Satt595, P10782A-1, P3436A-1, P10598A-1, Satt334, Satt510, Satt522, P9026A-1, P10646A-1, P5219A-1, P7659A-2, Satt570, Satt356, Sattl30, Sattll5, Satt594, Satt533, Satt303, Satt352, Satt566, Sattl99, Satt503, Satt517, Sattl91, SAT_117, Satt353, Satt442, Satt279, Satt314, Sattl42, Sattl81, Satt367, Sattl27, SCTT012, Satt27 0, Satt292, P10640A- 1, Satt249, SCT_065, Satt596, Satt280, Satt406, Satt380, Sattl83, Satt529, Satt431, Satt242, Sattl02, Satt441, Satt544, Satt617, Satt240, P10618A-1, Satt475, Sattl96, SAT_301, Satt523, Satt418, Satt398, Satt497, Satt284, Sattl66, Satt448, Satt373, Satt513, P12394A-1, Satt590, Satt567, Satt220, Satt536, Sattl75, Satt677, Satt680, P10615A-1, Satt551, Satt250, Satt346, Satt336, SAT__330-DB, P13069A- 1, P5467A-1, P5467A-2, Satt584, SAT_084, P3050A-2, SAT_275-DB, Satt387, Satt549, Satt660, Satt339, Satt255, Satt257, Satt358, P12396A-1, Satt487, Satt259, Satt347, Satt420, Satt576, Satt550, Satt633, Satt262, Satt473, Satt477, Satt581, P11070A-1, Sattl53, Satt243, P8230A-1, P10623A-1, P10632A-1, P10793A-1, P12391A-1, P13560A-1, P13561A-1, P2481A-1, S60021-TB, S60048-TB, S60076-TB, S60148-TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S60505-TB, S60513-TB, S60519-TB, S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812-TB, Satt040, Sattl08, Sattl09, Sattlll, Sattl76, Satt219, Satt299, e Satt512.
30. Conjunto de marcadores úteis para a identificação de uma planta de soja com aumento de produtividade caracterizado pelo fato de o conjunto de marcadores compreender entre 10% e 100% do conjunto de loci marcadores consistindo em: Satt642, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, Satt511, P12390B-1, Satt632-TB, Satt429, SAT_2 61, Sattl97, P10641A-1, P10638B-2, Satt399. Satt361, P10639A-1, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt640-TB, Satt557, Satt319, SAT_142-DB, Satt460, Satt433, Satt357, Satt321, Satt295, Satt203, Satt507, Sattl29, Sattl47, SAT_3 51, P10621B-2, Satt558, Satt701, Satt634, Satt582, Satt389, Satt4 64, Satt662, Satt672, Satt573, Satt598, Satt263, Satt602, Sattlõl, SAT_273-DB, Sattl46, Sattl93, Satt569, Sattl76, Satt343, Satt586, Satt040, Satt595, ' P10782A-1, Satt334, Satt522, Satt570, Satt356, Satt533, Sattl99, Satt517, Sattl91, SAT_117, Satt279, Sattl81, Sattl27, Satt270, Satt292, SAT_065, Satt596, Satt406, Satt380, Sattl83, Satt529, Satt242, Satt617, Satt240, SAT_301, Satt418, Satt398, Satt497, Sattl66, Satt448, Satt373, Satt513, P12394A-1, Satt536, Sattl75, Satt677, Satt680, P10615A-1, Satt551, Satt346, Satt336, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, SAT_084, SAT__275-DB, Satt660, Satt339, P12396A-1, Satt358, Satt487, Satt259, Satt420, Satt576, Satt633, Satt477, Satt581, Sattl53, Satt243, P10793A-1, P12391A-1, P12392A-1, P13560A-1, P13561A-1, S60021-TB, S60048-TB, S60076-TB, S60148-TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S60505-TB, S60513-TB, S60519-TB, S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812-TB, Satt040, Sattlll, Sattl76, Satt219 e Satt299.
31. Conjunto de marcadores úteis para a identificação de uma planta de soja com aumento de produtividade caracterizado pelo fato de o conjunto de marcadores compreender entre 10% e 100% do conjunto de loci marcadores consistindo em: Satt684, Satt042, Satt364, Satt454, Satt526, Satt300, Satt591, Sattl55, Satt385, Satt632-TB, Satt429, SAT_261, P10641A-1, P10638B-2, Satt399, Satt361, Satt661-TB, Sattl90, SAT_311-DB, Satt338, Satt640-TB, Satt557, Satt319, SAT_142-DB, Satt321, Satt203, Sattl29, Sattl47, SAT_351, P10621B-2, Satt701, Satt634, Satt582, Satt389, Satt464, Satt662, Satt672, Satt573, Satt.598, Satt263, Sattl51, SAT_273- DB, Sattl46, Sattl93, Satt569, Satt343, Satt586, Satt040, Satt595, Satt334, Satt522, Satt570, Satt356, Sattl99, Satt517, Sattl91, Sat_117, Satt279, Sattl81, Sattl27, Satt270, Satt292, Sat_065, Satt596, Satt406, Satt380, Sattl83, Satt529, Satt242, Satt617, Satt240, SAT_3 01, Satt418, Satt398, Satt497, Sattl66, Satt448, Satt373, Satt513, P12394A-1, Satt536, Sattl75, Satt677, Satt680, P10615A-1, Satt551, SAT_330-DB, P13069A-1, P5467A-1, P5467A-2, SAT_0 8 4, SAT_275-DB, Satt660, Satt339, Satt358, Satt487, Satt420, Satt57 6, Satt633, Satt581, Sattl53, Satt243, P10793A-1, P13560A-1, P13561A-1, S60021-TB, S60048-TB, S60076-TB, S60148-TB, S60149-TB, S60201-TB, S60243-TB, S60326-TB, S60338-TB, S60350-TB, S60361-TB, S60422-TB, S60440-TB, S60446-TB, S60505-TB, S60513-TB, S60519-TB, S60536-TB, S60552-TB, S60585-TB, S60630-TB, S60728-TB, S60812-TB, Sattlll, Satt219 e Satt299.
32. Subconjunto do conjunto de marcadores de acordo com a reivindicação 31, o subconjunto de loci marcadores caracterizado por compreender entre 10% e 100% do conjunto de marcadores consistindo em: Satt684, Satt526, Satt591, Satt385, Satt632-TB, Satt429, SAT_261, P10641A-1, P10638B-2, Sattl90, SAT_311-DB, Satt338, Satt640-TB, Satt557, SAT_142-DB, Satt321, Satt203, Sattl29, SAT_351, Satt701, Satt582, Satt389, Satt464, Satt672, Satt598, Satt34 3, Satt595, Satt334, Satt522, Satt570, Satt356, Sattl99, Sat_117, Satt279, Sattl81, Sattl27, Satt270, Satt292, Sat_065, Satt529, Satt242, Satt617, SAT_301, Satt398, Satt497, Sattl66, Satt373, Satt680, P10615A-1, SAT_330-DB, P13069A-1, SAT_275-DB, Satt339, Satt487, Satt420, Satt581 e Sattl53.
33. Subconjunto do conjunto de marcadores de acordo com a reivindicação 31, o subconjunto de loci marcadores caracterizado por consistir em: Satt684, Satt526, Satt591, Satt385, Satt632-TB, Satt429, SAT_2 61, P10641A-1, P10638B-2, Sattl90, SAT_311-DB, Satt338, Satt64 0-TB, Satt557, SAT_142-DB, Satt321, Satt203, Sattl29, SAT_351, Satt701, Satt582, Satt389, Satt464, Satt672, Satt598, Satt343, Satt595, Satt334, Satt522, Satt570, Satt356, Sattl99, Sat_117, Satt27 9, Sattl81, Sattl27, Satt270, Satt292, Sat_065, Satt529, Satt242, Satt617, SAT_301, Satt398, Satt497, Sattl66, Satt373, Satt680, P10615A-1, SAT_330-DB, P13069A-1, SAT_275-DB, Satt339, Satt487, Satt420, Satt581 e Sattl53.
34. Subconjunto do conjunto de marcadores de acordo com a reivindicação 31, o subconjunto de loci marcadores caracterizado por compreender entre 10% e 100% do conjunto de marcadores consistindo em: Satt526, Satt591, Satt429, SAT_261, P10641A-1, Sattl90, Satt557, SAT_142-DB, Sattl29, SAT_351, Satt464, Satt343, Satt595, Satt570, Sattl81, Sattl27, Satt270, Sat_065, Satt529, Satt242, Satt398, Sattl66, Satt373, Satt680, SAT_330-DB, P13069A-1, Satt339, Satt487, Satt581 e Sattl53.
35. Subconjunto do conjunto de marcadores de acordo com a reivindicação 31, o subconjunto de loci marcadores caracterizado por consistir em: Satt526, Satt591, Satt429, SAT-_261, P10641A-1, Sattl90, Satt557, SAT_142-DB, Sattl29, SAT_351, Satt464, Satt343, Satt595, Satt570, Sattl81, Sattl27, Satt270, Sat_065, Satt529, Satt242, Satt398, Sattl66, Satt373, Satt680, SAT_330-DB, P13069A-1, Satt339, Satt487, Satt581 e Sattl53.
BRPI0413253-0B1A 2003-08-01 2004-07-27 Método para identificar uma sublinhagem de soja com aumento de produtividade e conjunto de marcadores úteis para a identificação de uma planta de soja com aumento de produtividade BRPI0413253B1 (pt)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US49207403P 2003-08-01 2003-08-01
US60/492,074 2003-08-01
US54781104P 2004-02-25 2004-02-25
US60/547,811 2004-02-25
US58224104P 2004-06-22 2004-06-22
US60/582,241 2004-06-22
PCT/US2004/024919 WO2005012576A2 (en) 2003-08-01 2004-07-27 Molecular markers for the selection of soybean plants having superior agronomic performance

Publications (2)

Publication Number Publication Date
BRPI0413253A BRPI0413253A (pt) 2006-10-03
BRPI0413253B1 true BRPI0413253B1 (pt) 2015-03-03

Family

ID=34119823

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0413253-0B1A BRPI0413253B1 (pt) 2003-08-01 2004-07-27 Método para identificar uma sublinhagem de soja com aumento de produtividade e conjunto de marcadores úteis para a identificação de uma planta de soja com aumento de produtividade

Country Status (5)

Country Link
US (4) US7973212B2 (pt)
CN (1) CN101437958B (pt)
AR (2) AR045163A1 (pt)
BR (1) BRPI0413253B1 (pt)
WO (1) WO2005012576A2 (pt)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7973212B2 (en) * 2003-08-01 2011-07-05 Pioneer Hi-Bred International, Inc. Soybean plants having superior agronomic performance and methods for their production
MXPA06002028A (es) 2003-08-21 2006-05-17 Monsanto Technology Llc Desaturasas de acido graso de primula.
CA2562548C (en) 2004-04-16 2019-08-20 Monsanto Technology Llc Expression of fatty acid desaturases in corn
WO2007106728A2 (en) * 2006-03-10 2007-09-20 Monsanto Technology Llc Soybean seed and oil compositions and methods of making same
US20110010102A1 (en) * 2007-06-08 2011-01-13 Monsanto Technology Llc Methods and Systems for Sequence-Directed Molecular Breeding
AR066922A1 (es) 2007-06-08 2009-09-23 Monsanto Technology Llc Metodos de mejoramiento molecular del germoplasma de una planta por secuenciamiento dirigido
CA3024820C (en) 2007-08-29 2022-06-21 Monsanto Technology Llc Methods and compositions for breeding for preferred traits associated with goss' wilt resistance in plants
US8697941B2 (en) * 2008-07-23 2014-04-15 Pioneer Hi-Bred International, Inc. Molecular markers linked to PPO inhibitor tolerance in soybeans
US8748695B2 (en) * 2008-07-23 2014-06-10 Pioneer Hi-Bred International, Inc. Molecular markers linked to PPO inhibitor tolerance in soybeans
US8143491B1 (en) 2009-04-16 2012-03-27 Pioneer Hi-Bred International, Inc. Soybean variety XB42S09
US8158862B1 (en) 2009-04-16 2012-04-17 Pioneer Hi-Bred International, Inc. Soybean variety XB44J09
US8148614B1 (en) 2009-04-16 2012-04-03 Pioneer Hi-Bred International, Inc. Soybean variety XB39U09
US9480271B2 (en) 2009-09-15 2016-11-01 Monsanto Technology Llc Soybean seed and oil compositions and methods of making same
CA2818599A1 (en) * 2010-01-26 2011-08-04 Bailin Li Polynucleotide and polypeptide sequences associated with herbicide tolerance
US8217233B1 (en) * 2010-05-05 2012-07-10 Pioneer Hi-Bred International, Inc. Soybean variety XBP31006
FR2966046B1 (fr) 2010-10-13 2013-04-26 Mg Dev Dispositif de nettoyage d'une prothese auditive
CN102534026B (zh) * 2012-02-13 2013-11-27 中国科学院遗传与发育生物学研究所 辅助鉴定大豆百粒重相关位点的一种方法及其专用引物
US20130337442A1 (en) * 2012-06-15 2013-12-19 Pioneer Hi-Bred International, Inc. Genetic loci associated with soybean cyst nematode resistance and methods of use
IN2014DN10614A (pt) * 2012-06-15 2015-09-11 Agrigenetics Inc
WO2015061548A1 (en) 2013-10-25 2015-04-30 Pioneer Hi-Bred International, Inc. Stem canker tolerant soybeans and methods of use
WO2017136204A1 (en) 2016-02-05 2017-08-10 Pioneer Hi-Bred International, Inc. Genetic loci associated with brown stem rot resistance in soybean and methods of use

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5437697A (en) * 1992-07-07 1995-08-01 E. I. Du Pont De Nemours And Company Method to identify genetic markers that are linked to agronomically important genes
US6300541B1 (en) 1997-01-14 2001-10-09 Southern Illinois University Soybean sudden death syndrome resistant soybeans, soybean cyst nematode resistant soybeans and methods of breeding and identifying resistant plants
WO1998049887A1 (en) 1997-05-02 1998-11-12 The University Of Utah Soybean having epistatic genes affecting yield
WO1999031964A1 (en) 1997-12-19 1999-07-01 Pioneer Hi-Bred International, Inc. Nucleotide polymorphisms in soybean
WO2000018963A1 (en) * 1998-10-01 2000-04-06 Monsanto Company Methods for breeding for and screening of soybean plants with enhanced yields, and soybean plants with enhanced yields
US20020133852A1 (en) 2000-01-07 2002-09-19 Hauge Brian M. Soybean SSRs and methods of genotyping
US20020144310A1 (en) 2000-01-28 2002-10-03 Lightfoot David A. Isolated polynucleotides and polypeptides relating to loci underlying resistance to soybean cyst nematode and soybean sudden death syndrome and methods employing same
AR030360A1 (es) * 2001-01-05 2003-08-20 Monsanto Technology Llc Metodos para la cria y la seleccion de plantas de soja con rendimientos mejorados
US7250552B2 (en) 2001-06-07 2007-07-31 Pioneer Hi-Bred International, Inc. QTL controlling sclerotinia stem rot resistance in soybean
US7973212B2 (en) * 2003-08-01 2011-07-05 Pioneer Hi-Bred International, Inc. Soybean plants having superior agronomic performance and methods for their production

Also Published As

Publication number Publication date
BRPI0413253A (pt) 2006-10-03
US20050071901A1 (en) 2005-03-31
US8987548B2 (en) 2015-03-24
CN101437958A (zh) 2009-05-20
US20110258733A1 (en) 2011-10-20
AR045163A1 (es) 2005-10-19
WO2005012576A3 (en) 2005-06-09
US7973212B2 (en) 2011-07-05
WO2005012576A2 (en) 2005-02-10
AR086227A2 (es) 2013-11-27
US20140208453A1 (en) 2014-07-24
CN101437958B (zh) 2012-02-08
US20110283425A1 (en) 2011-11-17

Similar Documents

Publication Publication Date Title
US8987548B2 (en) Soybean plants having superior agronomic performance and method for their production
US8785733B2 (en) Soybean variety XB26X12
CN1261252A (zh) 具有影响产量的上位基因的大豆
US20150250122A1 (en) Soybean variety xr32au14
US9474229B2 (en) Soybean variety XB28E14
US9345218B1 (en) Soybean variety XB46P14
US9307738B1 (en) Soybean variety XB56W14
Sakamoto et al. Marker-assisted analysis for soybean hard seededness with isozyme and simple sequence repeat loci
US9339001B2 (en) Soybean variety XB005G14
US9363971B1 (en) Soybean variety XB47N14
US9521818B1 (en) Soybean variety XB20U14
Sanitchon et al. Identification of simple sequence repeat markers linked to sudden death syndrome resistance in soybean
US20130232628A1 (en) Soybean Variety XB25G12
Qin et al. A genetic composition analysis of soybean sibling varieties Jidou17 and Ji nf58
Qin et al. Genetic contribution of foreign germplasm to elite Chinese soybean (Glycine max) cultivars revealed by SSR markers
US9462768B1 (en) Soybean variety XB20Z14
US8742221B2 (en) Soybean variety XB31AX12
US8766044B2 (en) Soybean variety XB25F12
CN1876842A (zh) 一种辅助筛选高油大豆品种的方法及其专用引物
CN1757728A (zh) 一个与大豆油分含量相关的数量性状基因位点
US20150250124A1 (en) Soybean variety xb19s14
US9374969B1 (en) Soybean variety XB51P14
US9516848B1 (en) Soybean variety XBP34010
US9345219B1 (en) Soybean variety XB36M14
US9538720B1 (en) Soybean variety XBP39010

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 03/03/2015, OBSERVADAS AS CONDICOES LEGAIS.