BRPI0614050A2 - métodos para peneiramento de polimorfismos de hibridização especìficos de gene (gshps) e seus usos no mapeamento genético e desenvolvimento de marcador - Google Patents

métodos para peneiramento de polimorfismos de hibridização especìficos de gene (gshps) e seus usos no mapeamento genético e desenvolvimento de marcador Download PDF

Info

Publication number
BRPI0614050A2
BRPI0614050A2 BRPI0614050-5A BRPI0614050A BRPI0614050A2 BR PI0614050 A2 BRPI0614050 A2 BR PI0614050A2 BR PI0614050 A BRPI0614050 A BR PI0614050A BR PI0614050 A2 BRPI0614050 A2 BR PI0614050A2
Authority
BR
Brazil
Prior art keywords
hybridization
marker
genetic
markers
polymorphisms
Prior art date
Application number
BRPI0614050-5A
Other languages
English (en)
Inventor
John Salmeron
Tong Zhu
Original Assignee
Syngenta Participations Ag
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Syngenta Participations Ag filed Critical Syngenta Participations Ag
Publication of BRPI0614050A2 publication Critical patent/BRPI0614050A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medical Informatics (AREA)
  • Analytical Chemistry (AREA)
  • Theoretical Computer Science (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

MéTODOS PARA PENEIRAMENTO DE POLIMORFISMOS DE HIBRIDIZAçãO ESPECìFICOS DE GENE (GSHPs) E SEUS USOS NO MAPEAMENTO GENéTICO E DESENVOLVIMENTO DE MARCADOR. Um método para identificação de polimorfismos de hibridização específicos de gene (GSHPs) e seu uso é apresentado. O método envolve as etapas de a) peneiramento global para polimorfismos de hibridização usando micro-arranjo; b) redução de complexidade de genoma mediada por enzima; c) amplificação de sinal diferencial mediado por enzima e redução de ruído; d) extração de dados e identificação de GSHP; e e) uso de GSHPs em peneiramento de alto rendimento.

Description

Relatório Descritivo da Patente de Invenção para "MÉTODOSPARA PENEIRAMENTO DE POLIMORFISMOS DE HIBRIDIZAÇÃO ES-PECÍFICOS DE GENE (GSHPs) E SEUS USOS NO MAPEAMENTO GE-NÉTICO E DESENVOLVIMENTO DE MARCADOR".
Campo da Invenção
A presente invenção refere-se ao campo de biotecnologia. Maisespecificamente, a presente invenção se refere a métodos para peneiramen-to de polimorfismos de hibridização específicos de gene, e aos polimorfis-mos descobertos, e seu uso no desenvolvimento de marcador, para mape-amento genético, e seleção/geração auxiliada por marcador, e identificaçãogenética.
Antecedentes da Invenção
O desenvolvimento de marcadores genéticos moleculares temfacilitado o mapeamento e seleção de traços agricolamente importantes emcolheita de plantas, e para a identificação de genes associados com estadosde doença, ou para identificação pessoal em humanos. Os marcadores her-meticamente ligados a genes são um recurso na identificação rápida de li-nhas de planta ou de indivíduos humanos na base de genótipo, bem comona geração de planta pelo uso de seleção auxiliada por marcador (MAS). Osgenes de introgressão particular em uma linha de colheita desejada ou culti-var também seriam facilitados pelo uso de marcadores adequados de DNA.
Marcadores Moleculares e Seleção Auxiliada por Marcador
Um mapa genético é uma representação gráfica de um genoma(ou uma porção de um genoma, tal como cromossomo simples) onde as dis-tâncias entre marcos no cromossomo são medidas por freqüências de re-combinação entre os marcos. Um marco genético pode ser qualquer umavariedade de marcadores polimórficos conhecidos, por exemplo, mas nãolimitado a, marcadores moleculares, tais como marcadores SSR, marcado-res RFLP, ou marcadores SNP. Além disso, os marcadores SSR podem serderivados de ácidos nucléicos genômicos ou expressos (por exemplo,ESTs). A natureza destes marcos físicos e os métodos usados para detectá-los variam, mas todos estes marcadores são fisicamente distinguíveis um dooutro (bem como foram a pluralidade de alelos de um marcador particular)na base de comprimento e/ou seqüência de polinucleotídeo.
Embora seqüências de DNA específicas que codificam proteínassejam geralmente bem conservadas através de uma espécie, outras regiõesde DNA (tipicamente de não-codificação) tendem a acumular polimorfismo,e, portanto, podem ser variáveis entre indivíduos da mesma espécie. Taisregiões proporcionam a base para numerosos marcadores genéticos mole-culares. Em geral, qualquer traço polimórfico diferencialmente herdado (in-cluindo polomorfismo de ácido nucléico) que segrega entre progenia é ummarcador potencial. A variabilidade genômica pode ser de qualquer origem,por exemplo, inserções, anulações, duplicações, elementos repetitivos, mu-tações de ponto, eventos de recombinação, ou a presença e seqüência deelementos transponíveis. Os marcadores moleculares em muitas espécies,associados com numerosos genes, são conhecidos na técnica, e são publi-cados ou disponíveis a partir de várias fontes, tal como o recurso de InternetSOYBASE para marcadores em soja. Similarmente, numerosos métodospara detecção de marcadores moleculares são também bem estabelecidos.
A principal motivação para desenvolvimento de tecnologias demarcador molecular do ponto de vista de geradores de planta, tem sido apossibilidade de aumentar a eficiência de geração através da seleção auxili-ada por marcador (MAS). Um alelo de marcador molecular que demonstradesequilíbrio de ligação com um traço fenotípico desejado (por exemplo, umlocal de traço quantitativo, ou QLT, por exemplo, resistência a uma doençaparticular) proporciona uma ferramenta útil para a seleção de um traço dese-jado em uma população de planta. Os componentes chaves à implantaçãodesta aproximação são: (i) a criação de um mapa genético denso de marca-dores moleculares, (ii) a detecção de QLT baseado nas associações estatís-ticas entre o marcador e a variabilidade fenotípica, (iii) a definição de umconjunto de alelos marcadores desejados baseados nos resultados da análi-se de QLT, e (iv) o uso e/ou extrapolação desta informação ao conjunto atualde geração de germeplasma para capacitar que as decisões de seleção ba-seadas em marcador sejam feitas.Dois tipos de marcadores são freqüentemente usados nos pro-tocolos de seleção auxiliados por marcador, a saber, marcadores de repeti-ção de seqüência simples (SSR, também conhecidos como microsatélite), emarcadores de polimorfismo de nucleotídeo simples (SNP).
Os marcadores moleculares que se baseiam em polimorfismosde nucleotídeo simples (SNPs) são bem conhecidos na técnica. Várias téc-nicas têm sido desenvolvidas para a detecção de SNPs1 incluindo hibridiza-ção específica de alelo (ASH; ver, por exemplo, Coryell et al., (1999) "Allelespecific hybridization markers for sybean", Theor. Appl. Genet., 98:690-696).Tipos adicionais de marcadores moleculares são também amplamente usa-dos, incluindo, mas não limitado a, etiquetas de seqüência expressa (ESTs)e marcadores de SSR, polimorfismo de comprimento de fragmento amplifi-cado (AFLP), DNA polimórfico aleatoriamente amplificado (RAPD), e marca-dores de isozima. Uma ampla faixa de protocolos é conhecida ao técnico noassunto para detecção desta variabilidade, e estes protocolos são freqüen-temente específicos para o tipo de polimorfismo que eles são designadospara detectar. A amplificação de PCR1 polimorfismos de conformação detrança simples (SSCP), e replicação de seqüência auto-sustentada (3SR; verChan and Fox, "NASBA e outros métodos de amplificação baseados emtranscrição para microbiologia de pesquisa e diagnóstico, "Reviews in Medi-cai Microbiology 10:185-196 [1999]).
A ligação de um marcador molecular a outro marcador é medidacomo uma freqüência de recombinação. Em geral, quanto mais próximos osdois locais (por exemplo, dois marcadores de SSR) estão no mapa genético,mais próximos eles estão um do outro no mapa físico. Uma distância genéti-ca (determinada pelo cruzamento sobre freqüências, medido em centimor-gans; cM) é geralmente proporcional à distância física (medida em paresbases, por exemplo, pares de kilobase [kb], ou pares de megabase [Mbp]que dois locais ligados são separados um do outro em um cromossomo.
Uma falta de proporcionalidade precisa entre cM e distância física podemresultar da variação em freqüências de recombinação para regiões cromos-somais diferentes, por exemplo, algumas regiões cromossomais são "pontosquentes" de recombinação, enquanto outras regiões não mostram qualquerrecombinação, ou somente demonstram eventos raros de recombinação. Emgeral, quanto mais próximo o marcador está do outro marcador, se medidoem termos de recombinação ou distância física, mais fortemente eles estãoligados. Em alguns aspectos, quanto mais próximo um marcador molecularestá de um gene que codifica um polipeptídeo que concede um fenótipo par-ticular (tolerância seca, por exemplo), se medida em termos de recombina-ção ou distância física, melhor este marcador serve para etiquetar o traçofenotípico desejado.
A variabilidade de mapeamento genético pode também ser ob-servada entre populações diferentes da mesma espécie de colheita. Apesardesta variabilidade no mapa genético que pode ocorrer entre populações, omapa genético e informação de marcador derivados de uma população ge-ralmente permanecem úteis através de populações múltiplas em identifica-ção de plantas com traços desejados, seleção contadora de plantas comtraços indesejáveis, e em guia de MAS.
Mapeamento de QLT
É o objetivo do reprodutor de planta selecionar e enriquecer apopulação de planta para indivíduos que têm traços desejados, por exemplo,tolerância de estresse de calor, conduzindo por último a produtividade agrí-cola aumentada. Tem sido reconhecido por algum tempo que o local cro-mossomal específico (ou intervalos) pode ser mapeado em um genoma doorganismo que se correlaciona com fenótipos quantitativos particulares. Tallocal é denominado local de traço quantitativo, ou QLT. O reprodutor deplanta pode vantajosamente usar marcadores moleculares para identificarindivíduos desejados pela identificação de alelos marcadores que mostramuma probabilidade estatisticamente significante de co-segregação com umfenótipo desejado (por exemplo, tolerância de infecção patogênica), manifes-tado como desequilíbrio de ligação. Pela identificação de um marcador mo-Iecular ou grupos de marcadores moleculares que co-segregam com um tra-ço quantitativo, o reprodutor está, desse modo, identificando um QLT. Pelaidentificação e seleção de um alelo marcador (ou alelos desejados a partirde marcadores múltiplos) que se associam com fenótipo desejado, o repro-dutor de planta é capaz de selecionar rapidamente um fenótipo desejadopela seleção do alelo marcador molecular correto (um processo denominadoseleção auxiliada por marcador, ou MAS). Quanto mais marcadores molecu-lares que são colocados no mapa genético, mais potencialmente útil estemapa se torna para condução de MAS.
Paradigmas experimentais múltiplos têm sido desenvolvidos pa-ra identificar e analisar QLT (ver, por exemplo, Jansen (1996) Trends PlantSci 1:89). A maioria das pesquisas publicadas no mapeamento de QLT emespécies de colheita têm sido baseada no uso do cruzamento bi-parental(Lynch and Walsh (1997) Genetics and Analysis of Quantitative Traits, Si-nauer Associates, Sunderland). Tipicamente, estes paradigmas envolvemcruzamento de um ou mais pares parentais, que podem ser, por exemplo,um par simples derivado de duas cepas congênitas, ou ancestrais múltiplosrelacionados ou não-relacionados de cepas ou linhas congênitas diferentes,que exibem cada características diferentes relativas ao traço fenotípico deinteresse. Tipicamente, este protocolo experimental envolve derivação de100 a 300 progenias de segregação de um cruzamento simples de duas li-nhas congênitas divergentes (por exemplo, selecionado para maximizar dife-renças do marcador fenotípico e molecular entre as linhas). Os ancestrais eprogenia de segregação são genotipados para local de marcador múltiplo, eavaliados para um a vários traços quantitativos (por exemplo, resistência àdoença), tolerância seca, cor de fruta, etc). O QLT é, em seguida, identifica-do como associações estatísticas significantes entre valores genotípicos evariabilidade fenotípica entre a progenia de segregação. A resistência desteprotocolo experimental vem da utilização do cruzamento congênito, porqueos ancestrais resultantes F1 todos têm as mesmas fases de ligação. Dessemodo, após uniformização das plantas F1, todas as progenias de segrega-ção (F2) são informativas, e desequilíbrio de ligação é maximizado, a fasede ligação é conhecida, existem somente dois alelos de QLT, e, exceto paraprogenia de retro-cruzamento, a freqüência de cada alelo de QLT é 0,5,
Numerosos métodos estatísticos para determinação se os mar-cadores são geneticamente ligados a um QLT (ou a outro marcador) sãoconhecidos àqueles técnicos no assunto, e incluem, por exemplo, modeloslineares padrões, tais como ANOVA, ou mapeamento de regressão (Haleyand Knott (1992) Heredity 69:315), métodos de probabilidade máxima, taiscomo algoritmos de exigência-maximização, (por exemplo, Lander and Bots-trein (1989) "Mapping Mendelian factors underlying quatitative traits usingRFLP Iinkage maps", Genetics 121:185-199; Jansen (1992) "A general mis-ture model for mapping quantitative trait Ioci by using molecular markers",Theor. Appl. Genet., 85:252-260; Jansen (1993) "Maximum Iikelihood in ageneralize linear finite mixture model by using the EM algorithm, "Biometrics49:227-231; Jansen (1994) "Mapping of quantitative trait Ioci by using geneticmarkers: an overview of biometrical moldeis," In J. W. van Ooijen and J. Jan-sen (eds.), Biometrics in Plant breeding: applications of molecular markers,pp. 116-124, CPRO-DLO Netherlands; Jansen (1996) "A general Monte Car-lo method for mapping multiple quantitative trait loci," Genetics 142:305-311;and Jansen and Stam (1994) "High Resolution of quantitative trait into multi-ple Ioci via interval mapping, "Genetics 136:1447-1455). Métodos estatísticosexemplares incluem análise de marcador de ponto simples, mapeamento deintervalo (Lander and Botstein (1989) Genetics 121:185), mapeamento deintervalo composto, análise de regressão penalizada, análise de raça com-plexa, análise de MCMC, análise de MQM (Jansen (1994) Genetics138:871), HAPLO-IM+análise, análise de HAPLO-MQM, e HAPLO-MQM+análise, Bayesian MCMC, regressão de ruga, análise de identidadepor descendente, regressão de Haseman-EIston, qualquer dos quais sendoadequados no contexto da presente invenção. Em adição, detalhes adicio-nais com relação a métodos estatísticos alternativos aplicáveis a populaçõesde geração complexas que podem ser usadas para identificar e localizarQLTs são descritos no: U. S. Ser. N9 09/216.089 por Beavis et al. "QLTMAPPING IN PLANT BREEDING POPULATIONS" e PCT/US00/34971 porJansen et al. "MQM MAPPING HAPLOTYPED PUTATIVE QLTS ALLELES:a SIMPLE APPROACH FOR MAPPING QLTS IN PLANT BREEDING PO-PULATIONS." Qualquer destas aproximações são computacionalmente in-tensivas, e são usualmente realizadas com a assistência de um sistema ba-seado em computador e software especializado. Pacotes estatísticos espe-cializados são disponíveis de uma variedade de fontes públicas e comerci-ais, e são conhecidos àqueles técnicos no assunto.
Resumo da Invenção
Um método altamente eficiente para peneirar polimorfismos dehibridização específicos de gene em qualquer genoma, incluindo, e, particu-larmente, em genomas complexos, foi desenvolvido. Os polimorfismos dehibridização específicos de gene são polimorfismos anônimos descobertosna região de codificação de genes alvos. O método inventado pode detectarpolimorfismos de nucleotídeo simples (SNP), e polimorfismo de comprimentode fragmento de restrição associada (RFLP), polimorfismo de comprimentode fragmento amplificado (AFLP), e polimorfismo estrutural secundário si-multaneamente (Figura 1). O polimorfismo detectado pode ser usado direta-mente como marcador de hibridização em peneiramento de alto rendimento,ou transformado em SNPs, e se desenvolve em um marcador de polimorfis-mo funcional, ou uso como marcador usando tecnologias de etapa de leiturabaseadas em não-hibridização. Tais marcadores podem ser usados em apli-cações de geração de planta para seleção/geração auxiliada por marcador,ou em aplicações de planta ou animal/humano para identificação de genóti-pos, identificação de local de traço quantitativo, e/ou aplicações de mapea-mento de gene.
O presente método inclui os seguintes componentes gerais: 1)peneiramento genômico global para polimorfismo de hibridização usandomicro-arranjo por hibridização genômica comparativa; 2) redução de com-plexidade de genoma mediada por enzima; 3) amplificação de sinal diferen-cial mediada por enzima e redução de ruído; 4) extração de dados e identifi-cação de GSHP; e 5) uso de GSHP em peneiramento de alto rendimento.
Entre estes componentes, a redução de complexidade de genoma mediadapor enzima, e amplificação de sinal diferencial mediada por enzima e redu-ção de ruído, são particularmente úteis para peneiramento do genoma deorganismos com genomas complexos. Para aqueles organismos com geno-mas simples, estes componentes são opcionais, e podem ser substituídoscom incorporação direta de etiquetas fluorescentes usando métodos, taiscomo etiquetação de hexâmero aleatória.
A invenção proporciona um método para detecção de polimor-fismos de hibridização específicos de gene em seqüências de polinucleotí-deo de DNA genômico, o método compreendendo:
a. seleção de seqüências de oligonucleotídeo curtas comple-mentares às seqüências de polinucleotídeo genômicas, referidas seqüênciasde oligonucleotídeo curtas a serem sintetizadas diretamente em ou sintetiza-das e colocadas em uma superfície de micro-arranjo;
b. preparação de DNA genômico de duas fontes genéticas, esujeição de referido DNA genômico a restrição de local específica usandouma ou mais enzimas de restrição para produzir polimorfismos de compri-mento de fragmento de restrição (RFLPs);
c. amplificação seletivamente de RFLPs de uma faixa de tama-nho selecionada para criar alvos de polimorfismo amplificados;
d. fragmentação dos alvos amplificados aleatoriamente emfragmentos de cerca de 50 a cerca de 200 bases, e etiquetação de extremi-dade dos fragmentos não-seletivamente;
e. hibridização dos fragmentos etiquetados de extremidade àsseqüências de nucleotídeo curtas na superfície de micro-arranjo; e
f. quantificação dos sinais a partir da hibridização e detecção depolimorfismos.
O presente método pode ser adicionalmente usado para detectarGSHP em espécies filogeneticamente proximamente relacionadas AeBu-sando um micro-arranjo com sondas a partir da espécie de modelo B. Parafazer isto, a similaridade de seqüência entre as espécies AeB deve ser a-cessada computacionalmente e/ou experimentalmente. Se uma aproximaçãocomputacional é usada, as seqüências representativas de A devem serBLAST contra B. Se uma aproximação experimental é usada, o DNA genô-mico de espécie A deve ser extraído, etiquetado, e hibridizado ao micro-arranjo com sondas designadas a partir da espécie B. Se o número de se-qüências similares está acima do limite aceitável, então o DNA genômico daespécie A pode ser usado em um modo similar como DNA genômico nativoB para detecção de GSHP dentro da seqüência homóloga.
A invenção proporciona um ensaio de custo efetivo para polimor-fismo de gene de varredura em escala de genoma total, e proporciona nu-merosas vantagens, conforme esboçado abaixo.
Comparado aos métodos de mapeamento convencionais, a presente inven-ção proporciona:
• Cobertura ampla de genoma - Embora elas representem somente 0,7-1%das seqüências de genoma, as seqüências de sonda cobrem usualmente60-80% dos genes no genoma.
• A capacidade de gerar grandes números de marcadores para mapeamentode genoma de densidade ultra-alta. É estimado que a taxa de polimorfismomédia em seqüências de codificação de milho seja 1 em 124 bases. Um ex-perimento pode peneirar até 3,25 χ 105 polimorfismos. Mesmo se somenteuma base entre as 25 bases da sonda é considerada para ser sensível adetecção, ela pode pelo menos identificar 1,3 χ 104 polimorfismos. Estesmarcadores potenciais podem ser usados para seleção auxiliada por marca-dor, e para geração de um mapa genético de densidade ultra-alta.
· Todos os marcadores são marcadores de gene - todos os marcadores po-dem influenciar ou ser responsável pelos traços complexos. Micro-arranjosGeneChip foram designados, baseados no gene ou seqüências EST. Dessemodo, os polimorfismos identificados serão associados com os genes. Com-parados aos marcadores aleatórios usados para mapeamento, os marcado-res de gene podem ser biologicamente funcionais e podem, desse modo,facilitar a análise funcional para dissecação do traço.
• Conversível à forma compatível de alto rendimento - as sondas de oligonu-cleotídeo contendo marcadores de polimorfismo podem ser convertidas emmarcadores de SNP por seqüenciamento, visto que 80-90% dos SFPs (poli-morfismo de característica simples) são SNPs. Os marcadores de SFP po-dem também serem diretamente utilizados, visto que eles podem ser facil-mente migrados a partir do GeneChip regular para um Gene-Chip mini-marcador de baixo custo. Isto capacita a utilidade dos marcadores para pe-neiramento de alto rendimento de baixo custo.
• O experimento rápido de GeneChip pode sobreviver até 3,25 χ 107 basespara milho e 5,75 χ 106 bases para tomate, e isto leva apenas dois dias. Umprojeto de mapeamento total pode ser feito em 4-6 meses.
• Custo efetivo - ele é de custo efetivo. Baseado em $500 o custo para chipe reagentes, é estimado que o custo de descoberta por marcador seja 0,25cents no milho.
Comparado a outros métodos de mapeamento baseados em micro-arranjo:
· Baixo custo para descoberta de marcador - outros métodos baseados emmicro-arranjo, tais como arranjos GeneChip de broto, têm alto custo.
• Aplicável a organismos com um genoma complexo, incluindo muitos dosorganismos mais altos, tais como espécie de colheita, animais, e sistemasde modelo ecológico.
· Acurado e preciso - minimiza a interferência a partir da ligação não-específica.
• Focalizado nos marcadores de gene - a filtragem de metilação enriqueceos fragmentos de gene nos alvos etiquetados.
• Aumenta a eficiência de etiquetação pela redução da complexidade da re-união alvo.
• Aumenta a intensidade de sinal e sinais diferenciais por amplificação prefe-rencial dos alvos.
• Detecta somente variações genéticas, não as variações de transcrição quepodem ser grandemente afetadas pelas condições ambientais e experimen-tais.
O presente método pode ser aplicado às seguintes aplicaçõesnão-limitativas que foram amplamente usadas na agricultura e ciência e prá-tica médica: 1) construção de mapa de gene de densidade ultra-alta; 2) iden-tificar marcadores para traços de gene simples ou QLTs por análise segre-gante de massa (BSA) e aproximações similares; 3) QLT associado e genescandidatos através de todas as análises de ligação de genoma ou estudosassociados; e 4) peneiramento de alto rendimento usando marcador de di-agnóstico.
Breve Descrição dos Desenhos
Figura 1
Detecção de polimorfismos de seqüência por hibridização desonda alvo. As linhas escuras e claras representam as seqüências alvos apartir das variedades genéticas diferentes que são homólogas à sonda dedetecção. Os círculos representam o polimorfismo de seqüência entre asvariedades.
Figura 2
Procedimento experimental para redução de complexidade degenoma.
Figura 3
Comparação de freqüência de sondas com intensidades de sinaldiferentes na soja (detecção nativa) e feijões sojas e feijões comuns (detec-ção heteróloga) usando um arranjo de GeneChip de feijão soja. É claro queum número significante de sondas de feijão soja pode hibrizidar alvos defeijão comum.
Descrição Detalhada da Invenção
Definições
Antes de descrever a presente invenção em detalhes, é para sercompreendido que esta invenção não é limitada a concretizações particula-res, que pode, naturalmente, variar. É para ser compreendido que a termino-logia aqui usada é para a proposta de descrição de concretizações particula-res somente, e não é pretendida para ser limitada. Conforme usado nesterelatório descritivo e nas reivindicações em anexo, os termos no singular eas formas singulares "um", "uma" e "o", por exemplo, incluem referentes plu-rais, a menos que o conteúdo indique claramente de outro modo. Desse mo-do, por exemplo, referência a "planta", "a planta" ou "uma planta" tambéminclui uma pluralidade de plantas; também, dependendo do contexto, o usodo termo "planta" pode também incluir progenia geneticamente similar ouidêntica daquela planta; uso do termo "um ácido nucléico" opcionalmenteinclui, como uma matéria prática, muitas cópias daquela molécula de ácidonucléico; similarmente, o termo "sonda" opcionalmente (e tipicamente) en-volve muitas moléculas de sonda similares ou idênticas.
A menos que de outro modo indicado, ácidos nucléicos são es-critos da esquerda para a direita na orientação 5' a 3'. As faixas numéricasrecitadas dentro do relatório descritivo são inclusivas dos números que defi-nem a faixa, e incluem cada inteiro ou qualquer fração não-inteira dentro dafaixa definida. A menos que de outro modo definido, todos os termos técni-cos e científicos aqui têm o mesmo significado conforme comumente com-preendido por um técnico no assunto ao qual a invenção pertence. Emboramuitos métodos e materiais similares ou equivalentes aqueles aqui descritospossam ser usados na prática para teste da presente invenção, os materiaispreferidos e métodos são aqui descritos. Na descrição e reivindicação dapresente invenção, a seguinte terminologia será usada de acordo com asdefinições abaixo.
Uma "planta" pode ser uma planta total, qualquer parte desta, ouuma célula ou cultura de tecido derivada de uma planta. Desse modo, o ter-mo "planta" pode ser referir a qualquer de: plantas totais, componentes deplanta ou órgãos (por exemplo, folhas, caules, raízes, etc), tecidos de planta,sementes, células de planta, ou derivadas através da cultura de uma célulatomada de uma planta. O termo "planta de milho" inclui plantas de milho to-tais, células de planta de milho, protoplasto de planta de milho, célula deplanta de milho ou cultura de tecido de milho a parir do qual as plantas demilho podem ser regeneradas, caules de planta de milho, grupos de plantade milho e células de planta que são intactas em plantas de milho ou partesde plantas de milho, tais como sementes de milho, vagens de milho, floresde milho, cotilédone de milho, folhas de milho, talos de milho, botões de flo-res de milho, raízes de milho, pontas de raiz de milho, e similares.
"Germeplasma" se refere a material genético de, ou de um indi-víduo (por exemplo, uma planta), um grupo de indivíduos (por exemplo, umalinha de planta, variedade ou família), ou um clonado derivado de uma linha,variedade, espécie, ou cultura. O germeplasma pode ser parte de um orga-nismo ou célula, ou pode ser separado a partir do organismo ou célula. Emgeral, o germeplasma proporciona material genético com uma composiçãomolecular específica que proporciona um fundamento físico para alguns outodas as qualidades hereditárias de um organismo ou cultura de célula. Con-forme aqui usado, germeplasma inclui células, sementes ou tecidos dosquais novas plantas podem crescer, ou partes de planta, tais como, folhas,caules, polens, ou células, que podem ser cultivadas em uma planta total.
O termo "alelo" se refere a uma de duas ou mais seqüências denucleotídeo diferentes que ocorrem em um local específico. Por exemplo,um primeiro alelo pode ocorrer em um cromossomo, enquanto um segundoalelo ocorre em um segundo cromossomo homólogo, por exemplo, conformeocorre para cromossomos diferentes de um indivíduo heterozigótico, ou en-tre indivíduos homozigóticos ou heterozigóticos em uma população. Um "ale-lo favorável" é o alelo em um local particular que confere, ou contribui parafenòtipo agronomicamente desejável, por exemplo, tolerância a uma pesteou a seca, ou alternativamente, em um alelo que permite a identificação deplantas susceptíveis que podem ser removidas de um programa de geraçãoou plantio. Um alelo favorável ou um marcador é um alelo marcador que se-grega com um fenótipo favorável, ou alternativamente, segrega com fenòtipode planta susceptível, portanto proporcionando o benefício de identificarplantas de sonda secas. Uma forma alélica favorável de um segmento decromossomo é um segmento de cromossomo que inclui uma seqüência denucleotídeo que contribui para desempenho agronômico superior em um oumais locais genéticos fisicamente localizados no segmento de cromossomo.
"Freqüência alélica" se refere a freqüência (proporção ou percentagem) naqual um alelo está presente em um local dentro de um indivíduo, dentro deuma linha, ou dentro de uma população de linhas. Por exemplo, para umalelo "A", indivíduos diplóides de genótipo "AA", "Aa" ou "aa" têm freqüênciasalélicas de 1,0, 0,5 ou 0,0, respectivamente. Pode-se estimar a freqüênciade alelo dentro de uma linha pelo cálculo da média das freqüências de alelode uma amostra de indivíduos a partir desta linha. Similarmente, pode-secalcular a freqüência de alelo dentro de uma população de linhas pelo cálcu-lo da média das freqüências de alelo de linhas que compõem a população.Para uma população com um número finito de indivíduos ou linhas, uma fre-qüência de alelo pode ser expressa como uma contagem de indivíduos oulinhas contendo o alelo (ou qualquer outro grupamento especificado).
Um alelo se correlaciona "positivamente" com um traço quandoestá ligado a ele, e quando a presença do alelo é um indicador que o traçodesejado ou forma de traço ocorrerá em uma planta compreendendo o alelo.Um alelo se correlaciona negativamente com um traço quando está ligado aele, e quando a presença do alelo é um indicador que o traço desejado ouforma de traço ocorrerá em uma planta compreendendo o alelo.
Um indivíduo é "homozigótico" se o indivíduo tem somente umtipo de alelo em um dado local (por exemplo, um indivíduo dipióide tem umacópia do mesmo alelo em um local para cada dois cromossomos homólo-gos). Um indivíduo é "heterozigótico" se mais um do que um tipo de aleloestá presente em um dado local (por exemplo, um indivíduo dipióide comuma cópia cada de dois alelos diferentes). O termo "homogeneidade" indicaque membros de um grupo têm o mesmo genótipo em um ou mais locaisespecíficos. Em contraste, o termo "heterogeneidade" é usado para indicarque indivíduos com o grupo diferem em genótipo em um ou mais locais es-pecíficos.
Um "local" é uma região cromossomal onde um ácido nucléicopolimórfico, traço determinante, gene ou marcador, está localizado. Dessemodo, por exemplo, um "local de gene" é uma localização específica no ge-noma de uma espécie onde um gene específico pode ser encontrado.
O termo "local de traço quantitativo" ou "QLT" se refere a umlocal genético polimórfico com pelo menos dois alelos que afetam diferenci-almente a expressão de um traço fenótico em pelo menos um fundo genéti-co, por exemplo, em pelo menos uma população de geração, ou progenia.QLTs são tipicamente identificados como "marcados" usando marcadoresmoleculares.
Os termos "marcador", "marcador molecular", "ácido nucléicomarcador", e "local marcador", se referem a uma seqüência de nucleotídeoou produto codificado desta (por exemplo, uma proteína) usados como umponto de referência quando identificando um local ligado. Um marcador podeser derivado da seqüência nucleotídea genômica, ou de seqüências nucleo-tídeas expressas (por exemplo, de um RNS dividido, um cDNA, etc), ou deum polipeptídeo codificado. O termo também se refere a seqüências de áci-do nucléico complementares a, ou flanqueando as seqüências marcadoras,tais como ácidos nucléicos usados como sondas ou pares de prímeres ca-pazes de amplificar a seqüência marcadora. Uma "sonda marcadora" é umaseqüência de ácido nucléico ou molécula que pode ser usada para identificara presença de um local marcador, por exemplo, uma sonda de ácido nucléi-co que é complementar a uma seqüência de local marcador. Alternativamen-te, em alguns aspectos, uma sonda marcadora se refere a uma sonda dequalquer tipo que seja capaz de distinguir (isto é, genótipo) o alelo particularque está presente em um local marcador. Ácidos nucléicos são complemen-tares quando eles hibridizam especificamente em solução, por exemplo, deacordo com as regras de emparelhamento de base de Watson-Crick. Um"local marcador" é um local que pode ser usado para trilhar a presença deum segundo local ligado, por exemplo, um local ligado que codifica ou con-tribui para expressão de um traço fenotípico. Por exemplo, um local marca-dor pode ser usado para monitorar segregação de alelos em um local, talcomo QLT, que são geneticamente ou fisicamente ligados ao local marca-dor. Desse modo, um "alelo marcador" alternativamente um "alelo de umlocal marcador", é um de uma pluralidade de seqüências de nucleotídeo po-limórfico encontradas em um local marcador em uma população que é poli-mórfica para o local marcador. Cada um dos marcadores identificados é es-perado estar em proximidade física e genética próximas (resultando em liga-ção física e/ou genética) a um elemento genético, por exemplo, um QLT, quecontribui para a tolerância.
"Marcadores genéticos" são ácidos nucléicos que são polimórfi-cos em uma população, e onde os alelos dos quais podem ser detectados edistinguidos por um ou mais métodos analíticos, por exemplo, RFLP, AFLP,isozima, SNP, SSR e similares. O termo "marcador genético" e "marcadormolecular" se referem a um local genético (um "local marcador") que podeser usado como um ponto de referência quando identificando um local gene-ticamente ligado, tal como um QLT. Tal marcador é também referido comoum marcador de QLT. O termo também se refere a seqüências de ácido nu-cléico complementares às seqüências genômicas, tais como ácidos nucléi-cos usados como sondas.
Marcadores correspondentes a polimorfismos genéticos entremembros de uma população podem ser detectados por métodos bem esta-belecidos na técnica. Estes incluem, por exemplo, métodos de amplificaçãoespecíficos de seqüência baseados em PCR, detecção de polimorfismos decomprimento de fragmento de restrição (RFLP), detecção de marcadores deisozima, detecção de polimorfismos de polinucleotídeo por hibridização es-pecífica de alelo, (ASH), detecção de seqüências variáveis amplificadas dogenoma de planta, detecção de duplicação de seqüência auto-sustentada,detecção de repetições de seqüência simples (SSRs), detecção de polimor-fismos de nucleotídeo simples (SNPs), ou detecção de polimorfismos decomprimento de fragmento amplificado (AFLPs). Métodos bem estabelecidossão também conhecidos para a detecção de etiquetas de seqüência expres-sa (ESTs), e marcadores de SSR derivados de seqüências EST e DNA po-limórfico amplificado aleatoriamente (RAPD).
Um "mapa genético" é uma descrição de relacionamentos deligação genética entre locais em um ou mais cromossomos (ou grupos deligação) dentro de uma dada espécie, geralmente representada em umaforma diagramática ou tabular. "Mapeamento genético" é o processo de de-finição dos relacionamentos de ligação de locais através do uso de marcado-res genéticos, segregação de população para os marcadores, e princípiosgenéticos padrões de freqüência de recombinação. Um "mapa genético" éuma localização em um mapa genômico relativo aos marcadores genéticoscircundantes no mesmo grupo de ligação onde um marcador específico podeser encontrado dentro de uma dada espécie. Em contraste, um mapa físicodo genoma se refere a distâncias absolutas (por exemplo, medidas em paresbases Ou isolados, e sobrepondo fragmentos genéticos, por exemplo, con-tigs). Um mapa físico do genoma não leva em consideração o comportamen-to genético (por exemplo, freqüências de recombinação) entre pontos dife-rentes no mapa físico.
Uma "freqüência de recombinação genética" é a freqüência deum cruzamento sobre evento (recombinação) entre dois locais genéticos. Afreqüência de recombinação pode ser observada seguindo-se a segregaçãode marcadores e/ou traço seguindo meiose. Uma freqüência de recombina-ção genética pode ser expressa em centimórgãos (cM), onde um cM é a dis-tância entre dois marcadores genéticos que mostram uma freqüência de re-combinação de 1% (isto é, um evento de cruzamento ocorre entre aquelesdois marcadores uma vez em todas as 100 divisões de célula).
Conforme aqui usado, o termo "ligação" é usado para descrevero grau com que um local marcador está "associado com" outro local marca-dor, ou algum outro local (por exemplo, um local de tolerância).
Conforme aqui usado, equilíbrio de ligação descreve uma situa-ção onde dois marcadores segregam independentemente, isto é, classifica-ção entre progenia aleatoriamente. Os marcadores que mostram equilíbriode ligação são considerados não-ligados (se ou não eles estão no mesmocromossomo).
Conforme aqui usado, desequilíbrio de ligação descreve umasituação onde dois marcadores segregam em uma maneira não-aleatória,isto é, têm uma freqüência de recombinação de menos do que 50% (e, pordefinição, são separados por menos do que 50 cM no mesmo grupo de liga-ção). Os marcadores que mostram desequilíbrio de ligação são considera-dos ligados. A ligação ocorre quando o local do marcador e um local ligadosão encontrados juntos em plantas de progenia mais freqüentemente do quenão junto nas plantas de progenia. Conforme aqui usado, ligação pode serentre dois marcadores, ou alternativamente um marcador e um fenótipo. Umlocal de marcador pode estar associado com (ligado a) um traço, por exem-plo, um local de marcador pode estar associado com tolerância ou patogeniade planta quando o local de marcador está em desequilíbrio de ligação como traço de tolerância. O grau de ligação de um marcador molecular em umtraço fenotípico (por exemplo, um QLT) é medido, por exemplo, como umaprobabilidade estatística de co-segregação daquele marcador molecular como fenótipo.
Conforme aqui usado, o relacionamento de ligação entre ummarcador molecular e um fenótipo é dado como uma "probabilidade" ou"probabilidade ajustada". O valor de probabilidade é a probabilidade estatís-tica que a combinação particular de um fenótipo e a presença ou ausênciade um alelo de marcador particular é aleatório. Desse modo, quanto menor aclassificação de probabilidade, maior a probabilidade de um fenótipo e ummarcador particular se co-segregarèm. Em alguns aspectos, a classificaçãode probabilidade é considerada "significante" ou "insignificante". Em algumasconcretizações, uma classificação de probabilidade de 0,05 (p=0,05, ou umaprobabilidade de 5%) de classificação aleatória é considerada uma indicaçãosignificante de co-segregação. Contudo, a presente invenção não está limi-tada a este padrão particular, e uma probabilidade aceitável pode ser qual-quer probabilidade de menos do que 50% (p=0,5). Por exemplo, uma proba-bilidade significante pode ser menor do que 0,25, menor do que 0,20, menordo que 0,15, ou menor do que 0,1.
O termo "desequilíbrio de ligação" se refere a uma segregaçãonão-aleatória de local, ou traços genéticos (ou ambos). Em qualquer caso, odesequilíbrio de ligação implica que os locais relevantes estão dentro deproximidade física suficiente ao longo de um comprimento de um cromos-somo, de modo que eles segregam juntos com freqüência mais do que alea-tória (isto é, não-aleatória) (no caso de traços de co-segregação, os locaisque se sujeitam aos traços estão em proximidade suficiente um do outro).
Os locais ligados co-segregam mais do que 50% das vezes, por exemplo, decerca de 51% a cerca de 100% das vezes. O termo "fisicamente ligado" é,as vezes, usado para indicar que dois locais, por exemplo, dois locais mar-cadores, estão fisicamente presentes no mesmo cromossomo.
Vantajosamente, os dois locais ligados estão localizados emproximidade tal que a recombinação entre pares de cromossomos homólo-gos não ocorrem entre os dois locais durante meiose com alta freqüência,por exemplo, tal como locais ligados co-segregam em pelo menos cerca de90% das vezes, por exemplo, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%,99%, 99,5%, 99,75%, ou mais vezes.
A frase, "proximamente ligado", no presente pedido, significaque a recombinação entre dois locais ligados ocorre com uma freqüência deigual ou menor do que cerca de 10% (isto é, são separados em um mapagenético por não mais do que 10 cM). De outro modo, os locais proximamen-te ligados co-segregam pelo menos 90% das vezes. Os locais marcadoressão especialmente úteis na presente invenção quando eles demonstramuma probabilidade significante de co-segregação (ligação) com um traçodesejado (por exemplo, tolerância patogênica). Por exemplo, em alguns as-pectos, estes marcadores podem ser denominados marcadores de QLT li-gados. Em outros aspectos, marcadores moleculares especialmente úteissão aqueles que estão ligados, ou proximamente ligados, aos marcadoresde QLT.
Em alguns aspectos, a ligação pode ser expressa como qual-quer limite ou faixa desejada. Por exemplo, em algumas concretizações, doislocais ligados são dois locais que são separados por menos do que 50 cMunidades de mapa. Em outras concretizações, os locais ligados são dois lo-cais que são separados por menos do que 40 cM. Em outras concretizações,dois locais ligados são dois locais que são separados por menos do que 30cM. Em outras concretizações, dois locais ligados são dois locais que sãoseparados por menos do que 20 cM. Em outras concretizações, os dois lo-cais ligados são separados por menos do que 15 cM. Em alguns aspectos, évantajoso definir uma faixa considerada de ligação, por exemplo, entre 10 e20 cM, ou entre 10 e 30 cM, ou entre 10 e 40 cM.
Quanto mais proximamente um marcador está ligado a um se-gundo local, melhor um indicador para o segundo local daquele marcador setorna. Desse modo, em uma concretização, locais proximamente ligados,tais como um local marcador e um segundo local (por exemplo, um marca-dor de QLT) revelam uma freqüência de recombinação inter-local de 0% oumenos, preferivelmente cerca de 9% ou menos, ainda mais preferivelmentecerca de 8% ou menos, ainda mais preferivelmente cerca de 7% ou menos,ainda mais preferivelmente cerca de 6% ou menos, ainda mais preferivel-mente cerca de 5% ou menos, ainda mais preferivelmente cerca de 4% oumenos, ainda mais preferivelmente cerca de 3% ou menos, ainda mais pre-ferivelmente cerca de 2% ou menos. Em concretizações altamente preferi-das, os locais relevantes (por exemplo, um local marcador e um marcador deQLT) revelam uma freqüência recombinante de cerca de 1% ou menos, porexemplo, cerca de 0,75% ou menos, mais preferivelmente cerca de 0,5% oumenos, ou ainda mais preferivelmente cerca de 0,25% ou menos. Dois locaisestão localizados no mesmo cromossomo, e a uma tal distância que recom-binação entre os dois locais ocorre em um freqüência de menos do que 10%(por exemplo, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 0,75%, 0,5%, 0,25%,ou menos) são também referidos para serem "proximal" um ao outro. Emalguns casos, dois marcadores diferentes podem ter as mesmas coordena-das de mapa genético. Neste caso, os dois marcadores estão em tal proxi-midade um do outro que recombinação ocorre entre eles com uma tal baixafreqüência que é não-detectável.
Quando se refere ao relacionamento entre dois elementos gené-ticos, tal elemento genético que contribui para tolerância e um marcador pro-ximal, a ligação de fase de "acoplamento" indica o estado onde o alelo "favo-rável" no local de tolerância está fisicamente associado a mesma cepa decromossomo como o alelo "favorável" do local marcador ligado respectivo.Na fase de acoplamento, ambos os alelos favoráveis são herdados juntospor progenia, que herdam esta cepa de cromossomo. Na ligação de fase de"repulsão", o alelo "favorável" no local de interesse (por exemplo, um QLTpara tolerância) está fisicamente ligado com um alelo "desfavorável" no localmarcador proximal, e os dois alelos "favoráveis" não são herdados juntos(isto é, os dois locais estão "fora de fase" um com o outro).
Conforme aqui usado, os termos "intervalo de cromossomo" ou"segmento de cromossomo" designam uma extensão linear contígua deDNA genômico que reside em planta ou em um cromossomo simples. Oselementos genéticos ou genes localizados em um intervalo de cromossomosimples estão fisicamente ligados. O tamanho de um intervalo de cromos-somo não é particularmente limitado.
Em alguns aspectos, por exemplo, no contexto da presente in-venção, geralmente os elementos genéticos localizados dentro de um inter-valo de cromossomo simples são também geralmente ligados, tipicamentedentro de uma distância de recombinação genética de, por exemplo, menosdo que ou igual a 20 centimórgão (cM), ou, alternativamente, menos do queou igual a 10 cM. Isto é, dois elemento genéticos dentro de um intervalo decromossomo simples suportam recombinação em uma freqüência de menosdo que ou igual a 20% ou 10%.
Em um aspecto, qualquer marcador da invenção está ligado(geneticamente e fisicamente) a outro marcador que está a uma distância deou menos do que 50 cM. Em outro aspecto, qualquer marcador da invençãoestá proximamente ligado (geneticamente ou fisicamente) a qualquer outromarcador que está em proximidade, por exemplo, a uma distância de oumenos do que 10 cM. Dois marcadores proximamente ligados nos mesmoscromossomos podem estar posicionados 9, 8, 7, 6, 5, 4, 3,2,1, 0,75, 0,5 ou0,25 cM ou menos um do outro.
"Tolerância" ou "tolerância aperfeiçoada" em uma planta paraestresse biótico ou abiótico, é uma indicação que a planta é menos afetadacom relação ao rendimento e/ou sobrevivência ou outras medidas agronômi-cas relevantes, após ocorrência do estresse, do que uma planta menos tole-rante ou mais "susceptível". A tolerância é um termo relativo, indicando quea planta afetada produz melhor rendimento do que outra planta similarmenteafetada mais susceptível. Isto é, o estresse causa uma diminuição reduzidana sobrevivência e/ou rendimento em uma planta tolerante, conforme com-prado a um planta susceptível. Um técnico no assunto aprecia que a tolerân-cia da planta a vários estresses varia amplamente, e que a tolerância tam-bém variará dependendo da severidade do estresse. Contudo, por simplesobservação, um perito pode determinar a tolerância relativa ou susceptibili-dade de plantas diferentes, linhas de planta ou famílias de planta para es-tresse de uma dada severidade.
O termo "cruzado" ou "cruzamento" no contexto desta invençãosignifica a fusão de gametas, via polinização para produzir progenia (por e-xemplo, células, sementes ou plantas). O termo envolve ambos cruzamentossexuais (a polinização de uma planta por outra) e uniformização (auto-polinização, por exemplo, quando o pólen e óvulo são da mesma planta).
O termo "introgressão" se refere a transmissão de um alelo de-sejado de um local genético de um fundo genético para outro. Por exemplo,a introgressão de um alelo desejado em um local especificado pode sertransmitida a pelo menos uma progenia, via um cruzamento sexual entredois ancestrais da mesma espécie, onde pelo menos um dos ancestrais temo alelo desejado em seu genoma. Alternativamente, por exemplo, a trans-missão de um alelo pode ocorrer por recombinação entre dois genomas do-adores, por exemplo, em um protoplasto fundido, onde pelo menos um dosprotoplastos doadores tem o alelo desejado em seu genoma. O alelo dese-jado pode ser, por exemplo, um alelo selecionado de um marcador, um QTL,um transgene, ou similares. Em qualquer caso, a descendência compreen-dendo o alelo desejado pode ser repetidamente retro-cruzado a uma linhatendo um fundo genético desejado e selecionado para o alelo desejado, pararesultar no alelo que se torna fixo em um fundo genético selecionado.
Uma "linha" ou "cepa" é um grupo de indivíduos de parentescoidêntico que são geralmente congênitos para algum grau, e que são geral-mente homozigóticos e homogêneos em muitos locais (isogênico ou quaseisogênico). Uma "sublinha" se refere ao um subconjunto congênito de des-cendentes que são geneticamente distintos de outros subconjuntos similar-mente congênitos descendidos do mesmo progenitor. Tradicionalmente, uma"sublinha" tem sido derivada pela reprodução da semente de uma planta desoja individual selecionada na geração F3 a F5 até que os locais de segre-gação residuais são "fixados", ou homozigóticos através de muitos, ou todosos locais. As variedades comerciais de soja (ou linhas) são tipicamente pro-duzidas por agregação ("volumosa") da progenia auto-polinizada de umaplanta F3 a F5 simples de um cruzamento controlado entre 2 ancestrais ge-neticamente diferentes. Enquanto a variedade tipicamente parece uniforme,a variedade de auto-polinização derivada a partir da planta selecionada e-ventualmente (por exemplo, F8) torna-se uma mistura de plantas homozigó-ticas que pode variar no genótipo em qualquer local que era heterozigóticona planta F3 a F5 originalmente selecionada. No contexto da invenção, sub-linhas baseadas por marcador, que diferem uma da outra baseado no poli-morfismo qualitativo no nível de DNA em um ou mais locais marcadores es-pecíficos, são derivados por genotipagem de uma amostra de semente deri-vada da progenia auto-polinizada individual derivada de uma planta F3-F5selecionada. A amostra de semente pode ser diretamente genotipada comosemente, ou como tecido de planta que se desenvolve de tal amostra desemente. Opcionalmente, a semente que se divide em um genótipo comumno local especificado (ou locais) é aumentada, proporcionando uma sublinhaque é geneticamente homogênea nos locais identificados importantes paraum traço de interesse (rendimento, tolerância, etc.).
Uma "linha ancestral" é uma linha de ancestral usada como umafonte de genes, por exemplo, para o desenvolvimento de linhas de elite.
Uma "população ancestral" é um grupo de ascendentes que contribuírampara o volume de variação genética que foi usado para desenvolver linhasde elite. "Descendentes" são a progenia de ascendentes, e podem ser sepa-rados de seus ascendentes por muitas gerações de reprodução. Por exem-pio, linhas de elite são os descendentes de seus ascendentes. Uma "estrutu-ra de raça" define o relacionamento entre um descendente e cada ascen-dente que dá ocorrência àquele descendente. Uma estrutura de raça podeenvolver uma ou mais gerações, descrevendo relacionamento entre o des-cendente e os seus ancestrais, os avós, os bisavós, etc.
Uma "linha de elite" ou "cepa de elite" é uma linha agronomica-mente superior que resultou de muitos ciclos de reprodução e seleção paradesempenho agronômico superior. Numerosas linhas de elite são disponí-veis e conhecidas àqueles técnicos do assunto de reprodução de planta.
Uma "população de elite" é um grupo de indivíduos de elite ou linhas quepodem ser usados para representar o estado da técnica em termos de genó-tipos agronomicamente superiores de uma dada espécie de colheita, tal co-mo, milho, soja ou tomate. Similarmente, um "germeplasma de elite" ou cepade elite de germeplasma é um germeplasma agronomicamente superior,tipicamente derivado de e/ou capaz de prover uma planta com desempenhoagronômico superior, tal como uma linha de elite existente ou recentementedesenvolvida de milho, soja ou tomate.
Em contraste, uma "cepa exótica" ou um "germeplasma exótico"é uma cepa ou germeplasma derivada de uma planta não pertencente a umalinha de elite disponível ou cepa de germeplasma. No contexto de um cru-zamento entre duas plantas de soja ou cepas de germeplasma, por exemplo,um germeplasma exótico não está proximamente relacionado pelo descen-dente ao germeplasma de elite com o qual ele é cruzado. Mas comumente, ogermeplasma exótico não é derivado de qualquer linha de elite conhecida desoja, mas preferivelmente é selecionado para introduzir novos elementosgenéticos (tipicamente novos alelos) em um programa de reprodução.
O termo "amplificação" no contexto de amplificação de ácido nu-cléico é qualquer processo pelo qual cópias adicionais de um ácido nucléicoselecionado (ou uma forma transcrita destas) são produzidas. Métodos típi-cos de amplificação incluem vários métodos de duplicação baseados empolimerase, incluindo a reação de cadeia de polimerase (PCR), métodosmediados por ligase, tais como a reação de cadeia de Iigase (LCR) e méto-dos de amplificação baseados em polimerase de RNA (por exemplo, portranscrição). Um "amplicon" é um ácido nucléico amplificado, por exemplo,um ácido nucléico que é produzido pela amplificação de um ácido nucléicogabarito por qualquer método de amplificação disponível (por exemplo, PCR1LCR, transcrição, ou similar).
Um "ácido nucléico genômico" é um ácido nucléico que corres-ponde em seqüência a um ácido nucléico herdável em uma célula. Exemploscomuns incluem DNA genômico nuclear e amplicons deste. Um ácido nu-cléico genômico é, em alguns casos, diferentes de um RNA dividido, ou deum cDNA correspondente, em que o RNA dividido ou cDNA é processado,por exemplo, por maquinaria de divisão, para remover introns. Ácidos nucléi-cos genômicos compreendem opcionalmente não-transcritos (por exemplo,seqüências estruturais de cromossomo, regiões promotoras, regiões intensi-ficadoras, etc.) e/ou seqüências não-transladadas (por exemplo, introns),pela qual RNA dividido/cDNA tipicamente não têm seqüências não-transcritas ou introns. Um "ácido nucléico gabarito" é um ácido nucléico queserve como gabarito em uma reação de amplificação (por exemplo, uma re-ação de amplificação baseada em polimerase, tal como PCR1 uma reaçãode amplificação mediada por ligase, tal como LCR, uma reação de transcri-ção, ou similar). Um ácido nucléico gabarito pode ser genômico na origem,ou alternativamente, pode ser derivado de seqüências expressas, por exem-plo, um cDNA ou um EST.
Um "ácido nucléico exógeno" é um ácido nucléico que não é na-tivo a um sistema especificado (por exemplo, um germeplasma, planta, vari-edade, etc.), com relação a seqüência, posição genômica, ou ambas. Con-forme aqui usado, os termos "exógeno" ou heterólogo", conforme aplicadosa polinucleotídeos ou polipeptídeos, tipicamente se referem a moléculas queforam artificialmente supridas a um sistema biológico (por exemplo, uma cé-lula de planta, um gene de planta, uma espécie de planta particular, ou vari-edade, ou um cromossomo de planta em estudo), e são não-nativos àquelesistema biológico particular. Os termos podem indicar que o material rele-vante originado de uma fonte outra do que uma que ocorre naturalmente, oupodem se referir a moléculas tendo uma configuração não-natural, localiza-ção genética, ou arranjo de partes.
Em contraste, por exemplo, um gene "nativo" ou "endógeno" éum gene que não contém elementos de ácido nucléico codificados por fontesoutras do que o cromossomo ou outro elemento genético no qual ele é nor-malmente encontrado na natureza. Um gene endógeno, transcrito ou poli-peptídeo, é codificado por seu local cromossomal natural, e não artificial-mente suprido à célula.
O termo "recombinante" em referência a um ácido nucléico oupolipeptídeo indica que o material (por exemplo, um ácido nucléico recombi-nante, gene, polinucleotídeo, polipeptídeo, etc) foi alterado por intervençãohumana. Geralmente, o arranjo de partes de uma molécula recombinantenão é uma configuração nativa, ou a seqüência primária do polinucleotídeoou polipeptídeo recombinante foi, de algum modo, manipulada. A alteraçãopara produzir o material recombinante pode ser realizada no material no inte-rior de ou removido de seu ambiente ou estado natural. Por exemplo, umácido nucléico que ocorre naturalmente torna-se um ácido nucléico recombi-nante se ele é alterado, ou se ele é transcrito de DNA que já tenha sido alte-rado, por meio de intervenção humana realizada dentro da célula da qual elese origina. Uma estrutura de leitura aberta de seqüência de gene é recombi-nante se esta seqüência de nucleotídeo foi removida a partir do contextonatural, e clonada em qualquer tipo de vetor de ácido nucléico artificial. Osprotocolos e reagentes para produzir moléculas recombinantes, especial-mente ácidos nucléicos recombinantes, são comuns e rotina na técnica. Otermo recombinante pode também se referir a um organismo que abriga ma-terial recombinante, por exemplo, uma planta que compreende um ácido nu-cléico recombinante é considerada uma planta recombinante. Em algumasconcretizações, um organismo recombinante é um organismo transgênico.
O termo "introduzido" quando se refere a translocação de umácido nucléico heterólogo ou exógeno em uma célula, se refere a incorpora-ção do ácido nucléico na célula usando qualquer metodologia. O termo en-volve métodos de introdução de ácido nucléico tais como "transfecção","transformação" e "transdução".
Conforme aqui usado, o termo "vetor" é usado em referência apolinucleotídeo ou moléculas que transferem segmento(s) de ácido nucléicoem uma célula. O termo "veículo" é as vezes usado intercambeavelmentecom "vetor". Um vetor opcionalmente compreende partes que mediam a ma-nutenção do vetor, e capacitam seu uso pretendido (por exemplo, seqüêncianecessária para replicação, droga concedendo gene, ou resistência antibióti-ca, um local de clonagem múltipla, elementos promotores/intensificadoresoperavelmente ligados que capacitam a expressão de um gene clonado,etc). Vetores são freqüentemente derivados de plasmídeos, bacteriófagos ouplanta ou vírus animal. Um "vetor de clonagem" ou "vetor shuttle" ou "vetorde subclonagem" contém partes operavelmente ligadas que facilitam as eta-pas de sub-clonagem (por exemplo, local de clonagem múltipla contendolocais de endonuclease de restrição múltipla).
O termo "vetor de expressão", conforme aqui usado, se refere aum vetor compreendendo seqüências de polinucleotídeo operavelmente li-gadas que facilitam expressão de uma seqüência de codificação em um or-ganismo hospedeiro particular (por exemplo, um vetor de expressão bacteri-al, ou um vetor de expressão de planta). As seqüências de polinucleotídeoque facilitam a expressão procariotes incluem tipicamente, por exemplo, umpromotor, um operador (opcional), e um local de ligação de ribossomo, fre-qüentemente junto com outras seqüências. As células eucarióticas podemusar promotores, intensificadores, sinais de terminação e polialdenilação, eoutras seqüências que são geralmente diferentes daquelas usadas por pro-cariotes.
O termo "planta transgênica" se refere a uma planta que com-preende dentro de sua célula um polinucleotídeo heterólogo. Geralmente, opolinucleotídeo heterólogo é estavelmente integrado dentro do genoma, talque o polinucleotídeo é passado para gerações sucessivas. O polinucleotí-deo heterólogo pode ser integrado no genoma sozinho como parte de umcassete de expressão de recombinante. "Transgênico" é usado aqui para sereferir a qualquer célula, linha de célula, calo, tecido, parte de planta, o genó-tipo dos quais foi alterado pela presença de ácido nucléico heterólogo, inclu-indo aqueles organismos transgênicos ou células inicialmente assim altera-das, bem como aqueles criados por cruzamentos ou propagação sexual apartir do organismo transgênico inicial, ou célula. O termo "transgênico", con-forme aqui usado, não envolve a alteração do genoma (cromossomal ou ex-tra-cromossomal) por métodos de geração de planta convencional (por e-xemplo, cruzamentos), ou por eventos que ocorrem naturalmente, tal comofertilização cruzada aleatória, infecção viral não-recombinante, transforma-ção bacterial não-recombinante, transposição não-recombinante, ou muta-ção espontânea.
"Clonagem posicionai" é um procedimento de clonagem no qualum ácido nucléico alvo é identificado e isolado por sua proximidade genômi-ca ao ácido nucléico marcador. Por exemplo, um clone de ácido nucléicomarcador pode incluir parte ou todo de duas mais regiões cromossomais queestão próximas uma da outra. Se um marcador pode ser usado para identifi-car o ácido nucléico genômico de uma biblioteca genômica, métodos pa-drões, tais como, sub-clonagem ou seqüenciamento do clone que estão Io-calizados perto do marcador.
Um ácido nucléico especificado é "derivado de" um dado ácidonucléico quando ele é construído usando-se a dada seqüência de ácido nu-cléico, ou quando o ácido nucléico especificado é construído usando-se odado ácido nucléico. Por exemplo, um cDNA ou EST é derivado de um mR-NA expresso.
O termo "elemento genético" ou "gene" se refere a uma seqüên-cia herdável de DNA, isto é, uma seqüência genômica, com significânciafuncional. O termo "gene" pode também ser usado para se referir a, por e-xemplo, um cDNA e/ou um mRNA codificado por uma seqüência genômica,bem como aquela seqüência genômica.
O termo "genótipo" é a constituição genética de um indivíduo (ougrupo de indivíduos) em um ou mais locais genéticos, conforme contrastadocom o traço observável (o fenótipo). Genótipo é definido pelo(s) alelo(s) deum ou mais locais conhecidos que o indivíduo tenha herdado de seus ances-trais. O termo genótipo pode ser usado para se referir a constituição genéti-ca individual em um local simples, em locais múltiplos, ou, mais geralmente,o termo genótipo pode ser usado para se referir a composição genética indi-vidual para todos os genes em seu genoma. Um "haplotipo" é o genótipo deum indivíduo em uma pluralidade de locais genéticos. Tipicamente, os locaisgenéticos descritos por um haplotipo são fisicamente e geneticamente liga-dos, isto é, no mesmo segmento de cromossomo.
Os termos "fenótipo" ou "traço fenotípico" ou "traço" se referem aum ou mais traços de um organismo. O fenótipo pode ser observável ao olhonu, ou por quaisquer outros meios de avaliação conhecidos na técnica, porexemplo, microscópio, análise bioquímica, análise genômica, um ensaio pa-ra uma resistência de doença particular, etc. Em alguns casos, um fenótipo édiretamente controlado por um gene simples ou local genético, isto é, um"traço genético simples". Em outros casos, um fenótipo é o resultado de vá-rios genes. Um "local de traço quantitativo" (QLT) é um domínio genéticoque é polimórfico e efetua um fenótipo que pode ser descrito em termosquantitativos, por exemplo, altura, peso, teor de óleo, dias para germinação,resistência à doença, etc, e, portanto, pode ser cedido um "valor fenotípico"que corresponde a um valor quantitativo para o traço fenotípico. Um QLTpode agir através de um mecanismo de gene simples, ou por um mecanismopoligênico.
Um "fenótipo molecular" é um fenótipo detectável no nível deuma população de (uma ou mais) moléculas. Tais moléculas podem ser áci-dos nucléicos, tais como DNA genômico ou RNA, proteínas, ou metabólitos.
Por exemplo, um fenótipo molecular pode ser um perfil de expressão paraum ou mais produtos de gene, por exemplo, em um estágio específico dedesenvolvimento de planta, em resposta a uma condição ambiental de es-tresse, etc. Perfis de expressão são tipicamente avaliados no nível de RNAou proteína, por exemplo, em um arranjo de ácido nucléico, ou "chip", ouusando anticorpos ou outras proteínas de ligação.
O termo "rendimento" se refere a produtividade por unidade deárea de um produto de planta particular de valor comercial. Por exemplo,rendimento de soja é comumente medido em alqueires de semente por acre,ou toneladas métricas de semente por hectare por estação. O rendimento éafetado por ambos fatores genéticos e ambientais. "Agronômicos", "traçosagronômicos" e "desempenho agronômico" se referem a traços (e elementosgenéticos subjacentes) de uma dada variedade de planta que contribui paraproduzir sobre o curso de desenvolvimento da estação. Traços agronômicosindividuais incluem vigor de emergência, vigor vegetativo, tolerância à es-tresse, resistência à doença ou tolerância, resistência a herbicida, ramifica-ção, florescimento, ajuste de semente, tamanho da semente, densidade desemente, suportabilidade, debulhamento, e similares. O rendimento é, por-tanto, a culminação final de todos os traços agronômicos.
Um "conjunto" de marcadores ou sondas se refere a uma cole-ção ou grupo de marcadores ou sondas, ou os dados derivados destes, usa-dos para uma proposta comum, por exemplo, identificação de plantas desoja com um traço desejado (por exemplo, tolerância para pestes ou seca).
Freqüentemente, os dados correspondentes aos marcadores ou sondas, oudados derivados de seu uso, são armazenados em um meio eletrônico. En-quanto cada um dos membros de um conjunto possui utilidade com relaçãoa proposta especificada, marcadores individuais selecionados a partir doconjunto, bem como subconjuntos incluindo alguns, mas não todos os mar-cadores, são também efetivos em alcançar a proposta especificada.
Uma "tabela de consulta" é uma tabela que correlaciona umaforma de dados a outra, ou uma ou mais formas de dados com um resultadoprognosticado que os dados são relevantes. Por exemplo, uma tabela deconsulta pode incluir uma correlação entre dados de alelo e um traço prog-nosticado que uma planta compreendendo um dado alelo é igualmente pararevelar. Estas tabelas podem ser, e tipicamente são, multidimensionais, porexemplo, tendo alelos múltiplos em cálculos simultâneos, e, opcionalmente,levando outros fatores em conta também, tal como fundo genético, por e-xemplo, na produção de um prognóstico de traço.
Um "meio legível de computador" é um meio de armazenamentode informação que pode ser acessado por um computador usando uma in-terface disponível ou de costume. Exemplos incluem memória (por exemplo,ROM ou RAM, memória de flash, etc), meio de armazenamento ótico (porexemplo, CD-ROM), meio de armazenamento magnético (acionadores dehard de computador, discos floppy, etc), cartões de entrada, e muitos outrosque são comercialmente disponíveis. A informação pode ser transmitida en-tre um sistema de interesse e o computador, ou para ou a partir do compu-tador, ou para ou a partir do meio legível de computador para armazenamen-to ou acesso de informação armazenada. Esta transmissão pode ser umatransmissão elétrica, ou pode ser outros métodos disponíveis, tais como umaligação de infravermelho, uma ligação sem fio, ou similares.
"Instruções de sistema" são conjuntos de instrução que podemser parcialmente ou totalmente executados pelo sistema. Tipicamente, osconjuntos de instrução estão presentes como software de sistema.Visão geral do processo básico da invenção
A análise baseada em micro-arranjo de polimorfismos de hibridi-zação tem os seguintes cenários possíveis (ver Figura 1):
Caso 1: Detecção direta do polimorfismo de seqüência dentro da regiãode sonda.
Caso 2: Detecção direta do polimorfismo de seqüência amplificada den-tro da região de sonda.
Caso 3: Detecção indireta do polimorfismo de seqüência imediatamentefora da região de sonda. O polimorfismo de seqüência pode for-mar estruturas secundárias diferentes que podem afetar a efici-ência de hibridização.
Caso 4: Detecção indireta do polimorfismo de seqüência fora da regiãode sonda. O polimorfismo de seqüência altera o local de restri-ção de enzima, e, desse modo, resulta em RFLPs. Os RFLPs fo-ram subseqüentemente preferencialmente amplificados, e istoconduz a uma diferença de abundância alvo.
Caso 5: Detecção indireta do polimorfismo de seqüência dentro da regiãode sonda. O polimorfismo de seqüência altera o local de restri-ção de enzima, e, desse modo, os resultados no RFLPs. Os R-FLPs foram subseqüentemente amplificados, e isto conduz auma diferença de abundância alvo.
O presente método usa o micro-arranjo com sondas de oligonu-cleotídeo de curta ligação para detectar indiretamente os polimorfismos deseqüência pela leitura das diferenças de sinal de hibridização (polimorfismosde hibridização) em um experimento de hibridização de DNA genômicocomparativo. Ele inclui as seguintes etapas maiores (Figura 2):
A. Selecionar sondas de oligonucleotídeo e delinear um micro-arranjo para adetecção
1) Selecionar seqüências curtas de oligonucleotídeo (25mer noexemplo) que complementa as seqüências genômicas de interesse. Preferi-velmente, as sondas serão complementadas pelas seqüências de gene (se-qüências de codificação ou regulatórias).2) As moléculas de oligonucleotídeo serão sintetizadas direta-mente na superfície de micro-arranjo, ou sintetizadas e depositadas na su-perfície de micro-arranjo.
3) O micro-arranjo manufaturado determinará a cobertura dasseqüências a serem sobrevividas.
B. Variações de seqüência traduzida em variações de alvos de hibridização(ver Figura 2):
1) Preparar DNA genômico de duas variedades genéticas usan-do métodos de escolha. A restrição do DNA genômico preparado por enzi-mas de restrição de local específico. Variações subseqüentes no local derestrição criarão comprimento diferente dos fragmentos de restrição (poli-morfismos de comprimento de fragmento de restrição, ou RFLPs). As enzi-mas de restrição usadas devem criar várias bases suspensas. A enzima u-sada nesta etapa pode ser uma enzima de restrição simples, ou uma combi-nação de enzimas de restrição múltiplas. Se uma enzima sensível a metila-ção é usada, somente as regiões de hipometilação serão seletivamente res-tringidas.
2) Esta etapa traduz o polimorfismo de seqüência em RFLPs.
3) Um par de oligonucleotídeos de DNA com Tm única e compo-sição base, e seqüência parcial complementar às bases suspensas dosfragmentos de restrição, serão ligados a todos os fragmentos de restrição,indiferente do tamanho do fragmento. Os oligonucleotídeos universalmenteadicionados (ligadores universais) serão, em seguida, usados como príme-res de PCR para amplificação de PCE.
4) Sob a condição de amplificação de PCR de escolha, os frag-mentos de restrição na faixa certa (dependendo do tempo de execução usa-do na amplificação de PCR) serão seletivamente amplificados. Os fragmen-tos de tamanho grande não serão amplificados devido a extensão insuficien-te. Por esta etapa, os RFLps serão traduzidos em polimorfismos em alvo(moléculas a serem hibridizadas para as sondas) em abundância.
C. Etiqueta e Alvos Hibridizados
1) Alvos amplificados serão fragmentados em um modo aleatóriopor DNase1 ou outros meios em 50-200 fragmentos base.
2) Cada fragmento curto será etiquetado na extremidade pornucleotídeos alvejados de fluorescência de escolha não-seletivamente portransferase terminal.
3) As moléculas alvos etiquetadas serão usadas para hibridizaràs sondas de oligonucleotídeo curtas no micro-arranjo de acordo com acomplementação de seqüência.
4) O sinal fluorescente do alvo etiquetado será capturado pelassondas de hibridização durante hibridização. Se uma molécula etiquetadanão tem uma sonda correspondente, ela será lavada. Se uma molécula eti-quetada é baixa em abundância, o sinal não será detectado pelo micro-arranjo. Isto proporcionará a oportunidade de eliminar o ruído a partir defragmentos de DNA genômico grandes não fragmentados pelas enzimas derestrição, fragmentos de DNA genômico grandes fora da faixa de amplifica-ção, e fragmentos em sondas correspondentes.
D. Quantificar sinal de hibridização e detectar polimorfismos
1) Os sinais de hibridização serão capturados por um escanea-dor de laser ou CCD, e quantificados por um algoritmo computacional.
2) Os sinais de cada sonda (característica) obtidos de varieda-des genéticas diferentes serão comparados. As sondas com diferenças desinal serão registradas e estatisticamente analisadas. A origem das sondascom sinais diferenciais será analisada.
3) Os sinais diferenciais refletem polimorfismo de nucleotídeosimples que conduz a afinidade de ligação diferente, polimorfismo de frag-mento de restrição amplificado (RFLP e AFLP) que conduz a abundânciaalvo diferente, e polimorfismo de seqüência que conduz a estrutura secundá-ria diferente dos alvos.
Um exemplo de tal detecção é ilustrado por detecção de GSHPem milho. Neste caso, um micro-arranjo no formato GeneChip com 1,3 mi-Ihões de sondas de oligonucleotídeo é usado para a detecção. Estas sondasforam selecionadas baseado nas seqüências de região de codificação degene. O DNA genômico de Mo17 e B73 é extraído, fragmentado usando-sePst I, uma enzima sensível à metilação, amplificado por PCR por um par deligadores universais, etiquetado com nucleotídeos identificados fluorescen-tes, e hibridizado ao micro-arranjo de GeneChip de milho. Os sinais diferen-ciais são detectados, registrados e analisados por métodos estatísticos.
Dois métodos de etiquetação alternativos são descritos para eti-quetação de genoma complexo que capacita a aplicação em espécies eco-nômicas que freqüentemente com genomas complexos. A etiquetação alvopode ser alcançada usando-se método de etiquetação de extremidade me-diada por enzima (um método de redução de genoma), ou usando-se ummétodo de etiquetação aleatória, em que oligonucleotídeos de hexâmeroaleatórios são usados como prímeres para sintetizar fragmentos Klenow, eincorporam os nucleotídeos alvos fluorescentes. Comparando à etiquetaçãoaleatória, a sensibilidade de detecção e precisão se aperfeiçoam dramatica-mente. Entre os polimorfismos selecionados pelo valor ρ e diferença de ve-zes, somente 1% do polimorfismo detectado pelo método de etiquetação tema diferença de sinal maior do que 5 vezes. Em contraste, aproximadamente60% dos polimorfismos detectados pelos métodos da invenção tem a dife-rença de sinal maior do que 5 vezes.
Comparando a outros métodos de redução de genoma que fo-ram anteriormente descritos, tais como DNA de invólucro alto, cDNA, ou mé-todos de filtração de metilação, o método descrito nesta invenção é único etem vantagens, conforme mostrado na Tabela 1.Tabela 1
Comparação dos métodos de redução de genoma inventado epublicado anteriormente.
<table>table see original document page 36</column></row><table>
Exemplos
O presente método pode ser usado, mas não limitado, na se-guinte aplicação imediata que foi amplamente usada na ciência e práticaagrícola e médica: 1) construção de mapa de gene de densidade ultra-alta;2) identificar marcadores para traços de gene simples ou QLTs por análisesegregante volumosa (BSA), e aproximações similares; 3) QLT associado egenes candidatos através de todas as análise de ligação de genoma ou es-tudos associados; e 4) alto rendimento de peneiramento usando-se marca-dor de diagnóstico.
EXEMPLO 1
Materiais e Métodos
Micro-arranjo de GeneChip usado para o ensaio
Um micro-arranjo de GeneChip de milho designado costumeiro(SYNG007) manufaturado por Affymetrix foi usado para a análise de hibridi-zação genômica comparativa, e mapeamento de densidade ultra-alta de mi-lho. O micro-arranjo de GeneChip de milho consiste de aproximadamente1,3 milhões de sondas de oligonucleotídeo representando 82.000 genes úni-cos ou grupos EST. Somente sondas equiparadas perfeitas são incluídas nodesenho do arranjo.
Outros arranjos descritos incluem arranjo de GeneChip de toma-te designado costumeiro, arranjo de exon de genoma total de Arabidopsiscostumeiro, arranjo de Phytophthora designado costumeiro, e arranjos deGeneChip Drosophilia comerciais.
Extração de DNA genômico
Amostras de tecido são coletadas de material de folha de mudasde duas semanas de idade. DNA genômico (gDNA) foi extraído usando-se ométodo CTAB e coluna de Qiagen DNeasy (Qiagen). Os gDNAs extraídosforam eluídos e re-suspensos em tampão de EDTA TE. A qualidade do gD-NA foi determinada por eletroforese de gel. Os gDNAs foram quantificadosusando-se um espectrofotômetro de UV, e ajustados para uma concentraçãofinal de 250 ng/μ.
Filtragem de metilação por reação enzimática de restrição
O gDNA preparado foi digerido pela enzima Pstl de restriçãosensível de metilação. Brevemente, 2μΙ de gDNA (250 ng/μΙ) foi misturadocom 2 μΙ de tampão NEB 3, 2 μΙ de BSA, 2 μΙ de Pstl e 12 μΙ de água livre denuclease em 20 μΙ de reação em gelo. Os conteúdos foram misturados porvórtice. A reação de enzima foi conduzida sob as seguintes condições usan-do um termocloclizador: 37°C por duas horas, 85°C por vinte minutos e re-tenção a 4°C.
Ligação de adaptadores universais
Um total de 20 μl de Pstl que digeriu gDNA foi usado para a rea-ção de ligação. Dois oligonucleotídeos de DNA1 com seqüência de CAC GATGGA TCC AGT e CTG GAT CCA TCG TGC A, foram usados como adapta-dores de Pstl. 4 μl de cada adaptador foram pré-cozidos em 2 μΙ de tampãode recozimento 10X e 10 μl de água livre de nuclease em 65°C por 10 minu-tos, e reduz gradualmente a temperatura a 25°C sobre o curso de duas ho-ras. A reação de ligação contém 2,5 μl de tampão NEB t$ DNA Ligase, 1,25μl de Adaptador Pstl e 1,25 μl de NEB T4 DNA Ligase. A reação foi incubadaa 16°C por duas horas, terminada pela aplicação a 70°C por vinte minutos eretenção a 4°C. Seguindo a reação, a ligação de 25 μΙ é diluída pela adiçãode 75 μl de água livre de nuclease.
Amplificação e purificação de PCR
Fragmentos restritos ligados foram amplificados por reação decadeia de polimerase (PCR) usando-se adaptadores de Pstl como locais deprímeres. A reação de PCR contém 10 μΙ de reação de ligação diluída, 10 μΙde tampão de PCR, 10 μΙ de dNTP's, 10 μΙ de MgCI2, 7,5 μΙ de Pstl Primer(GAT GGA TCC AGT GCA G), 2,5 μΙ de polimerase AmpIiTaq Goid e 50 μΙde água livre de nuclease. A amplificação foi feita pelo uso de um termocicli-zador com o seguinte programa: 95°C por 3 minutos, 25 ciclos de 95°C por30 segundos, 59°C por 30 segundos, e 72°C por 30 segundos, seguido por72°C por 7 minutos, e retenção a 4°C. Fragmentos com tamanho variado de400-1000 bps foram amplificados, e purificados por um dos dois métodos:por Kit de Purificação de PCR Qiagen QIAquick, ou por KIT de Purificaçãode PCR Qiagen MinEIute 96UF, de acordo com a instrução do fabricante. Aconcentração final dos produtos de PCR foi ajustada a um mínimo de 450ng/μl.
Fragmentação e etiquetacão
Os produtos de PCR foram adicionalmente fragmentados emfragmentos de 50-200 bp em 55 μΙ de reação que contém 45 μΙ de produtode PCR purificado equivalente a 20 μΙ em tampão EB, 5 μΙ tampão de Frag-mentação 10x Affymetrix e 5 μΙ de Reagente de Fragmentação Affymetrixdiluído (DNase I 0,0481Ι/μΙ). A reação foi incubada em 37°C por 30 minutos,5°C por quinze minutos, e retenção a 4°C.
Estes pequenos fragmentos foram etiquetados em 70 μΙ de rea-ção contendo 50,6 μΙ da amostra fragmentada, e 19,4 μΙ da mistura de eti-quetação a 37°C por 2 horas, e terminada por 95°C por 15 minutos. A mistu-ra de etiquetação consiste de 14 μΙ de tampão 5X Tdt1 2 μΙ de Reagente deEtiquetação de DNA de GeneChip, e 3,4 μΙ de Transferase de Deoxinucleo-tidil Terminal.
Etiquetação aleatória de qDNA
O gDNA preparado foi desnaturado na presença de octâmerosaleatórios. Brevemente, 4 μΙ de gDNA (500 ng/μΙ) foi misturado com 20 μΙ desolução de 2,5X de prímeres aleatórios, e 20 μΙ de água livre de nucleaseem 44 μΙ de reação no gelo. Os conteúdos foram misturados por vórtice. Areação foi efetuada sob a seguinte condição usando um termociclizador:99°C por cinco minutos, e retenção a 4°C.
À 44 μΙ de amostra, as seguintes adições foram feitas em gelo; 5μΙ de mistura de biotin etiquetado dNTP e 1 μΙ de Fragmento Klenow. Osconteúdos foram misturados por vórtice. A reação foi efetuada sob a seguin-te condição usando um termociclizador: 37°C por duas horas, e retenção a 4°C.
Hibridização, lavagem, alveiamento e escaneamento
Os fragmentos de PCR etiquetados (alvos) foram hibridizadospara as sondas de oligonucleotídeo no micro-arranjo de GeneChip. Breve-mente, micro-arranjos de GeneChip pré-hibridizados, 200 μΙ de tampão dehibridização 1X a 42°C por 10 minutos usando-se um forno de hibridizaçãoAffymetrix a 60 RPM. 250 μΙ de reação contendo 70 μΙ de gDNA etiquetado,2,5 μΙ de oligo controle B2, 2,5 μΙ de controle 100X RNA1 2,5 μΙ de DNA Her-ring Sperm, 2,5 μΙ de BSA Acetilatado, 125 μΙ de tampão 2X-Hibridização,18,75 μΙ de DMSO, 22,25 μΙ de água de DEPC e 4 μΙ de Affymetrix ReagenteX foram pré-incubados a 99°C por 5 minutos, e 42°C por 5 minutos. A mistu-ra de hibridização pré-tratada foi então aplicada ao arranjo de GeneChip ehibridiza no forno de hibridização a 42° com 60 RPM por 16 horas. Em se-guida a hibridização, os arranjos de GeneChip foram lavados e alvejadosusando-se protocolo fluídico EukGE-WS2v4_450 de acordo com as instru-ções de Affymetrix. As imagens dos arranjos foram adquiridas usando-se umAffymetrix GeneChip Scanner-3000. Os dados de imagem foram processa-dos usando-se programa Affymetrix GCOS.
EXEMPLO 2
Construção de um mapa de ligação de densidade ultra-alta em milho
Um micro-arranjo de GeneChip de milho designado costumeirofoi desenvolvido para identificar polimorfismo de característica simples (SFP)dentro de seqüências de codificação em uma escala de genoma. Este micro-arranjo de GeneChip tem 1,3 milhões de sondas de oligonucleotídeo de25mer para aproximadamente 82.000 genes e grupos EST. Aproximada-mente 14400 SFPs1 representando 1% do número total das característicaspeneiradas, foram identificados entre B73 e M017. Usando-se estes polimor-fismos de hibridização como marcadores, um mapa de densidade ultra-altade milho foi desenvolvido para a população intermediada de B73 e Mo17(IBM). 4368 marcadores de gene foram mapeados por 10997 SFPs. Noventae três por cento dos SFPs estudados podem ser validados pelo modelo desegregação dos fragmentos de RFLP conhecidos associados. A análise deseqüência adicional destes SFPs confirmou os polimorfismos de nucleotídeosimples associado (SNPs) nas regiões de sonda. Usando-se um método deequiparação padrão, nós adicionalmente mapeamos 34.034 SFPs represen-tando 11.427 genes únicos ou grupos de EST. Os genes mapeados são va-lidados por análises de seqüência, e suportados pelas relações de macro-sintenia entre arroz e milho. A integração destes marcadores de gene comoutros tipos de marcadores genéticos e físicos facilitarão a reprodução auxi-liada por marcador e identificação de genes que controlam traços comple-xos. Ver apêndice para métodos detalhados.EXEMPLO 3
Construção de um mapa de compartimento de densidade ultra-alta em tomate
Um total de 74 linhas de introgressão (ILs) e seus ancestraisforam peneirados para polimorfismos de hibridização por hibridização genô-mica comparativa usando-se micro-arranjos de GeneChip de tomate desig-nados costumeiros. Devido a eles serem detectados por sondas de oligonu-cleotídeos de DNA simples (característica) representando os fragmentos degene, as diferenças de sinal de hibridização são denominadas polimorfismosde característica simples (SFPs).
A hibridização de DNA para as duas linhas parentais foi duplica-da 8 vezes para assegurar a significância estatística da detecção. Emboranenhuma duplicação de hibridização de DNA de muitos dos ILs1 os experi-mentos de hibridização para ILs selecionados associados com traços impor-tantes foram duplicados duas vezes e pode ser feito mais para aumentar onúmero de marcadores associados com estes traços.
A qualidade dos dados foi primeiro avaliada usando-se Refina-dor, um módulo de qualidade de dados em Expressionist (GeneData). Todosos dados encontraram a média para padrão de alta qualidade. A reprodutibi-lidade dos experimentos de hibridização de DNA foi examinada, e um coefi-ciente de correlação médio de 0,93 foi alcançado através de todos os con-juntos de dados de linha de 18 parentais. Aproximadamente 8364 SFPs en-tre duas linhas parentais foram identificados usando-se dois métodos esta-tísticos independentes com um conjunto de critérios estatísticos de alta se-veridade. A taxa de descoberta falsa destes SFPs foi estimada para ser me-nos do que 0,1%. Os métodos estatísticos usados foram validados pelo mé-todo de validação cruzada. Na média o genótipo de um testador pode sercorretamente assinalada 97% do tempo baseado nos SFPs identificados. OsSFPs identificados foram validados molecularmente e geneticamente. Umtotal de 131 fragmentos de gene contendo SFPs eram PCR amplificado, eseqüenciados. Entre eles, 101 foram confirmados e conduzem a uma taxade confirmação de 77%.As sondas usadas para detectar SFPs foram associadas com375 marcadores genéticos conhecidos por seqüência de alinhamento deconjuntos de sonda de oligonucleotídeo de DNA com seqüências marcado-ras. 82 marcadores foram encontrados para serem sobrepostos por 8364sondas detectando SFPs. Pela comparação do sinal de hibridização de cadalocal (característica) nos ILs para a referência parental, o alelo de cada localnos Ils foi designado. A designação de alelo baseado nos SFPs associadoscom marcador foi comparada a designação de alelo para o estudo genético.90% dos 6560 genótipos foram designados de acordo com a informação alé-lica a partir do estudo de mapeamento anterior. A partir destes 8364 SFPs,1630 marcadores de gene de alta confidência foram identificados nos com-partimentos genéticos. Aproximadamente 70-90 marcadores de SFP estãosendo selecionados e validados. Outros SFPs foram estudados computacio-nalmente e molecularmente para refinar a aproximação e procura de marca-dores de SFP adicionais.
EXEMPLO 4
Identificação de marcadores de traço em tomate
Uma aproximação de análise segregante volumosa foi usadapara identificar marcadores ligados fechados para o local de resistência Fu-sarium Fr1. Duas reuniões de DNA genômico foram preparadas a partir deuma população F2, uma de 22 indivíduos homozigóticos para o alelo resis-tente e a outra de 21 indivíduos para o alelo susceptível. As duas reuniõesde DNA genômico e DNA genômico a partir das linhas parentais foram pre-paradas, etiquetadas e cada uma hibridizada para os micro-arranjos de Ge-neChip de tomate designados costumeiros de acordo com o procedimentodescrito no Apêndice. As sondas que detectam sinais de hibridização dife-renciais (p<0,001, diferença de vezes >1,5) entre as duas reuniões foramselecionadas como marcadores candidatos. Os candidatos foram adicional-mente seqüenciados para identificar SNPs e, em seguida, mapeados paradeterminar ligação ao local alvo. 16 de 17 marcadores candidatos identifica-dos neste experimento foram encontrados para serem geneticamente liga-dos ao local alvo por classificação de 43 linhas individuais que compõem asreuniões de BSA resistentes e susceptíveis. Teste adicional de 90 cavidadescaracterizaram variedades de tomate resistente e susceptível também con-firmaram a ligação hermética, e validaram a robustez da aproximação. Apro-ximações similares identificaram marcadores genéticos proximamente Iiga-dos para local de resistência Stemphillium Sm e locais de resistência Phyto-phtora.
EXEMPLO 5
Identificação de SFPs em espécies proximamente relacionadas usando-sedetecção heteróloga
DNA genômico foi extraído a partir de variedades diferentes depimenta, etiquetadas pelo método de hexímero aleatório, e hibridizado aomicro-arranjo de GeneChip de tomate designado costumeiro de acordo comos procedimentos descritos no Apêndice. Os experimentos foram duplicadosdez vezes para cada variedade. AS duas espécies pertencentes a Solana-ceae, e compartilham 90% de similaridade nas seqüências de codificação nonível de nucleotídeo. Sob uma condição de hibridização estrita conformedescrita, aproximadamente N% das sondas de tomate detectaram sinais dealvo de pimenta. Um total de 1248 SFPs putativos entre ancestrais C (chinêsPl 159234) e (frutescens, BG2814-6) foi detectado usando-se os critérios dediferença de vezes >1,5 e p<0,01. Entre estes, 137 SFPs têm seqüências depimenta alinhadas (com média de 5 diferenças bases), e 60 deles foram se-lecionados para validação de SNPs. Os resultados mostraram que 40-60%dos SFPs são causados pelos SNPs dentro de ou adjacente às sondas de 25 mer.
Similarmente, os SFPs foram detectados com sucesso em Bras-sica e beterrabas usando arranjos de GeneChip de Arabidopsis, em folhausando arranjos de GeneChip de Dosophila, em Plasmopara viticola usandoarranjos de GeneChip de Phytophthora, e em feijão comum usando arranjosde soja (ver Figura 3).
EXEMPLO 6
Identificação de SFPs entre ancestrais B73 e Mo17 de milho ou linhas gené-ticas diferentes.Seis a dez conjuntos de dados de hibridização genômica dupli-cados de B73 e Mo17, ou linhas genéticas de outras espécies, foram usadaspara análise de dados. Um roteiro de perlita costumeiro foi desenvolvido eusado para identificar os SFPs entre estes dois ancestrais. Brevemente, ossinais de intensidade para cada hibridização foram normalizados ao valormédio de todas as características do chip após eles serem carregados noprograma. As intensidades normalizadas eram transformadas de Iog natural,e a diferença de valor de cada característica entre os ancestrais é submetidaa teste-t. As chamadas significantes foram em seguida filtradas com critériosde mudança de vezes. De modo a gerar saídas de dados sob severidadediferente, cortes de valor ρ diferente e mudança de vezes foram usados. Oscandidatos prognosticados com diferenças significantes sob os critérios defi-nidos foram selecionados e usados como polimorfismo de característicasimples (SFP). Estes candidatos foram adicionalmente validados computa-cionalmente ou experimentalmente por seqüenciamento.
EXEMPLO 7
Validações cruzadas de SFP identificado
Os SFPs prognosticados baseados nos testes-t múltiplos no ní-vel de característica foram adicionalmente examinados por validações cru-zadas. Nesta análise, uma das duplicações foi removida a partir do conjuntode dados conforme o testador. O novo conjunto de dados foi usado para i-dentificar SFPs entre os ancestrais baseados no teste-t. Pela comparaçãodos dados de SFP recentemente produzidos, a identidade do testador podeser designada. Devido ao testador ser selecionado a partir de uma de duaslinhas de ancestral, a identidade designada é esperada concordar com aidentidade original. Total de 18 validações cruzadas foram efetuadas a partirde combinações diferentes de uma duplicação esquerda, e a média das ta-xas acordadas foi computada.
EXEMPLO 8
Designações de genótipo nas linhas de progenia
Os genótipos de todas as 93 linhas de progenia para qualquerSFP foram determinados usando-se o seguinte algoritmo. Para cada SFPidentificado, os sinais de intensidade em todas as duplicações de linha deancestral foram considerados para seguir duas distribuições normais, umade B73, e outra de Mo17. Cada forma de curva de distribuição pode ser de-terminada pelos valores de desvio médio e padrão para a dada característicaem uma linha de ancestral, que foram gerados no processo de identificaçãode SFP. Devido a esta população inter-unida ter sido auto-cruzada por 6-7gerações, acredita-se que a freqüência de genótipo heterozigótico é muitobaixa. Conseqüentemente, somente genótipo homozigótico foi consideradona computação. De modo a designar o genótipo baseado na medição deintensidade quantitativa, o valor de intensidade foi primeiro normalizado etransformado por Iog conforme descrito acima. Em seguida, o valor foi usadopara as computações de área: para a distribuição com a média menor (es-querda), uma integração a partir da negativa distante deste valor cobertopela distribuição foi computada; enquanto para a distribuição com médiamuito maior (direita), uma integração a partir deste valor para a positiva dis-tante coberta pela distribuição foi computada, conforme descrito em seguida:
<formula>formula see original document page 45</formula>
Aesquerda e Adireita são as áreas descritas acima; xg é a intensida-de após normalização e transformação de log; μ1 e μ2 são as médias dedistribuição esquerda e direita; e σ1 e σ2 são os desvios padrões das distri-buições esquerda e direita. Estas duas áreas foram, em seguida, compara-das, e a distribuição com as áreas computadas menores foi designada paraa dada intensidade.
EXEMPLO 9
Validação de designações de genótipo
Modelos de segregação de 1343 marcadores genéticos anteri-ormente publicados na população IBM foram usados como referência paravalidar os genótipos designados (Lee et al. 2002). A informação genotípicafoi descarregada a partir de www.maizegdb.org. As seqüências destes mar-cadores genéticos foram programadas contra as seqüências de conjunto desonda de milho para estabelecer as ligações entre os marcadores genéticose os marcadores de gene de SFP. Os genótipos de SFP que cruzam todasas linhas de progenia com aquelas ides de conjunto de sonda de milho fo-ram recuperados a partir do conjunto de dados de designação de genótipo, eforam comparados aos dados do marcador genético correspondente. A per-centagem de genótipo de acordo foi então computado.
EXEMPLO 10
Condensações de marcador: de SFP a marcador de conjunto de sonda
SFPs múltiplos a partir do mesmo conjunto de sonda foram usa-dos para avaliar o nível de confidência de marcadores de gene. Isto é acom-panhado primeiro pela pesquisa das características polimórficas múltiplasdentro de um conjunto de sonda, e assume que não existe recombinaçãoocorrida entre eles. Estes SFPs foram comparados com o conjunto de son-da, e o genótipo mais freqüente foi selecionado como representativo do con-junto de sonda. Para aqueles conjuntos de sonda com igual número de ge-nótipos diferentes no nível de característica, eles são ignorados como dadosperdidos a partir do cálculo.
EXEMPLO 11
Mapeamento genético usando-se o programa MapMarker modificado
Três conjuntos de dados de genótipos diferentes foram usadosna análise de mapeamento: a) marcadores de RFLP públicos e SSR; b)Marcadores de SSR Syngenta; e c) marcadores de nível de conjunto desonda conforme descrito acima. O MapMarker original (Lander et al. 1987)foram modificados para um programa mapmarker500 de linha de comandoUNIX para acomodar um grande número de marcadores de SFP (Yiping Fa-ne t al, Syngenta, não publicado). As computações foram efetuadas usandoMapMarker500. Os 1127 marcadores públicos foram usados como as ânco-ras para gerar uma estrutura. Os marcadores a partir de outros conjuntos dedados foram então designados para os cromossomos apropriados baseadosnas melhores classificações de LOD para as âncoras na estrutura. As locali-zações do marcador foram então determinadas usando-se comando "build".Para minimizar o impacto do efeito aleatório, cinco cursos independentesforam efetuados e a ordem comum foi selecionada como a ordem genética.
Para aqueles marcadores que podem ser mapeados nas localizações múlti-plas para um dado corte de diferença de LOD, o corte de LOD mais severofoi usado até que ele foi mapeado em uma localização simples. Nos marca-dores de conjunto de sonda, os dados são divididos em subgrupos diferen-tes baseados na severidade usada nas identificações de SFP e se um dadomarcador vem dos SFPs múltiplos. Os marcadores no grupo com as condi-ções mais severas foram envolvidos na primeira computação de mapeamen-to. Os marcadores mapeados, bem como as âncoras formaram, em seguida,nova estrutura de âncora, e os marcadores no grupo com as segundas con-dições mais severas foram envolvidos na computação. O processo foi repe-tido até todos os marcadores de grupo computados.
EXEMPLO 12
Comparação de mapa de gene de SFP e mapa genético prévio
De modo a avaliar a qualidade do mapa que nós geramos, omapa de gene de SFP e mapa IBM2 (www.maizeqdb.org) foram compara-dos. Este mapa combina o mapa de associação genética, bem como o mapafísico; conseqüentemente, os marcadores no mapa podem vir de fonte dife-rente. Para fazer esta comparação, as seqüências marcadoras no mapa pú-blico foram programadas contra seqüências de conjunto de sonda de milho,e ligações entre ides de marcador público e ides de conjunto de sonda foramgeradas. Os marcadores sobrepostos em ambos os mapas foram então i-dentificados, e as localizações foram comparadas.
EXEMPLO 13
Expansão de mapa de milho usando Algoritmo de Equiparação Padrão(PMA)
Para cada marcador genético mapeado, os genótipos que cru-zam todas as linhas de mapeamento foram recuperados e os arquivos decélula de hibridização correspondentes foram separados em dois volumes,baseados em seus genótipos. Este marcador mapeado foi usado como "is-ca". Os testes-t foram aplicados entre aqueles dois volumes nos níveis decaracterística após as intensidades serem normalizadas e transformadas porlog. As células significantes foram então filtradas com os critérios de mudan-ça de vezes conforme discutido acima. Os dados de saída foram analisadosconforme segue. Primeiro, os valores ρ foram transformados para a "classifi-cação" usando Iog negativo com base 10 para a conveniência computacio-nal. Então, para cada chamada significante, se ela não estava no mapa atu-al, sua intensidade e as classificações em todas as iscas foram coletadas. Aisca com a classificação mais alta foi então identificada e selecionada. Emseguida, impele-se as chamadas significantes a obterem dados de genótipoconforme descrito acima, e apagam-se as chamadas se os genótipos tive-rem mais do que um número de diferenças comparado aos genótipos naisca de classificação mais alta. Finalmente, para aqueles conjuntos de sondacom chamadas significantes múltiplas, o processo de condensação foi usa-do: a melhor localização para este conjunto de sonda deve ser a região comas iscas que a maioria das características significantes apontam.
EXEMPLO 14
Confirmação de Pstl RFLP
As seqüências com informação de SNP entre B73 e MoM 7 foramextraídas a partir da seqüência de milho e conjunto de dados de SNP. Todosos SNPs e seqüências de flanqueamento foram pesquisados para seqüênciade reconhecimento de Pstl de enzima de restrição CTGCAG. As seqüênciascom polimorfismos Pstl foram então programadas contra seqüências genô-micas de milho para encontrar seqüências maiores que cobrem os locais dePstl polimórficos. Aquela seqüências genômicas mais longas foram progra-madas contra conjunto de sonda de milho e seqüências de característicaindividual. Para aqueles conjuntos de sonda que foram localizados ao redordos locais de Pstl polimórficos, seus comportamentos característicos indivi-duais, incluindo as intensidades, mudanças de vezes, e valores ρ nos testes-t foram extraídos a partir de todo o conjunto de dados de comportamentoscaracterísticos. As seqüências e comportamentos característicos correspon-dentes foram então comparados e analisados para concluir se o Pstl RFLPpode ser confirmado.Referências
Lander ES1 Green P1 Abrahamson J, Barlow A, Daly MJ, Lincoln SE, New-burg L. (1987). MAPMARKER: an interactive computer package for construc-ting primary genetic Iinkage maps of experimental and natural populations.Genomics.1:174-181.
Lee M, Sharopova N, Beavis WD1 Grant D, Katt M, Blair D, Hallauer A.(2002). Expanding the genetic map of maize with the intermated B73 χ Mo17(IBM) population. Plant Mol Biol. 48:453-461

Claims (17)

1. Método para o peneiramento de material de ácido nucléicogenômico para polimorfismos de hibridização específicos de gene, o métodocompreendendo: a) peneiramento global para polimorfismos de hibridizaçãousando micro-arranjo; b) redução de complexidade de genoma mediada porenzima; c) amplificação de sinal diferencial mediado por enzima e reduçãode ruído; d) extração de dados e identificação de GSHP; e e) uso de GSHPsem peneiramento de alto rendimento.
2. Método para o peneiramento de material de ácido nucléicogenômico para polimorfismos de hibridização específicos de gene, o métodocompreendendo:a. seleção de sondas de nucleotídeos e designação de um mi-cro-arranjo compreendendo referidas sondas para a detecção de variaçãode seqüência;b. tradução das variações de seqüência em variações de alvosde hibridização;c. etiquetação e hibridização dos alvos;e. detecção de um sinal de hibridização; ef. quantificação do sinal de hibridização e detecção de polimor-fismos.
3. Método para detecção de polimorfismos de hibridização espe-cíficos de gene em seqüências de polinucleotídeos de DNA genômico, o mé-todo compreendendo:a. seleção de seqüências curtas de oligonucleotídeo comple-mentares às seqüências de polinucleotídeo genômico, referidas seqüênciascurtas de oligonucleotídeo a serem sintetizadas diretamente em ou sintetiza-das e colocadas em uma superfície de micro-arranjo;b. preparação de DNA genômico a partir de duas fontes genéti-cas, e sujeição de referido DNA genômico à restrição específica de local u-sando uma ou mais enzimas de restrição para produzir polimorfismos decomprimento de fragmento de restrição (RFLPs);c. amplificação seletivamente de RFLPs de uma faixa de tama-nho selecionada para criar alvos de polimorfismo amplificados;d. fragmentação dos alvos amplificados aleatoriamente emfragmentos de cerca de 50 a cerca de 200 bases e etiquetação de extremi-dade dos fragmentos não-seletivamente;e. hibridização dos fragmentos etiquetados de extremidade paraas seqüências curtas de oligonucleotídeo na superfície de micro-arranjo; ef. quantificação dos sinais a partir da hibridização, e detecção depolimorfismos.
4. Método, de acordo com a reivindicação 3, no qual os oligonu-cleotídeos curtos selecionados na etapa a. são de cerca de 25 mers a cercade 30 mers.
5. Método, de acordo com a reivindicação 3, no qual os fragmen-tos dos alvos amplificados da etapa d. são etiquetados na extremidade u-sando nucleotídeos alvejados fluorescentes e uma transferase terminal.
6. Método, de acordo com a reivindicação 3, no qual os sinais dehibridização da etapa f. são capturados por um dispositivo selecionado apartir do grupo consistindo de um escaneador de laser e um CCD.
7. Método, de acordo com a reivindicação 6, no qual os sinais dehibridização capturados são quantificados usando um algoritmo computacional.
8. Método, de acordo com a reivindicação 3, compreendendoadicionalmente: g. comparar sinais de fundos ou variedades genéticas dife-rentes com diferenças de sinal, e determinar as origens dos sinais diferenci-ais.
9. Método, de acordo com a reivindicação 8, compreendendoadicionalmente: h. identificar os polimorfismos de nucleotídeo simples quecausam os sinais diferenciais da etapa g.
10. Polimorfismos de nucleotídeo simples identificados no méto-do de acordo com a reivindicação 9.
11. Mapa genético desenvolvido usando a informação gerada nométodo de acordo com a reivindicação 3.
12. Mapa genético desenvolvido usando a informação gerada nométodo de acordo com a reivindicação 8.
13. Marcadores moleculares desenvolvidos usando a informaçãogerada no método de acordo com a reivindicação 3.
14. Marcadores moleculares desenvolvidos usando a informaçãogerada no método de acordo com a reivindicação 8.
15. Local de traço quantitativo identificado usando a informaçãogerada no método de acordo com a reivindicação 3.
16. Local de traço quantitativo, de acordo com a reivindicação-15, caracterizado adicionalmente pelo uso dos marcadores moleculares deacordo com a reivindicação 13.
17. Local de traço quantitativo, de acordo com a reivindicação-15, caracterizado adicionalmente pelo uso dos marcadores moleculares deacordo com a reivindicação 14.
BRPI0614050-5A 2005-06-30 2006-06-22 métodos para peneiramento de polimorfismos de hibridização especìficos de gene (gshps) e seus usos no mapeamento genético e desenvolvimento de marcador BRPI0614050A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US69578105P 2005-06-30 2005-06-30
US60/695,781 2005-06-30
PCT/US2006/024232 WO2007005305A1 (en) 2005-06-30 2006-06-22 METHODS FOR SCREENING FOR GENE SPECIFIC HYBRIDIZATION POLYMORPHISMS (GSHPs) AND THEIR USE IN GENETIC MAPPING AND MARKER DEVELOPMENT

Publications (1)

Publication Number Publication Date
BRPI0614050A2 true BRPI0614050A2 (pt) 2011-03-09

Family

ID=37604789

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0614050-5A BRPI0614050A2 (pt) 2005-06-30 2006-06-22 métodos para peneiramento de polimorfismos de hibridização especìficos de gene (gshps) e seus usos no mapeamento genético e desenvolvimento de marcador

Country Status (7)

Country Link
US (1) US20070048768A1 (pt)
EP (1) EP1907577A4 (pt)
CN (1) CN101213312A (pt)
AU (1) AU2006266251A1 (pt)
BR (1) BRPI0614050A2 (pt)
CA (1) CA2611788A1 (pt)
WO (1) WO2007005305A1 (pt)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2687760C (en) * 2007-05-23 2017-10-31 Syngenta Participations Ag Sugar beet polynucleotide markers
EP2016821A1 (en) 2007-06-13 2009-01-21 Syngeta Participations AG New hybrid system for Brassica napus
WO2016000267A1 (zh) * 2014-07-04 2016-01-07 深圳华大基因股份有限公司 确定探针序列的方法和基因组结构变异的检测方法
CN108009401B (zh) * 2017-11-29 2021-11-02 内蒙古大学 一种筛选指纹图谱遗传标记的方法
CN109762922A (zh) * 2019-01-30 2019-05-17 山东省农作物种质资源中心 用于菜豆种质资源鉴定的snp标记及其筛选方法
CN110093406A (zh) * 2019-05-27 2019-08-06 新疆农业大学 一种盘羊及其杂交后代遗传基因研究方法

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0317239A3 (en) * 1987-11-13 1990-01-17 Native Plants Incorporated Method and device for improved restriction fragment length polymorphism analysis
US6013431A (en) * 1990-02-16 2000-01-11 Molecular Tool, Inc. Method for determining specific nucleotide variations by primer extension in the presence of mixture of labeled nucleotides and terminators
US20020048749A1 (en) * 1998-04-15 2002-04-25 Robert J. Lipshutz Methods for polymorphism identifcation and profiling
US5786146A (en) * 1996-06-03 1998-07-28 The Johns Hopkins University School Of Medicine Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids
US6110668A (en) * 1996-10-07 2000-08-29 Max-Planck-Gesellschaft Zur Forderung Der Wissenschaften E.V. Gene synthesis method
US6800436B1 (en) * 1997-11-27 2004-10-05 Chugai Seiyaku Kabushiki Kaisha Diagnostic method, diagnostic reagent and therapeutic preparation for diseases caused by variation in LKB1 gene
JP2002528096A (ja) * 1998-10-27 2002-09-03 アフィメトリックス インコーポレイテッド ゲノムdnaの複雑性制御および分析
NZ521626A (en) * 2000-03-29 2005-09-30 Cambia Methods for genotyping by hybridization analysis
US6844154B2 (en) * 2000-04-04 2005-01-18 Polygenyx, Inc. High throughput methods for haplotyping
US20040038206A1 (en) * 2001-03-14 2004-02-26 Jia Zhang Method for high throughput assay of genetic analysis
DE10119468A1 (de) * 2001-04-12 2002-10-24 Epigenomics Ag Mikroarray-Verfahren zur Anreicherung von DNA-Fragmenten aus komplexen Mischungen
WO2002086163A1 (en) * 2001-04-20 2002-10-31 Karolinska Innovations Ab Methods for high throughput genome analysis using restriction site tagged microarrays
US20020192650A1 (en) * 2001-05-30 2002-12-19 Amorese Douglas A. Composite arrays
US6872529B2 (en) * 2001-07-25 2005-03-29 Affymetrix, Inc. Complexity management of genomic DNA
WO2003020952A2 (en) * 2001-08-31 2003-03-13 Gen-Probe Incorporated Affinity-shifted probes for quantifying analyte polynucleotides
US20030186280A1 (en) * 2002-03-28 2003-10-02 Affymetrix, Inc. Methods for detecting genomic regions of biological significance
EP1350853A1 (en) * 2002-04-05 2003-10-08 ID-Lelystad, Instituut voor Dierhouderij en Diergezondheid B.V. Detection of polymorphisms
ATE358182T1 (de) * 2002-09-05 2007-04-15 Plant Bioscience Ltd Genomteilung
US20050042654A1 (en) * 2003-06-27 2005-02-24 Affymetrix, Inc. Genotyping methods
US20050100939A1 (en) * 2003-09-18 2005-05-12 Eugeni Namsaraev System and methods for enhancing signal-to-noise ratios of microarray-based measurements

Also Published As

Publication number Publication date
US20070048768A1 (en) 2007-03-01
EP1907577A1 (en) 2008-04-09
CA2611788A1 (en) 2007-01-11
CN101213312A (zh) 2008-07-02
WO2007005305A1 (en) 2007-01-11
EP1907577A4 (en) 2009-05-13
AU2006266251A1 (en) 2007-01-11

Similar Documents

Publication Publication Date Title
US10844399B2 (en) Methods and compositions for Goss&#39; Wilt resistance in corn
Paux et al. Sequence-based marker development in wheat: advances and applications to breeding
Jiang Molecular marker-assisted breeding: a plant breeder’s review
Salgotra et al. From genomics to functional markers in the era of next-generation sequencing
US10337072B2 (en) Copy number detection and methods
US11032986B2 (en) Methods of creating drought tolerant corn plants using markers linked to cold shock domain-containing proteins and compositions thereof
US20200093087A1 (en) Quantitative trait loci (qtl) associated with shatter resistant capsules in sesame and uses thereof
US20220010325A1 (en) Quantitative trait loci (qtl) associated with shattering-resistant capsules in sesame and uses thereof
BR112017026015B1 (pt) Métodos para selecionar uma planta de milho com resistência à podridão de colmo causada por antracnose e método para introgredir um alelo qtl associado com a resistência à podridão de colmo causada por antracnose em uma planta de milho
BRPI0614050A2 (pt) métodos para peneiramento de polimorfismos de hibridização especìficos de gene (gshps) e seus usos no mapeamento genético e desenvolvimento de marcador
US20170022574A1 (en) Molecular markers associated with haploid induction in zea mays
US20070192909A1 (en) Methods for screening for gene specific hybridization polymorphisms (GSHPs) and their use in genetic mapping ane marker development
US10716271B2 (en) Soy gene cluster regions and methods of use
BR112021012597A2 (pt) Métodos e composições para selecionar e/ou prever plantas de algodão resistentes à resistência ao fusarium race-4 em algodão
US10517242B1 (en) Disease resistance alleles in soybean
Boopathi et al. QTL analysis
US10172305B2 (en) Diagnostic molecular markers for seed lot purity traits in soybeans
JP4437895B2 (ja) 小穂非脱落性遺伝子等についての新規遺伝マーカーおよびその利用法
WO2013033234A1 (en) Molecular markers associated with aphid resistance in soybean
Şahin et al. Concepts and applications of bioinformatics for sustainable agriculture
BR102020009417A2 (pt) Métodos de identificação, distinção e seleção de plantas do gênero glycine resistentes ou suscetíveis à mancha alvo, de introgressão em plantas do gênero glycine de alelos de resistência à mancha alvo, para genotipar plantas alvo de glycine resistentes àmancha-alvo, molécula de ácido nucleico e seu uso, kit de detecção, e, planta de glycine resistente à manchaalvo
WO2014169004A2 (en) Methods for producing soybean plants with improved fungi resistance and compositions thereof
Byrne et al. Marker-assisted selection
Stewart RK Salgotra, BB Gupta &
Cieślak et al. Anna Hawliczek1, Leszek Bolibok2, Katarzyna Tofil1, Ewa Borzęcka1, Joanna Jankowicz

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE A 6A ANUIDADE.

B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]

Free format text: NAO APRESENTADA A GUIA DE CUMPRIMENTO DE EXIGENCIA. REFERENTE A 6A ANUIDADE.