PT868535E - Metodos e composicoes para a determinacao de sequencias de moleculas de acido nucleico - Google Patents

Metodos e composicoes para a determinacao de sequencias de moleculas de acido nucleico Download PDF

Info

Publication number
PT868535E
PT868535E PT97905634T PT97905634T PT868535E PT 868535 E PT868535 E PT 868535E PT 97905634 T PT97905634 T PT 97905634T PT 97905634 T PT97905634 T PT 97905634T PT 868535 E PT868535 E PT 868535E
Authority
PT
Portugal
Prior art keywords
acid
substituted
group
compound
alkyl
Prior art date
Application number
PT97905634T
Other languages
English (en)
Inventor
Jeffrey Van Ness
John C Tabone
James J Howbert
John T Mulligan
Original Assignee
Qiagen Genomics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=26681206&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=PT868535(E) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Qiagen Genomics Inc filed Critical Qiagen Genomics Inc
Publication of PT868535E publication Critical patent/PT868535E/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6872Methods for sequencing involving mass spectrometry
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07BGENERAL METHODS OF ORGANIC CHEMISTRY; APPARATUS THEREFOR
    • C07B2200/00Indexing scheme relating to specific properties of organic compounds
    • C07B2200/11Compounds covalently bound to a solid support
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Description

DESCRIÇÃO EPÍGRAFE:"" ‘MÉTODOS E CÕMPÕSICÕES PÃRA Ã DETÉRMÍNÃCÃO Ί DE SEOUÊNCIAS DE MOLÉCULAS DE ÁCIDO NUCLEICO”
CAMPO TÉCNICO A presente invenção relaciona-se em geral com métodos e composições para a determinação de sequências de moléculas de ácido nucleico, e mais especificamente, com métodos e composições que permitem a determinação simultânea de múltiplas sequências de ácido nucleico.
ANTECEDENTES DA INVENÇÃO A sequenciação de ácido desoxiribonucleico (DNA) é uma das técnicas básicas da biologia. Está no coração da biologia molecular e tem um papel de expansão rápida no lesto da biologia. O Projecto do Genoma Humano representa um esforço multinacional para ler todo o código genético humano. E o maior projecto alguma vez desenvolvido em biologia, e já começou a ter um grande impacto em medicina. O desenvolvimento de uma tecnologia de sequenciação mais barata e rápida assegurará o sucesso deste projecto. De facto, um investimento substancial tem sido financiado pelos ramos NIH e DOE do Projecto do Genoma Humano para melhorar a tecnologia de sequenciação, contudo, sem ter tido um impacto substancial nas praticas correntes (Sulston and Waterston, Nature 376:175, 1995).
Nas duas últimas décadas , a determinação e análise da sequência de ácido nucleico tem formado uma das pedras base da investigação em biologia, isto, aliado a novos utensílios c metodologias de investigação, permitiu aos cientistas estudar os genes e os produtos génicos de forma a melhor compreender a função destes genes, assim como desenvolver novas terapias e diagnósticos.
Duas metodologias diferentes de sequenciação do DNA, que foram desenvolvidas em 1977, são ainda hoje largamente utilizadas. Resumidamente, o método enzimático descrito por Sanger ( Proc. Natl. Acad Sei. (USA) 74:5463. 1977) que utiliza icmiinadorcs-didcsoxi, envolve a síntese de uma cadeia de DNA a partir de um modelo de cadeia única por uma DNA polimerase. 0 método de Sanger de sequenciação depende do facto de os didesoxinucleótidos (ddNTPs) estarem incorporados na cadeia em crescimento da mesma maneira que os desoxinucleótidos normais (se bem que com uma menor eficiência). No entanto, os ddNTPs diferem dos desoxinuc.leófirins normais (dNTPs) pois não têm 0 grupo .V- OH necessário para o elongamento da cadeia. Quando um ddNTP é incorporado na cadeia de DNA, a ausência do grupo ~Y - hidroxilo evita a formação de uma nova ligação fosfodiéster e o fragmento de DNA termina com o ddNTP complementar à base no DNA modelo. O método Maxam e Gilbert (Maxam e Gilbert, Proc. Natl. Acad. Sei. (USA) 74:560, 1977) emprega um método de degradação química do DNA original (em ambos os casos o DNA tem de ser clonal). Ambos os métodos produzem populações de fragmentos que começam de um ponto específico e terminam em cada base que é encontrada no fragmento de DNA a sequenciar. A terminação de cada fragmento depende da localização de uma base particular dentro do fragmento original de DNA. Os fragmentos de DNA são separados por electroforcse em gel de poliacrilamida e a ordem das bases de DNA (adenina, citosina, timina, guanina: também conhecidas como A, C, T, G, respectivamentc) é lida de uma auto-radiografia do gel.
Uma estratégia fastidiosa de sequenciação de DNA agrupado (pooling) (Church e Kieffcr-Higgins, Science 24:185, 1988) é uma das mais recentes formas de sequenciação de DNA. Um estratégia de sequenciação (pooling) de agrupamento consiste em fazer um conjunto dc um número de DNA modelos (amostras) e processar as amostras como conjuntos. De forma a separar a informação sequencial no final do processamento, as moléculas de DNA de interesse são ligadas a um conjunto de oligonucleótidos ‘"marcadores” no inicio. As moléculas de DNA marcadas são agrupadas, amplificadas e fragmentadas quimicamente em placas com 96 poços. Depois da electroforese das amostras agrupada, o DNA é transferido pura um suporte sólido e hibridizado com uma série sequencial de oligonucleótidos cspecificamenle mareados. Estas membranas são então pesquisadas tantas vezes quantas os marcadores no conjunto original, produzindo, em cada conjunto de pesquisa, auto-radiografias semelhantes às de métodos padrão de sequenciação de DNA. Assim, cada reacção e gel dá uma quantidade de dados equivalente à obtida em rcacções convencionais e géis multiplicados pelo numero de sondas usadas. Se a fosfatase alcalina for usada como enzima repórter, o substrato 1,2-dioxetano pode ser usado o qual é detectado num ensaio de 2 quimiluminescência. No entanto, a maior desvantagem desta estratégia de conjunto é que as sequências só podem ser lidas por Southern blotting do gel de sequenciação e hibridizando a membrana uma vez para cada clone do conjunto.
Juntamente com avanços nas metodologias de sequenciação. ocorreram avanços na sua rapidez devido ao aparecimento de sequenciação de DNA automatizada. Resumidamente, estes métodos usam iniciadores marcados por fluorescência que substituem métodos que empregam componentes marcados radioactivamente. Corantes fluorescentes são ligados quer aos iniciadores sequenciais quer aos lerminadores ddNTP. Componentes robóticos utilizam actualmente tecnologia da polimerase de reacção em cadeia (PCR) que originou o desenvolvimento de estratégias de amplificação linear. Sequênciações comerciais actuais permitem que todas as reacções dos terminadores 4-didesoxi sejam realizados numa única faixa. Cada reacção de terminador-didesoxi é representada por um único iniciador fluorescente (um fluoróforo para cada tipo de base : A,T,C,G). Só um DNA modelo (/. <?. amostra de DNA) é representado por faixa. Os géis actuais permitem a electroforese simultânea de 64 amostras em 64 faixas diferentes. Os fragmentos de terminação ddNTP diferentes são detectados pela irradiação da faixa do gel com luz seguido da delecção da luz emitida pelo fluorófero. Cada passo de electroforese demora cerca de 4 - 6 horas. Cada separação por electroforese resolve cerca de 400-600 nucleótidos (nt) e portanto cerca de 6000 nt podem ser scquenciados por hora por sequenciador. O uso de cspectrometria de massa para o estudo de constituintes monoméricos de ácidos nucleicos encontra-se também descrito (Hignite, In Biochemical Applications of Mass Spectromclry, Waller e Dermer (eds.), Wiley-lnterscience, Capítulo 16, p. 527, 1972). Resumidamente, para oligómeros maiores, um sucesso significativo foi obtido por desorção do plasma para oligonucleótidos sintéticos protegidos com um comprimento até 14 bases c para oligos não protegidos até 4 bases de comprimento. Como para proteínas, a aplicabilidade de ESí-MS a oligonucleótidos tem sido demonstrada (Covey et a!.. Rapicl Comm. in Mass Spcc. 2:249-256, 1988). Estas espécies são ionizadas em solução, com as cargas localizadas nas ponlcs fósiodiéster acídicas e /ou nos grupos fosfato terminais, e originam na fase gasosa múltiplos aniões moleculares carregados, juntamente com aductos de sódio. A sequenciação de DNA com um numero de bases <- 100 pela técnica ddNTP cnzimática comum é mais complicada do que para DNA modelo maiores e por isso é muitas vezes empregada a degradação química. Contudo, o método de decomposição química requer cerca de 50 pmol de material radioactivo marcado na extremidade com '2P. 6 passos químicos, separação por electroforese e exposição a um filme. Para oligonucleótidos pequenos (< 14 nls) a combinação de ionização por electropulverização (ESl-Electro Spray lonization) c espectrometria de massa (MS.Mass Spectrometry) de transformada de Fourier (IT) é muito mais rápida e sensível. Os produtos de dissociação de iões multiplamcnte carregados medidos com potências de elevada resolução (105) representam consecutivas cortes da estrutura fornecendo toda a sequência em menos de um minuto em quantidades de amostra inferiores ao picomolc (Little et al., ,/. Am. Chem. Soc. 116:4893, 1994). Para medidas de pesos moleculares, ESI/MS tem sido estendidas a fragmentos maiores (Potier et al.. Nm. Acids Res. 22:3895, 1994). ESI/FTMS parece ser um valioso complemento aos métodos clássicos de sequenciação e mutações “pinpoint” em nucleótidos tão grandes como 100-mers. Dados espectrais têm recentemente sido obtidos carregando 3xl()'lj mole de um 50-mer usando uma fonte ESI mais sensível (Valaskovic, Anal. Chem. 68:259, 1995). A outra forma de sequenciação de DNA por espectrometria de massa é aquela no qual o DNA é marcado com isótopos individuais de um elemento c a análise do espectro de massa apenas tem que distinguir os isótopos depois de misturas de tamanhos de DNA terem sido separadas por electroforese. (A outra forma descrita acima utiliza o poder de resolução do especlrómetro de massa para separar e detectar os oligonucleótidos de DNA de diferentes comprimentos, no melhor uma difícil proposta). Todos os procedimentos descritos abaixo empregam o procedimento de Sanger para converter um iniciador de sequenciação numa série de fragmentos de DNA cuja diferença no comprimento é de um nucleótido. As moléculas de DNA sintetizadas cnzimaticamente contêm cada uma o iniciador original, uma sequência replicada de parte do DNA de interesse e o terminador didesoxi. Isto é. um conjunto de moléculas de DNA c produzido que contêm o iniciador e diferem em comprimento umas das outras por um resíduo de nucleótido.
Brennen et al. (Biol. Mass Spec.. New York, Elsevier, p. 219, 1990) descreveu métodos para utilizar os 4 isótopos estáveis de enxofre como marcardores de DNA que permitem detectar fragmentos de DNA que tenham sido separados por electroforese capilar. Usando os análogos α-tio dos ddNTPs, um único isótopo de enxofre é incorporado em cada um dos fragmentos de DNA. Assim, cada um dos 4 tipos de fragmentos dc DNA (terminados com ddTTP, ddATP, ddGTP, ddCTP) pode ser unicamente marcado de acordo com o nucleólido terminal; por exemplo, l2S para fragmentos que terminam com A, ,JS para G, ,4S 4
C_. . para C. e K’S para Ί’. e misturados para uma coluna de electroforese, fracções de picolitros são obtidas por uma cabeça de impressora de jacto de tinta modificada, e posteriormente sujeitas a combustão completa numa fornalha. Este processo oxida os tiofosfatos do DNA marcado a SCb, o qual é sujeito a análises num espectrómetro de massa de sector magnético ou de quadrupolo. A representação da unidade de massa do SO2 é 64 para fragmentos que terminam com A, 65 para U e 68 para T. A manutenção da resolução dos fragmentos de DNA à medida que saem da coluna depende da toma de amostras suficientemente pequenas. Uma vez que 0 espectrómetro de massa está acoplado directamente à coluna capilar· de gel, a velocidade de análise é determinada pela velocidade da electroforese. Infelizmente este processo é dispendioso, liberta gás radioactivo c não foi comercializado. Duas outras restrições básicas também se dão nesta abordagem: (a) nenhuns outros componentes com massas de 64, 65, 66 ou 68 (contaminante isobárico) podem ser tolerados e (b) a % de abundância natural dos isótopos de enxofre (32S é 95.0,33S é 0.75, ’4S é 4.2 e ’6S é 0.11) determina a sensibilidade e o custo. Uma vez que o 32S tem uma abundância natural de 95%, os outros isótopos têm que ser enriquecidos a > 99% para eliminar 0 32S contaminante. Os isótopos com uma abundância < I % tem custos muito elevados para se obterem com um enriquecimento de 99%; mesmo quando 0 ’6S é purificado 100 vezes contem tanto ou mais j4S quanto o 3Í’S.
Gilbert descreveu um sequenciador de DNA automatizado que consiste num sintetizador de oligómeros, uma formação numa membrana, um detector que detecta hibridação e um computador central. O sintetizador sintetiza e marca múltiplos oligómeros com sequências previstas arbitrárias. Os oligómeros são usados para sondar DNA imobilizado nas membranas. O detector identifica padrões de hibridação c envia então estes padrões para um computador central que constrói uma sequência e a seguir prevê a sequência do próxima corrida de síntese dos oligómeros. Através de um processo iterativo, uma sequência de DNA pode ser obtida de uma forma automatizada.
Brennen descreveu um método para sequenciação de ácidos nucleicos baseado 11a ligação de oligómeros (Patente U. S. No. 5,403,708). Os métodos e composições para formação dc produtos de ligação hibridados a um ácido nucleico modelo são descritos. Um iniciador é hibridado a um DNA modelo e um conjunto de oligonucleótidos de extensão aleatória é também liibiidada ao modelo iniciador na presença de ligase(s). O enzima ligasc liga covalentemente os oligómeros hibridados ao iniciador. Modificações permitem a determinação da sequência dc nuclcótidos dc um ou mais membros de um primeiro conjunto 5 de resíduos de nucleótidos alvo no ácido nucleico modelo que estão espaçados a intervalos de N nucleótidos. Neste método, o produto ligado marcado é formado onde a posição e tipo de marcador incorporado no produto de ligação fornece informação relativamente ao resíduo de nucleótido no ácido nucleico modelo com o qual o resíduo de nucleótido marcado está emparelhado em termos de bases.
Koster descreveu um método para sequenciação de DNA por espectrometria de massa depois de degradação do DNA por uma exonuclease W0‘A·9 421 822 o método descrito é simples na medida em que a sequencia de DNA é directamente determinada ( a reacção Sanger não c usada). O DNA é clonado em vectores padrão, a extremidade 5' é imobilizada e as cadeias são sequcncialmente degradadas na extremidade 3' por acção de uma exonuclease e os produtos enzimáticos (nucleótidos) são detectados por espectrometria de massa.
Weiss et al. descreveu um dispositivo de hibridação/imagem automatizado para sequenciação de DNA de mistura (multiplex) fluorescente W0'A'9 511 %l. O método é baseado no conceito de hibridizar sondas ligadas a enzimas hibridados a uma membrana contendo fragmentos de DNA separados por tamanho resultantes de uma reacção de Sanger típica. A Patente WO-A-9 504 160 revela um reagente marcador contendo um grupo analito que tem dois resíduos analito ligados a uma entidade marcador contendo um grupo repórter. IJma biblioteca destes reagente é usada para sequencial- ácidos nucleicos.
Jacobson cl al. (G.A.T.A., Vol. 8, p.223-29, 1991) revela um reagente marcador contendo um marcador inorgânico. A Patente WO-A-9 528 640 revela um reagente marcador e um sistema de análise onde grupos de nucleótidos relevantes e os correspondentes grupos repórter são adicionados a cada um dos lados de um único ligante. A necessidade de informação de sequenciação é maior do que a que pode ser fornecida pelas máquinas de sequenciação actualmente existentes, tais como a ABI377 e a Pharmacia ALF. Uma das principais limitações da tecnologia actual c o pequeno número dc marcadores que podem ser resolvidos usando o actual sistema de marcação. O sistema Church 6 dc agrupamento (pooling) discutido acima usa mais marcadores mas o uso e detecção destes marcadores é trabalhoso. A presente invenção descobre novas composições e métodos que podem ser utilizados para sequenciar moléculas de ácidos nucleicos com grande aumento de rapidez e sensibilidade em relação aos métodos descritos acima, e fornece ainda outras vantagens relacionadas.
SUMÁRIO DA INVENÇÃO
Mencionando resumidamente, a presente invenção fornece métodos, compostos, composições, kits e sistemas para determinar a sequencia de moléculas de ácidos nucleicos. Num aspecto da invenção é fornecido um método para determinar a sequencia de uma molécula dc ácido nucleico compreendendo: (a) originando fragmentos de ácidos nucleicos marcados que são complementares a uma molécula de ácido nucleico alvo, seleccionada onde o marcador é um grupo orgânico que é correlacionado com um nucleótido particular e detectável por espectrometria ou potenciometria; (b) separando os fragmentos marcados por comprimentos sequenciais; (c) cortando os marcadores dos fragmentos marcados; e (d) detectando os marcadores por espectrometria ou potenciometria e assim determinando a sequencia da molécula de ácido nucleico. Em organizações preferidas, os marcadores são detectados por espectrometria de massa, espectrometria de infravermelho, espectrometria de ultravioleta ou amperometria potenciostática.
Noutro aspecto, a invenção fornece um composto com a fórmula: r™-l - x onde,
Tmv é um grupo orgânico detectável por espectrometria de massa, compreendendo carbono, pelo menos um átomo de hidrogénio e fluoreto. e átomos opcionais seleccionados do oxigénio, azoto, enxofr e, fósforo e iodo, L é um grupo orgânico que permite que um único grupo contendo Tms seja cui lado do resto do composto, onde o grupo contendo Tms compreende um grupo funcional 7
que suporta um único estado de carga ionizado quando o composto é sujeito a espectrometria de massa e é uma atnina terciária, amina quaternária ou ácido orgânico; e X é um fragmento de ácido nucleico; com a garantia que o composto não esteja ligado a um suporte sólido através de X nem tenha uma massa inferior a 250 daltons. É revelada uma composição compreendendo uma pluralidade de compostos da fórmula T",s - L - MOI, em que, Tms é um grupo orgânico detectável por espectrometria de massa, compreendendo carbono, pelo menos um átomo de hidrogénio e fluoreto, e átomos opcionais seleccionados do oxigénio, azoto, enxofre, fósforo e iodo; L é um grupo orgânico que permite que um grupo contendo T"’5, seja cortado do resto do composto, onde o grupo contendo T",s compreende um grupo funcional que suporta um único estado de carga ionizado quando o composto é sujeito a espectrometria de massa e é seleccionado de uma amina terciária, amina quaternária e ácido orgânico; MOI é um fragmento de ácido nucleico onde L c conjugado ao MOI noutro local que não a extremidade 3'do MOI; e onde não haja dois compostos com o mesmo Tn,iou o mesmo MOI. É revelada uma composição compreendendo água e um composto da formula T"’s-I,-M01, em que, T"1S é um grupo orgânico detectável por espectrometria de massa, compreendendo carbono, pelo menos um átomo de hidrogénio e fluoreto, e átomos opcionais seleccionados do oxigénio, azoto, enxofre, fósforo e iodo; L é um grupo orgânico que permite que um grupo contendo Tms seja cortado do resto do composto, em que o grupo contendo Tms compreende um grupo funcional que suporta um único estado de carga ionizado quando o composto é sujeito a espectrometria de massa e é seleccionado de uma amina terciária, amina quaternária e ácido orgânico; e MOI é um fragmento de ácido nucleico onde L é conjugado ao MOI noutro local que não a extremidade 3'do MOI. lí revelada uma composição compreendendo uma pluralidade dc conjuntos de compostos, cada conjunto de compostos tendo a fórmula Tini-L-MOI, em que. T,ns c um grupo orgânico detectável por espectrometria de massa, compreendendo carbono, pelo menos um átomo de hidrogénio e fluoreto, e átomos opcionais seleccionados do oxigénio, azoto, enxofre, fósforo e iodo; L é um grupo orgânico que permite que um grupo contendo Tms seja cortado do resto do composto, em que o grupo contendo Tn,s compreende um grupo funcional que suporta um único estado dc carga ionizado quando o composto é sujeito a espectrometria 8 de massa e é seleccionado de uma amina terciária, amina quaternária e ácido orgânico; MOI é um fragmento de ácido nucleico onde L é conjugado ao MOI num local que não a extremidade 3 do MOI; onde dentro de um conjunto, todos os membros têm o mesmo grupo T"s e os fragmentos MOI têm comprimentos variáveis que terminam com o mesmo didesoxinucleótido seleccionado de ddAMP, ddGMP, ddCMP e ddTMP e onde entre os conjuntos, os grupos T"'s difiram de pelo menos 2 amu. É revelada uma composição compreendendo uma primeira pluralidade de conjuntos de compostos como descritos no parágrafo precedente, em combinação com urna segunda pluralidade de conjuntos de compostos tendo a fórmula T"’s-L-MOI, onde, Tms é um grupo orgânico detectável por espectrometria de massa, compreendendo carbono, pelo menos um átomo de hidrogénio e fluoreto, e átomos opcionais seleccionados do oxigénio, azoto, enxofre, fósforo e iodo; L é um grupo orgânico que permite que um grupo contendo Tms seja cortado do resto do composto, em que o grupo contendo T"1S compreende um grupo funcional que suporta um único estado de carga ionizado quando o composto é sujeito a espectrometria de massa e é seleccionado de uma amina terciária, amina quaternária e ácido orgânico; MOI é um fragmento de ácido nucleico onde L é conjugado ao MOI num local que não a extremidade 3'do MOI; e onde todos os membros da segunda pluralidade têm um sequencia MOÍ que termina com o mesmo didesoxinucleótido seleccionado de ddAMP, ddGMP, ddCMP e ddTMP; com a condição que o didesoxinucleótido presente nos compostos da primeira pluralidade não seja o mesmo que o didesoxinucleótido presente nos compostos da segunda pluralidade.
Noutro aspecto, a invenção fornece um kit para análises de sequenciação de f)NA. O kit compreende uma pluralidade de conjuntos de contentores, cada conjunto de contentores compreendendo pelo menos cinco contentores, no qual o primeiro contentor contém um vector. o segundo, terceiro, quarto e quinto contentores contêm compostos da presente invenção tal que o fragmento de ácido nucleico para o segundo, terceiro, quarto c quinto contentores é idêntico e complementar a uma porção do vector dentro do conjunto de contentores, c o grupo T",s dentro dc cada contentor c diferente dos outros grupos Tmí' no kit.
Noutro aspecto, a invenção fornece um sistema para uso no método da presente invenção. O sistema compreende um equipamento de separação que separa fragmentos de ácido nucleico marcado, um equipamento que corta de um fragmento de ácido nucleico 9 marcado um marcador que é correlacionado com um nuclcótido particular e que é detectável por detecção electroquímica, e um equipamento para amperometria potenciostática.
Dentro de outros arranjos da invenção, 4, 5, 10, 15, 20 ,25, 30, 35, 40, 50, 60, 70, 80. 00. 100, 200, 250, 300, 350, 400, 450 ou mais do que 500 moléculas marcadas únicas e diferentes podem ser utilizadas simultaneamente dentro da mesma reacção, onde cada marcador é único para um fragmento de ácido nucleico seleccionado, sonda, ou primeiro ou segundo membro, c pode ser identificado separadamente.
Estes e outros aspectos da presente invenção tornar-se-ão evidentes com a referência à descrição detalhada que se segue e aos desenhos junto. Adicionalmente, são citadas abaixo várias referências que descrevem em maior detalhe alguns procedimentos ou composições (e. g. plasmideos, etc.) e são, assim, incorporadas por referência na sua totalidade
BREVE DESCRICÃQ DOS DESENHOS A Figura 1 mostra o fluxograma para a síntese de pentafluorofenil esteres de marcadores de espectroscopia de massa quimicamente quebráveis, para libertar marcadores com terminal amida carboxílico. A Figura 2 mostra o fluxograma para a síntese dc pentafluorofenil ésteres de marcadores de espectroscopia de massa quimicamente quebráveis, para libertar marcadores com terminal ácido carboxílico.
As Figuras 3-6 e 8 mostram os fluxogramas para a síntese de telralluorofenil esteres dc um conjunto de 36 marcadores de espectroscopia de massa fotoquimicamente quebráveis. A Figura 7 mostra o fluxograma para a síntese de um conjunto de 36 marcadores dc espectroscopia de massa fotoquimicamente quebráveis terminados em amina. Λ Figura 9 mostra a síntese de 36 oligonucleótidos marcados de espectroscopia de massa fotoquimicamente quebráveis feitos dos correspondentes conjuntos de 36 tetrafluorofenil ésteres de marcadores ácidos de espectroscopia de massa fotoquimicamente quebráveis. A Figura 10 mostra a síntese de 36 oligonucleótidos marcados de espectroscopia de massa fotoquimicamente quebráveis feitos dos correspondentes conjuntos de 36 marcadores de espectroscopia de massa fotoquimicamente quebráveis terminados em amina. 10 A Figura 11 ilustra a detecção simultânea de múltiplos marcadores por espectrometria de massa. A Figura 12 mostra o espectrograma de massa da matriz alfa-ciano sozinha. A Figura 13 mostra um fragmento de ácido nucleico marcado modularmente construído.
DRSCRICÃO DETALHADA DA INVENÇÃO
Expondo resumidamente, num aspecto a presente invenção fornece compostos onde uma molécula de interesse, ou seu precursor, é ligada por uma ligação instável (ou ligações instáveis) a um marcador. Assim, compostos da invenção podem ser vistos como tendo a fórmula geral: T - L - X onde T é o componente marcador, L é o componente ligante que é, ou contém, uma ligação instável, e X é ou a molécula do componente de interesse (MOÍ) ou um componente de um grupo funcional (L|,) através do qual o MOI pode ser ligado ao T-L. Os compostos da invenção podem, portanto, ser representados pelas fórmulas gerais mais específicas: T-L - MOI e T-L - Li,
Por razões descritas abaixo em detalhe, conjuntos de compostos T-L-MOI podem ser propositadamente sujeitos a condições que causam o corte da(s) ligação(Ões) instável (eis), libertando assim um grupo marcador do composto restante. O grupo marcador é então caracterizado por uma ou mais técnicas analíticas, e assim fornece informação directa acerca da estrutura do grupo marcador, e (mais importante) informação indirecta acerca da identidade do MOI correspondente.
Como um simples exemplo ilustrativo de um composto representativo da invenção onde L é uma ligação directa, refere-se a seguinte estrutura (i):
Estrutura (i)
Componente marcador Componente molécula de interesse 11 ·(►·. *“i
Na estrutura (i), T é um grupo aromático policíclico contendo azoto ligado a um grupo carbonilo, X é um MOI (e especificamente um fragmento de ácido nucleico que termina num grupo amina), e L é a ligação que forma o grupo amida. A ligação amida é instável relativamente às ligações em T porque, como reconhecido na área, uma ligação amida pode ser quimicamente quebrada (partida) por condições ácidas ou básicas que deixam as ligações no componente marcador inalteradas. Assim, um grupo marcador (i.e. o produto do corte que contem T) pode ser libertado como se mostra abaixo:
Estrutura (i)
Contudo, o ligante L pode ser mais do que apenas uma ligação directa , como se mostra no seguinte exemplo ilustrativo, onde se faz referência a outro composto representativo da invenção tendo a estrutura (ii) mostrada abaixo:
Estrutura (ii)
12
>ν Η
F, bem conhecido que compostos tendo um grupo orto-nitrobenzilamína (ver átomos na caixa na estrutura (ii)) são fotolíticamente instáveis, e assim a exposição destes compostos a radiação actínica de um comprimento de onda especificado causará o corte selectivo da ligação benzilamina (ver ligação representada a linha grossa na estrutura (ii)). Assim, a estruturas (ii) tem os mesmos grupos T e MOI que a estrutura (i), no entanto o grupo ligante contem múltiplos átomos e ligações nas quais existe uma ligação instável particular. Λ fotólise da estrutura (ii) liberta assim um grupo marcador (grupo contendo T) tio restante composto, como se mostra abaixo.
O
X o (Fragmento de ácido nucleico)
Restante do composto A invenção fornece assim compostos que, depois de expostos a condições de corte apropriadas, sofrem uma reacção de corte para libertar um grupo marcador do restante composto. Os compostos da invenção podem ser descritos em lermos do grupo marcador, do MOI (ou seu precursor. Li,) e da(s) ligação(ões) instável(eis) que juntam os dois grupos. Allernativamente, os compostos da invenção podem ser descritos em termos dos componentes tios quais são formados. Assim, os compostos podem ser descritos como o produto da reacção tle um reagente marcador, um reagente ligante e um reagente MOI, como se segue. 13 :: i ·· O reagente marcador consiste numa pega química (Th) e num componente variável (Tvc) de forma que o reagente marcador é considerado ter a estrutura geral:
Tvc - T|,
Para ilustrar esta nomenclatura, pode ser feita referência à estrutura (iii), que mostra um reagente marcador que pode ser usado para preparar o composto da estrutura (ii). O reagente marcador tendo a estrutura (iii) contem um componente variável do marcador e uma pega do marcador, como se mostra abaixo:
Estrutura (iii)
Na estrutura (iii), a pega do marcador(-C (=0)-A) apenas fornece uma maneira para fazer reagir o reagente marcador com o reagente ligante para formar o grupo T-L. O grupo “A” na estrutura (iii) indica que o grupo carboxilo está num estado quimicamente activo. e portanto está pronto para se ligar a outras pegas. “A” pode ser, por exemplo, um grupo hidroxilo ou penlaíluorofenoxi, entre muitas outras possibilidades. A invenção fornece um grande numero de possíveis pegas de marcador que podem ser ligadas a um componente variável do marcador, como discutido acima em detalhe. O componente variável do marcador é assim uma parte de “Τ' na fórmula T-L-X, e será também parte do grupo marcador que se forma a partir da reacção que corta L.
Como também descrito acima em detalhe, o componente variável do marcador é assim chamado porque, na preparação de conjuntos dc compostos de acordo com a invenção, é desejado que os membros de um conjunto tenham componentes variáveis únicos, para que os membros individuais possam ser distinguidos uns dos outros por uma técnica analítica. 14
Como um exemplo, o componente variável do marcador da estrutura (iii) pode ser um membro do seguinte conjunto, onde membros do conjunto possam ser distinguidos por espectros de massa e de UV:
Da mesma maneira, o reagente ligante pode ser descrito em termos das suas pegas químicas (há necessariamente pelo menos 2, cada uma das quais pode ser designada por L|,) que flanqueia um componente ligante instável, onde o componente ligante instável consiste no grupo instável requerido (L2) e grupos instáveis opcionais (L1 e L’), onde os grupos instáveis opcionais servem efcctivamente para separar L2 das pegas Li,, e os grupos instáveis requeridos servem para fornecer uma ligação instável dentro do componente ligante instável. Assim, o reagente ligante pode ser visto como tendo a fórmula geral:
Lh-L'-L2-L3-Lh A nomenclatura usada para descrever o reagente ligante pode ser ilustrada com a observação da estrutura (iv), que de novo resulta do composto de estrutura (ii):
Estrutura (iv)
Pega do ligante. 15
Como ilustra a estrutura (iv), os átomos podem servir em mais do que um papel funcional. Assim, na estrutura (iv), o azoto benzílico funciona com uma pega química ao permitir que o reagente ligante se lige ao reagente marcador através de uma reacção de formação de amida, e subsequentemente também serve como uma parte necessária da estrutura do grupo instável L2 uma vez que a ligação carbono-azoto benzílica é particularmente susceptível a corte fotolítico. A estrutura (iv) também ilustra que um reagente ligante pode ler um grupo L ’ (neste caso, um grupo metileno) apesar de não ter um grupo L1. Da mesma maneira, reagentes ligantes podem ter um grupo L1 mas não um grupo L'\ ou podem ler grupos L1 e LJ, ou podem não ter nem grupos L1 nem L’. Na estrutura (iv), a presença do grupo “P” próximo do grupo carbonilo indica que o grupo carbonilo está protegido da reacção. Dada esta configuração, o grupo carboxilo activado do reagente marcador (iii) pode reagir de forma limpa com o grupo amina do reagente ligante (iv) para formar uma ligação amida e dar um composto da formula T-L-Li,. O reagente MOI é um forma reactiva apropriada de uma molécula de interesse onde a molécula de interesse é um fragmento de ácido nucleico, um reagente MOI apropriado é um fragmento de ácido nucleico ligado através do seu grupo hidroxilo 5' a um grupo fosfodiéster e depois a uma cadeia alquileno que termina num grupo amina. Este grupo amina pode depois reagir com o grupo carbonilo da estrutura (iv), (depois de, claro, desproteger o grupo carbonilo, e de preferência depois de subsequentemente activar o grupo carbonilo para reacção com o grupo amina) para então ligar o MOI ao ligante.
Quando visto em ordem cronológica, a invenção é vista como tomando um reagente marcador (tendo uma pega química no marcador e um componente variável do marcador), um reagente ligante, (tendo duas pegas ligantes químicas, um grupo instável requerido e 0-2 grupos instáveis opcionais) e um reagente MOT (tendo uma molécula de um componente de interesse e uma molécula química de pega de interesse) para formar T-L-MOI. Assim, para formar T-L-MOl, tanto o reagente marcador como o reagente ligante reagem primeiro juntos para fornecer o T-L-Lh, e depois o reagente MOÍ reage com T-L-L|, para fomccci u T-L-MOl, ou (menos piefeiencialmciite) o reagente ligante e o ícageule MOI reagem juntos primeiro para fornecer o Lh-L-MOI, e depois o L|,-L-MOI reage com o reagente marcador para fornecer o T-L-MOI. Por razões de conveniência, compostos tendo a fórmula T-E-MOI serão descritos em termos de reagente marcador, reagente ligante e reagente MOI que podem ser usados para formar estes compostos. Claro que, os mesmos compostos coni 16 fórmula T-L-M01 podiam ser preparados por outros (tipicamente mais laboriosos) métodos, e estarem ainda dentro do núcleo dos compostos T-L-MOI inventivos.
Em qualquer caso, a invenção garante que um composto T-L-MOI seja sujeito a condições de corte, tais que um grupo marcador seja libertado do restante do composto. O grupo marcador compreenderá pelo menos o componente variável do marcador e tipicamente compreendera adicionalmente alguns ou todos os átomos do pega do marcador, alguns ou todos os átomos da pega do ligante que foi usado para ligar o reagente marcador ao reagente ligante, o grupo instável opcional L1 se este grupo estava presente no T-L-MOI. e conterá talvez alguma parte do grupo instável L2 requerido dependendo da estrutura precisa de L2 e da natureza da química de corte. Por conveniência, o grupo marcador pode ser referido como grupo contendo T uma vez que o T constituirá tipicamente a maior porção (em termos de massa) do grupo marcador.
Dada esta introdução a um aspecto da presente invenção, os vários componentes L. e X serão descritos em detalhe. Esta descrição começa com as definições de certos termos que se seguem, que serão usadas em seguida na descrição de T, L e X.
Como aqui usado, o termo “fragmento de ácido nueleico” significa uma molécula que é complementar a uma molécula de ácido nueleico alvo seleccionada. (i. e., complementar a toda ou a uma porção sua), e pode ser derivada da natureza ou produzida sinteticamente ou recombinantemente, incluindo moléculas que não ocorrem naturalmente, e podem ser na forma de cadeia simples ou dupla quando apropriado; e inclui um oligonucleótido (c.g., DNA ou RNA), um iniciador, uma sonda, um análogo de ácido nueleico (c.g., PNA), um oligonucleótido que é prolongado na direção 5 para 3 por uma polimerase, um ácido nueleico que é cortado quimicamente ou enzimaticamente, um ácido nueleico que é terminado com um terminador didesoxi ou tapado na extremidade 3'ou 5'com um composto que evita a polimerização na extremidade 5'ou 3', e suas combinações. A complementaridade de um fragmento de ácido nueleico a uma molécula de ácido nueleico alvo seleccionada geralmente significa a exibição de pelo menos cerca de 70% de emparelhamenlo especifico de bases por todo o comprimento do fragmento. Prcfcrcncialmcntc o fragmento dc ácido nueleico exibe pelo menos cerca de 80% de emparelhamenlo especifico de bases, e mais preferencial mente pelo menos cerca de 90%. Ensaios para determinação da percentagem de mau emparelhamenlo (e assim a percentagem de emparelhamento especifico das bases) são 17 bem conhecidos na área e são baseados na percentagem de mau emparelhamento como função de Tm quando relativo ao controlo totalmente emparelhado em termos de bases.
Como aqui usado, o termo “alquil”, só ou em combinação, referc-se a um hidrocarboneto radical saturado, de cadeia linear ou ramificada, contendo de .1 a 10. preferencialmente de 1 a 6 e mais preferencialmente de 1 a 4, átomos de carbono. Exemplos destes radicais incluem, mas não são limitados a estes, metil, etil, n-propil, iso-propil, n-butil, iso-butil. sec-butil. tert-butil, pentil, iso-amil, hexil, decil, e semelhantes. O termo “alquileno”, refere-se a um hidrocarboneto biradical saturado, de cadeia linear ou ramificada, contendo de I a 10. preferencialmente de 1 a 6 e mais preferencialmente de 1 a 4, átomos de carbono. Exemplos destes diradicais incluem, mas não são limitados a estes, meti leno, etileno (-CH2-Cl-l·-), propileno, e semelhantes. O termo “alquenil”, só ou em combinação, refere-se a um hidrocarboneto radical de cadeia linear ou ramificada, tendo pelo menos 1 ligação carbono-carbono dupla num total de 2 a 10, preferencialmente de 2 a 6 e mais preferencialmente de 2 a 4, átomos de carbono. Exemplos destes radicais incluem, mas não são limitados a estes, etenil, E- e Z-propenil, isopropenil, E- e Z-butenil, E- e Z-isobutenil, E- e Z-pentenil, decenil e semelhantes. O termo “alquenileno”, refere-se a um hidrocarboneto diradical de cadeia linear ou ramificada, tendo pelo menos I ligação carbono-carbono dupla num total de 2 a 10, preferencialmente de 2 a 6 e mais preferencialmente de 2 a 4, átomos de carbono. Exemplos destes diradicais incluem, mas não são limitados a estes, metilideno (=CH2). etilideno (-CH=(JH-), propilideno (-CH2-(Tl ( ll-).c semelhantes. O termo "alquinil”, só ou em combinação, refere-se a um hidrocarboneto radical de cadeia linear ou ramificada, tendo pelo menos 1 ligação tripla carbono-carbono num total de 2 a 10. preferencialmente de 2 a 6 e mais preferencialmente de 2 a 4, átomos de carbono. Exemplos destes radicais incluem, mas não são limitados a estes, etinil (acetilenil). propinil (propargil), butinil, hexinil, dccinil e semelhantes. O termo “alquinilcmf'. só ou em combinação, refere-se a um hidrocarboneto diradical de cadeia linear ou ramificada, lendo peio menos 1 ligação tripla carbono-carbono num total dc 2 a 1 0, preferencialmente dc 2 a 6 c mais preferencialmente de 2 a 4, átomos de carbono. Exemplos destes radicais incluem, mas níto são limitados a cstc3, etinileno (-C-C-), propinileno (-ClfrC-C) c semelhantes. O termo “cicloalquilo”, só ou em combinação, refere-se a um arranjo cíclico, saturado, de átomos de carbono, com números de 3 a 8 e preferencialmente de 3 a 6, átomos 18 de carbono. Exemplos destes radicais cicloalquil incluem, mas não são limitados a estes, cicloprop.il, ciclobutil, ciclopentil, ciclohexil e semelhantes. O termo “cicloalquileno” refere-se a uma forma diradical de um cicloalquil. (.) termo “cicloalquenilo”, só ou em combinação, refere-se a um carbociclo cíclico, contendo de 4 a 8, e preferencialmente 5 ou 6, átomos de carbono e uma ou mais duplas ligações. Exemplos destes radicais cicloalquenil incluem, mas não são limitados a estes, eiclopentenil, ciclohexenil, ciclopentadienil e semelhantes. O termo “cicloalquenileno” referc-sc a uma forma diradical de um cicloalquenil. 0 termo “arilo” refere-se a um grupo aromático carbociclico (consistindo totalmente em carbono e hidrogénio) seleccionado do grupo consistindo de fenil, naftil, indenil, indanil, azulenil, íluorenil e antracenil; ou um grupo aromático hcterociclico seleccionado do grupo consistindo de furil, tienil, piridil, pirrolil, oxazolil, tiazolil. imidazolil, pirazolil, 2-pirazolinil, pirazolidinil, isoxazolil, isotiazolil, 1,2,3-oxadiazolil. 1.2.3-triazolil, 1.3.4- liadiazolil, piridazinil, pirimidinil, pirazinil, 1,3,5-triazinil, 1,3,5-tritianil, indolizinil, indolil. isoindolil, 3H-indolil, indolinil, benzo [bjfuranil, 2,3-dihidrobenzofuranil, benzo [b] tiofenil. 1 H-indazolil, benzimidazolil, bcnzitiazolil, purinil, 4H-quinolizinil, quinolinil. isoquinolinil, cinolinil, ftalazinil, quinazolinil, quinoxalinil, 1.8-naftiridinil, pteridinil. carbazolil, acridinil, fenazinil, fenotiazinil, e fenoxazinil.
Os grupos “Arilo”, como definidos nesta aplicação podem conter independentemente de um a 4 substituintes que são independentemente sclcccionados do grupo consistindo de hidrogénio, halogénio, hidroxilo, amina, nitro, trifluoremetil, lritluorometoxi, alquilo, alquenilo, alquinilo, ciano. carboxi, carboalcoxi. 1,2-dioxietileno, alcoxi. alquenoxi ou alquinoxi, alquilamino, alquenilamino, alquinilamino, acilo alifático ou aromático. alcoxi-carbonilamino, alquilsulfonilamino, morfolinocarbomlamino, liomorfolinocarbonilamino, N-alquil guanidina, aralquilaminosulfonil; aralcoxialquil; N-aralcoxiureia; N-hidroxilureia; N-alquenilureia; N,N-(alquil,hidroxil)ureia: heterociclilo; aril lioariloxi substituído; N.N-(aril.alquil) hidrazina; sulfonilheterociclilo Ar' substituído; heterociclilo aralquil substituido; heterociclilo cicloalquil e cicloalquenil substituído; arilo cicloalquil combinado: alquilo ariloxi substituido, hetcrociclilamino; acilaminocarbonil alifático ou aromático; alqucnil acil substituido alifático ou aromático; aminocarboniloxy Ar' substituido; aril Ar', Ar'disubstítuido; acilo acilo substituido alifático ou aromático; 19 cicloalquiicarbonilalquilo; amina cicloalquil substituída; ariloxicarbonilalquilo; ácido ou éster de Ibsforodiamidilo; "Ar” é um grupo arilo carbocíciico ou heterocíclico como definido acima tendo um a três substituintcs scleccionados do grupo consistindo de hidrogénio, halogénio, hidroxilo, amina, nitro, trifluoremetil, trifluorometoxi, alquilo, alquenilo, alquinilo, 1,2-tlioximetile.no, 1,2-dioxietileno, alcoxi, alquenoxi, alquinoxi, alquilamino. alquenilamino ou alquinilamino, alquilcarboniloxi, acilo alifático ou aromático, alquil-carbonilamino, alcoxicarbonilamino, alquilsulfonilamino, N-alquil ou Ν,Ν-dialquil ureia. 0 termo “alcoxi”, só ou em combinação, refere-se a um radical alquiléter, onde o termo "alquilo” é como definido acima. Exemplos de radical alquiléter apropriados incluem, mas não são limitados a estes, metoxi, etoxi, n-propoxi, iso-propoxi, n-butoxi. iso-butoxi,sec-butoxi. tcrt-butoxi e semelhantes. 0 termo “alquenoxi”, só ou em combinação, refere-se a um radical de fórmula alquenil-O-, onde o termo “alquenil” é como definido acima garantido que o radical não é um éter enol. Exemplos de radicais alquenoxi apropriados incluem, mas não são limitados a estes, aliloxi. E- e Z-3-metil-2-propenoxi e semelhantes. O termo “alquiniloxi”, só ou em combinação, refere-se a um radical de fórmula alquinil-O-, onde o termo “alquinil” é como definido acima garantido que o radical não é um éter inol. Exemplos dc radicais alquinoxi apropriados incluem, mas não são limitados a estes, pmpargiloxi, 2-butmiloxi e semelhantes. O termo “tioalcoxi”, refere-se a um radical tioéter de fórmula alquil-S-, onde alquilo é como definido acima. 0 termo “alquilamino”, só ou em combinação, refere-se a um radical amina mono- ou di-alquil substituído (l.e. radical de fórmula alquil-NH- ou (alquil^-N), onde o termo “alquilo” é como definido acima. Exemplos de radicais alquilamino apropriados incluem, mus uão são limitados a estes, melilaiuino, clilauiiuo, piopilaminu, ispi.ipiopilamino, t-butilamino, Ν,Ν-dietilamino e semelhantes. O termo “alquenilamino”, só ou cm combinação, rcfcrc-sc a um radical dc fórmula alquenil-NI I- ou (alquenil^N-, onde o termo “alquenil” é como definido acima, garantido que o radical não é uma enamina. Um exemplo destes radicais alquenilamino é o radical alilamino. 20 .· -.. ·.» •ísitt?»*·?* ;«*»·
0 termo “alquinilamino”, só ou em combinação, referc-se a um radical de fórmula alquinil-NH- ou (alquinil^N-, onde o termo “alquenil” é como definido acima, garantido que o radical não é uma inamina. Um exemplo destes radicais alquinilamino é o radical propargil amino. O termo “amida” refere-se quer a -N(R')-C(=0)- como a -C(=0)-N(R')- onde R1 é aqui definido para incluir hidrogénio assim como outros grupos. O termo “amida substituída’' refere-se à situação em que R1 não é hidrogénio, enquanto o termo "amida não substituída” refere-se à situação em que R1 é hidrogénio. O termo “ariloxi”, só ou em combinação, refere-se a um radical de fórmula aril-0- onde arilo é como definido acima. Exemplos de radicais ariloxi incluem, mas não são limitados a estes, fenoxi, naftoxi, piridiloxi e semelhantes. O termo “arilamino”, só ou em combinação, refere-se a um radical de fórmula aril-NU- onde arilo é como definido acima. Exemplos de radicais arilamino incluem, mas não são limitados a estes, fenilamino (anilídio), naftilamino, 2-,3- e 4-piridilamino e semelhantes. O termo “cicloalquilo aril combinado”, só ou em combinação, relere-se a um radicai cicloalquilo que partilha dois átomos adjacentes com um radical aril, onde os termos "cicloalquilo” e “arilo” são como definido acima. Um exemplo de um radical cicloalquilo aril combinado é o radical ciclobutilo benzo combinado. O termo “alquilearbonilamino”, só ou em combinação, refere-se a um radical de formula alquil-CONH, onde o termo “alquilo” é como definido acima. O termo “alcoxicarbonilamino”, só ou cm combinação, refere-se a um radical de fórmula alquil-OCONH, onde o termo “alquilo” é como definido acima. O termo “alquilsulfonilamino”. só ou em combinação, refere-se a um radical de fórmula alquil-S02NH-, onde o termo “alquilo” é como definido acima. O termo “arilsulfonilamino”, só ou em combinação, refere-se a um radical de fórmula aril-SC^NH-, onde o termo “arilo” é como definido acima. O termo “N-alquilureia”, só ou em combinação, refere-se a um radical de fórmula alquil-NU-CO-NTI-, onde o termo “alquilo” c como definido acima. O termo “N-arilureia”, só ou em combinação, referc-se a um radical de fórmula aril NI I CO NU , onde o termo “arilo” é como definido acima. O termo halogénio significa flúor, cloro, bromo e iodo. 21 O termo “hidrocarboneto radical” refere-se a um arranjo de átomos de carbono e hidrogénio que precisa de apenas um átomo de hidrogénio para ser uma molécula estável independente. Assim, um hidrocarboneto radical tem um local de valência aberto num átomo de carbono, através do qual o hidrocarboneto radical pode ser ligado a outro(s) átomo(s). Alquilo, alquenilo, cicloalquilo, etc são exemplos de hidrocarbonetos radicais. O termo “hidrocarboneto diradical” refere-se a um arranjo de átomos de carbono e hidrogénio que precisa de dois átomos de hidrogénio de forma a ser uma molécula estável independente. Assim, um hidrocarboneto radical tem dois locais de valência abertos num ou dois átomos de carbono, através do qual o hidrocarboneto radical pode ser ligado a outro(s) átomo(s). Alquileno, alquenileno, alquinileno, cicloalquileno, etc são exemplos de hidrocarbonetos diradicais. O termo “hidrocarbilo” refere-se a qualquer arranjo estável consistindo inteiramente em átomos de carbono e hidrogénio tendo um único local de valência ao qual está ligado a outro grupo, e assim inclui radicais conhecidos como alquilo, alquenilo, alquinilo, cicloalquilo, cicloalquenilo, arilo (sem incorporação de heteroátomos no anel aril), arilalquilo, alquilarilo e semelhantes. Hidrocarboneto radical é um outro nome para hidrocarbilo. O termo “hidrocarbileno” refere-se a qualquer arranjo estável consistindo inteiramente em carbono e hidrogénio tendo dois locais de valência aos quais está ligado a outros grupos, e assim inclui alquileno, alquenileno, alquinileno, cicloalquileno, cicloalquenileno, arileno (sem incorporação de heteroátomos no anel arileno), arilalquileno, alquilarileno e semelhantes. Hidrocarboneto diradical é um outro nome para hidrocarbileno. O termo “hidrocarbil-O-hidrocarbileno” refere-se a um grupo hidrocarbil ligado a um áiomo de oxigénio, onde o átomo de oxigénio está da mesma maneira ligado a um grupo hidrocarbileno num dos dois locais de valência ao qual o grupo hidrocarbileno está ligado a outros grupos. Os termos “hidrocaibil-S-liidrocarbileiio”, “hidrocarbil-NH-hidrocarbileno” c “hidrocarbil-amida-hidrocarbileno” têm significados equivalentes, onde o oxigénio foi substituído por enxofre, -NH- ou um grupo amida, rcspcctivamcntc. O termo N-(hidrocarbil)hidrocarbileno refere-se a um grupo hidrocarbileno onde um dos dois locais de valência está ligado a um átomo de azoto, e este átomo de azoto está simultaneamente ligado a um hidrogénio e a um grupo hidrocarbilo. O termo N,N-di(hidrocarbil)hidiOcarbileno refere-se a um grupo hidrocarbileno onde um dos dois sítios de 22 valência está ligado a um átomo de azoto, e este átomo de azoto está simultaneamente ligado a dois grupos hidrocarbil. O termo “hidrocarbilacil- hidrocarbileno” refere-se a um grupo hidrocarbilo ligado através de um grupo acil (-C(=0)-) a um dos dois locais de valência de um grupo hidrocarbileno.
Os termos “heterociclilhidrocarbil” e “heterocilil” referem-se a um arranjo cíclico, estável, de átomos que inclui átomos de carbono e até quatro átomos (referidos como heteroátomos) seleccionados de oxigénio, azoto, fósforo e enxofre. O arranjo cíclico pode ser na forma de um anel monociclico de 3-7 átomos, ou de anel biciclico de 8-11 átomos. Os anéis podem ser saturados ou insaturados (incluindo anéis aromáticos), e podem opcionalmente ser benzocombinados. Os átomos de azoto e enxofre no anel podem estar em qualquer forma oxidada, incluindo a forma quaternizada do azoto. Um heterociclilhidrocarbil pode estar ligado a qualquer heteroátomo ou carbono endociclico o que resulta na criação de uma estrutura estável. Heterociclilhidrocarbil preferidos incluem heterociclos monociclicos de 5-7 membros contendo um ou dois heteroátomos de azoto.
Um heterociclilhidrocarbil substituído refere-se a um heterociclilhidrocarbil como definido acima, onde pelo menos um átomo do seu anel está ligado a um substituinte indicado que se estende para fora do anel.
Ao referir-se a grupos hidrocarbil e hidrocarbileno, o termo “derivados de qualquer dos seguintes onde um ou mais hidrogénios é substituído por um numero igual de íluoretos’' retére-se a moléculas que contêm átomos de carbono, hidrogénio e lluoretos, mas nenhuns outros átomos. O termo “éster activado” é um éster que contém um “grupo de partida” que é rapidamente deslocado por um nucleóíilo, tal como uma amina, um álcool ou um nucleófilo tiol. Estes grupos de partida são muito conhecidos e incluem, sem limitação, N-hidroxisuccinimida, N-hidroxibenzolriazole, halogéuio (halogenelos), alcoxi incluindo tetrafiuorofenolatos, tioalcoxi e semelhantes. O termo “éster protegido” refere-se a um grupo éster que é disfarçado ou de outra forma tornado não rcactivo. Ver, e.g., Grcene, “Protccting Groups in Organic Synlhesis”.
Em virtude das definições acima, outros termos químicos usados ao longo desta aplicação podem ser facilmente compreendidos pelos entendidos na área. Os termos podem 23 ser usados sozinhos ou em qualquer das suas combinações. Os comprimentos preferidos ou mais preferidos das cadeias de radicais aplicam-se a todas estas combinações.
Λ. GERAÇÃO DE FRAGMENTOS DE ÁCIDOS NUCLEICOS MARCADOS
Como comentado acima, um aspecto da presente invenção fornece um esquema geral para sequenciação de DNA que pennite o uso de mais de 16 marcadores em cada faixa; com detecção contínua, os marcadores podem ser detectados e a sequência lida à medida que a separação por tamanhos ocorre, tal como com a sequenciação baseada na fluorescência convencional. Este esquema é aplicável a qualquer das técnicas de sequenciação de DNA baseadas na separação por tamanhos de moléculas marcadas. Marcadores e ligardes adequados para uso na presenta invenção, assim como métodos para sequenciação de ácidos nucleicos, são discutidos com mais detalhe abaixo. I. Marcadores "Marcador”, como aqui usado, refcre-sc em geral a uma entidade química que é usada para identificar exclusivamente uma “molécula de interesse”, e mais especificamente refere-se ao componente variável do marcador assim como a tudo o que lhe possa estar mais infimamente ligado em qualquer um dos reagente marcador, componente marcador e entidade marcador.
Um marcador que é útil na presente invenção possui vários atributos: 1) É capaz de ser distinguido de todos os outros marcadores. Esta descri minaçáo de outras entidades químicas pode ser baseada no comportamento cromatográfico do marcador (particularmente depois da reacção de corte), nas suas propriedades espectroscópicas e potenciométricas, ou algumas dessas combinações. Métodos espectroscópicos pelos quais os marcadores são proveitosamente distinguidos incluem espectroscopia de massa (MS), infravermelhos (IR), ultravioleta (UV) e fluorescência, onde MS. IR. c UV são os métodos espectroscópicos preferidos, e MS o mais preferido. Ampeiometria pulenciométrica é um método potenciómetrico preferido. 2) O marcador é capaz de ser detectado quando presente a 10'22 a 10‘6 moles.
3) 0 marcador possui uma pega química através da qual pode ser ligada ao MOÍ o qual a marcador deve identificar exclusivamente. A ligação pode ser feita directamente ao MOI, ou indirectamente através de um grupo “liganteT 4) O marcador é quimicamente estável relativamente a todas as manipulações à qual é sujeito, incluindo ligações e cortes do MOI, e quaisquer manipulações do MOI enquanto o marcador lhe estiver ligado 5) O marcador não interfere significativamente com as manipulações realizadas no MOI enquanto lhe estiver ligado. Por exemplo, se a marcador estiver ligado a um oligonucleótido, o marcador não pode interferir significativamente com qualquer hihridação ou reacções enzimáticas (e.g. reacções de sequcnciação PCR) realizadas no oligonucleótido. Da mesma forma, se o marcador estiver ligado a um anticorpo, não pode interferir significafivamente com o reconhecimento do antigenio pelo anticorpo.
Um grupo marcador que se pretenda que seja detectado por um certo método espectroscopico ou potenciométrico deve possuir propriedades que aumentem a sensibilidade e especificidade de detecção por esse método. Tipicamente, o grupo marcador terá aquelas propriedades uma vez que foram desenhadas na componente variável do marcador, que constituirá tipicamente a maior porção do grupo marcador. Na discussão seguinte, o uso da palavra "marcador” retére-se tipicamente ao grupo marcador (/. é. o produto do corte que contém a componente variável do marcador), no entanto, pode também ser considerada referir-se ao próprio componente variável do marcador porque esta é a porção do grupo marcador que é tipicamente responsável por fornecer as propriedades de detecção únicas. Em compostos da fórmula T-L-X, a porção “T" conterá a componente variável do marcador. Onde a componente variável do marcador foi desenhada para ser caraclerizada por, e.g. , cspcctrometria de massa, a porção “T” de T-L-X pode ser referida como T"'\ Da mesma maneira, o produto do corte de T-L-X que contém T pode ser referido como o grupo contendo T'"\ Os seguintes métodos cspcctroscópicos c potenciométricos podem ser usados para caraeterizar grupos contendo Tm\
a. Caractcrísticas de Marcadores MS
Onde um marcador é analisável por espectrometria de massa ( i.e., ê uma marcador que pode ser lido por MS, também aqui referido como um marcador MS ou “grupo contendo Tms”). o aspecto essencial do marcador é que seja passível de ser ionízável. Assim. 25
um elemento preferido no desenho do marcador que pode ser lido por MS é incorporar aí uma funcionalidade química que possa carregar uma carga positiva ou negativa em condições de ionização na MS. Este aspecto confere uma melhor eficiência na formação do ião e uma maior sensibilidade total de detecção, particularmente em ionização de electropulverização. A funcionalidade química que suporta uma carga ionizada pode derivar de T"1S ou L ou ambos. Os lactores que podem aumentar a sensibilidade relativa de um analito a ser detectado por espectrometria de massa são discutidos em, e.g., Sunner, J., et al., Anal. Chem. (50:1300-1307 (1988).
Uma funcionalidade preferida para facilitar o transporte de uma carga negativa é um ácido orgânico, tal como hidroxilfenólico, ácido carboxílico, fosfonato, fosfato, tetrazole, sulfonil ureia, álcool perfluoro e ácido sulfónico.Uma funcionalidade preferida para facilitar o transporte de uma carga positiva em condições de ionização são aminas aromáticas ou alifáticas. Exemplos de grupos funcionais de aminas que dão uma maior detectabilidade a marcadores MS incluem aminas quaternárias (z.e., aminas que têm quatro ligações, cada uma a átomos de carbono, ver Aebersold, U.S. Patent No. 5,240,859) e aminas terciárias (i.e., aminas que têm três ligações, cada uma a átomos de carbono, que inclui grupos C=N-C tal como estão presentes na piridina, ver Hess et al., Anal Biochem. 224:313, 1995; Bures et al., Anal. Biochem. 224:364, 1995). Aminas terciárias impedidas são particularmente preferidas. As aminas terciárias e quaternárias podem ser alquilo ou arilo. Um grupo contendo Tms tem que ter pelo menos uma espécie ionizável, mas pode possuir mais do que uma espécie ionizável. O estado de carga preferido é o de uma única espécie ionizável por marcador. Consequentemente, é preferido que cada grupo contendo 1m= (e cada componente variável do marcador) contenha só um grupo amina ou ácido orgânico impedido.
Radicais contendo aminas adequados que podem formar parte do grupo contendo Tms incluem os seguintes:
CNH—(Cj-Cn/, IIο
(Crcio) (C,-C10)
-CNH—(C,-C|o)—NIIo -CNH—(C2-Cin)— N(C,-CI0)2 O /_'\ . „ x -CN N(C,-C|0) ; e
—CNH—(C,-Cl()>-II V o —CNH—(C2-Cl0)— O xc/NH
,N
O
O A identificação de um marcador por espectrometria de massa é preferencinlmente baseada na razão entre a sua massa molecular e carga (m/z) A gama de massa molecular preferida de marcadores MS é de cerca de 100 a 2000 daltons, e preferencialmente o grupo contendo Tmí> tem uma massa de pelo menos cerca de 250 daltons. mais preferencialmente de pelo menos cerca de 300 daltons, e ainda mais preferencial mente de pelo menos cerca de 350 daltons. Em geral é difícil para espectrómetros de massa distinguirem entre grupos tendo iões parecidos abaixo de cerca de 200-250 daltons (dependendo do instrumento exacto), e assim grupos contendo Tms preferidos da invenção têm massas acima desta gama.
Como explicado acima, o grupo contendo Tms pode conter átomos diferentes dos presentes na componente variável do marcador, e de facto diferentes dos presentes na própria T"’\ Assim, a massa do próprio Tms pode ser menor do que cerca de 250 daltons. desde que o grupo contendo Tms tenha uma massa de pelo menos cerca de 250 daltons. Assim, a massa de T"’* pode variar de 15 ( /.c\, um radical metil) até cerca de 10000 daltons, c preferencialmente varia de 100 a cerca de 5000 daltons, e mais preferencial mente varia dc cerca dc 200 a cerca de 1000 daltons. 27 E relativamente difícil distinguir marcadores por espectrometria de massa quando essas marcadores incorporam átomos que têm mais do que um isótopo com abundância significativa. Consequentemente, grupos T preferidos que são pretendidos para identificação por espectrometria de massa (grupos T'm), contêm carbono, pelo menos um hidrogénio e fluoreto, e átomos opcionais seleccionados do oxigénio, azoto, enxofre, fósforo e iodo. Embora outros átomos possam estar presentes no T"\ a sua presença pode tornar a análise dos resultados do espectro de massa um pouco mais difícil. Preferencialmente, o grupo T"'s têm apenas átomos de carbono, azoto e oxigénio, em adição a hidrogénio e/ou lluoreto. 0 lluoreto é um átomo preferido ainda opcional a ter num grupo Tms. Em comparação com o hidrogénio, o fluoreto é, claro, mais pesado. Assim, a presença de átomos de lluoreto mais do que de hidrogénio forma grupos Tms de maior massa, permitindo assim ao grupo T"’s alcançar e exceder uma massa maior do que 250 daltons, o que é desejável como acima explicado. Adicionalmente, a substituição de hidrogénio por lluoreto confere maior volatilidade ao grupo contendo Tms, e uma maior volatilidade do analito aumenta a sensibilidade quando a espectrometria de massa é usada como método dc dctecção. A fórmula molecular de Τ'™ está dentro da esíera de Cι.500N0.iooOn-100S0-1«Po-1o Hi,pjilfi onde a soma de α, β e δ é suficiente para satisfazer as valências por outro lado insatisfeitas dos átomos de C, N, O, S e P. A designação CiõooNo-iooOo-iooSn-ioPn-io HaFpIs significa que Tms contem pelo menos um, e pode conter qualquer numero de átomos de carbono de I a 500, em adição a opcionalmente conter até 100 átomos de azoto (“No-” significa que T""’ não precisa conter nenhum átomo de azoto), e até 100 átomos de oxigénio, e até 10 átomos de enxofre e até 10 átomos de fósforo. Os símbolos α, β e δ representam o numero de átomos hidrogénio, lluoreto c iodeto em Tms, onde quaisquer dois destes números podem ser zero, e onde a soma destes números c igual ao total das valências por outro lado insatisfeitas dos átomos de C, N, O, S e P. Preferencialmente, Tms tem uma fórmula molecular que está dentro da esfera dc Ci„soNo-ioOo.ioHaF|) onde a soma de α e β é igual ao numero de átomos de hidrogénio c fluoreto, respectivamente, presentes no grupo.
b. Caraclerísticas de Marcadores IR 1 lá duas formas primárias de detecção 1K de grupos químicos orgânicos: IK de dispersão de Raman e IR de absorção. Espectros IR de dispersão de Rarnan e espectros IR de 28 absorção são métodos espectroscópicos complementares. Em geral, a excitação de Raman depende de alterações na polarizabilidade da ligação enquanto a absorção de IR depende de alterações no momento dipolar da ligação. Linhas de absorção de IR fracas tornam-se linhas de Raman fortes e vice versa. O comprimento de onda é a unidade característica para o espectro de IR Há 3 regiões espectrais para marcadores IR que têm aplicações separadas: IR próximo a 12500 até 4000 cm'1, IR médio a 4000 até 600 cm"1, IR longínquo a 600 até 300 em1. Para os usos aqui descritos onde um composto serve como marcador para identificar uma MOI, sonda ou iniciador, as regiões espectrais médias seriam preferíveis. Por exemplo, o elongamento carbonilo (1850 a 1750 cm'1) seria medido para ácidos carboxílicos, ésteres carboxílicos e arnidas, e carbonatos alquilo e arilo, carbamatos e cetonas. A ligação N-H (1750 a 160 cm'1) seria usada para identificar aminas, iões amónia e arnidas. De 1400 até 1250 cm'1 a ligação R-OH é detectada assim como o elongamento C-N em arnidas. Configurações de substituição aromáticas são detectadas a 900 até 690 cm'1 (ligação C-H, ligação N-H para ArNfU). C-H saturados, olefinas, anéis aromáticos, ligações duplas e triplas, ésteres, acetais, cetais, sais de amónia, compostos N-0 tais como oximas, nitro. N-oxidos, e nitratos, azo, hidrazonas, quinonas, ácidos carboxílicos, arnidas, e iactamas todos possuem ilados de correlação infravermelha vibracional (ver Pretsch et al., Speclral Data for Struclure Delerminalion of Organic Compounds, Springer-Verlag, New York, 1989). Compostos preferidos incluiriam um nitrilo aromático que exibe uma vibração de elongamento nitrilo íorte a 2230 até 2210 cm Outros tipos úteis de compostos são alquinos aromáticos que têm uma forte vibração de elongamento que dá origem a uma nítida banda de absorção entre 2140 e 2100 cm"1. IJm terceiro tipo de composto sáo as azidas aromáticas que exibem uma intensa banda de absorção na região 2160 a 2120 cm ''. Os tiocianatos são representativos de compostos que têm uma absorção forte a 2275 até 2263 cm'1.
c. Curuclcríslicus da Murcudaras UV
Uma compilação de tipos de cromóforos orgânicos c as suas respectivas propriedades visiveis-UV c ciada cm Scott (Inlcrpretation of the UV Spcctrci of Natural Products, Pergamon Press, New York, 1962). Um cromóforo é um átomo ou grupo de átomos ou electrões que são responsáveis pela absorção de luz particular. Existem regras empíricas para o máximo de π para π* cm sistemas conjugados (ver Pretsch et al., Speclral Data for Struclure· Dclermination of Organic Compounds, p. B65 e B70, Springer Verlag, New York. 29 1989). Compostos preferidos (com sistemas conjugados) possuiriam n transições para π e π para π*. Estes compostos são exemplificados por Violeta Acido 7, Laranja de Acridina, Amarelo de Acridina G, Azul Brilhante G, Vermelho do Congo, Violeta de Cristal, Oxalato Verde de Malaquita, Amarelo de Metanil, Azul de Metileno, Laranja dc Metilo, Violeta de Meti lo B, Verde de Naftol B, Azul de Óleo N, Vermelho de Óleo O. 4-fenilazofenol, Salranina O. Verde de Solvente 3, e Laranja do Sudão G, sendo todos comercialmente disponíveis (Aldrich, Milwaukee, Wl). Outros compostos adequados estão listados em, e.g., Jane. I.. et al.,7. Chrom. 323:191-225 (1985). d. Caracleristica de um Marcador Fluorescente
As sondas fluorescentes são identificadas e quantificadas mais direclamenle pelo seus comprimentos de onda e intensidades de absorção e emissão de fluorescência. Espectros de emissão (fluorescência e fosforescência) são muito mais sensíveis e permitem medidas mais especificas do que espectros de absorção. Outras características fotofísicas tais como o lempo de vida do estado excitado e anisotropia de fluorescência têm uma utilização menos alargada. Os parâmetros de intensidade geralmente mais úteis são o coeficiente de extinção molar (r.) para a absorção e o rendimento quântico (QY-quantum yield) para a fluorescência. O valor de ;; é especificado a um comprimento de onda (usualmente o máximo dc absorção da sonda), enquanto QY é uma medida da emissão total de lbtões sobre todo o perfil espectral de fluorescência. Uma largura de banda óptica estreita (<20 nm) é usualmente usada para excitação dc fluorescência (por absorção), enquanto a largura da banda de dctccção dc fluorescência é muito mais variável, variando de todo o espectro para a sensibilidade máxima alc uma banda estreita (~ 20 nm) para resolução máxima. A intensidade de fluorescência por molécula dc sonda é proporcional ao produto de ε por QY. A gama destes parâmetros entre lluorólbros de importância pratica actual é de aproximadamente 10000 até 100000 cm'1 M'1 para ε e 0.1 até 1.0 para QY. Compostos que podem servir como marcadores fluorescentes são como se segue: fluoresceína, rodamina, azul lambda 470, verde lambda, vermelho lambda 664. vermelho lambda 665. laranja de acridina, e iodeto de propídio, que estão comcrcialmente disponíveis na Lambda Fluorescence Co. (Pleasant Gap, PA). Compostos fluorescentes tais como vermelho do nilo. Vermelho do Texas, lissaminaIM. BODIPY™s estão disponíveis na Molecular Probes (Eugcne, OR). 30 e. Características de Marcadores Potenciométricos 0 principio da detccção electroquímica (ECD-electrochemical detection) é baseado na oxidação ou redução de compostos que quando certas voltagens são aplicadas, dão ou aceitam electrões produzindo assim uma corrente que pode ser medida. Quando certos compostos são sujeitos a uma diferença de potencial, as moléculas sofrem um rearranjo molecular na superfície dos eléctrodos de trabalho com a perda (oxidação) ou ganho (redução) de electrões, dizendo-se que estes compostos são electrónicos e sofrem reacções cleclroquimicas. Detectores EC aplicam uma voltagem a uma superfície do eléctrodo sobre a qual o cluente de HPLC fluí. Compostos electroactivos eluindo da coluna tanto dão electrões (oxidar) como aceitam electrões (reduzir) gerando um pico de corrente em tempo real. Essencialmcnte, a quantidade de corrente gerada depende da concentração do analito e da voltagem aplicada, com cada composto a ter uma voltagem especifica à qual começa a oxidar ou a reduzir. O detector electroquímico rnais popular actualmente é o detector amperométrico no qual o potencial é mantido constante e é então medida a corrente produzida na reacção electroquímica. Este tipo de espectrometria é usualmente chamada “amperometria potcnciostática". Amperómetros comerciais estão disponíveis na ESA, Inc. Chelmford, MA.
Quando a eficiência de detecção é de 100%, os detectores especializados são chamados ‘"colométricos". Os detectores colométricos são sensíveis e o que tem um numero dc vantagens praticas relativamente à selectividade e sensibilidade que faz estes tipos de detectores úteis num arranjo. Em detectores colométricos, para uma dada concentração de analito. o sinal da corrente é representado em função do potencial aplicado (voltagem) ao eléctrodo de trabalho. O gráfico sigmoídal resultante é chamado a curva corrente-voltagem ou voltamagrama hidrodinâmico (IIDV-hydrodynamic voltammagram). O HDV permite a melhor escolha do potencial aplicado ao eléctrodo de trabalho que permite maximizar o sinal observado. IJma grande vantagem do ECD é a sua sensibilidade inerente com niveis de detecção usuais nu gama das sub fcnitomole.
Numerosos químicos e compostos são electroquimicamente activos incluindo muitos bioquímicos, farmacêuticos c pesticidas. Compostos que co-clucm cromatograficarnente podem ser efectivamente separados mesmo se os seus potenciais de meia onda ( o potencial a metade do sinal máximo) diferir apenas por 30-60 mV.
Sensores colométricos recentemente desenvolvidos fornecem selectividade, identificação e resolução de compostos co-eluentes quando usados como detectores em 31
separações baseadas em cromatografia líquida. Assim, estes detectores exibidos adicionam um outro conjunto de separações que têm lugar no proprio detector. Instrumentos correntes possuem 16 canais que estão, em principio, limitados só pela velocidade à qual os dados podem ser adquiridos. O numero de compostos que podem ser separados num arranjo EC é cromatogratlcamente limitado (i,e., contagem de placas limitada). No entanto, se dois ou mais compostos que co-eluem cromatograficamente tiverem uma diferença nos potências de meia onda de 30-60 mV, o arranjo é capaz de distinguir os compostos. A capacidade de um composto ser electroquimicamente activo baseia-se na posse de um grupo activo EC (i.e., -()H.-0,-N,-S).
Compostos que têm sido detectado com sucesso usando detectores colométricos incluem 5-hidroxitriptamina, 3-metoxi-4-hidroxifenil-glicol, ácido homogentísico. dopamina, metaneírina, 3-hidroxiquinurenina, acetominofen, 3-hidroxitriptofol, ácido 5-hidroxindolacético, ácido octanesulfónico, fenol, o-cresol, pirogalol, 2-nitrofenol, 4-nilrolenol, 2,4-dinitrofenol, 4,6-dinitrocresol, 3-metil-2-mtrofenoI, 2,4-diclorofenol, 2,6-diclorofenol, 2,4.5-triclorofenol, 4-cloro-3-metilfenol, 5-metilfenol, 4-metil-2-nitrofenol, 2-hidroxianilina, 4- hidroxianilina, 1,2-fenilenediamina, benzocatecina, buturon, clortoluron, diuron, isoproturon, linuron, metobromuron, metoxuron, monolinuron, monuron, metionina, triploíano. lirosina, ácido 4-aminobenzóico, ácido 4-hidroxibenzóico. ácido 4- hidroxicumárico, ácido 7-metoxicumárico. apigenina baicaleina, ácido cafeico, catecina, centaureina. ácido clorogénico, daidzcina, datiscetma, diosmetina, galáto de epicatecina, cpigalo catecina, gaiato de epigalo catecina, eugenol, eupatorina, ácido ferulico, fisetina. galangina. ácido gálico, gardenina, genisteina, ácido gcntísico, hesperidina. irigenina, canferol, leucoianidina, luteolina, mangostina, morina, miricetina, naringina, narirutina, pelargondina. peonidina, floretina, pratenseina, ácido protocaleeúieo, ramnciina. quercetina, saquranelina, escutelareina, escopoletina, siringaldeido, ácido siríngico, tangeritina, tioxei uliim, uiubelileione, ácido vanílico 1,3-dimetil-tctrahidroisoquinoIina, 6- liitlroxidopamina, r-salsolinol, N-metil-r-salsolinol. tetrahidroisoquinolina, amitriptilina, nporaodina, capsaicina, clorodiazcpoxido, clorpromazina, daunorubieina, desipramina, doxepina, lliioxctina, flurazepam, imipramina, isoproterenol, metoxamina, morfina, mortina-3 glucoronoide, nortriptilina, oxazepam, fenilefrina, trimipramina, ácido ascórbico, N-acetil serotonina, 3,4-dihidroxibenzilamina, ácido 3,4-dihidroximandélico (DOMA), ácido 3.4-dihidroxifenilacético (DOPAC). 3.4-dihidroxifenilalanina (L-DOPA), 3,4-dihidroxifenilglicol 32
(DHPG). ácido 3-hidroxiantranílico, ácido 2-hidroxifenilacético (2HPAC), ácido 4-hidroxibenzóico (4HBAC), ácido 5-hidroxiindole-3-acético (5HIAA), 3-hidroxiquinurenina, ácido 3-hidroxintandélico, 3-hidroxi-4-metoxifeniletiJamina, ácido 4-hidroxifenilacético (4HPAC). ácido 4-hidroxifeniláctico (4HPLA), 5-hidroxitriptofano (5HTP), 5-hidroxitriptofol (5IITOL). 5-hidroxitriptamina (5HT), sulfato de 5-hidroxitriptamina, 3-metoxi-4-hidroxifcnilglicol (MHPG), 5-raetoxitriptamina, 5'metoxitriptofano, 5-metoxitriptofol, 3-inetoxitiramina (3MT), 3-metoxitirosina (3-OM-DOPA), 5-metilcisteina, 3-metilguanina, btifolenina. dopamina, dopamina-3-glucoronido, dopamina-3-sulfato, dopamin-4-sulfato, epinelfina, epinina, ácido fólico, glutationa (reduzida), guanina, guanosina, ácido homogentísico (HGA), ácido homovanílico (HVA), alcóol homovanílico (HVOL), ácido homoverático, sulfato de hva, hipoxantina, indole, ácido indole-3-acético, ácido indole-3-láclico, cinurina, melatonina, metanefrina, N-metiltriptamina, N-metiltiramina, N,N-dimetillriptamina, Ν,Ν-dimetiltirainina, norepinefrina, normatenefrina, octopamina, piridoxal, fosfato de piridoxal. piridoxamina. sinefrina, triptofol, triptamina, tiramina, ácido úrico, ácido vnnililmandélico (vma), xautina e xantosina. Outros compostos adequados são citados em , c.g.. Jane, I., et ai. ,/. Chrom. 323:191-225 (1985) e Musch, G., et al. J. Chrom. 348:97-110 (1985). listes compostos podem ser incorporados em compostos de fórmula T-L-X por métodos conhecidos na área. Por exemplo, compostos tendo um grupo ácido carboxílico podem ser reagidos com aminas, hidroxilos, etc..para formar ligações aniida. éster e outras entre T e L.
Em adição às propriedades acima referidas, e independentemente do método de detecção pensado, c preferível que o marcador tenha uma estrutura química modular. Isto ajuda na construção de um grande numero de marcadores relacionadas estruturalmcnte usando as técnicas de química combinatória. Por exemplo, o grupo Tms tem desejávelmente várias propriedades. Contém desejavelmente um grupo funcional que suporta um único estado de carga ionizado quando o grupo contendo T"ls é sujeito a especlroinelria de massa (nmis simplesmente referido como um grupo “aumentador da sensibilidade dc espectroscopia de massa" ou MSSE (inass spec sensitivity cnhanccr)). Também, pode desejavelmente servir como um membro na família de grupos contendo Tms , onde cada um dos membros da família tem uma razão diferente massa/carga, contudo têm aproximadamente a mesma sensibilidade no espeeirómetro de massa. Assim, os membros da família têm desejavelmente o mesmo MSSE. De forma a permitir a criação de famílias de compostos, tem sido considerado Λ Λ 3.-) conveniente gerar reagentes marcadores através de um esquema de síntese modular, de tal Ibrma que as próprias componentes dos marcador possam ser vistas como módulos incluídos.
Numa abordagem modular preferida à estrutura do grupo T"’\ Tnis tem a fórmula
T2-(J-T3-V onde T2 é um grupo orgânico formado por carbono e um ou mais de hidrogénio, fluoreto, iodeto, oxigénio, azoto, enxofre, e fósforo, tendo uma gama de massa de 15 a 500 daltons; T é um grupo orgânico formado por carbono e um ou mais de hidrogénio, fluoreto, iodeto, oxigénio, azoto, enxofre, e fósforo, tendo uma gama de massa de 50 a 1000 daltons; J é uma ligação directa ou um grupo funcional tal como amida, éster, amina. sufeto. éter, tioéster, dissnllurcto, tioéter, ureia, tioureia, carbamato, tiocarbamato, base de Schiff, base de Schiff reduzida, imina, oxima, hidrazona, fosfato, fosfonato, lòsforamida, fosfonamida, sulfonato, sulfonamida ou ligação carbono-carbono; e n é um numero inteiro que varia entre 1 a 50, tal que quando n é maior que 1, cada T* e .1 é seleccionado independentemente. Λ estrutura modular T2 -(J- T3-)n- fornece uma entrada conveniente para famílias de compostos T-L-X, onde cada membro da família tem um grupo T diferente. Por exemplo, quando T é Tra>, e cada membro da família tem desejavelmente o mesmo MSSE. um dos grupos T’ pode fornecer essa estrutura MSSE. De forma a fornecer variabilidade entre membros de Lima família em termos da massa de T,ra, o grupo T2 pode ser variado entre membros da lamília. Por exemplo, um membro da família pode ter T2 = metilo, enquanto outro tem T? = etilo, e outro tem T2=propilo, etc.
De forma a proporcionar saltos grandes ou “cm massa”, pode ser desenhado um giupu T’ que adiciona signilícantes (e.g., uma ou várias centenas) unidades de massa a T-L-X. 1 Im grupo Τ’ assim pode ser referido como um grupo que ajusta a gama de peso molecular (“WRA”-(weight range adjuster)). Um WRA é bastante útil se se estivei a trabalhai com um conjunto único de grupos T2, que terão massas que se estendem numa gama limitada. Um único conjunto dc grupos T2, pode scr usado para criar grupos Tms tendo uma larga gama dc massa apenas incorporando um ou mais grupos T3 WRA dentro de T"’\ Assim, usando um exemplo simples, se um conjunto de grupos T2 permite uma gama de massa de 250 340 daltons para o T",s. a adição de um único WRA, tendo, corno numero de exemplo 100 dalton, como grupo T3 proporciona acesso à gama de massa 350-440 daltons enquanto se usa o mesmo conjunto de grupos T2. Da mesma forma, a adição de dois grupos WRA de 100 dalton (cada um como grupo T3) proporciona acesso à gama de massa 450-540 daltons. onde esta 34
adição incremental de grupos WRA pode ser continuada para proporcionar o acesso a uma cama de massa muito larga para o grupo Tms. Compostos preferidos com a fórmula T2 —(J- T3-i..-Χ têm a fórmula Rvvvc- (R-wra) w-Rmssg-E-X onde VWC é um grupo “T2”. e cada um dos grupos WRA e MSSE são grupos “T”\ Esta estrutura é ilustrada na Figura 13, e representa um caminho modular para a preparação do grupo Tms.
Na fórmula T2 T’-)n-, T2 e T são preferencialmente seleccionados de hidrocarbil, hidrocarbil-O-hidrocarbileno, hidrocarbil-S-hidrocarbileno, hidrocarbil-NH-hidrocarbileno, hidrocarbil-amida-hidrocarbileno, N-(hidrocarbil)hidrocarbileno, N,N- di(hidrocarbil)hidrocarbileno, hidrocarbilacil-hidrocarbileno, heterocicli 1 hidrocarbi 1 onde os hetero átomos são seleccionado(s) de oxigénio, azoto, enxofre e fósforo, helerocicli Ihidrocarbil substituídos onde os hetero átomos são seleccionado(s) de oxigénio, azoto, enxofre e fósforo e os substituintes são seleccionados de hidrocarbil, hidrocarbil-O-hidrocarbileno, hidrocarbil-NH-hidrocarbileno, hidrocarbil-S-hidrocarbileno, N-(hidrocarbil)hidrocarbileno, N,N-di(hidrocarbil)hidrocarbileno e hidrocarbilacil-hidrocarbileno. Adicionalmente, T2 e/ou TJ podem ser um derivado de qualquer um dos grupos T2/T'! potenciais previamente listados, tal que um ou mais hidrogénios são tluoretos substituídos.
Também observando a fórmula T2 -(J-T'-)n-, um T! preterido tem a fórmula -G( R2)-. onde G é uma cadeia alquileno C|.() tendo um único substituinte R2. Assim, se G é tiileno (-CII2-CH2-) qualquer um dos dois átomos de carbono etileno pode ler um substituinte R2. c R2 é seleccionado de alquil, alquenil, alquinil, cicloalquil, cicloalquil ariI combinado, cicloalquenil. aril. aralquil, alquenil ou alquinil aril substituído, alquil cicloalquil substituído, cicloalquil cicloalquenil substituído, biaril, alcoxi, alquenoxi, alquinoxi, aralcoxi, alquenoxi <>u alquinoxi aril substituído, alquilamino, alquenilamino ou alquinilamino, alquilamino aril substituído, alquenilamino ou alquinilamino aril substituído, ariloxi, arilamino. alquilo N-nlquilurciu substituído, alquilo N-arilureia substituído, alquilo alquilearbonilamina substituído, alquilo aminocarbonil substituído, heterociclil, alquil heterociclil substituído, amino heterociclil substituído, aralquilo carboxialquil substituído, arilo oxocarbociclil combinado e helerociclilalquil; cicloalquenil, alquilo e aralquilo aril substituído, alquilo hidroxi substituído, alquilo alcoxi substituído, alquilo aralcoxi substituído, alquilo alcoxi substituído, alquilo aralcoxi substituído, alquilo amina substituído. alquilo (alquiloxicarbonilamino aril substituído) substituído, alquilo tiol substituído, alquilo 35 alquilsuUbn.il substituído, alquilo (alquilotio hidroxi substituído) substituído, alquilo tioalcoxi substituído, alquilo hidrocarbilacilamino substituído, alquilo heterociclilacilamino substituído, alquilo (heterociclilacilamino hidrocarbil substituído) substituído, alquilo alquilsulfonilamino substituído, alquilo arilsulfonilamino substituído, morfolino-alquilo, tiomoifolina-alquilo, mortolina carbonil substituída alquilo, alquilo tiomorfolinacarbonil substituído, alquilo [N-(alquilo, aiquenilo ou alquinilo)- ou N,N-[dialquilo, dialquenilo, dialquinilo ou (alquilo, alquenilo)-aminol carbonil substituído, heterociclilaminocarbonil, heteiOciclilalquilenoaminocarbonil, alquilo heterociclilaminocarbonil substrituído, alquilo heterociclilalquilenoaminocarbonil substituído, N,N-[dialquilo] alquilenoaminocarbonil, alquilo N,N-[dialquiloJ alquilenoaminocarbonil substituído, heterociclilcarbonil alquilo substituído, heterociclilcarbonil-alquilo alquilo substituído, alquilo carboxil substituído, acilaminoalquilo dialquilamino substituído e cadeias laterais de aminoácidos seleccionadas de arginina, asparagina, glutamina, S-metil cisteína, metionina e dos seus correspondentes derivados sulloxi e sulfona, glicina, leucina, isoleucina, alo-isoleucina, tert-leucina. norleucina, fenilalanina, tirosina, triptofano, prolina, alanina, ornitina, histidina, glutamina, valina, trconina, serina, ácido aspártico, beta-cianoalanina, e alotreonina; alinil e heterocicliJcarboniJ, aminocarbonil, amido, mono- ou dialquilaminocarbonil. mono- ou diarilaminocarbonil. alquilarilaminocarbonil, diarilaminocarbonil, mono- ou diacilaminocarbonil, acilo aromático ou alifático, alquilo opcionalmente substituído por substituintes seleccionados de amino, carboxi, hidroxi, mercapto, mono- ou dialquilamina, mono- ou diarilamina, alquilacilamina, diarilamina, mono- ou diacilamina, alcoxi. alquenoxi, ariloxi, tioalcoxi, tioalquenoxi, tioalquinoxi, lioariloxi e heterociclil.
Um composto preferido da fórmula T2-(J-T3-)n-L-X tem a estrutura: T4
I
Amida
36
onde G é (CFUVè tal que um hidrogénio num e só num dos grupos CH2 representado por um único S‘G” é substituído com - (CH2)c-Amida-T4; T2 e T4 são grupos orgânicos da fórmula C|. 25IV>0„.9HaF|) tal que a soma de α e β é suficiente para satisfazer as valências de outra forma insatisfeitas dos átomos de C, N e O; amida é 0 O
II II — N— C— ou —C —N —
I I R1 R' R1 é hidrogénio ou alquilo Cmo; c é um inteiro variando de 0 a 4; e n é um inteiro variando de 1 a 50 tal que quando n é maior do que 1. G, c, Amida, R1 e T4 são seleccionados independentemente.
Num seguinte arranjo preferido, um composto da fórmula T2-(J-T’-)„-L-X tem a estrutura: T4
Amida
X onde T2 é um grupo orgânico da fórmula Ci^NojjOo-gHaFp tal que a soma dc α e β é suficiente para satisfazer as valências de outra forma insatisfeitas dos átomos de C, N e O; e Τ'1 inclui uma amina terciária ou quaternária ou um ácido orgânico; m é um inteiro variando de 0 a 49, e T2,T\ R1, LeX foram definidos previamente.
Um outro composto preferido tendo a fórmula T2-(J-T3-)„-L-X tem a estrutura particular:
Amida
37
X onde 7-1 é um grupo orgânico da fórmula Ci^No-yOo.qHaFp tal que a soma de α e β é suficiente para satisfazer as valências de outra forma insatisfeitas dos átomos de C, N e O; e 'Γ inclui uma amina terciária ou quaternária ou um ácido orgânico; m é um inteiro variando de 0 a 49. e T2, T4, c, R1 ,”Amida’\ L e X foram definidos previamcnte.
Nas estruturas acima que têm um grupo T\ -Amida-T"’’ é de preferência um dos seguintes, que são apropriadamente feitos reagindo ácidos orgânicos com grupos amina livres que se estendem de “G”:
Onde os compostos acima têm um grupo T\ e o grupo “G” tem um grupo carboxílico livre (ou seu reactivo equivalente), então os grupos -Amida-T5 preferidos são os seguintes, que devem ser convenientemente preparados reagindo a apropriada amina orgânica com um grupo carboxílico livre que se estende de um grupo “G”: 38
(C,-Cl0) ,Ν· ο -CNH—(C,-C,
CN Η (Co-C 10) N(CrCU))2 · Ο —(_'Ν^ ^N(C|-C|o) e
O
Em três arranjos preferidos da invenção, T-L-MOI tem a estrutura: T4
Arnida
ou a estrutura: 39 Τ4 Amida
\(C,-CI0)_ODN —3’—OH
onde Ϊ2 e T4 são grupos orgânicos da fórmula Ci-ajNo.gOo-oSo.sPo-.iH^F[da tal que a soma de a, [3 e δ é suficiente para satisfazer as valências de outra forma insatisfeitas dos átomos de C, N, O, S e P; G é (Cíhfi.ft onde um e um só hidrogénio nos grupos CI-I2 representados por cada G é substituído com - (CH?)c-Amida-T4; Amida é
O O
II II — N— C— ou — C —N —
I I RI R1 R1 é hidrogénio ou alquilo Cm»; o é um inteiro variando de 0 a 4; '‘Cmo” representa um grupo hidrocarbileno tendo de 2 a 10 átomos de carbono, 'ODN-.V-OH” representa um fragmento de ácido nucleico tendo um grupo terminal 3'hidroxilo (/.<?., um fragmento de ácido nucleico ligado a (Cmo) noutra que não a extremidade 3'do fragmento de ácido nucleico); e 11 é um inteiro variando de 1 a 50 tal que 40
q uando η é maior do que 1, então G, c, Amida, R1 e T4 são seleccionados independentemente. Preferencialmente não há três heteroátomos ligados a um único átomo de carbono, onde T2 e T1 são grupos orgânicos da fórmula C|-2sNo-«)Oo-9HaFp tal que a soma de α e β é suficiente para satisfazer as valências de outra forma insatisfeitas dos átomos de C, N e O; G é (C’Hi)i.f, onde um e um só hidrogénio nos grupos CH2 representados por cada G é substituído com - (CI-fX-Amida-T4; Amida é O O
II II N— C— ou —C —N —
I I R1 R1 R1 é hidrogénio ou alquilo Cmo; c é um inteiro variando de 0 a 4; '(.)DN-3'-OH” representa um fragmento de ácido nucleico tendo um grupo terminal 3'hidroxil; e n é um inteiro variando de 1 a 50 tal que quando n é maior do que 1, G, c, Amida. K1 e Γ1 são seleccionados independentemente.
Em estruturas corno mencionadas acima que contêm um grupo T2-C(=0)-N(R')-. este grupo pode ser formado reagindo uma amina da fórmula 14N(R')- com um ácido orgânico seleccionado dos seguintes, que são apenas exemplos e não constituem uma lista exaustiva de potenciais ácidos orgânicos: Ácido fórmico, Ácido acético, Ácido propiólico, Ácido propiónico, Ácido lluoracético, Ácido 2-butinóico, Ácido ciclopropanocarboxílico. Acido butírico, Ácido metoxiaeético, Ácido difluoracélieo, Ácido 4-penlinóico, Ácido ciclohutanocarboxílico, Ácido 3,3-dimetilacrílico, Ácido valérico, Ν,Ν-dimetilglicina, N-Ibrmil-Gly-OH. Ácido ctoxiacctico, Ácido (metiltio)acético, Ácido pirrolc-2-carboxílico. Ácido 3-í'uróico, Ácido isoxazole-5-carboxílico. Ácido trans 3-hexenóico, Ácido triiluoracético, Ácido hexanóico, Ac-Gly-OH, Ácido 2-hidroxi-2-mctilbutírico, Ácido benzóico. Ácido nicotínico, Ácido 2-pirazinocarboxílico, Ácido l-metil-2-pirrolecarboxílico, Ácido 2-eiclopenteno- 1-acético, Ácido ciclopentilacético, Ácido (S)-(-)-2-pirrolidona-5-carboxílico, N-metil-L-prolina, Ácido heptanóico, Ac-b-Ala-OH, Ácido 2-etil-2-hidroxibnlíric.o. Árido ?-(?-metnxictoxi)acético. Ácido p-toluico. Ácido 6-metilnicotinico, Ácido 5-metil-2-pirazinocarboxílico, Ácido 2,5-dimetilpirrole-3-carboxílico, Ácido 4-lluorobenzóico. Ácido 3,5-dimetilisoxazole-4-carboxílico. Ácido 3-ciclopenlilpropiónico, Ácido oclanóico. Ácido N,N-climetilsuccinâmico, Ácido fenilpropiólico. Ácido cinâmico. Ácido 4-etilbenzóico. Ácido p-anísico. Ácido 1.2.5-lrimelilpirrole-3-carboxílico. Ácido 3- 41 (Uioro-4-metiIbenzóico, Ac-DL-propargilglicina, Ácido 3-(trifluorometil)butírico, Ácido 1-pipcridinapropiónico, N-acetiJprolina, Ácido 3,5-difluorobenzóico, Ac-L-Val-OH, Ácido indole-2-carboxílico, Ácido 2-benzofuranocarboxílico, Ácido benzotriazole-5-carboxílico, Ácido 4-n-propiIbenzóico, Ácido 3-dimetilaminobenzóico, Ácido 4-etoxibenzóico, Ácido 4-(metiltio)benzóico, N-(2-furoil)glicina, Ácido 2-(metiltio)nicotínico, Ácido 3-fluoro-4-meioxibenzóico, Tía-Gly—OH, Ácido 2-naftoico, Ácido quináldico, Ac-L-Ile-OH, Ácido 3-melilinde.no-2-carboxílico, Ácido 2-quinoxaIinecarboxílico, Ácido I -metilindole-2-carboxilico. Ácido 2,3,6-trifluorobenzóico, N-formil-L-Met-OH, Ácido 2-[2-(2-mc(oxietoxi)etoxi]acético, Ácido 4-n-butilbenzóico, N-benzoiigliciiia, Ácido 5-Huoroindole-2-citiboxílico, Ácido 4-n-propoxibcnzóico, Ácido 4-acetil-3,5-dimetil-2-pirrolecarboxílico, Acido 3,5-dimetoxibenzóico, Ácido 2,6-dimetoxinicotínico, Ácido ciclohexanopentanóico, Ácido 2-naftiJacético, Ácido 4-(lH-pirrol-i-iJ)benzóico, Ácido indole-3>propiónico. Ácido m-trifluoiOmetilbenzóico, Ácido 5-metoxiindole-2-carboxílico, Ácido 4-pentilbenzóico, Bz-b-Ala-OH, Ácido 4-dietilaminobenzóico, Ácido 4-n-butoxibenzóico, Ácido 3-metil-5-CF3-isoxazole-4-carboxílico, Ácido (3,4-dimetoxitenil)acético, Ácido 4-bifenilcarboxílico, Pivaloil-Pro-OH, UctanoiI-UIy-OH, Ácido (2-nafíoxi)acético, Ácido indole-3-butírico, Ácido 4-((rinuorometiI)fenilacético, Ácido 5-metoxindole-3-acético Ácido 4-(irilluorometoxi)benzóico, Ac-b-Phe-OH, Ácido 4-pentiloxibenzóico, Z-Uly-OH, 4-carboxil-N-(rur-2-ilmetil)pirrolidina-2-ona, Ácido 3,4-dietoxibenzóico, Ácido 2,4-dimetil-5-C02Et-l>ii rolc-.VcaiboxíIico, Ácido N-(2-fluorofenil)succinâmico, Ácido 3,4,5-trimetoxibenzóico, Ácido N-fenilantranílico, Ácido 3-fenoxibenzóico, Nonanoil-Gly-OH. Ácido 2-icnoxipiridina-3-cai'boxíIico, Ácido 2,5-dimctil-1 -('eiiilf)irrole-3-carboxílíco, Ácido trans-4-((rinuorometil)cinâmico, Ácido (5-metif-2-feniloxazol-4-il)acético, Ácido 4-(2-cidohexeniloxi)bcnzóico. Ácido 5-metoxi-2-mctilindolc-3-acctico, Ácidt) lians-4- cotininocarboxílico, Ácido Βζ-5-aminovalérico, Ácido 4-hexiloxibenzóico, Ácido N-(3-mcloxiienil)succinâniico, Z-Sar-OH, Ácido 4-(3,4-dimctoxifcnil)butírico, Ac-o-Pluoro-DL-Phe-OIl. Ácido N-(4-fluorofenil)glutarcâmico, Ácido 4'-etil-4-bifenilcarboxílico, Ácido 1.2.3,4-tetrahidroacridinocarboxílico, Ácido 3-í'enoxifenilacético, Ácido N (2,4- dilluoroFenil).succinâmico, N-Decanoil-Gly-OH, Ácido (+)-6-mctoxi-a-metil-2- naftnlcnoacclico. Ácido 3-(frifliioiOmetoxi)cinâmico, N-formil-DL-Trp-OH, Ácido (R)-(+)-a-metoxi-a-(1riHuorometil)fenilacético, Bz-DL-Leu-OH, Ácido 4- (liilluorometoxi)fenoxiacético. Ácido 4-heptiloxibenzóico, Ácido 2.3.4-1rimeto\·idnâmico. 42 2.6-Dimetoxibenzoil-Gly-OH, Ácido 3-(3,4,5-trimetoxifenuil)propiónico, Ácido 2,3,4,5,6-penlafluorofenoxiacético, N-(2,4-difluorofenil)glutarâmico, N-Undecanoil-Gly-OH, Ácido 2-(4-tluorobenzoil)benzóico, Ácido 5-trifluorometoxindole-2-carboxíIico, Ácido N-(2,4-diíluorofenil)diglicolâmico, Ac-L-Trp-OH, Tfa-L-Fenilglicina-OH, Ácido 3-iodobenzóico, Ácido 3-(4-n-pentilbenzoil)propiónico, Ácido 2-fenil-4-quinolinocarboxílico, Ácido 4-octiloxibenzóico, Bz-L-Met-OH, Ácido 3,4,5-trietoxibenzóico, N-Lauroil-Gly-OH, Ácido 3.5-bis(trifluorometil)benzóico, Ac-5-Metil-DL-Trp-OH, Ácido 2-iodofenilacético, Ácido 3-iodo-4-metilbenzóico. Ácido 3-(4-n-hexilbenzoil)propiónico, N-Hexanoil-L-Phe-OH, Ácido 4-noniloxibenzóico, Ácido 4'-(trifluorometil)-2-bifenilcarboxílico, Bz-L-Phe-OH, N-Tridecanoil-Gly-OH, Ácido 3,5-bis(trifluorometil)fenilacético, Ácido 3-(4-n-heptilbenzoil)propiónico, N-Hepitanoil-L-Phe-OH, Ácido 4- deciloxibenzóico. Ácido N-(a, a, a -triíluoro-m-toIiI)antraníIico, Ácido niflúmico, Ácido 4-(2-hidroxihexafluoroisopropil)benzóico, N-Miristoil-Gly-OH, Ácido 3-(4-n-octilbenzoil)propiónico, N-Octanoil-L-Phe-OH, Ácido 4-undeciloxibenzóico, 3-(3,4,5-Trimetoxifenil)propionil-Gly-OH, Ácido 8-iodonaftóico, Ácido N-pentadecanoil-Gly-OH, Ácido 4-dodeciloxibenzóico, N-Palmitoil-GIy-OH e N-Estearoil-Gly-OH. Estes ácidos orgânicos estão disponíveis em um ou mais de Advanced ChemTech, Louisville, KY; Bachem Bioscience Inc., Torrance, CA; Calbiochem-Novabiochem Corp., San Diego, CA; Farchan Laboratories Inc., Gainesville FL; Lancaster Synthesis, Windham NH; e MayBridge Cbemical Company (c/o Ryan Scientific), Columbia, SC. Os catálogos destas companhias usam as abreviações que foram usadas acima para identificar os ácidos. f. Química Combinatória como Meio de Preparação de Marcadores A química combinatória é um tipo de estratégia sintética que leva à produção de grandes bibliotecas químicas (ver, por exemplo, PCT Application Publication No. WO 94/08051). Estas bibliotecas combinatórias podem ser usadas como marcadores para a identificação de moléculas de interesse (MOIs). A química combinatória pode ser definida como a ligação covalente sistemática e repetitiva de um conjunto de “blocos de construção” diferentes de estruturas variantes entie si para originar uma grande formação de entidades moleculares diversas. Os blocos de construção podem tomar várias formas, sintéticas e 43 ocorrendo naturalmente, tais como nucleófilos, electrófilos, dienos, agentes de alquilação ou dc acilação, diaminas, nucleótidos, aminoácidos, açucares, lípidos, monómeros orgânicos, sinlons, e combinações destes. As reacções químicas usadas para ligar os blocos de construção podem envolver alquilação, acilação, oxidação, redução, hidrólise, substituição, eliminação, adição, ciclização, condensação, e semelhantes. Este processo pode produzir bibliotecas de compostos que são oligoméricos, nâo-oligoméricos, ou suas combinações. Se oligoméricos, os compostos podem ser ramificados, não ramificados, ou cíclicos. Exemplos de estruturas oligoméricas que podem ser preparadas por métodos combinatórios incluem oligopéptidos, oligonucleótidos, oligossacáridos, polilípidos, poliésteres, poliamidas, poliuretanos, poliureias, poliéteres, poli(derivados de fósforo), e.g., fosfatos, losfonatos, Ibslbramidas, fosfonamidas, fosfitos, fosfinamidas, etc. e poli(derivados de enxofre), e.g., sul lonas, sulfonatos, sulfitos, sulfonamidas, sulfenamidas, etc.
Um tipo comum de biblioteca combinatória de oligómeros é a biblioteca combinatória de péptidos. Inovações recentes na química dos péptidos e em biologia molecular permitiu bibliotecas consistindo de dez a centenas dc milhões de diferentes sequências de péptidos a ser preparadas e usadas. Estas bibliotecas podem ser divididas em três categorias largas. Uma categoria das bibliotecas envolve a síntese química de bibliotecas de péptidos não ligados a suportes solúveis, (e.g., Houghten et al., Nature 554:84, 1991). Uma segunda categoria envolve a síntese química de bibliotecas de péptidos ligados a suportes, presentes em suportes sólidos tais como pinos de plástico, esferas de resina, ou algodão (Geysen et al., Mol. Immunol. 23:709, 1986; Lam et al., Nature 354:82, 1991 ; Eichler e Houghten. Binchemistry 32:11035, 1993). Nestas duas primeiras categorias, os blocos de construção são tipicamente L-aminoácidos, D-aminoácidos, aminoácidos não naturais, ou alguma mistura ou combinação destes. Uma terceira categoria usa uma abordagem da biologia molecular para preparar péptidos ou proteínas na superfície de partículas de fagos Πlamentosos ou plasmídcos (Scott c Cruig, Curr. Opinion Biotech. 5.40, 1994). Dibliotccas de péptidos não ligados a suportes solúveis, parecem ser adequadas para um numero de aplicações, incluindo o uso como marcadores. O reportório disponível dc diversidades químicas em bibliotecas de péptidos pode ser aumentado por passos lais como a permetilação (Oatresb et al., Proc. Natl. Acad Sei, USA 91Λ 1138. 199Ί).
Numerosas variantes de bibliotecas combinatórias de péptidos são possíveis, nas quais a estrutura do péptido é modificada, e /ou as ligações amida têm sido substituídas por grupos miméticos. Grupos amida miméticos que podem ser usados incluem ureias, uretanos e grupos carbonilmetileno. Reestruturando a estrutura tal que as cadeias laterais emanem preferivelmente dos azotos da amida de cada aminoácido do que dos carbonos-alfa, origina bibliotecas de compostos conhecidos como peptoides (Simon et al., Proc. Naíl. Acad. Sei.., USA 89:9367, 1992).
Um outro tipo comum de biblioteca combinatória de oligómeros é a biblioteca combinatória de oligonucleótidos, onde os blocos de construção são uma forma de nucleótidos ou derivados de polissacáridos ocorrendo naturalmente ou não naturalmente, incluindo onde vários grupos orgânicos e inorgânicos podem substituir as ligações fosfato, e o azoto ou o enxofre pode substituir o oxigénio numa ligação éter (Schneider et al., Biochem. 34:9599, 1995; Freier et al., J. Med. Chem. 38 :344, 1995 ; Frank, .7. Biotechnology 41:259, 1995; Schneider et al., Published PCT WO 942052; Ecker et al., Nucleic Acids Res. 21:1853, 1993).
Mais recentemente, a produção combinatória de colecções de compostos moleculares pequenos não oligoméricos tem sido descrita (DeWitt et al., Proc. Natl. Acad. Sei... USA 90:690, 1993; Bunin et al., Proc. Natl. Acad. Sei., USA 9/:4708, 1994). Estruturas adequadas à elaboração dentro de bibliotecas de moléculas pequenas incluem uma larga variedade de moléculas orgânicas, por exemplo, heterocíclicos, aromáticos, alicíclicos, alifáticos, esteroides, antibióticos, inibidores de enzimas, ligandos, hormonas, fármacos, alcaloides, opióides, terpenos, porfirmas, toxmas, catalisadores, assim como suas combinações. g. Métodos Específicos para Síntese Combinatória de Marcadores
Dois métodos para a preparação e uso de um conjunto diverso de marcadores MS contendo amina são descritos abaixo. Em ambos os métodos, é empregada a síntese em fase sólida para permitir a síntese paralela simultânea de um grande número de ligantes marcados, usando as técnicas dc química combinatória. No primeiro método, a eventual corte do marcador do oligonucleótido resulta na libertação de uma amida carboxílica. No segundo método, o corte do marcador produz um ácido carboxílico. Os componentes químicos e elementos de ligação usados nestes métodos são abreviados como se segue: 45
R FM 00 ΛΙΙ C02ll OONIl· NIB OH CONH COO NHj-Rink- C02I-I = resina = grupo de proteção fluorenilmetoxicarbonil = grupo de proteção alilo = grupo ácido carboxílico = grupo carboxílico amida = grupo amina = grupo hidroxilo = ligação amida = ligação éster = ácido 4-[(a-amino)-2,4-dimetoxibenzilj-tenoxibutírico (ligante de Rink)
Oi I-1 MeO- C02i I 01 I-2McO- C02H NHtA-COOI 1= = ácido (4-hidroximetii) íenoxibutírico = ácido (4-hidroximetil-3-metoxi) fénoxiacético aminoácido com uma função amina aromática ou alifática na cadeia lateral X1....Xn-COOH - conjunto de n ácidos carboxílicos diferentes com pesos moleculares únicos oligo 1 ...oligo(n) — conjunto de n oligonucleólidos l-IBTU = O-benzotriazol-1 -yl-N,N.N',N '-tetrametiluronio hcxafluorofosfato Λ set|uència de passos no Método 1 é como se segue:
OH-2McO CONH R 4 FM0C-NH-Rink-C02H; par (e.g., HBTU)
FMOC NH Rink COO-2MeO-CONI-I-R 4 piperidina (remover FMOC)
N1-0 R i nlt- COO-2 MeO-CON I-l-R 4 FMOC-NH-A-COOH; par (e.g„ HBTU)
FMOC-NH-A-CONI-I-Rink-COO-2McO-CONII-R 4 piperidina (remover FMOC)
NI-O-A-CONI I-Rink-COO-2McO-CONI I-R 4 dividir em n alíquotas
44444 liuar a n ácidos diferentes Xl....Xn-COOH 46
X1 ....Xn-CONH-A-CONH-Rink-COO-2MeO-CONH-R
-UU1 cortar ligantes marcados da resina com 1 % TFA
X1 ....Xn-CONH-A-CONH-Rink-C02H 44444 ligar a n oligos (oligo 1 ....oligo(n)) (e.g., via ésteres Pfp) XI ....Xn-CONH-A-CONH-Rink- CONH- oligo 1 ....oligo(n) 4 conjunto de oligos marcados 4 realizar reacção de sequenciação
4- separar fragmentos de diferentes tamanhos da reacção de sequenciação (e.g., via HPLC ou CE 4 cortar marcadores dos ligantes com 25%-l00% TFA
XI.... X n-CONH-A-CONH
I analisar por espectrometria de massa A sequência de passos no Método 2 é como se segue: (.).11-1 MeO-COr-All I FM0C-NH-A-C02H; par (e.g., HBTU) FMOC-NFJ-A-COO-1 McO- C02-A11 4 paládio (remover Alilo) F M OC-NH-A-COO-1 MeO- C02 4 OH-2MeO-CONH-R; par (e.g., HBTU)
FM OC-NII-A-COO-1 MeO-C.OO-2MeO-CONH-R 4 piperidina (remover FMOC)
N FB-A-COO-1 MeO-COO-2MeO-CONH-R 4 dividir em n alíquotas
44444 ligar a n ácidos diferentes XI ....Xn-COOFI
X1 ....Xn-CC)NH-A-COO-lMeO-COO-2MeO-CONH-R
44 444 cortar ligantes marcados da resina com 1% TFA
X I ....Xn-CONH-A-COO-l Me()-C02H 4' 4· 4 ligar a n oligos (oligo 1 ....oligo(n)) (e.g., via ésteres Pfp) XI .....Xn-CONH-A-COO-lMeO-CONH- oligo 1 ....oligo(n) 47 X conjunto de. oligos marcados I realizar reacção de sequenciação X separar fragmentos de diferentes tamanhos da reacção de sequenciação (e.g., via HPT.C ou CF.
X cortar marcadores dos ligantes com 25%-100% TFA
X1 ....Xn-CONH-A- COjH
X analisar por espectrometria de massa 2. Liaantes
Um componente “ligante” (ou L), como aqui usado, significa quer uma ligação covalcnte directa quer um grupo químico orgânico que é usado para ligar um “marcador” (ou T) a uma molécula de interesse (ou MOI) através de ligações químicas covalentes. Em adição, a própria ligação directa, ou uma ou mais ligações dentro do componente ligante é quebrável em condições que permitem que T seja libertado (noutras palavras, cortado) do restante do composto T-L-X (incluindo o componente MOI). O componente variável do marcador que está presente em T deve ser estável às condições de corte. De preferência, a corte pode ser realizado rapidamente; em poucos minutos e preferencialmente em cerca de 15 segundos ou menos.
Em geral, um ligante é usado para ligar cada elemento de um grande conjunto de marcadores a cada elemento de um igualmente grande conjunto de MOIs. Tipicamente, urna única combinação marcador-ligante é unida a cada MOI (para dar vários Τ-Ι.--ΜΟΓ), mas em alguns casos, mais do que uma combinação marcador-ligante pode ser unida a cada MOI individual (para dar vários (T-L)n-MUl. Numa outra organizaçao da presente invenção, dois ou mais marcadores são ligados a um único ligante através de múltiplos locais independentes no ligante, e esta múltipla combinação marcador-ligante é então ligada a um MOI individual (para dar vários (T)n-L-MOI).
Depois de várias manipulações do conjunto de MOIs marcados, condições físicas e/ou químicas especiais são usadas para cortar uma ou mais ligações covalcnte no ligante. resultando na libertação dos marcadores dos MOIs. A(s) ligação (ões) quebrável(eis) podem ou não ser algumas das mesmas ligações que foram formadas quando o marcador, o ligante. c a MOI foram unidos. O desenho do ligando irá, em grande parte, determinar as 48 condições sob as quais o corte deve ser realizado. Por conseguinte, os ligantes podem ser identificados pelas condições de corte às quais são particularmente susceptíveis. Quando um ligante é instável à luz (i.e., predisposto ao corte por exposição a radiação actinica), deve ser dada a designação ao ligante Lhlt. Da mesma forma, as designações Liludo, Lhas“, L|0J ,L[I^, Len/ . Lcle, L,a e Lvs podem ser usados para se referir aos ligantes que são particularmente susceptíveis à corte por ácido, base, oxidação química, redução química, actividade catalítica de um enzima (mais simplesmente “enzima”), oxidação ou redução elcctroquímica, temperatura elevada (“térmica”) e permuta de tiol, respectivamente.
Alguns tipos de ligantes são instáveis a um único tipo de condições de corte, enquanto outros são instáveis a muitos tipos de condições de corte. Adicionalmente, em ligantes capazes de ligar múltiplos marcadores (para dar estruturas do tipo (T)n-L-MOI)), cada um dos locais de ligação do marcador pode ser instável a diferentes condições de corte. Por exemplo, num ligante com dois marcadores ligados a ele, um dos marcadores pode ser instável apenas a uma base, e o outro instável apenas a fotólise.
Um ligante que é útil na presente invenção possui muitos atributos: 1) O ligante possui uma pega química (Lh) através da qual pode ser ligado a uma MOI. 2) O ligante possui uma segunda pega química (Lh) separada através da qual o marcador é ligado ao ligante. Se a um único ligante estiverem ligados múltiplos marcadores (estruturas do tipo (T)n-L-MOI)), então existe para cada marcador uma2) O ligante possui uma segunda pega química (Lh) separada através da qual o marcador é ligado ao ligante. Sc a um único ligante estiverem ligados múltiplos marcadores (estruturas do tipo (T)n-L-MOl)), então existe para cada marcador uma pega separada. 3) O ligante é estável a todas as manipulações a que é sujeito, com excepção das condições que permitem o corte em que um grupo contendo T é libertado do restante do composto, incluindo o MOI. Assim, o ligante é estável durante a ligação do marcador ao ligante. a ligação do ligante à MOI, e quaisquer manipulações da MOI enquanto o marcador e o ligante (T-L) lhe estiverem ligados. 4) O ligando não interfere significativamente com as manipulações realizadas na MOI enquanto T-L está ligada a esta. Por exemplo, se T-L estiver ligado a um oligonucleótido, T-L não deve interferir significativamente com qualquer hibridização ou 49 reacções enzimáticas (e.g., PCR) realizadas no oligonucleótido. Da mesma forma, se T-L está ligado a um anticorpo, não deve interferir significativamente com o reconhecimento do antigcnio pelo anticorpo. 5) O corte da ligação do marcador com o restante do compostos ocorre de uma Ibnna muito controlada, usando processos físicos ou químicos que não afectam adversamente a delectabilidade do marcador.
Para qualquer ligante, é preferível que o ligante seja passível de ser ligado a uma grande variedade de MOls, e que uma grande variedade de marcadores seja passível de ser ligado ao ligante. Esta flexibilidade é vantajosa porque permite que uma biblioteca de conjugados T-L, uma vez preparada, seja usada com muitos conjuntos diferentes de MOls.
Como explicado acima, um ligante preferido tem a fórmula L„-L1-L2-L3-Lh onde cada L|, é uma pega reactiva que pode ser usada para ligar o ligante a um reagente marcador e a uma molécula reagente de interesse. L2 é uma parte essencial do ligante, uma vez que L2 fornece instabilidade ao ligante. L1 e L3 são grupos opcionais que servem efeelivamente para separar L2 da pega L|,. L1 (que, por definição, está mais próximo de T do que LJ), serve para separar T do requerido grupo instável IÂ Esta separação pode ser útil quando a reacção de corte origina espécies particularmente reactivas {e.g., radicais livres) que podem causar modificações aleatórias na estrutura do grupo contendo T. A medida que o local de corte é mais afastado do grupo contendo T, há uma menor probabilidade de que espécies reactivas formadas no local de corte destruam a estrutura do grupo contendo T. Também, como os átomos em L1 estarão tipicamente presentes no grupo contendo T, estes átomos L1 podem dar uma qualidade desejável ao grupo contendo T. Por exemplo, quando o grupo contendo T é um grupo contendo Ί e uma amina impedida está desejavelmente presente como parte da estrutura do grupo contendo Tn,\ (para servir, e. g., como um MSSE), a amina impedida pode estar presente no grupo instável L'.
Noutros casos, L1 e/ou L3 podem estar presentes num componente de um ligante apenas porque O fornecedor comercial de uni ligando escolheu vender o ligando numa forma tendo esse grupo L1 e/ou L\ Neste caso, não há nenhum inconveniente em usar ligandos lendo grupos L1 c/ou L·’ (desde que estes gmpo3 não inibam a reacção de corte), apesar de puderem não contribuir com nenhuma vantagem particular de comportamento aos compostos que os incorporam. Assim, a presente invenção permite aos grupos L1 e/ou 1/ estarem presentes no componente do ligando.
Grupos L1 e/ou LJ podem ser uma ligação directa (neste caso o grupo não está elèctivamenle presente), um grupo hidrocarbileno (e.g., alquileno, arileno, cicloalquileno, ele). -O-hidrocarbileno (e.g., -O-CH2-, O- CIl2CH(CEb)-,etc.) ou hidrocarbileno-(0-hidrocarbileno)w- onde w é um inteiro que varia entre 1 e cerca de 10 (e.g., -CFG-O-Ar-.-CI-L·-(O-Cd bCHjlr, etc.).
Com 0 aparecimento da síntese de fase sólida, uma grande quantidade de literatura tem-se desenvolvido relativamente aos ligandos que são instáveis a condições de reacção específicas. Em sínteses de fase sólida típicas, um suporte sólido é ligado através de um ligando instável a um local reactivo, e uma molécula a ser sintetizada é gerada no local reactivo. Quando a molécula tiver sido completamente sintetizada, a construção sólida suporle-ligando-molécula é sujeita a condições de corte que libertam a molécula do suporte sólido. Os ligantes instáveis que têm sido desenvolvidos para uso neste contexto (ou que podem ser usados neste contexto) podem também ser fácilmente usados como o reagente ligando na presente invenção.
Lloyd-Williams, P., et al., “Convergent Solid-Phase Peptide Synthcsis”, Tetrahedron Report No. 347, 49(48):11065-11133 (1993) fornece uma extensiva discussão de ligandos que são instáveis a radiação actínica (i.c., fotólise), assim como a ácido, base e outras condições de corte. Fontes adicionais de informação acerca de ligandos instáveis são bem conhecidas na área.
Como descrito acima, diferentes desenhos de ligandos irão conferir capacidade dc corte (‘'instabilidade”) em condições físicas ou químicas específicas diferentes. Exemplos de condições que servem para cortar vários desenhos dc ligandos incluem condições ácido, base, oxidação, redução, fluoreto, permuta de tiol, fotólise c enzimática.
Exemplos de ligandos com capacidade de serem cortados que satisfazem os critérios gerais para os ligando listados acima são bem conhecidos aos da área c incluem aqueles encontrados no catálogo disponível da Pierce (Rockford, IL). Exemplos incluem: • glicobis(succiiiimidilsuccinato) ctileno (EGS). um reagente de ligações cruzadas amina reactivo que é quebrável por hidroxilamina (1M a 37°C durante 3-6 horas); 51 • fartarato de disuccinimidil (DST) e sulfo-DST. um reagente de ligações cruzadas amina reactivo quebrável por 0.015 M periodato de sódio; • bis[2-(succinimidiloxicarboniloxi)etil]sulfona (BSOCOES) e sulfo-BSOCOHS. que são reagentes de ligações cruzadas amina reactivo, quebráveis por base (pH I 1.6): • l,4-di-[3'-(2'-piridilditio(propionamida))]butano (DPDPB), um ligante cruzado piridilditiol que é quebrável por permuta de tiol ou por redução; • N-[4-(p-azidosalicilamido)-butil]-3'-(2'pirididitio)propionamida (APDP), um lignnie cruzado piridilditiol que é quebrável por permuta de tiol ou por redução; • bis-[beta-4- azidosalicilamido)etil]-dissulfureto (SADP), um ligante cruzado foto reactivo que é quebrável por permuta de tiol ou por redução: • N-succmimidil-(4-azidofenil)-l,3’ditiopropionato (SADP), um ligante cruzado lotorcíictivo que é quebrável por pemuta de tiol ou por redução, • sulfosuccinimidil-2-(7-azido-4-metilcumarina-3-acetamida)etil-l ,3 '-ditiopropionato (SAF.D), um ligante cruzado fotoreactivo que é quebrável por permuta de tiol ou por redução; • sul fosuccinimidil-2-(m-azido-o-nitrobenzamida)etil-1,3 '-ditiopropionato (SAND), um ligante cruzado fotoreactivo que é quebrável por permuta de tiol ou por redução;
Outros exemplos de ligantes quebráveis e de condições de corte que podem ser usados para libertar os marcadores são como se segue. Um grupo ligante silil pode ser cortado por fluorclo ou sob condições ácidas. Um grupo de ligação 2-nitrobenziloxi 3-,4-,5-, ou 6-substituido ou 4-nitrobenziloxi 2-,3-,5-, ou 6-substituido pode ser cortado por uma fonte de fotões (fotólise). Um grupo de ligação 2-alcoxifenoxi 3-,4-,5-, ou 6-substituido ou 4-alcoxiíenoxi 2-,3-,5-, ou 6-substituido pode ser cortado por Ce(NH4)2(NO;i)f, (oxidação). Um ligante NCO? (uretano) pode ser cortado por hidróxido (base), ácido, ou LiAlH4 (redução). I Jm grupo de ligação 3-pentenil, 2-butenil, ou 1-butenil pode ser cortado por ();, O.sCVKV, ou KMnO.1 (oxidação). Um grupo de ligação 2-[furii 3-,4- ou 5-substituido]oxi pode ser CORTADO por 02, Brç, MeOH, ou ácido.
As condições para 0 corte de outros grupos de ligação instáveis incluem: grupos de ligação t-alquiloxi podem ser cortados por ácido; grupos de ligação metil(dialquil)meloxi ou 2-ak|uilo-l,3-dioxano-2-il 4-substituido podem ser cortados por H3O": grupos de ligação 52 2-sililetoxi podem ser cortados por fluoreto ou ácido; grupos de ligação 2-(X)-etoxi (onde X = ceto. éster antida, ciano, NO2, sulfureto, sulfoxido, sulfona) podem ser cortados sob condições alcalinas; grupos de ligação benziloxi 2-,3-,4-,5-,ou 6-substituido podem ser cortados por ácido ou sob condições redutoras; grupos de ligação 2-buteniloxi podem ser cortados por (Plv,P):,RhCI(H) ; grupos de ligação 2-bromofcnoxi 3-,4-,5-,ou 6-substituido podem ser cortados por Li, Mg ou BuLi; grupos de ligação metiltiometoxi podem ser cortados por Hg2+; grupos de ligação 2-(X)-etiloxi (onde X=halogénio) podem ser cortados por Zn ou Mg; grupos de ligação 2-hidroxietiloxi podem ser cortados por oxidação (e.g., com Pb(OAc)4).
Ligantes preferíveis são aqueles que são cortados por ácido ou fotólise. Muitos tios ligantes instáveis ao ácido que têm sido desenvolvidos para síntese de péptidos em fase sólida são úteis para ligar marcadores a MOIs. Alguns destes ligandos são descritos numa revisão recente por Lloyd-Williams et al. (Tetrahedron 49:11065-11133, 1993). Um tipo de liganlc útil é baseado em álcoois p-alcoxibenzilícos, dos quais 2, o ácido 4-hidroximetilfenoxiacético e o ácido 4-(4-hidroximetil-3-metoxiíenoxi)butírico e estão comercialmente disponíveis em Advanced ChemTech (Louisville, KY). Ambos os ligantes podem ser ligados a um marcador através de uma ligação éster ao álcool benzíiico, e a uma MOI contendo uma amina através de uma ligação amida ao ácido carboxílico. Os marcadores ligados por estas moléculas são libertados da MOI variando a concentração de ácido trilUioroacético. Os cortes destas ligações resultam na libertação de um ácido carboxílico no marcador. O corte ácido de marcadores ligados através de ligantes relacionados, tais como 2.4-dimetoxi-4'-(carboximetiloxi)-benzhidrilamina (disponível em Advanced ChemTech na forma FMOC protegida), resulta na libertação de uma amida carboxílica no marcador libertado.
Os ligantes instáveis à luz úteis para esta aplicação têm também sido. na maior parte, desenvolvidos para síntese de péptidos em fase sólida (ver revisão de Lloyd-Williams). hstes ligandos sao gcralmente baseados em 2-nitrobenzilésteres ou 2-nitrobenzilaiiiidas. Dois exemplos de ligantes sensíveis à luz que também têm sido recentemente relatados na literatura são o ácido 4-(4-( l-Fmoc-amino)etil)-2-ineloxi-5-iiitiOfenoxi)butanóico (Ilolmcs c Joncs, J. Org ('hem. 60:2318-2319, 1995) e 0 ácido 3-(Fmoc-amino)-3-(2-nitrofenil)propiónico (Brown el al.. Molecular Diversity /:4-12, 1995). Ambos os ligandos podem ser ligados através do ácido carboxílico a uma amina na MOI. A ligação do marcador ao ligando é feita por formação dc uma amida entre o ácido carboxílico no marcador e a amina no ligante. O corte de ligantes instáveis à luz é geralmente realizado com luz UV de comprimento de onda de 350 nm a intensidades e tempos conhecidos das pessoas da área. O corte dos ligantes resulta na libertação de uma amida primária no marcador. Exemplos de ligantes quebráveis pela luz incluem ésteres de nitrofenilglicina, cloretos e melanosulfonatos de exo- e endo-2-benzonorborneil, e ácido 3-amino-3(2-nitrofenil) propiónico. Exemplos de cortes enzimáticos incluem esterases que cortarão ligações ésteres, nucleases que cortarão ligações fosfodiéster, proteases que cortarão ligações peptídicas, etc.
Um componente ligante preferido tem uma estrutura orto-nitrobenzílica como mostrado abaixo: d
onde nm átomo de carbono nas posições a, b, c, d ou e é substituído com -L/-X, e L1 (que é preferencialmente uma ligação directa) está presente para a esquerda de N(Il') na estrutura acima. Um componente ligante assim é susceptível de induzir selectivamente por luz o corte da ligação entre o carbono marcado “a” e N(R'). A identidade de R1 não é tipicamente crítica para a rcacção de corte, contudo R1 é preferencialmente seleccionado do hidrogénio e hidrocarbil. A presente invenção possibilita que na estrutura acima -NfR1)- possa ser substituído por -0-. Também, na estrutura acima, uma ou mais posições b, c, d ou c podem ser opcionalmente substituídas com alquilo, alcoxi, lluoreto, cloreto, hidroxilo, carboxilato ou amida. onde estes substituintes são seleccionados independentemente em cada caso.
Um outro componente ligante preferido com uma pega química L|, tem a seguinte estrutura: d
54 onde uma ou mais posições b, c, d ou e é substituída com hidrogénio, alquilo, alcoxi, fluoreto, cloreto, hidroxilo, carboxilato ou amida. R1 é hidrogénio ou hidrocarbil, e R2 é -OH ou um grupo que protege ou active um ácido carboxílico de se unir com outro grupo. Grupos fluorocarboneto e hidrofluorocarboneto são grupos preferidos que activam um ácido carboxílico a unir-se com outro grupo. 3. Moléculas de Interesse (MOI1
Exemplos de MOIs incluem ácidos nucleicos ou análogos de ácidos nucleicos (£·.£.. PNA), fragmentos de ácidos nucleicos (i.e fragmento de ácidos nucleico), ácidos nucleicos ou fragmentos sintéticos, oligonucleótidos (e.g., DNA ou RNA). proteínas, péptidos. anticorpos ou fragmentos de anticorpos, receptores, ligantes rcceptores. membros de um par ligante, eitoquinas, hormonas, oligossacáridos, moléculas orgânicas sintéticas, fármacos, e suas combinações. MOls preferidas incluem fragmentos de ácidos nucleicos. Fragmentos de ácidos nucleicos preferidos são sequências iniciadoras que são complementares a sequências presentes nos vectores, onde os vectores são usados para sequenciação de bases. De preferencia um fragmentos de ácidos nucleico é ligado directamente ou indirectamente a um marcador noutro local que não a extremidade 3'do fragmento; e mais preferencialmente na extremidade 5' do fragmento. Fragmentos de ácidos nucleicos podem ser comprados ou preparados baseados cm bases de dados genéticas (e.g., Dib et al., Nature S8U\ 152-154, 1996 c CE PH Genotype Database, http://vvww.cephb.fr) e vendedores comerciais (e.g.. Promega, Madison, Wl).
Como aqui usado, a MOI inclui derivados de uma MOÍ que contém uma funcionalidade útil na ligação da MOI a um composto T-L-L|,. Por exemplo, um fragmento de ácido nucleico que tem um fosfodiéster na extremidade 5', onde o fosfodiéster está também ligado a uma alquilenamina, é uma MOI. Uma MOI assim está descrita em, e.g. U.S. Patente 4,762.779 que está aqui incorporada por referência. Um fragmento de ácido nucleico com uma modificação interna é também uma MOI. Um exemplo de uma modificação interna dc um fragmento de ácido nucleico é onde a base (e.g., adenina, guanina, citosina, timina, uracilo) foi modificada para adicionar um grupo funcional reactivo. Estes fragmentos de ácido nucleico assim intemamente modificados estão comercialmente disponíveis em, e.g., Glen Uesenrch. í-lorndon, V. Λ. . Um outro exemplo de uma modificação interna de um fragmento 55 de ácido nucleico é onde um fosforamidato abásico é usado para sintetizar um fosfodiéster modificado que é colocado entre um açúcar e um grupo fosfato de um fragmento de ácido nucleico. O fosforamidato abásico contém um grupo reactivo que permite que um fragmento de ácido nucleico que contém este grupo derivado de fosforamidato seja ligado a outro grupo, e.g., um composto T-L-Li,. Estes fosforamidatos abásicos são comercialmente disponíveis em, e.g.. Clonetech Laboratories, Inc., Paio Alto, CA. 4. Pegas Químicas (Li,)
Uma pega química é um arranjo atómico reactivo ainda estável presente como parte de uma primeira molécula, onde a pega pode sofrer uma reacção química com uma pega química complementar presente como parte de uma segunda molécula, de forma a formar uma ligação covalente entre as duas moléculas. Por exemplo, a pega química pode ser um grupo hidroxilo, e a pega quimica complementar pode ser um grupo ácido carboxílico (ou um seu derivado activado, e.g., éster hidrofluoarilo), em consequência do que a reacção entre estas duas pegas forma uma ligação covalente (especifícamente, um grupo éster) que junta as duas moléculas.
As pegas químicas podem ser usadas num grande numero de reacções que Ibrmam ligações covalentes que são adequadas para ligar marcadores a ligantes, e ligantes a MOls. Estas reacções incluem alquilação (e.g., para formar éteres, tioéteres), acilação (e.g, para Ibrmar esteres, amidas, carbamatos, ureias, tioureias), fosibrilaçâo (e.g., para formar Ibsfatos. fosfonatos, fosforamidas, fosfonamidas), sulfonilação (e.g., para formar sulfonatos, sulfonamidas), condensação (e.g., para formar munas, oximas, hidrazonas), siliiaçáo, formação dc dissulfureto, e geração de intermediários reactivos, tais como nitrenos ou carbenos, por fbtóiise. Em geral, pegas e reacções de formação de ligações que sao adequadas para ligar marcadores a ligantes são também apropriadas para ligar ligantes a MOls, e vice-versa. F.m alguns casos, a MOI pode sofrer uma prévia modificação ou derivatização para proporcionar a pega necessária para ligar o ligante.
Um tipo de ligaçãu especialmente útil para ligar ligantes a MOls c a ligação dc dissulfureto. A sua formação requer a presença de um grupo tiol (“pega”) no ligante, e um outro grupo tiol na MOI. Condições suaves dc oxidação são então suficientes para ligar os dois tiois como dissulfureto. A formação dc dissulfuretos pode também ser induzida usando um excesso dc um reagente de permuta dissulfureto apropriado, e.g., piridilo dissulfuretos. 56
Uma vez que a formação de dissulfureto é facilmente reversível, o dissulfureto pode também ser usado como a ligação quebrável para libertação do marcador, se desejado. Isto é tipicamente realizado em condições suaves semelhantes, usando um excesso de reagente de permuta de tiol apropriado, e.g., ditiotreitol.
Dc particular interesse para ligar marcadores (ou marcadores com ligantes) a oligonucleotidios é a formação de ligações amida. Pegas de aminas alifáticas primárias podem ser facilmente introduzidas em oligonucleótidos sintéticos com fosforamiditas tal como 6-monomefoxitritilhexilcianoetil-N.N-diisopropil fosforamidita (disponíveis em Glenn Research, Sterling, VA). As aminas encontradas em nucleótidos naturais tais como a adenosina e a guanosina são virtualmente não reactivas quando comparadas com a amina primária introduzida. Esta diferença na reactividade está na base da capacidade de sclectivamente formar amidas e grupos de ligação relacionados (e.g., ureias, tioureias, sulfonamidas) com a amina primária introduzida, e não com as aminas do nuclcótido.
Como listado no catálogo Molecular Probes (Eugene,OR), uma enumeração parcial de grupos funcionais amino-reactivos inclui ésteres carboxílicos activados, i soei anatos, isotiocíanatos, halogenetos de sulfonilo, e diclorotriazenos. Esteres activos são excelentes reagentes para modificações da aminas uma vez que os produtos amida formados são muito estáveis. Também, estes reagentes têm uma boa reactividade com aminas alifáticas e baixa reactividade com aminas nucieotídicas. Exemplos de ésteres activos incluem ésteres de N- hidroxisuccinimida, ésteres de pentafluorofenilo, ésteres de tetratluorofemlo, e ésteres de p-nitrofenilo. Ésteres activados são úteis porque podem ser feitos de virtualmente qualquer molécula que contenha um ácido carboxílico. Métodos para fazer ésteres activos estão listados cm Bodansky (Principies ofPeptide Chemistry (2d ed.), Springer Verlag, Londres, 1993). 5. Liuacão Lieante
Tipicamente, um único tipo de ligaule é usado para ligar um conjunto ou família de marcadores particular a um conjunto ou família de MOIs particular. Numa organização pieléi ida da invenção, deve ser seguido um procedimento único c uniforme para criar todas as várias estruturas T-L-MOI. Isto é especialmente vantajoso quando o conjunto de estruturas T-L-MOI c grande, porque permite que o conjunto seja preparado usando os métodos de química combinatória ou outra tecnologia de processamento paralela. Dc forma semelhante, o uso de um único tipo de ligante permite empregar um único procedi mento uniforme para 57 cortar todas as várias estruturas T-L-MOI. De novo, isto é vantajoso para um conjunto grande de estruturas T-L-MOI, porque o conjunto pode ser processado de forma paralela, repetida c/ou automatizada. Há, contudo, outras formas da presente invenção, onde um ou mais tipos de ligantes são usados para ligar diferentes subconjuntos de marcadores a correpondentes subconjuntos de MOIs. Neste caso, condições de corte selectivas podem ser usadas para cortar cada um dos ligantes independentemente, sem cortar os ligantes presentes noutros subconjuntos de MOIs.
Um grande número de reacções de formação de ligações covalentes são apropriadas para ligar marcadores a ligantes, e ligantes a MOIs. Estas reacções incluem alquílação (e.g.. para formar éteres, tioéteres), acilação {e.g, para formar esteres, amidas, carbamatos. ureias, lioureias), fosforilação (e.g., para formar fosfatos. fosfonatos, fosforamidas, fosfonamidas), sulfonilação (e.g., para formar sulfonatos, sullbnaniidas), condensação (e.g., para formar iminas, oxirnas, hidrazonas), sililação, formação de dissulfureto. e geração de intermediários reactivos, tais como nitrenos ou carbenos, por fotólise. Em geral, pegas e reacções de formação de ligações que são adequadas para ligar marcadores a ligantes são também apropriadas para ligar ligantes a MOIs, c vice-versa. Em alguns casos, a MOI pode sofrer uma prévia modificação ou derivatização para proporcionar a pega necessária para ligar o ligante.
Um tipo de ligação especialmente útil para ligar ligantes a MOIs é a ligação de dissulfureto. A sua formação requer a presença de um grupo tiol (“pega”) no ligante, e uni outro grupo tiol na MOI. Condições suaves de oxidação são então suficientes para ligar os dois tiois como dissulfureto. Λ formação de dissulfuretos pode também ser induzida usando um excesso de um reagente de permuta disulfureto apropriado, e.g., piridilo dissulfuretos. Uma vez que a formação de dissulfureto é facilmente reversível, o dissulfureto pode também ser usado como a ligação quebrável para libertação do marcador, se desejado. Isto é tipicamente realizado em condições suaves semelhantes, usando um excesso de reagente de pei umUi de tiol apropriado, e.g., ditiotreitol.
De particular interesse para ligar marcadores a oligonucleotidios é a formação de ligações amida. Pegas dc aminas alifáticas primárias podem ser facilmente introduzidas em oiigonucleótidos sintécticos com fosforamiditas tal como 6- monometoxitritilhcxilcianoetil-N.N diisopropil fosforamidita (disponíveis em Glenn Research, Sterling. VA). As aminas 58 encontradas em nucleótidos naturais tais como a adenosina e a guanosina são virtualmente não reactivas quando comparadas com a amina primária introduzida. Esta diferença na reactividade está na base da capacidade de selectivamente formar amidas e grupos de ligação relacionados (e.g., ureias, tioureias, sulfonamidas) com a amina primária introduzida, e não com as aminas do nucleótido.
Como listado no catálogo Molecular Probes (Eugene, OR), lima enumeração parcial de grupos funcionais amino-reactivos inclui ésteres carboxílicos activados, isocianatos, isotiocianatos, halogenetos de sulfonilo, e diclorotriazenos. Ésteres activos são reagentes excelentes para modificações da aminas uma vez que os produtos amida formados são muito estáveis. Também, estes reagentes têm uma boa reactividade com aminas alifáticas e baixa reactividade com aminas de nucleotídicas. Exemplos de ésteres activos incluem ésteres de N- hidroxisuccinimida, ésteres de pentafluorofenilo, ésteres de tetrafluorofenilo, e ésteres de p-nitrofenilo. Ésteres activados são úteis porque podem ser feitos de virtualmente qualquer molécula que contenha um ácido carboxítico. Métodos para fazer ésteres activos estão listados em Bodansky {Principies of Peptide Chemislry (2d ed.), Springer Verlag, Londres, 1993).
Existem numerosos reagentes de ligação cruzada comerciais que podem servir como ligantes (c.g., ver Pierce Cross-linkers, Pierce Chemical Co., Rockford, 1L). De entre estes estão os reagentes de ligação cruzada amino-reactivos homobifuncionais que são exemplificados por imidoésteres e N-bidroxisuccinimidil ésteres(NHS) homobifuncionais. Também existem reagentes de ligação cruzada heterobifuncionais que possuem dois ou mais grupos reactivos diferentes que permitem reacções sequenciais. Os imidoésteres reagem rapidamente com aminas a pH alcalino. Nl-IS-ésteres dão produtos estáveis quando reagidos com aminas primárias ou secundárias. Maleimidas, halogenetos de alquilo 011 arilo, alfa-haloacilos e dissulfuretos de piridilo são reactivos com tiol. As maleimidas são especificas para os grupos tiol (suliidril) na gama de pH de 6.5 a 7.5, c a pH alcalino podem tornar-se amino-reactivas. A ligação tioéter é estável em condições fisiológicas. Reagentes de ligação ciuzada alpha-haloacetil contêm o grupo iodoacetil c são reactivos cm relação a sufidrilos. Os intidazois podem reagir com o grupo iodoacetil, mas a reacção é muito lenta. Dissulfuretos de piridilo reagem com grupos tiol para formar uma ligação dissulfureto. As carbodiimidas juntam carboxilos a aminas primárias de hidrazidas o que dá origem à formação de uma ligação acil-hídrazina. As arilazidas são reagentes com fotoafmidade que são quimicamente inertes até serem expostos a luz U.V. ou visível. Quando estes compostos são decompostos pela acção da luz a 250-460 nm, um nitreno de arilo reactivo é formado. O nitreno de arilo no reactivo é relativamente não especifico. Glioxais são reactivos relativamentc a porções guanidinicas da arginina.
Numa organização típica da presente invenção, um marcador é primeiro ligado a um ligante. e depois a combinação do marcador e ligante é ligada a uma MOÍ, para criar a estrutura T-L-MOI. Altemativamente, a mesma estrutura é formada primeiro por ligação do ligante a uma MOI, seguido da ligação da combinação do ligante com a MOI a um marcador. Um exemplo é quando o MOI é um DNA iniciador ou oligonucleótido. Nesse caso, o marcador é tipicamente ligado primeiro ao ligante, depois o T-L é ligado a um DNA iniciador ou oligonucleótido, que é então usado, numa reacção de sequenciação.
Urna forma útil na qual um marcador poderia ser reversivelmente ligado a uma MOI ((í.jg.. um oligonucleótido ou um iniciador de sequenciação de DNA) é através de um I igante quimicamente instável. Um desenho preferido do ligante permite ao ligante ser cortado quando exposto a um ácido orgânico volátil, por exemplo, ácido trifluoroacético (TFA). TF A cm particular é compatível com a maior parte dos métodos de ionização de MS, incluindo pulverização eléctrica (electrospray).
Como descrito abaixo em detalhe, a invenção proporciona um método para determinação de sequência de uma molécula de ácido nucleico. Um composição que pode ser formada pelo método inventivo compreende um pluralidade de compostos da fórmula:
T",s-L-MOI onde l"”= é um grupo orgânico detectável por espectrometria de massa. Tms contém carbono, pelo menos um átomo de hidrogénio e. fluoreto, e pode conter átomos opcionais incluindo 0 oxigénio, azoto, enxofre, fósforo e iodo. Na fónuula, L é um grupo orgânico que permite que um grupo contendo T"’sseja cortado do resto do composto quando o composto é exposto a condições de corte. O grupo cortado contendo Tms inclui um grupo funcional que suporta um único estado de carga ionizado quando cada composto da pluralidade compostos c sujeito a espectrometria do massa. O grupo funcional pode ser uma anima terciária, amina quaternária ou um ácido orgânico. Na fórmula, MOI é um fragmento de ácido nucleico que está conjugado com L através da extremidade 5'da MOJ. O termo 60 “conjugado” significa que deve haver grupos químicos intermediando L e a MOI, e.g.. um grupo íbsfodiéster e/ou um grupo alquileno. O fragmento de ácido nuclcico deve ter uma sequência complementar a uma porção do vector, onde o fragmento é capaz de iniciar a síntese de nucleótidos.
Na composição, não há dois compostos com o mesmo T"'s ou a mesma MOI. Noutras palavras, a composição inclui uma pluralidade de compostos, onde cada composto tem quer um único Tms quer um único fragmento de ácido nucleico (único na medida em que tem uma sequência única de bases). Adicionalmente, a composição pode ser descrita como tendo uma pluralidade de compostos onde cada composto é definido com tendo um único Tms, onde o T"’s é único na medida em que nenhum outro composto tem um T"’s que fornece o mesmo sinal por espectrometria de massa. A composição, assim, conterá uma pluralidade de compostos, cada um contando um Tms com uma massa única. A composição pode também ser descrita como tendo uma pluralidade de compostos onde cada composto é definido como lendo uma sequência única de ácido nucleico. Estas sequências de ácidos nucleicos são intencionalmente únicas tal que cada composto servirá como iniciador para apenas um vector, quando a composição é combinada com vectores para sequenciação de ácidos nucleicos. O conjunto de compostos tendo grupos Tms únicos é o mesmo conjunto de compostos que tem sequências únicas de ácidos nucleicos.
Preferencialmente, os grupos Tms são únicos na medida em que há pelo menos 2 umu. mais preferencialmentc pelo menos 3 amu, e ainda mais preferencialmente pelo menos 4 iimu de separação de massa entre os grupos T"’s de quaiquer dois compostos diferentes. Na composição, há pelo menos 2 compostos diferentes, preferencialmente há mais do que 2 compostos diferentes e mais preferencialmente há mais do que 4 compostos diferentes. A composição pode ter 100 ou mais compostos diferentes, cada composto tendo um T"’s único e umti sequência de ácido nucleico única.
Uma outra composição que é útil nu, e.g., determinação da sequência de uma molécula de ácido nucleico, inclui água e um composto da fórmula Tmi-L-MOI, onde, T™’ é um grupo orgânico deleetável por espectrometria de massa. Tms contem carbono, pelo mcno3 um átomo de hidrogénio e fluoreto, e pode conter átomos opcionais incluindo oxigénio, azoto, enxofre, fósforo c iodo. Na fórmula, L c um grupo orgânico que permite que um grupo contendo T",s seja cortado do resto do composto, quando o composto é exposto a condições de corte. O grupo cortado contendo Tms inclui um grupo funcional que suporta um único estado 61
de carga ionizado quando cada composto do conjunto de compostos é sujeito a espectrometria de massa. O grupo funcional pode ser uma amina terciária, amina quaternária ou um ácido orgânico. Na fórmula, MOI é um fragmento de ácido nucleico ligado à sua extremidade 5'.
Em adição à água, esta composição deve conter um tampão, de forma a manter o pl-l da composição aquosa dentro da gama de cerca de 5 até cerca de 9. Além disto, a composição deve conter um enzima, sais (tal como MgCh e NaCl) e um de dATP, dGTP, dCTP e dTTP. Uma composição preferida contem água, Tms-L-MOI e um (e só um) de ddATP, ddGTP, ddCTP e ddTTP. Uma composição assim é adequada para uso no método de sequenciação didesoxi. A invenção também fornece uma composição que contem uma pluralidade de conjuntos de compostos, onde cada conjunto de compostos tem a fórmula:
Tms-L-MOI onde,
Tms é um grupo orgânico detectável por espectrometria de massa, compreendendo carbono, pelo menos um átomo de hidrogénio e fluoreto, e átomos opcionais seleccionados de oxigénio, azoto, enxofre, fósforo e iodo. L é um grupo orgânico que permite que um grupo contendo Tms seja cortado do resto do composto, onde o grupo contendo Tms compreende um grupo funcional que suporta um único estado de carga ionizado quando o composto é sujeito a espectrometria de massa e é seleccionado de amina terciária, amina quaternária e ácido orgânico. A MOI é um fragmento de ácido nucleico onde L está conjugado com MOI na extremidade 5' da MOI.
Dentro de um conjunto, todos os membros têm o mesmo grupo Tms, e os fragmentos da MOI têm comprimentos variáveis que terminam com o mesmo didesoxinucleóLido seleccionado de ddAMP, ddOMP, ddCMP e ddTMP; e entre conjuntos, os grupos T"’s diferem de pelo menos 2 amu, preferencialmcntc de pelo menos 3 amu. A pluralidade dc conjuntos c prefercncialmcnte pelo menos 5 c pode atingir 100 ou mais.
Numa composição preferida compreendendo um primeira pluralidade de conjuntos como descrito acima, está presente adicionnlmente uma segunda pluralidade de conjuntos de compostos da fórmula:
Tms-L-MOI onde Tms é um grupo orgânico detectável por espectrometria de massa, compreendendo carhono. pelo menos um átomo de hidrogénio e fluoreto, e átomos opcionais seleccionados He 62 oxigénio, azoto, enxofre, fósforo e iodo. L é um grupo orgânico que permite que um grupo contendo Tms seja cortado do resto do composto, onde o grupo contendo T"'4 compreende um grupo funcional que suporta um único estado de carga ionizado quando o composto é sujeito a espectromctria de massa e é seleccionado de amina terciária, amina quaternária ou ácido orgânico. MOI é um fragmento de ácido nucleico onde L está conjugado com MOI na extremidade 5 da MOI. Todos os membros dentro da segunda pluralidade têm uma sequência da MOI que termina com o mesmo didesoxinucleótido seleccionado de ddAMP. ddGMP, ddCMP e ddTMP; com a salvaguarda que o didesoxinucleótido presente nos compostos da primeira pluralidade não é o mesmo didesoxinucleótido presente nos compostos da segunda pluralidade. A invenção também fornece um kit para análises de sequenciação de DNA. O kit compreende uma pluralidade de conjuntos de contentores, onde cada conjunto de contentores inclui pelo menos cinco contentores. O primeiro contentor contém um vector. O segundo, terceiro, quarto e quinto contentores contêm compostos da fórmula:
Tms-L-MOI onde Ίé um grupo orgânico detectável por espectrometria de massa, compreendendo carbono, pelo menos um átomo de hidrogénio e fluoreto, e átomos opcionais seleccionados de oxigénio, azoto, enxofre, fósforo e iodo. L é um grupo orgânico que permite que um grupo contendo T'™ seja cortado do resto do composto, onde o grupo contendo T",s compreende um grupo .1'úncional que suporta um único estado de carga ionizado quando o composto é sujeito a espectrometria de massa e é seleccionado de amina terciária, amina quaternária ou ácido orgânico. MOI é um fragmento de ácido nucleico onde L está conjugado com MOI na extremidade 5'da MOI. A MOI para o segundo, terceiro, quarto e quinto contentores é idêntica e complementar a uma porção do vector dentro do conjunto de contentores, e o grupo T"'s dentro dc cada contentor é diferente dos outros grupos Tms no kit.
Piclcteucialiiieiile. dentro do kit, a pluralidade é de pelo menos 3. i.e., há pelo menos três conjuntos de contentores. Mais preferencialmente, há pelo menos 5 conjuntos de contentores.
Como escrito acima, a presente invenção fornece composições e métodos para determinação da sequência de moléculas de ácido nucleico. Resumidamente, estes métodos geralmente compreendem os passos (a) gerando fragmentos de ácidos nueieieos marcados que 63
N são complementares a urna molécula de ácido nucleico seleccionada (e.g., fragmentos marcados) de uma primeira terminação para uma segunda terminação da molécula de ácido nucleico), onde o marcador é correlacionado com um nucleótido particular ou seleccionado, e pode ser detectado por qualquer um de uma variedade de métodos, (b) separando os fragmentos marcados por comprimento sequencial, (c) cortando um marcador de um fragmento marcado, e (d) detectando os marcadores, e assim detenninando a sequência da molécula dc ácido nucleico. Cada um dos aspectos será discutido rnais detalhadamente abaixo.
B. ESTRATÉGIAS E MÉTODOS DE SEOUENCIACAO
Conto escrito acima, a presente invenção fornece métodos para determinação da sequência de moléculas de ácido nucleico. Resumidamente, fragmentos de ácido nucleico marcados são preparados. Os fragmentos de ácido nucleico são complementares a uma molécula de ácido nucleico alvo seleccionada. Numa organização preferida, os fragmentos de ácido nucleico são produzidos de uma primeira terminação para uma segunda terminação de uma molécula de ácido nucleico, e rnais preferencialmente de um terminação 5' para uma terminação 3'. Noutras organização preferidas, os fragmentos marcados são gerados de oligonucleótidos iniciadores marcados em 5' ou terminais dedisoxinucleótidos marcados. Um marcador de um fragmento de ácido nucleico marcado é correlacionado com um nucleótido particular e é detectãvel por espectrometria (incluindo fluorescência, mas de preferência outra que não a fluorescência), ou por potenciometria. Nunta organização preferida, pelo menos cinco fragmentos de ácido nucleico marcado são gerados e cada marcador é único para um fragmento dc ácido nucleico. Mais especificamente, o numero de fragmentos marcados estará . gcralmcnte. na gama de cerca de 3 a 2 000. Os fragmentos de ácido nucleico marcados podem ser gerados a partir de uma variedade de compostos, incluindo aqueles citados acima. Será evidente para alguém na área que os métodos da presente invenção não estão limitados ao nso apenas das composições e compostos representativos aqui descritas. A seguir à produção dos fragmentos dc ácido nucleico marcados, os fragmentos marcados são separados por comprimento sequencial. Esta separação pode ser realizada por uma variedade de técnicas. Num organização preferida, a separação é feita por cromatografia líquida (LC- liquid chromatography) e particularmente preferido por HPLC. A seguir, o marcador é cortado do fragmento marcado O método particular para c.orlar a ligação para 64 libertar o marcador é scleccionado com base no tipo particular de susceptibilidade da ligação a cortar. Por exemplo, um ligação foto sensível (i.e., uma que corte pela luz) será exposta à luz. (.) marcador libertado é detectado por espectrometria ou potenciometria. Meios de detenção preferidos são espectrometria de massa, espectrometria de infravermelho, espectrometria de ultravioleta e amperometria potenciostática (e.g., com ura detector amperómetrico ou detector colométrico).
Será apreciado por alguém na área que um ou mais dos passos possa ser automatizado, e.g., por uso de um instrumento. Adicionalmente, os passos dc separação, corte c detecção podem ser realizados de um forma contínua (e.g., caminho de fluxo contínuo/lluído contínuo dos fragmentos marcados desde a separação até ao corte e até à detecção). Por exemplo, os vários passos podem ser incorporados num sistema, tal que os passos sejam realizados de uma forma contínua. Um sistema assim tem tipicamente um formato de instrumentos ou combinação de instrumentos. Por exemplo, fragmentos de ácidos nuclcicos marcados que são separados (e.g,, por HPLC) podem fluir para um dispositivo para corte (e.g.. um foto-reactor) e depois para um detector de maredores (e.g., um espectrómetro de massa ou um detector amperómetrico ou colométrico). De preferência, o dispositivo para corte é ajustável de tal forma que possa ser seleccionado o comprimento de onda óptimo para a reacção de corte.
Será aparente para alguém na área que os métodos da presente invenção para sequenciação de ácidos nucleicos pode ser realizado numa variedade de casos. Por exemplo, este uso dos presentes métodos inclui a determinação da sequência primária para moléculas de acido nucleico virais, bacterianas, procariotas e eucariotas (e.g., mamárias); detecção de mutações; diagnóstico; forenses; identidade; e detecção de polimorfismo. 1. Métodos de Sequenciação
Como mencionado acima, os compostos incluindo aqueles da presente invenção podem ser utilizados para uma variedade de métodos de sequenciação, incluindo ambos os métodos de degradação enzimálicos e químicos. Rcsumidamcntc, o método enzimátíco descrito por Sangerf Prnc. Nall. Acud. Sei. (USA) 74:5463, 1977) que utiliza tenninadores didesoxi. envolve a síntese do uma cadeia do DNA a partir de um modelo de cadeia única por uma DNA polimerase. O método de Sanger de sequenciação depende do lacto dos didesoxinucleótidos (ddNTPs) serem incorporados na cadeia em crescimento da mesma 65 <··.. ••AfVViVViri>J«
maneira que os desoxinucleótidos normais (se bem que com uma menor eficiência). No entanto, ddNTPs diferem de desoxinucleótidos normais (dNTPs) pois não têm o grupo 3'- OH necessário para o elongamento. Quando um ddNTP é incorporado na cadeia de DNA, a ausência do grupo 3' - hidroxilo evita a formação de uma nova ligação fosfodiéster e o fragmento de DNA é terminado com o ddNTP complementar à base no DNA modelo. O método Maxarn e Gilbert (Maxam e Gilbert, Proc. Natl. Acad. Sei. (USA) 74:560, 1977) emprega um método de degradação química do DNA original ( em ambos os casos o DNA tem de ser clonal). Ambos os métodos produzem populações de fragmentos que começam num ponto especifico e terminam em toda base que é encontrada no fragmento de DNA a sequenciar. A terminação de cada fragmento depende da localização de uma base particular dentro do fragmento original de DNA. Os fragmentos de DNA são separados por electroforese em gel de poliacrilamida e a ordem das bases de DNA (A, C, T, G) é lida de uma auto-radiografia do gel. 2. Sequenciação de DNA por Exonuclease
Um procedimento para determinação de sequências de nucleótidos de DNA foi relatado por Labeit et al. (S. Labeit, 11J. Lehrach & R.S.Goody, DNA 5:173-7, 1986; um novo método de sequenciação de DNA usando desoxinucleosido alfa-tiotrifosfatos). No primeiro passo do método, quatro DNAs, cada um substituído separadamente com um desoxinucleosido fosíorotioato diferente no lugar do correspondente monofosfato, são preparados por polimerização direccionada para o modelo catalisada por DNA polimerase. No segundo passo, estes DNAs são sujeitos a tratamento com exonuclease de restrição HL, que produz apenas fragmentos que terminam com uma ligação fosforotioato entre nucleótidos. f.sies podem então ser separados por técnicas padrão de eleclroloiese em gel e a sequência pode ser lida directamente como nos métodos de sequenciação usados presentemente. Porter et al. (K. W. Porter, J. Toinasz, F. Huang, A. Sood & D. R. Shaw, Diochemisiry 34:11963-11969. 1995; N7-eianoburano-2'-desoxiguanosina 5'-trifosfato é um bom substrato para a DNA polimerase) descreveu um novo conjunto de nucleótidos boro substituídos análogos que são também resistentes a exonuclease e bons substratos para um numero de polimerases: estas buses são também adequadas para sequenciação de DNA por exonucleases. 66 3. Uma Estratégia Simplificada para Sequenciação de Grandes Numeros de Todo o Comprimento de cDNAs A sequenciação de cDNA tem sido sugerida como uma alternativa para criar a sequência genómica humana completa. Duas aproximações têm sido consideradas. A primeira envolve a formação de marcadores de sequência expressados (expressed sequence tags-ESTs) através de um só passo de sequência de DNA única numa extremidade de cada clone cDNA. Este método tem contribuído para a compreensão da distribuição de tipos de sequências expressadas e tem revelado uma homologia útil e ocasional com fragmentos genómicos, apesar de tudo tem adicionado pouco à nossa base de conhecimento uma vez que são fornecidos resultados insuficientes de cada clone. A segunda abordagem é formar sequências completas de cDNA que podem indicar a função possível dos cDNAs. Infelizmente a maior parte dos cDNAs estão num gama de tamanho de 1-4 kilobases o que bloqueia a automatização da determinação da sequencia de todo o comprimento. Actualmente o método mais eficiente para grande escala, produção de sequências com elevada produtividade é resultante da sequenciação de um local vector/iniciador, que tipicamente origina menos do que 500 bases de sequência de cada ala. A síntese de novos oligonucleótidos iniciadores de comprimento de 15-18 bases para “iniciadores andantes” pode permitir o fecho de cada sequência. Uma estratégia alternativa para sequenciação de todo o comprimento de cDNA é a tlc originar modelos modificados que são adequados para sequenciação com um iniciador universal, mas fornecendo protecção sobreposta das moléculas. Métodos de sequenciação “Shotgun” podem ser aplicados a estudos de sequenciação de cDNA preparando uma biblioteca separada a partir de cada clone de cDNA. No entanto, estes métodos não têm sido muito usados para a análise de fragmentos de 1.5 -4.0 kilobases, uma vez que são muito exigentes em termos de Ualmlhu durante a fase de elonagem inicial. Por sua vez têm sido geralmente aplicados em projectos onde a sequência alvo é da ordem das 15 até 40 kilobases, tal como cm inserções lambda ou de cosmídcos. 4. Analogia dc cDNA com Scqucncia3 Genómicas
Apesar da característica diferença de tamanhos dos clones individuais a serem analisados em sequenciação dc cDNA, há semelhanças com os requisitos para sequenciação dc DNA genõmico de larga escala. Em adição a um baixo custo por base, c uma elevada produtividade, a estratégia ideal para sequenciação em todo o comprimentorle cDNA terá uma 67 elevada precisão. A metodologia actual favorita para sequenciação de cDNA genómico envolve a preparação de bibliotecas de sequenciação “shotgun” a partir de cosmídeos, seguido de sequenciação aleatória usando instrumentos de sequenciação de DNA fluorescentes ABI, e encerramento (terminação) através de esforços direccionados. Apesar de tudo há acordo que a abordagem por “shotgun” fluorescente é superior a alternativas correntes em termos de eficiência a precisão. A qualidade da biblioteca “shotgun” inicial é uma determinante critica da facilidade e qualidade do conjunto da sequencia. A elevada qualidade do procedimento da biblioteca “shotgun” disponível preparou uma estratégia para a produção de bibliotecas ''shotgun” de conjuntos (multiplex) contendo misturas dos clones de cDNA mais pequenos. Aqui, os clones individuais a serem sequenciados são misturados antes da construção da biblioteca e depois identificados seguindo sequenciação aleatória, no estádio de análise por computador. Junções entre clones individuais são marcadas durante a produção da biblioteca quer por PCR quer por identificação de sequência do braço do vector.
Os clones podem ser preparados quer por métodos microbianos quer por PCR. Ouando se usa PCR, são usadas três reacções de cada clone de forma a minimizar o risco de erros.
Um sequenciação de passagem (pass sequencing) é um nova técnica desenhada para acelerar a identificação de sequências importantes dentro de uma nova região de DNA genómico. Resumidamente, uma biblioteca shotgun de elevada qualidade é preparada e depois é léila a amostragem das sequências para obter uma cobertura de 80 - 95%. Para um cosmideo isto será tipicamente cerca de 200 amostras. Essencialmente todos os genes deverão ter pelo menos um exon dctcctado nesta amostra usando quer similaridade da sequência (BLAST) quer varrimento da estrutura exon (GRAIL2). A “escuma” (“skimming”) tem sido aplicada com sucesso a cosmídeos e Pis. Uma sequenciação de passagem é potencialmente a mais rápida e menos dispendiosa forma de encontrar genes num projeeio de clonagein posicionai O icsultado é viitualmentc assegurado. Muitos investigadores estão actualmente a desenvolver cosmídeos contíguos para capturar exons c técnicas relacionadas. Os cosmídeos são totalmcntc adequados para sequenciação escuma (skimming). PI e outras BACs poderiam ser consideravelmente mais baratas uma vez que há poupança quer na construção da biblioteca shotgun quer na minimização de sobreposições. 68 5. Sequenciacão por Shotgun A sequenciação de DNA por shotgun começa com a fragmentação aleatória do DNA alvo. A sequenciação aleatória é então usada para gerar a maioria dos resultados. Uma Fase tlirecta completa então os intervalos, assegurando a cobertura de cada cadeia em ambas as direcções. A sequenciação shotgun oferece a vantagem de elevada precisão a um custo relativamente baixo. O procedimento é mais bem adequado à análise de fragmentos relali vamcntc grandes e é o método de escolha na sequenciação de DNA genómico de grande escala. Há vários factores que são importantes na realização de sequenciação shotgun de Forma precisa e a custo eficaz. Uma consideração importante é a qualidade da biblioteca shotgun que é gerada, uma vez que qualquer clone que não tenha inserções, ou tenha inserções irreais (chimeric), resultará numa subsequente sequenciação ineficiente. Outra consideração é o balanço cuidadoso das fases aleatória c direccionada da sequenciação, tal que uma elevada precisão seja obtida com um mínimo de perda de eficiência por sequenci ações desnecessárias. 6. Química de Sequenciacão: Química do Tenninador-Marcado Há dois tipos de químicas de sequenciação fluorescente actualmente disponíveis: iniciador corante, onde o iniciador é marcado fluorescentemente, e terminal corante, onde os terminais didesoxi são marcados. Cada uma destas químicas pode ser usada quer com Taq DNA polimera.se quer com enzimas sequenases. Enzimas sequenases parecem ler facilmente através de regiões ricas em G-C, palíndromos, repetições simples e outras sequências difíceis de ler. Sequenases são também boas para sequenciar populações mistas. A sequenciação por sequenases requer 5 pg do modelo, uma extensão e um processo de limpeza em múltiplos passos. A sequenciação iniciador-marcado requer quatro reacções separadas, uma para cada de A. C, G e T e em seguida um protocolo de limpeza laborioso. A química de sequenciação do ciclo terminada Taq é o método de sequenciação mais robusto. Com este método qualquer iniciador de sequenciação pode ser usado. A quantidade de modelo usada é relativanicrite pequena c todo o processo de reacção desde a montagem até à limpeza é razoavelmente fácil, comparado eoui as químicas da sequenase e do iniciador corante. Apenas 1.5 pg de modelo DNA e 4 pm de iniciador são necessários. A isto é adicionada uma mistura de reacção pronta. 69 Ί
Esta mistura consiste em tampão, enzima, dNTPs e didesoxinucleótidos marcados. Esta reacção pode ser feita num tubo pois cada um dos quatro didesoxis é marcado com um corante fluorescente diferente. Estes terminadores marcados estão presentes em excesso nesta mistura porque são difíceis de incorporar durante a extensão. Com DNA não limpo a incorporação deste didesoxi de elevado peso molecular pode ser inibida. Λ pré-mistura inclui dITP para minimizar compressões da banda. O uso de Taq como DNA polimerase permite que as reacções se dêm a elevadas temperaturas de forma a minimizar problemas de estrutura secundária assim como ligações de iniciador não específicas. Toda a mistura é submetida a 25 ciclos de desnaturação, amolecimento e extensão num cycler térmico e a reacção completa é corrida através de uma coluna Sephadex G50 (Pharmacia, Piscataway, NJ) e está pronta para carregar o gel depois de 5 minutos num secador de vácuo. 7. Desenho de Iniciadores
Quando se desenha iniciadores, deve ser usado o mesmo critério que para desenhar iniciadores PCR. Em particular, os iniciadores devem ter preferencialmente 18 a 20 nucleótidos de comprimento e a base da extremidade 3-inicial deve ser uma G ou C. Os iniciadores devem também ter de preferência uma Tm de mais de 50 °C. Iniciadores menores que 18 nucleótidos funcionam mas não são recomendados. Quanto menor o iniciador maior a probabilidade da sua ligação a mais do que um local no DNA modelo, e menor a sua Tm. A sequência deve ter um emparelhamento de 100% com o modelo. Qualquer mau emparei hamento, especialmente em direcção à extremidade 3-inicial irá diminuir grandemente a capacidade de sequenciação. Contudo iniciadores com caudas 5-inieial podem scr usadas desde que haja cerca de 18 bases no 3-inicial que liguam. Se se estiver a desenhar um iniciador a partir de um cromatograma de sequência, deve ser usada uma área de elevada confiança. À medida quer se passam as 350 a 400 bases num cromatograma padrão, os picos lornam-se mais largos e a base nao é tão precisa. Como aqui descrito, o iniciador pode possuir uma pega 5' através da qual um ligante ou ligante marcado pode ser ligado. 8. Preparação de Acido Nueleico Modelo O factor mais importante na sequenciação de DNA de iniciador marcado é a qualidade do modelo. Resumidamente, uma concepção errada comum é que se o modelo trabalha em sequenciação manual, pode trabalhar em sequenciação automatizada. De facto, se 70 uma reacção trabalha em sequenciação manual, deve trabalhar em sequenciação automatizada, no entanto, a sequenciação automatizada é muito mais sensível e um modelo de baixa qualidade pode resultar em poucos ou nenhuns resultados quando são utilizados métodos de sequenciação fluorescentes. Elevadas concentrações de sal e outros materiais celulares que não sejam extraídos apropriadamente durante a preparação do modelo, incluindo o RNA, podem da mesma maneira evitar a capacidade de obter informação precisa da sequência. Muitos protocolos de preparação mini e rnaxi produzem DNA que é suficientemente bom para sequenciação manual ou PCR, mas não para sequenciação automatizada (iniciador-marcado). Também o uso de fenol não é de todo recomendado uma vez que o fenol pode-se intercalar na estrutura da hélice. O uso de clorofórmio 100% é suficiente. Há um numero de métodos de preparação de DNA que são particularmente preferidos para os métodos de sequenciação com iniciador marcado aqui fornecidos. Em particular, preparações rnaxi que utilizam preparações de cloreto de césio ou colunas de preparação rnaxi (sendo cuidadoso para não sobrecarregar) Qiagen (Chatsworlh, CA) são preferidas. Para preparações mini, colunas tais como Promega's Magic Mini prep (Madison, Wl) podem ser utilizadas. Quando se sequencia fragmentos de DNA tal como fragmentos PCR ou fragmentos de corte de restrição, é geralmente preferido cortar o fragmento desejado de um gel de agarose de baixa fusão e em seguida purificar com um produto tal como o GeneClean (La Jolla, CA). É muito importante assegurar que apenas uma banda é cortada do gel. Para fragmentos PCK os iniciadores PCR ou iniciadores internos podem ser usados de lorma a assegurar que o fragmento apropriado foi sequenciado. Para obter um rendimento optimo do software de análise da sequência, os fragmentos devem ser maiores do que 200 bases. DNA de cadeia dupla ou de cadeia única pode ser sequenciado por este método.
Um lactor adicional geralmente levado em conta quando sc prepara o DNA para sequenciação é a escolha da estirpe hospedeiro. Companhias que vendem equipamento e leagentcx para sequenciação, tal como ABI (Foster City, CA) c Qiagen (Chatsworth. CA), recomendam tipicamente estirpes hospedeiro preferidas, e previamente recomendaram estirpes como DII5 alfa, HB101, XL-1 Blue, JM109, MV1190. Mesmo quando as preparações ele DNA são muito limpas, há outros factores inerentes que podem tornar difícil obter a sequência. Padrões ricos em G-C são sempre difíceis de sequenciar, e a estrutura secundaria pode também causar problemas. A sequenciação através de uma repetição longa pnwa frequentemente ser difícil. Por exemplo há medida que Taq se move ao longo de um 71 alongamento por nucleótidos T, o enzima frequentemente cai do padrão e salta para trás de novo, saltando um T. Isto resulta em produtos de extensão com uma quantidade X de Ts no alongamento por nucleótidos T e fragmentos com quantidades X-I, X-2 etc de Ts no alongamento por nucleótidos T. O resultado líquido é que mais do que uma base aparece em cada posição tornando a sequência impossível de ler. 9. Uso dc Vectores de Clonagem Molecularmente Distintos A sequcnciação pode também ser realizada utilizando vector de clonagem universal (Ml3) e iniciadores de sequenciação complementares. Resumidamente, para os presentes vectores de clonagem a mesma sequência de iniciador é usada e só 4 marcadores são empregues (cada marcador é um fluoróforo diferente que representa um terminador diferente (ddNTP)), cada processo de amplificação deve ter lugar em contentores diferentes (uma amostra de DNA por contentor). Isto é, é impossível misturar duas ou amostras de diferentes DNA no mesmo processo de amplificação. Com apenas 4 marcadores disponíveis, só uma amostra de DNA pode correr por faixa de gel. Não há conveniência em desenrolar a sequência de mais do que uma amostra de DNA com apenas 4 marcadores. (Neste aspecto, (rabalhadores na área têm muito cuidado em não misturar ou contaminar amostras diferentes de DNA quando usam tecnologias correntes).
Uma vantagem substancial é ganha quando múltiplos de 4 marcadores podem correr por faixa de gel ou no processo de separação respectivo. Hm particular, utilizando marcadores da presente invenção, mais do que uma amostra de DNA pode ser processada numa única reacção de amplificação ou contentor. Quando múltiplos de 4 marcadores estão disponíveis para uso, cada conjunto de marcadores pode ser atribuído a uma amostra particular de DNA a ser amplificada. (Um conjunto de marcadores é composto de uma série de 4 marcadores diferentes cada um com uma propriedade única. A cada marcador é atribuído representar um termiiiador-didesoxi diferente, ddATP, ddGTP, ddCTP, ou ddTTP. Paia empregar esta vantagem, tem que ser gerada uma série de vectores nos quais c inserido um único loeul de iniciação. Um único local dc iniciação c simplesmente um elongamento dc 18 nucleótidos que difere de vector para vector. A restante sequência de nucleótidos é mantida de vector para vector. Um iniciador de sequenciação é preparado (sintetizado) correspondendo a cada vector único. Cada iniciador único é derivado (ou marcado) com um único conjunto de marcadores. 72
Com estas respectivas ferramentas da biologia molecular em mãos, é possível na presente invenção processar multiplanos amostras num único contentor. Primeiro, as amostras de DMA a serem sequenciadas são clonadas na multiplicidade de vectores. Por exemplo, se estão disponíveis 100 vectores únicos, são realizados 100 reacções de ligação, passos de plaqueamento. e repicagent de placas. Segundo, uma amostra de cada tipo de vector é agrupada fazendo um conjunto de 100 vectores únicos contendo 100 fragmentos ou amostras de DNA únicos. Uma dada amostra de DNA é então identificada e automaticamente atribuído um conjunto de iniciadores com um conjunto de marcadores associados. Os respectivos iniciadores, tampões, polimerase(s), ddNTPs, dNTPs e co-factores são adicionados ao contentor da reacção e o processo de amplificação é levado a cabo. A reacção é em seguida sujeita a um passo de separação e a respectiva sequência é estabelecida segundo o aparecimento temporal dos marcadores. A capacidade de agrupar múltiplas amostras de DNA lem vantagens substanciais. O custo de reagentes de uma reacção PCR típica é de cerca de .1)2,00 por amostra. Com o método aqui descrito o custo de amplificação numa base por amostra poderá ser reduzido pelo menos por um factor de 100. O manuseamento das amostras poderá ser reduzido por um factor de pelo menos 100, e os custos de materiais poderão ser reduzidos. A necessidade de robots de amplificação de grande escala seria obviada. 10. Vectores de Sequenciacão para Marcação de Espectroscopia de Massa
Quebrável
Usando a marcação de espectrometria de massa quebrável (CMST -cleavable maxs spectroscopy tagging) da presente invenção, cada reacção de sequenciaçáo individual pode ser lida independentemente e simultaneamente à medida que a separação procede. Na sequenciaçáo CMST, um iniciador diferente é usado para cada vector de elonagem; cada reacção tem 20 iniciadores diferentes quando são usado 20 clones por conjunto. Cada iniciador corresponde a um dos vectores, e cada iniciador é marcado com uma única molécula CMST. São realizadas quatro reacções em cada amostra de DNA agrupado (uma para cada base), consequeiileincule cada vector tem quatro oligonucleótidos iniciadores, cada um idêntico em sequência mas marcado com um marcador CMS diferente. As quatro reacções de sequenciaçáo separadas são agrupados c corridas cm conjunto. Quando 20 amostras são agrupados, são usados 80 marcadores (4 bases por amostra vezes 20 amostras), e todas os 80 são simultaneamente detectados à medida que o gel corre. 73
A construção dos vectores pode ser realizada clonando um 20-mer aleatório em ambos os lados de um local de restrição. Os clones resultantes são sequenciados e é escolhido um numero para uso como vectores. Dois oligonucleótidos são preparados para cada vector escolhido, um homólogo à sequência em cada um dos lados do local de restrição, e cada um orientado tal que a extremidade 3' seja em direção ao local de restrição. São preparadas quatro preparações marcadas de cada iniciador, uma para cada base nas reacções de scqucnciação e cada uma marcada com um marcador CMS único. 11. Vantagens da Sequenciacão pelo Uso de Marcadores Reversíveis Há vantagens substanciais quando marcadores quebráveis são usados em tecnologias de sequenciação e relacionadas. Primeiro, um aumento da sensibilidade contribuirá para ler comprimentos maiores, assim como a capacidade de coleccionar marcadores por um periodo de tempo especifico antes da medida. O uso de marcadores quebráveis permite o desenvolvimento de um sistema que igualiza a largura da banda sobre ioda a gama do gel (1-1500 nucleótidos (nt), por exemplo). Isto irá afectar grandemente a capacidade de obter leituras de comprimentos maiores do que 450 nt. O uso de marcadores quebráveis múltiplos (identificadores de MW) tem também a vantagem de que múltiplas amostras de DNA podem ser corridas numa só faixa de gel ou processo de separação. Por exemplo, é possível, usando as metodologias aqui descobertas, combinar pelo menos 96 amostras e 4 reacções de sequenciação (A,G,T,C) numa só faixa ou processo de medição de fragmentos. Se forem empregues múltiplos vectores que possuam locais de iniciação únicos, então pelo menos 384 amostras podem ser combinadas por faixa de gel (as diferentes reacções do terminador não podem ser amplificadas com este esquema). Quando a capacidade de empregar marcadores quebráveis é combinada com a capacidade de usar múltiplos vectores, é obtido um aumento aparente de 10 000 vezes na produtividade da sequenciação de DNA. Também nos esquemas aqui descritos, o uso de reagentes diminui, os disponíveis diminuem, com uma resultante diminuição nos custos de operação para o consumidor.
Uma vantagem adicional é obtida da capacidade de processar controlos internos cm todas as metodologias aqui descritas. Para qualquer conjunto de amostrus, um ácido nucleico de controlo interno pode ser colocado na(s) amostra(s). Isto não é possível com as configurações actuais. lista vantagem permite o controlo do processo de amplificação, do 74 processo de separação, do sistema de detecção do marcador e montagem de sequenciação. Isto c uma enorme vantagem sobre os sistemas actuais nos quais os controlos estão sempre separados das amostras em todos os passos.
As composições e métodos aqui descritos têm também a vantagem de serem modulares por natureza e podem ser ajustadas a qualquer tipo de processo ou método de separação e ainda, podem ser ajustadas a qualquer tipo de sistema de detecção uma vez que são feitas melhorias em ambos os tipos das respectivas tecnologias. Por exemplo, as metodologias aqui descritas podem ser acopladas com arranjos CE “empacotada” ou dispositivos microfabricados que permitem a separação de fragmentos de DNA.
C. SEPARAÇÃO DE FRAGMENTOS DE DNA
Uma amostra que requer análise é frequentemente uma mistura de muitos componentes numa matriz complexa. Para amostras contendo compostos desconhecidos, os componentes têm de ser separados entre si tal que cada componente individual possa ser identificado por outros métodos analíticos. As propriedades de separação dos componentes numa mistura são constantes em condições constantes, e assim uma vez determinadas podem ser usadas para identificar e quantificar cada um dos componentes. Estes procedimentos são típicos em separações analíticas cromatográficas e electroforéticas. 1. Cromatogratia Liouida de Alta Eficiência (HPL(J) A cromatografia líquida de alta eficiência (HPLC) é uma técnica de separação cromatográfica para separar compostos que estão dissolvidos em solução. Os instrumentos de l-IPLC consistem num reservatório para a fase móvel, uma bomba, um injector, uma coluna de separação, e um detector. Os compostos são separados por injecção de uma alíquota da mistura da amostra no interior da coluna. Os diferentes componentes da mistura passam através da coluna a velocidades diferentes devido a diferenças uo seu comportamento de partição entre a fase líquida móvel e a fase estacionária.
Recentemente, IP-RO-IIPLC cm partículas PS/DVB não porosas com cadeias alquilo quimicamente ligadas têm mostrado ser rápidas alternativas à electroforese capilar na análise dc ácidos nucleicos de cadeia única e cadeia dupla fornecendo graus de resolução semelhantes (Huber et al., 1993, Anal. Biochem., 212, p351; Huber et al.,1993, Nuc. Acids lies.. 21. pl061; Huber et al., 1993, Biotechniques, 16, p898). Em contraste com a 75 >·· ·< · ’·*ψ/·***:Ρ,Ψ«*ϊ*·**· cromatografia de permuta iónica. que nem sempre retem DNA de cadeia dupla em função do comprimento da cadeia (Uma vez que os pares de bases AT interagem com a iãse estacionária positivamente carregada mais fortemente do que pares de bases GC), IP-RP-HPLC permite uma separação dependente estritamente do tamanho.
Tem sido desenvolvido um método usando acetato de trietilamónia 100 mM como reagente de par-iónico, oligonucleótidos fosfodiéster podem ser separados com sucesso em partículas de 2.3 μΜ de poli(estireno-divinilbenzeno) não porosas de alquiladas através de cromatografta líquida de alta eficiência (Oefner et al., 1994, Anal. Biochem.. 223, p39). A lécnica descrita permite a separação de produtos PCR diferindo apenas de 4 a 8 bases em comprimento numa gama de tamanhos de 50 a 200 nucleótidos. 2. Electroforese A electroforese é uma técnica de separação baseada na mobilidade de iões (ou DNA como é o caso aqui descrito) num campo eléctrico. O DNA carregado negativamente migra em direcção a um eléctrodo positivo e iões positivamente carregados migram em direcçâo a um eléctrodo negativo. Por razões de segurança um eléctrodo está usualmente na lerra e o outro é polarizado positivamente ou negativamente. Espécies carregadas têm diferentes velocidades de migração dependendo da sua carga total, tamanho, e forma, e podem consequentemente ser separadas. Um aparelho eléctrodo consiste numa fonte de potência de alta voltagem, eléctrodos, tampão, e um suporte para o tampão tal como um gel de poliacrilamida, ou um tubo capilar. Tubos capilares abertos são usados para muitos tipos de amostra e os outros suportes de gel são geralmcntc usados para amostras biológicas tais como misturas dc proteínas ou fragmentos de DNA. 3. Electroforese Capilar (CE) A electroforese capilar (CE) nas suas várias apresentações (solução livre, isotacoíõrcse, localização isoeléctrica, gel de poliacrilamida, '‘cromatografia" clcctrocinética micclar) está a desenvolver-se como um método para separações rápidas de elevada icsolução de volumes de amostra muito pequenos de misturas complexas. Em combinação com a sensibilidade e seleelividade ineicutes da MS, CE-MS é uma técnica potcncialmontc poderosa para bioanálises. Na nova aplicação aqui descoberta, a interface destes dois métodos levará a 76 métodos superiores de sequenciação de DNA que ofuscarão a velocidade dos métodos de sequenciação correntes em várias ordens de grandeza. Λ correspondência das velocidades de fluxo entre CF, e ionização por electropulverização (ESI) e o facto de que ambos são facilitados por (e principalmente usados para) espécies iónicas em solução fornece a base para uma combinação extremamente atraente. Λ combinação de electroforese capilar de zona (CZE) e isotacoforese capilar com cspectrómetros de massa quadrupolos baseados em ESI têm sido descritos (01 ivares et al., Anal. ('hem. 59:1230, 1987; Smith et al., Anal. Chem. 50:436, 1988; Loo et al., Anal. Chem. /79:404, 1989; Edmonds et al.,./. Chroma. 777:21, 1989; Loo et al., ./. Microcolumn Sep. 1:223, 1989; Lee et al., J. Chromatog. 755:313, 1988; Smith et al.../. Chromatog. 750:211, 1989; Grese et al., ./. Am. Chem. Soe. 111\2835, 1989). Péptidos pequenos são facilmente acessíveis a análises CZE com boa sensibilidade (femtomole). O método de separação mais potente para fragmentos de DNA é a electroforese em gel de poliacrilamida (PAGE), geralmente num formato de gel em fatia. Contudo, a maior limitação da tecnologia corrente é o tempo relativamente longo necessário para realizar a electroforese em gel dos fragmentos de DNA produzidos nas reacções de sequenciação. Uma magnitude maior (10 vezes) pode ser adquirida com o uso de electroforese capilar que utiliza geis ultrafinos. Em solução livre, numa primeira abordagem, todo o DNA migra com a mesma mobilidade uma vez que a adição de uma base resulta na compensação da massa e da carga. Hm geis dc poliacrilamida, os fragmentos de UNA são retidos e migram em função do comprimento e esta abordagem tem agora sido aplicada a CE. Um notável numero de placas por metro foi agora conseguido com poliacrilamida de ligações cruzadas (10+7 placas por metro. Cohen et al., Proc. Natl. Acad. Sei., USA 55: 9660, 1988). Tais colunas CE como descritas podem ser empregues para sequenciação de DNA. O método de CE é ern principio 25 vezes mais rápido do que a electroforese em fatias de gel num sequenciador padrão. Por exemplo, cerca de 300 bases podem sei lidas por hora. A rapidez da separação é limitada na electroforese em gel em fatia pela magnitude do campo eléctrico que pode ser aplicado ao gel sem produção de calor excessiva. Conscqucntcmcntc, a maior rapidez de CE é conseguida através do uso de elevados campos de forças (300 V/cm em CE versus 10 V/cm em electroforese cm placa gel. O formato capilar reduz a amperagem e assim a potência e a geração dc calor resultante. 77
Smith e outros (Sruith et al., Nucleic Acids Res. 18:4417, 1990) sugeriu empregai- múltiplos capilares em paralelo para aumentar a produtividade. Da mesma forma, Matilics e Huang (Mathies and Huang; Nature 359:167, 1992) introduziram a electroforese capilar na qual as separações são realizadas num arranjo paralelo de capilares e demonstraram uma sequenciação de alto rendimento (Huang et al.; Anal Chetn. 64:967, 1992.Huang et al.; Anal. Chcm. 64:2149, 1992). A maior desvantagem da electroforese capilar c a quantidade limitada de amostra que pode ser carregada no capilar. Concentrando uma grande quantidade de amostra no inicio do capilar, antes da separação, a capacidade de carregamento é aumentada, e os níveis de detecção podem ser baixados em várias ordens de grandeza. O método mais popular de pré-concentração em CE é o empilhamento da amostra. O empilhamento da amostra foi recentemente revisto (Chien and Burgi, Anal. Chetn. 64:489A, 1992). O empilhamento da amostra depende da diferença da matriz (pH, força iónica) entre o tampão da amostra e o tampão capilar, tal que o campo eléctrico através da zona de amostragem é mais do que na região capilar. No empilhamento da amostra, um grande volume de amostra num tampão de baixa concentração é introduzido para pré-concentração na cabeça da coluna capilar. O capilar é cheio com um tampão da mesma composição, mas com uma concentração maior. Quando os iões da amostra atingem o tampão capilar e o campo eléctrico mais baixo, empilham-se numa zona concentrada. O empilhamento da amostra aumentou a detectabilidade em 1-3 ordens de grandeza.
Um outro método de pré-concentração é a aplicação de isotacotòrcse (1'1'P) antes da separação por CE de zona livre de analitos. A ITP é uma técnica electroforética que permite que volumes de amostra de microlitros sejam carregados no capilar, em contraste com os baixos volumes de injecção nL tipicamente associados com a CE. A técnica baseia-se na inserção da amostra entre dois tampões (electrólitos avançado e reboque) de maior e menor mobilidade respeetivamente, do que o analito. A técnica é inerentemente uma técnica de concentração, onde os analitos se concentrain cm zunas puras migrando com a mesma rapidez. A técnica é correntemente menos popular do que os métodos de empilhamento ilcsciilos acima devido à necessidade de várias escolhas para os electrólitos avançado e de reboque, e a capacidade de separar apenas espécies catiónicas ou aniónicas durante um processo de separação. O fulcro do processo de sequenciação de DNA é a separação electroforética de ΟΝΛ ou de fragmentos de oligonucleótidos extraordinariamente selectiva. É notável porque 78 cada fragmento é resolvido e difere por um só nucleótido. Separações de até 1000 fragmentos (1000 pb) foram obtidos. Uma outra vantagem da sequenciação com marcadores quebráveis é a que se segue. Não há nenhuma necessidade de usar um formato de gel em fatia quando fragmentos de DNA são separados por electroforese em gel de poliacrilamida quando são empregues marcadores quebráveis. Uma vez que numerosas amostras são combinadas (4 a 2000) não há necessidade de correr amostras em paralelo como é o caso com os métodos correntes de iniciador corante ou terminador corante (i.e., sequenciador ABI373). Uma vez que não há necessidade de correr faixas paralelas, não há razão para usar uma fatia de gel. Assim, pode-se empregar um formato de gel cm tubo para o método de separação clcctroforctica. Grossman (Grossman et al., Genel. Anal. Tech. Appl. 9:9, 1992) mostraram que uma vantagem considerável é adquirida quando é usado um formato de gel em tubo em lugar de um formato de gel em fatia. Isto é devido à maior capacidade para dissipar calor Joule num formato tubo comparativamente com um gel em fatia que resulta em tempos de corrida mais rápidos (em 50%), e muito maior resolução de fragmentos de DNA de elevado peso molecular (maiores do que 1000 nt). Longas leituras são críticas em sequenciação gcnómica. Assim, o uso de marcadores quebráveis em sequenciação tem a vantagem adicional de permitir ao utilizador empregar o método de separação de DNA mais eficiente e sensível e que também possui a mais elevada resolução. 4. Dispositivos microfabricados A electroforese capilar (CE) é um método potente para sequenciação de DNA, análises forenses, análises de produtos PCR e medidas de tamanho de fragmentos de restrição. CE é de longe mais rápida do que a tradicional placa PAGE uma vez que com geis capilares um campo com muito maior potencial pode ser aplicado. No entanto, CE tem o inconveniente dc permitir que apenas uma amostra seja processada por gel. O método combina os tempos de separação mais rápidos de CE com a capacidade dc analisar múltiplas amostras em paralelo. O conceito básico por trás do uso de dispositivos microfabricados é a capacidade de aumentar a densidade dc informação em electroforese miniatorizando a dimensão da faixa a cerca de 100 micrometros. A industria electrónica usa rotineiramente microfabricação para fazer circuitos com características menores do que um micron em tamanho. A densidade corrente de disposições capilares é limitada ao diâmetro externo do tubo capilar. A microfabricação de canais produz uma maior densidade de disposições. A microfabricação também permite 79 disposições físicas que não são possíveis com fibras de vidro e liga os canais directamente a outros dispositivos num chip. Poucos dispositivos têm sido construídos em microchips para tecnologias de separação. Um cromatógrafo gasoso (Terry et al., IEEE Trans. Electron Dcvicc. ED-26:1880, 1979) e um cromatógrafo líquido (Manz et al., Sens. Actnators ///:249, 1990) têm sido fabricados em chips de silicone, mas estes dispositivos não têm sido largamente usado. Vários grupos reportaram corantes fluorescentes de separação e aminoáeidos em dispositivos microfabricados. (Manz et al., J. Chromatography 593: 253, 1992, Effenhauser et al., Anal. Chem. 65:2637, 1993). Recentemente, Woolley e Mathies (Woolley and Mathies, Proc. Nall. Acad. Sei. 91:11348, 1994) mostraram que a fotolitografia e a estampagem química podem ser usadas para fazer um elevado numero de canais de separação em substratos de vidro. Os canais são enchidos com matrizes de separação de hidroxietil celulose (HEC). Foi mostrado que fragmentos de DNA de restrição poderiam ser separados em tempos tão curtos como dois minutos.
D. CORTE DE MARCADORES
Como descrito acima, desenhos diferentes de marcadores confeririam capacidade de corte (“instabilidade”) em diferentes condições específicas físicas e químicas. Exemplos de condições que servem para cortar vários desenhos de marcadores incluem ácido, base, oxidação, redução, fluoreto, permuta de tiol, fotólise, e condições enzimáticas.
Exemplos de marcadores quebráveis que satisfazem os critérios gerais para marcadores descritos acima serão bem conhecidos pelos da área e incluem aqueles encontrados no catálogo disponível da Pierce (Rockford, IL). Os exemplos incluem: • glicobis(succinimidilsuccinato) ctileno (EGS), um reagente de ligações cruzadas amina reactivo que é cortada por hidroxilamina (1M a 37°C durante 3-6 horas); • tartarato de disuccinimidil (DST) e sulfo-DST, que é um reagente de ligações cruzadas atnina reactivo, quebrável por 0.013 M periodalo de sódio: • bis[2-(succinimidiloxicarboniloxi)etil]sulfona (BSOCOES) e sulfo- BSOCOES, que são ) que são reagentes de ligaçOes cruzadas amina reactivo, quebrável por base (pH 11.6); » I.4-di-[3'-(2'-piridilditio(propionaniida))]bulatio (DPDPB), um ligaute cruzado piridilditiol que é quebrável por permuta de tiol ou por redução; 80 • N-[4-(p-azidosalicilamido)-butil]-3'-(2'pirididitio)propionamida (APDP), um ligante cruzado piridilditiol que é quebrável por permuta de tiol ou por redução; • bis-[beta-4-(azidosalicilamido)etil]-dissuifureto (SADP), um ligante cruzado íbtoreactivo que é quebrável por permuta de tiol ou por redução; • N-succinimidil-(4-azidofenil)-l,3'-ditiopropionato (SADP), um ligante cruzado íbtoreactivo que é quebrável por permuta de tiol ou por redução; • sulfosuccinimidil-2-(7-azido-4-metilcuinarina-3-acetamida)etil-1,3-ditiopropionato (SAED), um ligante cruzado íbtoreactivo que é quebrável por permuta de tiol ou por redução; • sulfosuccinimidil-2-(m-azido-o-nitrobenzamida)etil-l ,3 'ditiopropionato (SAND), um ligante cruzado fotoreactivo que é quebrável por permuta de tiol ou por redução.
Outros exemplos de ligantes quebráveis e as condições de corte que podem ser usadas para libertar os marcadores são como se segue. Um grupo ligante sililo pode ser coi tado por fluoreto ou sob condições ácidas. Um grupo de ligação 2-nitrobenziloxi 3-,4-,5-,ou 6-substituido ou 4-nitrobenziloxi 2-,3-,5-,ou 6-substituido pode ser cortado por uma fonte dc fotões (fotólise). Um grupo de ligação 2-alcoxifenoxi 3-,4-,5-,ou 6-substituido ou 4-alcoxifenoxi 2-,3-,5-,ou 6-substituido podem ser cortados por CeíNH^NO.Of, (oxidação). Um ligante NCO2 (urctano) pode ser cortado por hidróxido (base), ácido, ou UAIH4 (redução). Um grupo de ligação 3-pentenil, 2-butenil, ou 1-butenil pode ser cortado por O3, OsO.1/104’. ou KMnC>4 (oxidação). Um grupo de ligação 2-[furil 3-,4- ou 5-substituido]oxi pode ser cortado por O2, Br2, MeOH, ou ácido.
As condições para 0 corte de outros grupos de ligação instáveis incluem: grupos de ligação t-alquiloxi podem ser cortados por ácido; grupos de ligação metil(dialquil)metoxi ou 2-alquilo-l ,3-dioxano-2-ilo 4-substituido podem ser cortados por Η3Ο"; grupos de ligação 2-sililetoxi podem ser cortados por fluoreto ou ácido; grupos de ligação 2-(X)-etoxi (onde X = cevo. éster amida, ciano, NO2, sulfureto, sulíoxido, sulfona) podem ser cortados sob condições alcalinas; grupos de ligação benziloxi 2-,3-,4-,5-,ou 6-substituido podem ser cortados por ácido ou sob condições redutoras; grupos de ligaçao 2-buteniloxi podem ser cortados por (Ph.vP)rRhCl(H) ; grupos de ligação 2-bromofenoxi 3-,4-,5-,ou 6-substituido podem ser 81 cortados por Li, Mg ou BuLi; grupos de ligação metiltiometoxi podem ser cortados por Hg" ; grupos de ligação 2-(X)-etiloxi (onde X=halogénio) podem ser cortados por Zn ou Mg; grupos de ligação 2-hidroxietiloxi podem ser cortados por oxidação (e.g., com Pb(OAc)4).
Ligantes preferíveis são aqueles que são cortados por ácido ou fotólise. Muitos dos ligantes instáveis ao ácido que têm sido desenvolvidos para síntese de péptidos em fase sólida são úteis para ligar marcadores a MOIs. Alguns destes ligandos são descritos numa revisão recente por Lloyd-Williams et al. (Tetrahedron 49:11065-11133, 1993). Um tipo de ligante útil é baseado em álcoois p-alcoxibenzilícos, dos quais 2, o ácido 4-hidroximetilfenoxiacético e o ácido 4-(4-hidroximetil-3-metoxifenoxi)butírico, estão comercialmente disponíveis em Advanced ChemTech (Louisville, KY). Ambos os ligantes podem ser ligados a um marcador através de uma ligação éster ao álcool benzilico, e a uma MOI contendo uma amina através de uma ligação amida ao ácido carboxílico. Os marcadores ligados por estas moléculas são libertados da MOI variando a concentração de ácido trilluoroacético. Os cortes destas ligações resultam na libertação de um ácido carboxílico no marcador. O corte ácida de marcadores ligados através de ligantes relacionados, tais como 2.4-chmetoxi-4 -(carboximetiloxi)-benzhidrilamina (disponível em Advanced Chcm Tech na Ibrma FMOC protegida), resulta na libertação de uma amida carboxílica no marcador libertado.
Os ligantes instáveis à luz úteis para esta aplicação têm também sido, na maior parte, desenvolvidos para síntese de péptidos em fase sólida (ver revisão de Lloyd-Williams). listes ligandos são geralmente baseados em 2-nitrobenzilésteres ou 2-nitrobenzilamidas. Dois exemplos de ligantes sensíveis à luz que têtn sido recentemente relatados na literatura são 0 ácido 4-(4-( l-l'moc-amino)etil)-2-metoxi-5-nitrofenoxi)bulanóico (Holmes e Jones, ./ Org. Chcm. 00:2318-2319, 1995) e o ácido 3-(Fmoc-arnino)-3-(2-nitrofcnil)propiónico (Brown et al.. Molecular Diversity 1:4-12, 1995). Ambos os ligandos podem ser ligados através do ácido carboxílico a uma amina na MOI. A ligação do marcador ao ligante c feita formando uma amida entre o ácido carboxílico no marcador e a amina no ligante. A corte de ligantes instáveis á luz é geralmente realizada com luz UV de comprimento de onde de 350 nm a intensidades e tempos conhecidos dos da área. Exemplos de fontes comerciais de instrumentos para corte fotoquímic.o são Aura Industries Inc (Staten Island, NY) e Agrenetics (Wilmington, MA). O corte dos ligantes resulta na libertação de uma amida primária no marcador. Exemplos de ligantes quebráveis pela luz incluem ésteres de nitrofenilglicina. 82 cloretos e metanosulfonatos de exo- e endo-2-benzonorborneil, e ácido 3-amino-3(2-nitrotenil) propiónico. Exemplos de cortes cnzimáticas incluem esterases que cortarão ligações ésteres, nucleases que cortarão ligações fosfodiéster, proteases que cortem ligações peptídicas, etc.
E DETECCÃO DE MARCADORES
Os métodos de detecção baseiam-se tipicamente na absorção e emissão em qualquer tipo de campo espectral. Quando átomos ou moléculas absorvem luz, a energia entrada excita uma estrutura quantizada a um nível de energia mais elevado. O tipo de excitação depende do comprimento de onda da luz. Os clectrões são promovidos a orbitais superiores por luz ultravioleta ou visível, as vibrações moleculares são excitadas por luz infravermelha, e as rotações são excitadas por microndas. Um espectro de absorção é a absorção de luz em função do comprimento de onda. O espectro de um átomo ou molécula depende da sua estrutura de níveis de energia. Espectros de absorção são úteis para a identificação de compostos. Métodos espectroscópicos de absorção específicos incluem espectroscopia de absorção atómica (AA), espectroscopia de infravermelho (IR), e espeetroscopia de UV-vis (uv-vis).
Os átomos ou moléculas que são excitados a elevados níveis de energia podem cair para níveis mais baixos por emissão de radiação .Esta emissão de luz é chamada fluorescência se a transição é entre estados do mesmo spin, e fosforescência se a transição ocorre entre estados de spins diferentes. A intensidade da emissão de um analito é linearmente proporcional à concentração (a baixas concentrações), e é útil para quantificar as espécies emissoras. Métodos espectroscópicos de emissão especifiosa incluem espectroscopia de emissão atómica (AES), espectroscopia de fluorescência atómica (AFS), fluorescência molecular induzida por laser (LIF), e fluorescência de raios-X (XRF).
Quando radiação electromagnética passa através da matéria, a maior parte da radiação continua na sua direcção original mas uma pequena fraeção é dispersa noutras dirceçõcs. A luz que é dispersa ao mesmo comprimento de onda do que a luz que entra é chamada dispersão Rayleigh. A luz que é dispersa em sólidos transparentes devido a vibrações (Ibnões) é chamada dispersão Brillouin. A dispersão Brillouin está tipicamente deslocada de 0.1 a 1 do numero de onda da luz incidente. A Luz que é dispersa devido a vihrações em moléculas ou Ibnões ópticos em sólidos opacos é chamada dispersão Ramnn. A 83 luz de dispersão Raman está deslocada por tanto como 4000 números de onda da luz incidente. Métodos espectroscópicos de dispersão específicas incluem a espectroscopia de Raman. A espectroscopia de IR é a medida do comprimento de onda e da intensidade da absorção de luz infravermelha-média pela amostra. A luz infravermelha-média (2.5 - 50 pm, 4000 - 200 cm'1) é suficientemente energética para excitar vibrações moleculares a níveis de energia superiores. Os comprimentos de onda de bandas de absorção de infravermelho são característicos de tipos de ligações químicas especificas e a espectroscopia de IR é em geral mais útil para identificação de moléculas orgânicas e organometálicas. A espectroscopia de absorção no infravermelho-próximo (N1R) é a medida do comprimento de onda e da intensidade da absorção de luz no infravermelho-próximo pela amostra. A luz no infravermelho-próximo corre a gama 800 nm - 2.5 μηι (12500 - 4000 cm'1) e é suficientemente energética para excitar sobremódulos e combinações de vibrações moleculares a níveis de energia superiores. A espectroscopia NIR é usada tipicamente para medidas quantitativas de grupos funcionais orgânicos, especialmente 0-11, N-l-1, e C=0. Os componentes e desenhos da instrumentação NIR são semelhantes aos espectrómetros de absorção uv-vis. A fonte de luz é usualmente uma lâmpada de tungesténio c o detector é usualmente um detector de estado sólido PbS. Os recipientes da amostra podem ser de vidro ou de quartzo e os solventes típicos são CCfi e CS2. A instrumentação conveniente da espectroscopia NIR torna-a adequada para medição e controlo do processo em linha. A espectroscopia de Absorção de Ultravioleta e Visível (uv-vis) é a medida do comprimento de onda e da intensidade da absorção de luz no ultravioleta -próximo e visível pela amostra. A absorção de IJV 110 vácuo ocorre a 100 - 200 nm; (IO5 - 50000 cm'1) UV quartzo a 200 - 350 nm; (50000 - 28750 cm'1) e visível a 350 - 800 nm; (28750 - 12500 cm ') c é descrita pela lei de Beer-Lambert-Bouguet. As luzes ultravioleta e visível são siilicicntcmente energéticas para promover eleclrões exteriores a ntveis de energia superiores. A espectroscopia uv-vis pode ser usualmente aplicada a moléculas e iões ou complexos inorgânicos cm solução. Os espectros uv-vis estão limitados pelas largas caraclerísticas dos espectros. A fonte de luz é usualmente uma lâmpada de hidrogénio ou deutério para medidas no uv e uma lâmpada de tungesténio para medidas no visível. Os comprimentos dc onda destas fontes de luz contínuas são seleccionados com um separador de comprimentos de onda 84 vai como um prisma ou uma rede de difracçâo monocromadora. Os espectros são obtidos por varrimento do separador de comprimentos de onda e as medidas quantitativas podem ser Icitas a partir dc um espectro ou a um só comprimentos de onda.
Espectrómetros de massa usam a diferença na razão mass-carga (m/z) de átomos ou moléculas ionizados para os separar entre si. A espectrometria de massa é assim útil para quantificação de átomos ou moléculas e também para determinar informação química e estrutural acerca das moléculas. As moléculas têm padrões de fragmentação diferentes que fornecem informação estrutural para identificar compostos. As operações gerais de um espcctrómctro de massa são como se segue. São criados iões em fase gasosa, os iões são separados no espaço ou no tempo com base na sua razão massa-carga, e a quantidade de iões de cada razão massa-carga c medida. O poder de separação de iões de um espectrómetro de massa é descrito pela resolução, que é definido como R=m/delta m, onde m é a massa do ião e delta é a diferença em massa entre dois picos separáveis num espectro de massa. Por exemplo, um espectrómetro de massa com uma resolução de 1000 pode separar um ião com uma m/z de 100.0 de um ião com uma m/z de 100.1.
Em geral, um espectrómetro de massa (MS) consiste numa fonte de iões, um analisador de massa sclectivo, e um detector de iões. Os desenhos do sector magnético, do quadrupolo. e do tempo de voo também requerem uma óptica de extraeção e aceleração de iões para transferir iões da região da fonte para o analisador de massa. Os detalhes de vários desenhos de analisadores de massa (para o sector -magnético MS, quadrupolo MS ou tempo dc voo MS) são descritos abaixo. Analisadores de Focagem Única para o sector-magnético MS utilizam um caminho de feixe de partículas de 180, 90, ou (50 graus. As várias forças que influenciam a partícula separam iões com razões massa-carga diferentes. Com analisadores de dupla focagem, um analisador electrostático é adicionado neste tipo de instrumento para separar partículas com diferença nas energias cinéticas.
Um filtro de massa quadrupolo para o quadrupolo MS consiste em quatro varetas de metal arranjadas em paralelo. As voltagens aplicadas afectam a trajectória dos iões que viajam no caminho de voo centrado entre as quatro varetas. Para voltagens DC c AC ciadas, só iões com uma certa razão massa/carga passam através do filtro do quadrupolo c lodos os outros iões são atirados do seu caminho original. Um espectro de massa é obtido medindo os iões que passam através do filtro do quadrupolo quando as voltagens nas varetas .são variadas. 85
Um espectrofotómetro de massa tempo-de-voo usa as diferenças nos tempos de trânsito através de uma “região de desvio” (“drift region”) para separar iões de diferentes massas. Opera num modo pulsado e por isso os iões são produzidos em pulsos e/ou extraídos em pulsos. Um campo eléctrico pulsado acelera todos os iões até uma região de desvio sem campo com uma energia cinética de qV, onde q é a carga do ião e V é a voltagem aplicada. Λ
Como a energia cinética do ião é 0.5 mV , iões mais leves têm uma velocidade mais alta que iões mais pesados e chegam ao detector, no fim da região de desvio, primeiro. O resultado de um detector de iões é apresentado num osciloscópio em função do tempo produzindo o espectro de massa. O processo de formação de iões é o ponto de partida na análise espectrométrica de massa. Λ ionização química é um método que emprega um ião reagente para reagir com as moléculas a analisar (marcadores) para formar iões quer por transferência de protão quer por transferência de hidreto. Os iões reagentes são produzidos inserindo um grande excesso de metano (em relação ao marcador) numa fonte de iões de impacto de electrões (EI). As colisões eleelrónicas produzem CH4+ e CH3+ que posteriormente reagem com metano para formar Cif' e CSHC. Outro método para ionizar os marcadores é por plasma ou por descarga luminosa. Plasma é um gás quente, parcialmente ionizado que excita e ioniza átomos eficazmente. Uma descarga luminosa é um plasma de baixa pressão mantido entre dois eléctrodos. A ionização por impacto de electrões emprega um feixe de electrões, usualmente gerados por um filamento de tungsténio, para ionizar átomos ou moléculas em lase gasosa. Um electrão do feixe colide com um electrão dos átomos ou moléculas a analisar criando iões. Λ ionização por electro-pulverizaçáo (ESI) utiliza uma agulha muito fina e uma série de escumadeiras. Uma solução da amostra é pulverizada para dentro da câmara da fonte formando gotas. As gotas estão carregadas ao sair do capilar e ao se vaporizar o solvente as golas desaparecem ficando moléculas de analilo altamente carregadas. Λ ESI é paiticulamiciite útil paia moléculas biológicas grandes que são difíceis de ionizar ou vaporizar. O bombardeamento por átomos rápidos (FAB) utiliza um feixe de alta energia de átomos neutros, tipicamente Xc ou Ar, que colide com uma amostra sólida causando desoipção e ionização. É usado para moléculas biológicas grandes difícil de obter em fase gasosa. C) FAB provoca uma pequena fragmentação e geralmente dá um grande pico de ião molecular, tornando-o útil para determinação de pesos moleculares. O feixe atómico é produzido por aceleração de iões de uma fonte de iões através de uma célula de permuta de 86 carga. Os iões apanham um electrão em colisões com átomos neutros formando um feixe de átomos de alta energia. A ionização por laser (L1MS) é um método no qual um pulso de laser remove material da superfície de uma amostra e cria um microplasma que ioniza alguns dos constituintes da amostra. A ionização por desorpção por laser assistida por matriz. (MALDI) é um método LIMS de vaporização e ionização de grandes moléculas biológicas tais como proteínas ou fragmentos de DNA. As moléculas biológicas são dispersas numa matriz sólida tal como ácido nicotínico. Um pulso de laser UV remove a matriz que transporta algumas das moléculas grandes para a fase gasosa numa forma ionizada de modo a que possam ser eximidas para o espectrómetro de massa. A ionização por desorpção de plasma (RD) utiliza um decaimento de 2j2Cf que produz dois fragmentos de fissão que vão em direcções opostas. IJm fragmento colide com a amostra originando 1-10 iões a analisar. O outro fragmento colide com o detector e despoleta a aquisição de dados. Este método de ionização é cspecialmente útil para grandes moléculas biológicas. A ionização por ressonância (R1MS) é um método no qual um ou mais feixes de laser são sintonizados em ressonância a transições de um átomo ou molécula na fase gasosa para promovê-las de uma forma escalonada acima do seu potencial de ionização para criar um ião. A ionização secundária (S1MS) utiliza um Icixc dc iões, tais como JHe+, l60+, ou 40Αι+; é focado para a superfície de uma amostra provocando a vaporização de partículas. A fonte de faísca é um método que ioniza analitos cm amostras sólidas por pulsão de uma corrente eléctrica entre dois eléctrodos.
Um marcador pode ficar carregado antes de, durante ou depois da corte da molécula á qual está ligado. Os métodos de ionização baseados na “desorção’' de iões, a formação directa ou emissão de iões de superfícies sólidas ou liquidas tem permitido um aumento dc aplicações a compostos não voláteis e termicamcnte instáveis. Estes métodos eliminam a necessidade da volatilizaçao da molécula neutra antes da ionizaçfio e geralmente minimiza a degradação térmica das espécies moleculares. Estes métodos incluem desorpção do campo (Beeky, Principie» of Field Ionization anel Fielcl Desorpíion Muxx Spvclrornelry, Rergamon, Oxford, 1977), desorpção do plasma (Sundqvist and Macfarlane, Mass Speclrom. AVr. 7:421, 1985), desorpção laser (Karas and Ilillcnkamp, Anal. Client. 60:2299, l988;Karas el al., Angew. Chem. 101:805, 1989), bombardeamento de partículas rápidas (<?.£., bombardeamento de átomos rápidos (fast atom bombardement), FAB, e espectrometria de massa ióniea secundária (secondary ion mass spectrometry), SIMS, Barber et al.. Anal. Chem. 5--/:645A, 1982), e ionização por pulverização térmica (thermospray (TS)) (Vestal. Mass 87
Speclrom. Rev. 2: 447, 1983). A pulverização térmica é largamente aplicada par a combinação em linha com a cromatografia líquida. Os métodos FAB de fluxo continuo (Caprioli et al., Anal. Chem. 5<5’:2949, 1986) têm também mostrado um potencial significativo. Um listagem mais completa de combinações de espectrometria de ionização/massa é espectrometria de massa por armadilha de iões, espectrometria de massa de ionização por electropiilverização, espectrometria de massa por pulverização de iões, espectrometria de massa de ionização líquida, espectrometria de massa de ionização à pressão atmosférica, espectrometria de massa de ionização de electrões, espectrometria de massa de ionização por bombardeamento de átomos metaestáveis, espectrometria de massa de ionização por bombardeamento de átomos rápidos, espectrometria de massa MALDI, espectrometria de massa tempo de voo por fotoionização, espectrometria de massa por gotícula laser, espectrometria de massa MALDITO!7, espectrometria de massa APC1, espectrometria de massa por nano pulverização, espectrometria de massa de ionização por pulverização nebulizada, espectrometria de massa de ionização química, espectrometria de massa de ionização por ressonância, espectrometria de massa de ionização secundária, espectrometria de massa por pulverização térmica.
Os métodos de ionização acessíveis a compostos biológicos não voláteis têm gamas de aplicação sobrepostas. As eficiências de ionização são grandemente dependentes da composição da matriz e do tipo de composto. Os resultados correntemenle disponíveis indicam que a massa molecular mais alta para TS é cerca de 8000 daltons (Joncs and Krolik, Rapicl Comm. Mass Spearom. /:67, 1987). Uma vez que a TS é praticada sobretudo com espectrómetros de massa quadrapolos, a sensibilidade tipicamente sofre desproporcionalmente a razões massa/carga (πι/z) maiores. Espectrómetros de massa tempo de vôo (time-of-llight) (TOF) estão comercial mente disponíveis e têm a vantagem de que a gama m/z é limitada apenas pela eficiência do dctcctor. Recentemente, dois métodos adicionais de ionização têm sido introduzidos. Estes dois métodos são agora referidos como desorpção laser assistida por matriz (matrix assisted laser desorption) (MALDI, Kara3 and Hillcnkamp Anal. Chem. 60:2299, 1988; Karas et al. Angew. Chem. 707:805, 1989) e ionização por electropulverizaçâo (elcctrospray ionization) (ESI). Ambas as metodologias têm eficiências de ionização muito elevadas (i.e., razões [iões moleculares produzidos]/[moléculas consumidas] muito elevadas). Λ sensibilidade, que define o potencial fundamental da técnica, depende do tamanho da amostra, da quantidade de iões, da velocidade de fluxo, da eficiência de detecção e da efectiva eficiência da ionização. 88 A MS por electropulverização é baseada numa ideia proposta primeiro nos anos (19)60 (Dole et al.,,/. Chem. Phya. 49:2240, 1968). Ionização por electropulverização (ESI) é um meio de produzir moléculas carregadas para análise por espectroscopia de massa. Resumidamente, a ionização por electropulverização produz gotículas altamente carregadas por nebulização de líquidos num campo electrostático forte. As gotículas altamente carregadas, geralmente produzidas num banho seco de gás a pressões atmosféricas, contraem-se por evaporação do solvente neutro até à repulsão das cargas se sobrepor às forças coesivas, levando a uma “explosão Colombica”. O mecanismo exacto da ionização é controverso e vários grupos têm avançado mais hipóteses (Blades et al., Anal. Chem. 63:2109-14, 1991; Kebarle et al.. Anal. Chem. 65:A972-86, 1993; Fenn, J. Am. Soe. Mass. Spectrom. 4:524-35, 1993). Apesar do processo fundamental da formação de iões, ESI produz moléculas carregadas da solução sob condições suaves. A capacidade de obter resultados úteis de espectros de massa em pequenas quantidades de uma molécula orgânica depende da eficiente produção de iões. A eficiência da ionização para a ESI está relacionada com a quantidade de cargas positivas associadas com a molécula. A melhoria experimental da ionização tem geralmente envolvido o uso de condições ácidas. Um outro método de melhorar a ionização tem sido utilizar aminas quaternárias quando possível (ver Aebersold et al., Protein Science 1:494-503, 1992; Smith et al.. Anal. Chem. 60:436-41, 1988). A ionização por electropulverização é descrita em mais detalhe como se segue. Λ produção de iões por electropulverização requer dois passos: dispersão dc gotículas allamcnte carregadas a pressões próximas da atmosférica, seguida dc condições para induzir a evaporação. Uma solução de moléculas de analito é passada através de uma agulha que é mantida a um potencial eléctrico elevado. Na extremidade da agulha, a solução dispersa-se numa névoa dc pequenas gotículas altamente carregadas contendo as moléculas de analito. As pequenas gotículas evaporam rapidamente e por um processo de desorpção do campo ou evaporação residual. moléculae de proteína protonada são libertadas para o interior du fase gasosa. Uma electropulverização é geralmente produzida por aplicação de um campo eléctrico elevado a um pequeno fluxo de líquido (geralmente 110 pL/min) de um tubo capilar. Uma diferença de potencial de 3-6 kV é tipicamente aplicada entre o capilar e o contra-eléctrodo localizado a uma distância de 0.2-2 cm (onde iões, aglomerados carregados, e até gotícula 89 carregadas, dependendo da extensão da desolvatação, podem ser amostrados pelo MS através de um pequeno orifícios). O campo eléctrico resulta na acumulação de carga na superfície do líquido na terminação do capilar; assim a velocidade de fluxo do líquido, a resistividade, e a tensão .superficial são factores importantes na produção das gotículas. O campo eléctrico elevado resulta na ruptura da superfície do líquido e formação das gotículas de líquido a I lamente carregadas. Gotículas carregadas positivamente ou negativamente podem ser produzidas dependendo da inclinação do capilar. O modo ião negativo requer a presença de uma armadilha de electrões tal como oxigénio para inibir a descarga eléctrica. IJm variada gama de líquidos podem ser pulverizados electrostaticamente em vácuo, ou com a ajuda de um agente de nebulização. O uso de apenas campos eléctricos para nebulização leva a algumas restrições praticas na gama de condutividade do líquido e da constante dieléctrica. Uma condutividade da solução menor do que 10'3 ohms é necessária, à temperatura ambiente, para um electropulverizador estável a velocidades de (luxo líquido úteis correspondendo a uma solução aquosa de electrólito de < IO-4 M. No modo mais útil para ESI-MS, uma velocidade dc fluxo líquido apropriada resulta na dispersão do líquido como uma névoa de boa qualidade. A uma pequena distância do capilar o diâmetro da gotícula é geralmente muito uniforme e na ordem dos 1 μηι. De particular importância é que a corrente total dc iões electropulverizados aumente penas ligeiramente para elevadas velocidades de fluxo de líquido. Há evidência que o aquecimento é útil para manipulação da cleclropulverização. Por exemplo, um aquecimento ligeiro permite a soluções aquosas serem rapidamente electropulverizados, presumivelmente devido à menor viscosidade e tensão superficial. Quer a electropulverização termicamente assistida quer a assistida por nebulização gasosa permitem que maiores velocidades de fluxo de líquido sejam usadas, mas diminui a extensão do carregamento das gotículas. A formação de iões moleculares requer condições que causem evaporação da população inicial de gotículas. Isto pode ser realizado a elevadas pressões por um fluxo de gás seco a temperaturas moderadas (< 60°C), por aquecimento durante o transporte através da interface, e (partieularmente no caso dos métodos de ai madilliameulo de iões) por colisões energéticas a pressões relalivamente baixas.
Apesar dos processos detalhados subjacentes a ESI se manterem incertos, as gotículas muito pequenas produzidas por ESI parecem permitir que quase todas as espécies carregando uma carga líquida em solução sejam transferidas para a fase gasosa depois de evaporação do solvente residual. Λ detecção por espectrometria de massa requer, então, que 90 os iões tenham uma gama de m/z tratável (< 4000 daitons para instrumentos quadrupolo) depois da desolvatação, assim como serem produzidos e transmitidos com eficiência suficiente. A larga gama de solutos já encontrada a serem acessíveis a ESI-MS, e a não existência de uma dependência substancial do peso molecular na eficiência de ionização, sugere um processo de ionização altamente não descriminador e largamente aplicável. A “fonte” da electropulverização de iões funciona próximo da pressão atmosférica. A “fonte” da electropulverização é tipicamente um capilar de metal ou vidro incorporando um método para predispor electricamente a solução líquida relativamente a um contra-eléctrodo. Soluções, tipicamente misturas água-metanol contendo o analito e frequentemente outros aditivos tal como ácido acctico, flúem para a terminação do capilar. Uma fonte ESI que pode acomodar essencialmente qualquer sistema solvente tem sido descrita (Smith et al.. Anal. Chem. 62:885, 1990). Velocidades de fluxo típicas para ESI são I -10 μΙ ,/min. O principal requisito de uma interface ESI-MS é fornecer amostras e transportar iões da região de alta pressão para o interior do MS tão eficientemente quanto possível. A eficiência de ESI pode ser muito alta, fornecendo a base para medidas exlremamente sensíveis, o que é útil para a invenção aqui descrita. O rendimento instrumental comum pode fornecer uma corrente total de iões no detector de cerca de 2x1012 A ou cerca de IO7 contagens para espécies mono carregadas. Com base no rendimento instrumental, concentrações tão baixas como 10'12 M ou cerca de 10'18 rnol/s de uma espécie mono carregada darão uma corrente iónica detectável (cerca de 10 contagens) se o analito estiver completamente ionizado. Por exemplo, limites de detecção attomole baixos têm sido obtidos para iões de amónia quaternária usando uma interface ESI com electroforese de zona capilar (Smith et al.. Anal. Chem. 59:1230, 1998). Para um composto com um peso molecular de 1000, o numero médio de cargas é 1. o numero aproximado de estados de carga é I, a largura do pico (m/z) é 1 e a intensidade máxima (ião/s) é 1x10 “.
Uma amostra muito pequena é realmenLe consumida ao obter um espectro de massa ESI (Smith et al.. Anal. Chem. 60:1948, 1988). Ganhos substanciais podem ser também obtidos pelo uso de arranjos de dctcctorcs com instrumentos sectoriais, permitindo dctccçõcs simultâneas dc porções do espectro. Uma vez que actualmente apenas cerca de 10'* de todos os iões formados por ESI 3ão dctcctados, a atenção a factorer, que limitam o rendimento do instrumento pode fornecer uma base para melhorar a sensibilidade. Será evidente para os da 91 área que a presente invenção contempla e fornece melhorias em metodologias de ionização e detecçào.
Uma interface é preferivelmente colocada entre a instrumentação de separação gel) e o detector (e.g., espectrómetro de massa). A interface tem preferencialmente as seguintes propriedades: (1) a capacidade de juntar os fragmentos de DNA a intervalos de tempo discretos. (2) concentrar os fragmentos de DNA, (3) remover os fragmentos de DNA dos tampões e meios da electroforese, (4) cortar o marcador do fragmento de DNA, (5) separar o marcador do fragmento de DNA, (6) recolher o fragmento de DNA, (7) colocar o marcador numa solução volátil, (8) volatilizar e ionizar o marcador, e (9) colocar ou transportar o marcador num aparelho de electropulverização que introduz o marcador no interior do espectrómetro de massa. A interface também tem a capacidade de “juntar” fragmentos de DNA à medida que eles eluem da parte inferior do gel. O gel pode ser composto de um gel em placa, um gel tubular, um capilar, etc. Os fragmentos de DNA podem ser colectados por muitos métodos. O primeiro método é aquele que usa um campo eléctrico onde os fragmentos de DNA são colectados no ou próximo do eléctrodo. Um segundo método é aquele onde fragmentos de DNA são colectados fazendo fluir uma corrente de um líquido pela parte inferior do gel. Aspectos dos dois métodos podem ser combinados onde o UNA colectado numa corrente que lluí pode ser rnais tarde concentrado por uso de um campo eléctrico. O resultado filial é que os fragmentos de DNA sSo removidos do meio no qual a separação se realizou. Isto é, fragmentos de DNA podem ser “arrastados” de um tipo de solução para outro por uso de um campo eléctrico.
Quando os fragmentos de DNA estão na solução apropriada (compatível com a electropulverização c espcctromctria de massa) o marcador pode ser coitado do fragmento de DNA. O fragmento de DNA (ou seus restantes) pode então ser separado do marcador por aplicação de um campo clcctrico (prcfcrcncialmcntc, o marcador c dc carga oposta à do marcador de DNA). O marcador é então introduzido no interior do aparelho de electropulverização por uso de um campo eléctrico ou de um líquido que circula.
Os marcadores fluorescentes podem ser identificados e quantificados mais directamente pelos seus comprimentos de onda e intensidades de emissão de absorção e de fluorescência.
Enquanto um espectrofluorómetro convencional é extremamente flexível, garantindo gamas contínuas de comprimentos de onda de excitação e de emissão (Ιι-;χ, I,si, E2), instrumentos mais especializados, tais como citómetros de fluxo e microscópios de varrimento laser requerem sondas que são excitáveis a um único comprimento de onda fixo. Em instrumentos contemporâneos, isto é usualmente a linha 488 nm do laser de argon. A intensidade de fluorescência, por molécula de sonda, é proporcional ao produto de ε e QY. A gama destes parâmetros entre fluóforos de importância prática actual é aproximadamente 10000 a 100000 cm'1 M'1 para ε e 0.1 a 1.0 para QY. Quando a absorção é conduzida para a saturação por iluminação de alta intensidade, a destruição irreversível do (luoróforo excitado (foto-branqueamento) torna-se 0 factor que limita a detectabil idade da fluorescência. O impacto pratico do foto-branqueamento depende da técnica de detecção de fluorescência em questão.
Será evidente para alguém na área que pode ser interposto um dispositivo (uma interface) entre os passos de separação e de detecção para permitir a operação contínua de separação por tamanho e detecção do marcador (em tempo real). Isto unifica a metodologia e intrumentação de separação com a metodologia e instrumentação de detecção formando um único dispositivo. Por exemplo, uma interface é interposta entre uma técnica de separação e detecção por espectrometria de massa ou amperometria potenciostática. A função da interface é principalmente a libertação do (e.g., espectrometria de massa) marcador do analito. Há muitas implementações representativas da interface. O desenho da interface é dependente da escolha dos ligantes quebráveis. No caso de ligantes quebráveis por luz ou foto-quebráveis, uma tònte de energia ou tbtões é requerida. No caso de um ligante instável ao ácido, ligante instável à base, ou liganle dissulfureto, é necessária a adição dc reagente dentro da interface. No caso de ligantes instáveis ao calor, é necessária uma fonte de calor. A adição de enzimas é necessária para um ligante sensível a enzimas tais como uma prolease específica e um ligante peptldico, uma nuclease e um ligante DNA ou RNA, uma glicozilase, HRP ou fosfatase e um ligante que é instável depois da corte (e. g., .semelhante a substratos quimiluminescentcs). Outras caractcrísticas da interface incluem um alargamento mínimo de banda, a separação de DNA dos marcadores antes da injecção no espcctrómctro dc massa. As técnicas dc separação incluem as baseadas nos métodos e 93
técnicas electroforéticos, técnicas de afinidade, retenção por tamanho (diálise), filtração e semelhantes.
Também é possível concentrar os marcadores (ou construção marcador-ligante-ácido nucleico), capturar electroforeticamente, e em seguida libertar em corrente de reagente alternada que é compatível com o tipo particular do método de ionização seleccionado. A interface deve também ser capaz de capturar os marcadores (ou construção marcador-ligante-ácido nucleico) em microesferas, lançar a(s) esfera(s) na câmara e em seguida realizar a desorpção/vaporização por laser. Também é possível extrair em fluxo PARA tampões alternados (e.g., de tampão de electroforese capilar para tampão hidrofóbico através de uma membrana permeável). Pode também ser desejável em algumas utilizações libertar intermitentemente os marcadores no espectrómetro de massa que o compreenderia uma outra função da interface. Uma outra função da interface é libertar marcadores de múltiplas colunas num espectrómetro de massa, com um corte no tempo de rotação para cada coluna. Também, é possível libertar marcadores de um única coluna em detectores MS múltiplos, separados por tempo, colectar cada conjunto de marcadores por uns poucos milisegundos, e depois libertá-los para um espectrómetro de massa. A seguir vem uma lista de vendedores representativos para tecnologias de separação e detecção que podem ser usadas na presente invenção. A Hoefer Scientific Instruments (San Francisco, CA) fabrica equipamento de electroforese (Two Step™ Poker FacerM 11) para aplicações de sequenciação. A Pharmacia Biotech (Piscataway, NJ) fabrica equipamento de electroforese para separações e sequenciação de DNA (PhastSystem para análises PCR-SSCP, MacroPhor System para sequenciação de DNA). A Perkin Elmer/Applied Biosystems Division (ABI, Foster City, CA) fabrica sequenciadores semi-autoniatizados baseados em corantes fluorescentes (ABI373 e ABI377). A Analytical Spectral Devices (Boulder, CO) fabrica espectrómetros UV. A Hitachi Instruments (Tokyo, Japan) fabrica espectrómetros de Absorção Atómica, espectrómetros de fluorescência, espectrómetros de Massa LC e GC, espectrómetros NMR, e espectrómetros UV-VIS. A PerSeptive Diosystcms (Framingham, MA) produz Espectrómetros de Massa (Voyager™ Elite). A Bruker Instruments Inc. (Manning Park, MA) fabrica Espectrómetros FT1R (Vector 22). Espectrómetros FT-Raman, Espectrómetros de Massa Tempo de Voo (Reflex IIrM), Espectrómetros de Massa por Armadilha de Iões (Esquire,M) e um Espectrómetro de Massa Maldi. Λ Analytical Technology Inc. (ATI, Boston, MA) faz unidades de Electroforese em 94
Gel Capilar, deteetores UV, e Detectores de “Diode Array”. A Teledyne Electronic Technologies (Mountain View, CA) fabrica um Espectrómetro de Massa por Armadilha de Iões (3DQ Discovery™ e o 3DQ Apogee™). A Perkin Elmer/Applied Biosystems Division (Foster City, CA) fabrica um Espectrómetro de Massa Sciex (quadrupolo triplo LC/MS/MS, o ΛΡΙ 100/300) que é compatível com electropulverização. A Hewlett-Packard (Santa Clara, CA) produz Detectores Selectivos de Massa (HP 5972A), Espectrómetros de Massa MALDI-TOF (HP G2025A), Detectores de “Diodo Array”, unidades CE, unidades HPLC (HP1090) assim como Espectrómetros UV. A Finningan Corporation (San Jose, CA) fabrica espectrómetros de massa (sector magnético (MAT 95 S,M), espectrómetros quadrapolo (MAT 95 SQim) e outros quatro espectrómetros relacionados). A Rainin (Emeryville.CA) fabrica instrumentos de HPLC.
Os métodos e composições aqui descritos permitem o uso de marcadores quebráveis para servir de mapas a tipos de amostra e identidade nuclear particulares. No inicio de cada método de sequenciação, um iniciador particular (seleccionado) é atribuído a um (mico marcador particular. Os marcadores mapeiam-se quer a um tipo de amostra, a um tipo de terminador didesoxi (no caso de uma reacção de sequenciação Sanger) ou preferencialmente a ambos. Especificamente, o marcador mapeia-se a um tipo de iniciador que por sua vez se mapeia a um tipo de vector que por sua vez se mapeia a uma identidade da amostra. O marcador pode também poder mapear-se a um tipo de terminal didesoxi (ddTTP, ddCTP, dctUTP, ddA ) P) por referência em cuja reacção didesoxinucleotídica o iniciador marcado é colocado. A reacção de sequenciação é então realizada e os fragmentos resultantes sao separados sequencialmente por tamanho em tempo.
Os marcadores são cortados dos fragmentos numa estrutura temporal e medidos e registados numa estrutura temporal. A sequência é construída por comparação do marcador mapa com a estrutura temporal. Isto é, todas as identidades dos marcadores são registadas com o tempo depois do passo de classificação por tamanho c os relacionados tornam-sc relacionados entre si numa estrutura temporal. O passo de classificação por tamanho separa os fragmentos dc ácido nuclcico por um incremento de um nucleótido e assim as identidades dos marcadores relacionadas são separadas por um incremento de um nucleótido. Por previsão do terminal didesoxi ou nucleótido mapa e tipo de amostra, a sequência é facilmente deduzida de uma forma linear. 95
Os seguintes exemplos são oferecidos como forma de ilustração, e não como forma de limitação.
Os químicos usados nos exemplos podem ser obtidos, a não ser quando de outra forma nomeado, a partir de Aldrich Chemical Company, Milwaukee, Wl. As seguintes abreviações, com os significados indicados, são usadas aqui: ΛΝΡ ~ Ácido 3-(Fmoc-amino)-3-(2-nitrofenil)propiónico NBA = Ácido 4-(Fmoc-aminometil)-3-nitrobenzóico I IATU - hexafluorofosfato de Ο-7-azabenzotriazol-l-ilo-N, N, Ν', N'-tetrametiluronio DIEA = diisopropiletilamina MCT = monoclorotriazina NMM = 4-metilmorfol.ina NMP = N-metilpirrolidona ACT357 = Sintetizador de péptido ACT357 de Advanced ChemTech, Inc., Louisville, KY ACT = Advanced ChemTech, Inc., Louisville, KY NovaBiochem = CalBiochem-NovaBiochem International, San Diego, CA TF A = Ácido trifluoroacético I la = I rifluoroacetil íNIP = Ácido N-metilisonipecótico Tfp = Tctratluorofenil DIAEA = 2-(Diisopropilamino)etilamina MCT = monoclorotriazeno 5'Al-l-ODN = oligodesoxinucleótido com cauda 5'-aminohexil 96
EXEMPLOS EXEMPLO 1
PREPARAÇÃO DE LIGANTES INSTÁVEIS AO ÁCIDO PARA USO EM SEQUENCIAÇÃO DE IDENTIFICADOR DE PESO MOLECULAR QUEBRÁVEL A. Síntese de Pentafluorofenil Esteres de Marcadores de Espectroscopia de Massa Quimicamente Quebráveis para Libertar Marcadores com Terminal Amida Carboxil A Figura 1 mostra o esquema da reacção.
Passo A. A resina TentaGel S AC (composto II; disponível em ACT; 1 eq.) é suspendida com DMF no vaso de recolha do sintetizador de péptido ACT357 (ACT). O composto I (3 eq.), HATU (3 eq.) e DIEA (7.5 eq.) em DMF são adicionados e o vaso de colecção agitado durante 1 hora. O solvente é removido e a resina é lavada com NMP (2X), MeOH (2X), e DMF (2X). A união de I à resina e os passos de lavagem são repetidos, para dar o composto III.
Passo B. A resina (composto III) é misturada com piperidina 25% em DMF e agitada durante 5 min. A resina é filtrada, e em seguida misturada com piperidina 25% em DMF e agitada durante 1U mm. U solvente é removido, a resina é lavada com NMP (2X), MeOH (2X), e DMF (2X) e usada directamente no passo C.
Passo C. A resina não protegida do passo B é suspendida em DMF e é adicionado um aminoácido FMOC-protegido, contendo funcionalidade amino na sua cadeia lateral (composto IV, e.g. alfa-N-FMOC-3-(3-piridil)-alanina, disponível em Synthetech. Albany, OR; 3 eq.), íIATU (3 cq.), e DIEA (7.5 eq.) em DMF. O vaso é agitado durante 1 hora. O solvente é removido e a resina é lavada com NMP (2X), MeOH (2X), e DMF (2X). A união dc IV à resina c os passos dc lavagem são repetidos, para dar o composto V.
Passo D. A resina (composto V) c tratada com piperidina como descrito no passo B para remover o grupo FMOC. A resina não protegida é então dividida igualmente pelo ACT357 do vaso de recolha para 16 vasos de reacção. 97
Passo E. As 16 alíquotas de resina não protegida do passo D são suspendidas em DMF. A cada vaso de reacção é adicionado o ácido carboxílico apropriado VI|.|6 (Ri-iftC02H; 3 eq.), HATI.J (3 eq.), e DIEA (7.5 eq.) em DMF. Os vasos são agitados durante 1 hora. O solvente é removido e as alíquotas de resina são lavadas com NMP (2X), MeOH (2X), e DMF (2X). A união de VI Μή às alíquotas de resina e os passos de lavagem são repetidos, para dar os compostos VII
Passo F. As alíquotas de resina (compostos VIImo) são lavadas com CH2CI2 (3X). A cada um dos vasos de reacção é adicionado TFA 1% em CH2CI2 e os vasos são agitados durante 30 min. O solvente é filtrado dos vasos de reacção para tubos individuais. As alíquotas de resina são lavadas com CH2CI2 (2X) e MeOH (2X) e 0 filtrado combinado em tubos individuais. Os tubos individuais são evaporados em vácuo, fornecendo os compostos VIIIi-io-
Passo G. Cada um dos ácidos carboxílicos livres VIIIi-κ, é dissolvido em DMF. A cada solução é adicionada piridina (1.05 eq.), seguida depentafluoroíènil tritluoroacetato (1.1 eq.). As misturas são agitadas durante 45 min à temperatura ambiente. As soluções são diluídas com EtOAc, lavadas com ácido cítrico aq. 1M (3X) e NaHCO.-! aq. 5% (3X), secas em Na2S04- filtradas, e evaporadas em vácuo, fornecendo os compostos IX|.i6· B. Síntese de Pentafluorofenil Ésteres de Marcadores de Espectrosconia de Massa Quimicamente Quebráveis, para Libertar Marcadores com Terminal Ácido Carboxílico A Figura 2 mo3tra o esquema da reacção.
Passo A (3 ácido 4-(hidroximetil)fenpxibutírico (composto I; 1 eq.) é combinado com DIEA (2.1 eq.) e brometo de alilo (2.1 eq.) em CHC13 e aquecida com refluxo durante 2 horas. A mistura ó diluída c.0111 EtOAc, lavada com HC1 IN (2X), tampão carbonato pH 0.5 (2X), e salmoura (IX), seca em Na2S04, e evaporada em vácuo para dar 0 éster alílico do composto I.
Passo B. O éster alílico do composto I do passo A (1.75 eq.) é combinado em CH2CI2 com um aminoácido FMOC-protegido contendo funcionalidade arnina na sua cadeia lateral 98 (composto II, e.g. alfa-N-FMOC-3-(3-piridil)-alanina, disponível da Synthetech. Albany, OR; I eq.), N-metilmorfolina (2.5 eq.), e HATU (1.1 eq.), e agitada à temperatura ambiente durante 4 horas. A mistura é diluída com CH2CI2, lavada com ácido cítrico aq. 1M (2X), água (I X), e NaHCOs aq 5% (2X), seca em Na2S04, e evaporada em vácuo. O composto III é isolado por cromatografia flash (CH2Cl2-> EtOAc1'
Passo C. O composto III é dissolvido em CH2CI2, Pd(PPli3)4 (0.07 eq.) e N-metilalinina (2 eq.) são adicionados, e a mistura agitada à temperatura ambiente durante 4 horas. A mistura é diluída com CI I2CI2, lavada com ácido cítrico aq. 1M (2X), água (IX), seca em Na2SC>4, e evaporada cm vácuo. O composto IV é isolado por cromatografia flash (CH2CI2—> EtOAc + l-IO Ac).
Passo D. A resina TentaGel S AC (composto V; 1 eq.) é suspendida com DMF no vaso de recolha do sintetizador de péptido ACT357 (Advanced ChemTech lnc.(ACT), Louisville, KY). O composto IV (3 eq.), HATU (3 eq.) e DIEA (7.5 eq.) em DMF são adicionados e o vaso de recolha agitado durante 1 hora. O solvente é removido e a resina é lavada com NMP (2X), MeOH (2X), e DMF (2X). A união de IV à resina e os passos de lavagem são repetidos, para dar 0 composto VI.
Passo E. A resina (composto VI) c misturada com piperidina 25% cm DMF c agitada durante 5 min. A resina é filtrada, e em seguida misturada com piperidina 25% em DMF e agitada durante 10 min. O solvente é removido e α resina lavada com NMP (2X), MeOH (2X), c DMF (2X). A resina não protegida é então dividida igualmente pelo ACT357 do vaso de recolha em 16 vasos de reaeção.
Passo F. As 16 nlíqnotns da resina não protegida do passo E são suspendidas cm DMF. A cada vaso de reaeção é adicionado o ácido carboxílico apropriado VI1|.K) (Rm(,C02; 3 eq.), HATU (3 eq.). e DIEA (7.5 eq.) em DMF. Os vasos são agitados durante I hora. O solvente é removido e as alíquotas de resina lavadas com NMP (2X), MeOH (2X), e DMF (2X). A ligação de VII mo às alíquotas da resina e os passos de lavagem são repetidos, para dar os compostos VIII 99
Passo G. As alíquotas da resina (compostos VIII i.,6) são lavados com CH2CI2 (3X). A cada um dos vasos de reacção é adicionado TFA 1% em CH2CI2 e os vasos agitados durante 30 min. () solvente é filtrado dos vasos de reacção para tubos individuais. As alíquotas de resina são lavadas com CH2CI2 (2X) e MeOH (2X) e os filtrados combinados em tubos individuais. Os tubos individuais são evaporados em vácuo, fornecendo os compostos IXi-k,.
Passo H, Cada um dos ácidos carboxílicos livres IXi-jôé dissolvido em DMF. A cada solução é adicionada piridina (1.05 eq.), seguida de pentafluorofenil trifluoroacetato (1.1 eq.). As misturas são agitadas durante 45 min. à temperatura ambiente. As soluções são diluídas com EtAOc, lavadas com ácido cítrico aq. 1M (3X) e NaHCOj aq. 5% (3X), secas sob Na2S04, e evaporadas em vácuo, fornecendo os compostos Xi-u,. EXEMPLO 2
DEMONSTRAÇÃO DA QUEBRA FOTOLÍTICA DE T-L-X
Um composto T-L-X preparado como no exemplo 13 foi irradiado com luz no UV próximo durante 7 min à temperatura ambiente. Uma lâmpada UV de fluorescência Kayonett (Southern New England Ultraviolet Co., Middletown, CT) com um pico de emissão a 350 nm é usada como fonte de luz UV. A lâmpada é colocada a uma distância de 15 cm das placas de Petri com amostras. A electroforese de gel SDS mostra que > 85% do conjugado é cortado nestas condições. EXEMPLO 3
PREPARAÇÃO DC INICIADORES MARCADOS FLUORESCENTES E DEMONSTRAÇÃO DA QUEBRA DO FLUORÓFORO Síntese e Purificação de Oligonucleótidos
Os oligonucleótidos (ODNs) são preparados em sintetizadores de DNA automatizados usando a química fosforamidite padrão fornecida pelo vendedor, ou a química l-I-fosfonato (Glenn Research Sterling, VA). Fosforamidites dA, dG. dC, e T bloqueadas 100 apropriadamente estão comercialmente disponíveis nestas formas, e nuclcósidos sintéticos podem ser rapidamente convertidos à forma apropriada. Os oligonucleótidos são preparados usando a fosíoramidite padrão fornecida pelo vendedor, ou a química H-fosfonato. Oligonucleótidos são purificados por adaptação de métodos padrão. Oligonucleótidos com grupos 5 '-tritil são cromatografados em IIPLC usando uma coluna de fase reversa 300 # Rainin (Emeryville, CA) Dynamax C-8 4.2x250 mm, 12 micrómeros, usando um gradiente de 15 % a 55% MeCN em 0.1N Et3NH+OAc\ pH 7.0, durante 20 min. Quando a detritilação é realizada, os oligonucleótidos são posteriormente purificados por cromatografia de exclusão molecular, lestes analíticos da qualidade dos oligonucleótidos são conduzidos com uma coluna PRP (Alltech, Deerfield, TL) a pH alcalino e por PAGE. A preparação de oligonucleótidos derivados de 2,4,6-trícIorotriazina: 10 a 1000 pg de oligonucleótido ligado a amina terminal 5' reagem com um excesso de cloreto cianúrico recristalizado em 10% n-metil-pirrolidona em tampão alcalino (p.l-1 8.3 a 8.5 preferencialmcnte) a 19 °C até 25 °C durante 30 a 120 minutos. As últimas condições de reacção consistem em borato de sódio 0.15 M a pH 8.3, 3.2 mg/ml de cloreto cianúrico recristalizado e 500 pg/ml do oligonucleótido respectivo. O cloreto cianúrico não reagido é removido por cromatografia de exclusão de tamanho numa coluna G-50 Sephadex (Pharmacia, Piscataway, NJ). O oligonucleótido purificado activado reage depois com um excesso molar de 100 vezes cistamina em borato de sódio 0.15M a pH 8.3 durante 1 hora à temperatura ambiente. A cistamina não reagida é removida por cromatografia de exclusão do tamanho numa coluna Sephadex G-50. Os ODNs derivados são então reagidos com fiuorocromos amina reactivos. A preparação ODN derivada é dividida em 3 porções e cada porção reage com quer (a) excesso molar de 20 vezes de cloreto de sulfonilo vermelho do Texas (Molecular Probes. Eugcne, OR), com (b) excesso molar de 20 vezes de cloreto de sulfonilo Lisdsamina (Molecular Probes, Eugene, UR), com (c) excesso molar de 20 vezes de isoliocianato de lluoresceina. As condições de reacção finais consistem em borato de sódio 0.15M a pH 8.3 durante I hora á temperatura ambiente. Os fiuorocromos não reagidos sao removidos por cromatografia de exclusão de tamanho numa coluna Sephadex G-50.
Para cortar o lluorocromo do oligonucleótido, os ODNs são ajustados a lxlO'15 molar e em seguida são feitas diluições (12, diluições 3 -vezes) em TE (TE é Tris 0.01M, pl l 101 7.0. EDTA 5 mM). A volumes de 100 μΐ de ODNs é adicionado 25 μΐ de ditiolreitol (DTT) 0.01M. A um conjunto de controlos idênticos nenhum DDT é adicionado. A mistura é incubada durante 15 minutos à temperatura ambiente. A fluorescência é medida num placa de microtitulação preta. A solução é removida dos tubos de incubação (150 microlitros) e colocada numa placa de microtitulação preta (Dynatek Laboratories, Chantilly, VA). As placas são então lidas directamente usando um fluorómetro Fluoroskan II (Flow Laboratories, McLean, VA) usando um comprimento de excitação de 495 nm e medindo a emissão a 520 um para fluoresceína, usando um comprimento de excitação de 591 nm e medindo a emissão a 612 nm para o Vermelho do Texas, e usando um comprimento de excitação de 570 nm e medindo a emissão a 590 nm para lissamina.
Moles de RFU RFU RFU Fluorocromo não cortado cortado livre 1.0 x 10 M 6.4 1200 1345 5.3 x Ι0Λ M 2.4 451 456 1.1 x 10 ft M 0.9 135 130 5.7 x 10 7 M 0.3 44 48 1.2 x 10 7 M 0.12 15.3 16.0 4.1 x 10 7 M 0.14 4.9 5.1 1.4 x .10 s M 0.13 2.5 2.8 4.5 x I0‘'M 0.12 0.8 0.9
Os resultados indicam que há um aumento de cerca de 200 vezes na fluorescência relativa quando o lluorocromo c cortado do ODN. EXEMPLO 4
PREPARAÇÃO DE INICIADORES DE SEQUÊNCIA Ml 3 MARCADOS Π DEMONSTRAÇÃO DA QUEBRA DE MARCADORES A preparação de oligonucleótidos 2,4,6-triclorotriazina derivados: 1000 μμ de oligonucleótido ligado a uma amina no terminal 5' (5'-hexilamina- 102 TGTAAAACGACGGCCAGT-3'') (Seq. ID N° 1) reage com um excesso de cloreto cianúrico recristalizado em 10% tampão alcalino n-metil-pirrolidona (pH 8.3 a 8.5 preferencialmente) a 19 a 25° C durante 30 a 120 minutos. As condições de reacção finais consistem em borato de sódio 0.15M a pH 8.3, 2 mg/ml de cloreto cianúrico recristalizado e 500 pg/ml do olignucleótido respectivo. O cloreto cianúrico não reagido é removido por cromatografia de exclusão de tamanho numa coluna Sephadex G-50. O oligonucleótido purificado activado reage depois com um excesso molar de 100 vezes de cistamina em borato de sódio 0.15M a pH 8.3 durante 1 hora à temperatura ambiente. A cistamina não reagida é removida por cromatografia de exclusão de tamanho numa coluna Sephadex G-50. Os ODNs derivados reagem depois com uma variedade de amidas. A preparação de ODN derivadas é dividida em 12 porções e cada porção reage (excesso molar de 25 vezes) com os ésteres pentafluorofenilicos de quer (1) ácido motoxibenzóico, (2) ácido 4-fluorobenzóico, (3) ácido toluico, (4) ácido benzóico, (5) ácido indole-3-acético, (6) ácido 2,6-difluorobanzóico, (7) ácido nicotínico N-óxido, (8) ácido 2-nitrobenzóico, (9) ácido 5-acetilsalicílico, (10) ácido 4-etoxibenzóico, (11) ácido cinâmico, (12) ácido 3-aminonicotínico. A reacção é durante 2 horas a 37 0 C em NaBorato 0.2 M pH 8.3. Os ODNs derivados são purificados por cromatografia de exclusão em gel numa coluna Sephadex G-50.
Para cortar o marcador do oligonucleótido, os ODNs são ajustados a 1x10° molar e em seguida são feitas diluições (12, diluições 3-vezes) em TE (TE é Tris 0.01M, pH 7.0, EDTA 5 mM) com etanol 50% (v/v). A volumes de 100 μΐ de ODNs são adicionados 25 μΙ de ditiotreitol (DTT) 0.01 Μ. A um conjunto idêntico de controlos nenhum DDT é adicionado. A incubação é durante 30 minutos à temperatura ambiente. Em seguida é adicionado NaCl a 0.1M e são adicionados 2 volumes de EtOI-1 para precipitar os ODNs. Os ODNs são removidos da solução por centifugação a 14000 x G a 4°C durante 15 minutos. Os sobrenadantes são guardados, e integralmente secos. O sedimento é então dissolvido em 25 μΐ de ÍVleOH. O sedimento é então testado por espectrometria de massa para presença de marcadores. O espectrómetro de massa usado neste trabalho é um espectrómetro de massa de transformada de l ourier (FTMS, bourier-transform mass spectrometer) de tonte de iões externa. As amostras preparadas para análises MALDI são depositadas na ponta de um sonda 103 directa e inseridas no interior da fonte de iões. Quando a amostra é irradiada com um pulso laser, iões são extraídos da fonte e passam num guia de iões quadrupolo longo que foca e (ransporla-os para um célula do analisador FTMS localizada no interior de uma cavidade de um magncto supercondutor. O espectro fornece a seguinte informação. Picos variando de intensidade de 25 a 100 unidades de intensidade relativa nos seguintes pesos moleculares: (I) 212.1 anui indicando um derivado de ácido 4-metoxibenzóico, (2) 200.1 indicando um derivado de ácido 4-fluorobenzóico, (3) 196.1 amu indicando um derivado de ácido toluico, (4) 182.1 amu indicando um derivado de ácido benzóico, (5) 235.2 amu indicando um derivado de ácido indole-3-acético, (6) 218.1 amu indicando um derivado de 2,6-difluorobenzóico, (7) 199.1 anui indicando um derivado de ácido N-óxido nicotínico, (8) 227.1 amu indicando uma 2-nilrobenzamida, (9) 179.18 amu indicando um derivado de ácido 5-acetilsalicílico, (10) 226.1 amu indicando um derivado de ácido 4-etoxibenzóico, (11) 209.1 amu indicando ura derivado de ácido cinàmico, (12) 198.1 amu indicando um derivado de ácido 3-aminonicotínico.
Os resultados indicam que os identificadores do peso molecular são cortados dos iniciadores e são detectáveis por espectrometria de massa. EXEMPLO 5
DEMONSTRAÇÃO DA SEQUENCIAÇÃO USANDO UM MÉTODO DE SEPARAÇÃO POR ITPLC. COLECTANDO FRACÇÕES, QUEBRANDO OS IDENTIFICADORES DE PESO MOLECULARE. DETERMINANDO A MASSA (E ASSIM A IDENTIDADE) DO IDEN TIFICADOR DE PESO MOLECULAR E EM SEGIJIIDA DEDUZINDO A
SEQUÊNCIA
Os seguintes oligomicleólidos são preparados como descritos no exemplo 4. I)M() 767: '5-hexilamina-TGTAAAACGACGGCCAGT-3') (Scq. IDNo. 1) DM O 768: ' 5-hexilamina-T GT AAAACGACGGCC AGT A-3') (Seq. IDNo. 2) DMO 769: '5 hexilamina TGTAAAACGACGGCCAGTAT 3') (Seq. IDNo. 3) DMO 770: 5-hexilamina-TGTAAAACGACGGCCAGTATG-3') (Seq. ID No. 4) DMO 771: '5-hexilamina-TGTAAAACGACGGCCAGTATGC-3') (Seq. ID No. 5) 104 DMO 772: '5-hexilamina-TGTAAAACGACGGCCAGTATGCA-3') (Seq. IDNo. 6) DMO 773: '5-hexilamina-TGTAAAACGACGGCCAGTATGCAT-3') (Seq.ID No.7) DMO 774:'5-liexilamina-TGTAAAACGACGGCCAGTATGCATG-3' (Seq.ID No.8) 100 pg de cada um dos oligonucleótidos ligados a uma amina no terminal 5' descritos acima reagem com um excesso de cloreto cianúrico recristalizado em 10% tampão alcalino n-metil-pirrolidona (pH 8.3 a 8.5 preferencialmente) a 19 a 25 °C durante 30 a 120 minutos. As condições de reacção finais consistem em borato de sódio 0.15M a pH 8.3, 2 mg/ml de cloreto cianúrico recristalizado e 500 pg/ml do olignucleótido respectivo. O cloreto cianúrico não reagido é removido por cromatografia de exclusão de tamanho numa coluna Sephadex G-50. O oligonucleótido purificado activado reage depois com um excesso molar de 100 vezes de cistamina em borato de sódio 0.15M a pH 8.3 durante 1 hora à temperatura ambiente. A cistamina não reagida é removida por cromatografia de exclusão de tamanho numa coluna Sephadex G-50. Os ODNs derivados reagem então com um éter pentafiuorolemTico particular dos seguintes: (1) DM0767 com ácido 4-metoxibenzóico, (2) DM0768 com ácido 4-fluorobenzóico, (3) ácido toluico, (4) DM0769 com ácido benzóico, (5) DM0770 com ácido indole-3-acético, (6) DM0771 com ácido 2,6-difluorobenzóico, (7) DM0772 com ácido N-óxido nicotínico, (8) DM0773 com ácido 2-nitrobenzóico. 10 ng de cada um dos oito ODNs derivados são misturados e em seguida separados por tamanho por HPLC. A mistura é colocada em 25 μΐ de água destilada. Toda a amostra é ínjectada no interior da seguinte coluna. E usada uma coluna LiChrosphcr 4000 DMAE. 50-10 mm (EM Separations, Wakeiield, Rl). O eluente A é Na2HP04 20 mM em 20% ACN. pH 7.4; Eluente B é Eluente A + NaCI 1 M, pl-l 7.4. O caudal é de 1 ml/min e a delccção c 1JV a 280 nm. O gradiente é como se segue: 0 min. @ 100% A e 0% B. 3 min. @ I ()()%A e 0 % B, 15 min. @ 80% A e 20 % B, 60 min. @ 0% A e 100% B, 63 min. @ 0% A e 100 % B. 65 min @ 100% A e 0 % R, 70 min. @ 100% A e 0 % B. São colectadas liracções em intervalos de 0.5 minutos.
Para cortar os marcadores do oligonucleótido, 100 μΐ de ditiolreilol (ΠΤΤ) 0.05M c adicionado a cada fracção. A incubação é durante 30 minutos à temperatura ambiente. Em seguida é adicionado NaCI a 0.1M e são adicionados 2 volumes de F.tOH para 105 precipitar os ODNs. Os ODNs são removidos da solução por centifugação a 14000 x G a 4°C durante 15 minutos. Os sobrenadantes são guardados, integralmente secos sob vácuo com centrifugação. O sedimento é então dissolvido em 25 μΐ de MeOH. O sedimento é então testado por espeetrometria de massa para presença de identificadores de peso molecular. A mesma técnica MALDI é empregue como descrito no Exemplo 4. Os seguintes pesos moleculares (marcadores) são observados no espectro de massa em função do tempo: 1' racção # Tempo Mws Fracção # Tempo Mws Pesos moleculares Pesos moleculares '1 0.5 nenhum 31 15.5 212.1 O 1 nenhum 32 16 212.1 /> 1.5 nenhum 33 16.5 212.1 4 2 nenhum 34 17 212.1; 200.1 5 2.5 nenhum 35 17.5 200.1 6 3 nenhum 36 18 200.1 7 3.5 nenhum 37 18.5 200.1 <S 4 nenhum 38 19 200.1; 196.1 0 4.5 nenhum 39 19.5 200.1; 196.1 10 5 nenhum 40 20 196.1 11 5.5 nenhum 41 20.5 196.1 12 6 nenhum 42 21 196.1; 182.1 13 6.5 nenhum 43 21.5 182.1 14 7 nenhum 44 22 182.1 15 7.5 nenhum 45 22.5 182.1; 235.2 16 8 nenhum 46 23 235.2 17 8.5 nenhum 47 23.5 235.2 18 9 nenhum 48 24 235.2; 218.1 19 9.5 nenhum 49 24.5 218.1 20 10 nenhum 50 25 218.1 21 10.5 nenhum 51 25.5 218.1; 199.1 °2 1 1 nenhum 52 26 199.1 106 23 11.5 nenhum 53 26.5 199.1; 227.1 24 12 nenhum 54 27 227.1 25 12.5 nenhum 55 27.5 227.1 26 13 nenhum 56 28 Nenhum 27 13.5 nenhum 57 28.5 nenhum 28 14 nenhum 58 29 nenhum 29 14.5 nenhum 59 29.5 nenhum 30 15 nenhum 60 30 nenhum O aparecimento temporal dos marcadores é assim 212.1, 200.1, 196.1, 182.1, 235.2. 218.1, 199.1, 227.1. Uma vez que 212.1 amu indica o derivado do ácido 4-metoxibenzóico. 200.1 indica o derivado do ácido 4-fluorobenzóico, 196.1 amu indica o derivado do ácido toluico, 182.1 amu indica o derivado do ácido benzóico, 235.2 amu indica o derivado do ácido indole-3-acético, 218.1 amu indica o derivado do ácido 2,6-difluorobenzóico, 199.1 amu indica o derivado do ácido N-óxido nicotínico, 277.1 amu indica a 2-nilrobenzamida a sequência pode ser deduzida como -5'-ATGCATG-3'-. EXEMPLO 6
DEMONSTRAÇÃO DA SEQUENCIAÇÀO DE DUAS AMOSTRAS DE DNA NUM ÚNICO MÉTODO DE SEPARAÇÃO POR HPLC
Neste exemplo, duas amostras de DNA são scquenciador num único método de separação.
Os seguintes oligonucleótidos são preparados como descrito no exemplo 1: DMO 767: '5-hexilamina-TGTAAAACGACGGCCAGT-3') (Seq. IDNo. 1) UMO 768: '5-hexilamina-TGTAAAACGACGGCCAGTA-3') (Seq. ID No. 2) DMO 769: '5-hexilamina-TGTAAAACGACGGCCAGTAT-3') (Seq. IDNo. 3) DMO 770: '5-hexilamina-TGTAAAACGACGGCCAGTATG-3') (Seq. 1D No. 4) DMO 771: ’5-hexilamina-TGTAAAACGACGGCCAGTATGC-3') (Seq. IDNo. 5) DMO 772. ' 5 -hexi lamina-T GT A A AACG ACGGCC AGT AT GC A 3') (Seq. ID No. 6) 107 DMO 775 DM0 776 DMO 777 DMO 778 DMO 779 DMO 780 '5-hexi!amina-TGTAAAACGACGGCCAGC-3') (Seq. 1D No. 9) '5-hexilamina-TGTAAAACGACGGCCAGCG-3') (Seq. ID No. 10) '5-hexilamina-TGTAAAACGACGGCCAGCGT-3') (Seq. ID No. 11) '5-hexilamina-TGTAAAACGACGGCCAGCGTA-3') (Seq. IDNo. 12) '5-hexilamina-TGTAAAACGACGGCCAGCGTAC-3') (Seq. ID No. 13) '5-hexilamina-TGTAAAACGACGGCCAGCGTACC-3') (Seq. IDNo.14) 100 qg de cada um dos oligonuclcótidos ligados a uma amina no terminal 5' descritos acima reagem com um excesso de cloreto cianúrico recristalizado em 10% tampão alcalino n-melil-pirrolidona (pH 8.3 a 8.5 preferencialmente) a 19 a 25 °C durante 30 a 120 minutos. As condições de reacção finais consistem em borato de sódio 0.15M a pH 8.3, 2 mg/ml de cloreto cianúrico recristalizado e 500 qg/rnl do olignucleótido respectivo. O cloreto cianúrico não reagido é removido por cromatogralla de exclusão de tamanho numa coluna Sephadex G-50. O oligonucleótido purificado activado reage depois com um excesso molar de 100 vezes de cistamina em borato de sódio 0.15M a pH 8.3 durante 1 hora à temperatura ambiente. A cistamina não reagida é removida por cromatografia de exclusão de tamanho numa coluna Sephadex G-50. Os ODNs derivados reagem então com um éter pentafluorofenilico particular dos seguintes: (1) DM0767 com ácido 4-metoxibenzóico e DM0773 com ácido N-oxido nicotínico, (2) DM0768 com ácido 4-íluorobenzóico c DM0774 com ácido 2-nitrobenzóico, (3) ácido toluico e DM0775 com ácido acetilsalicílico, (4) DM0769 com ácido benzóico e DM0776 com ácido 4-etoxibenzóico, (5) DMO770 com ácido indole-3-acético e DM0777 com ácido cinâmico (6) DM0771 com ácido 2,6-dilluorobcnzóico e DM0778 com ácido 3-aminonicotínico. Assim, há um dos marcadores para cada conjunto de ODNs. 10 ng de cada um dos doze ODNs derivados são misturados e em seguida separados por tamanho por HPLC. A mistura é colocada em 25 μΐ de água destilada. Toda a amostra c injectada no interior da seguinte coluna. É usada uma coluna LiChrospher 4000 DMAE. 50-10 mm (EM Separations, Wakefield, RI). O eluente A é NaiHPCti 20 mM em 20% ACN, pH 7.4; Eluente B é Eluente A + NaCl 1 M, pH 7.4. O caudal é de 1 ml/min e a detecção é UV a 280 nra. O gradiente é como se segue: 0 min. @ 100% A e 0% B, 3 min. @ 108 100%Λ e Ο % B, 15 mm. @ 80% A e 20 % R, 00 min. @ 0% A e 100% R, 6.1 min. @ 0% A e 100 % 13, 65 min. @ 100% A c 0 % Β, 70 min. @ 100% A e 0 % Β. São colectadas fracções cm intervalos de 0.5 minutos.
Para cortar o marcador do oligonucleótido, 100 μΐ de ditiotreitol (DTT) 0.05M é adicionado a cada fracçBO. A incubação é durante 30 minutos à temperatura ambiente. Em seguida é adicionado NaCl a 0.1M e são adicionados 2 volumes de EtOH para precipitar os ODNs. Os ODNs são removidos da solução por centifugação a 14000 x G a 4°C durante 15 minutos. Os sobrenadantes são guardados, integralmente secos sob vácuo com centrifugação. O sedimento é então dissolvido em 25 μΐ de McOII. O sedimento c então testado por espectrometria de massa para a presença de marcadores. A mesma técnica MALDI é empregue como descrito no Exemplo 4. Os seguintes pesos moleculares (marcadores) são observados no espectro de massa em função do tempo: ITacção # Tempo .Mws Fracção# Tempo Mws Pesos moleculares Pesos moleculares 1 0.5 nenhum 31 15.5 212.1, 199.1 2 1 nenhum 32 16 71? 1, 199.1 1.5 nenhum 33 16.5 212.1, 199.1 4 7 nenhum 34 17 212.1:200.1. 199.1 227.1 5 2.5 nenhum 35 17.5 200.1, 199.1.227.1 6 3 nenhum 36 18 200.1,227.1 7 2.5 nenhum 37 18.5 200.1,227.1,179.18 X 4 nenhum 38 19 200.1:196.1,179.18 9 4.5 nenhum 39 19.5 200.1:196.1.179.18 10 5 nenhum 40 20 196.1,179.18,226.1 11 5.5 nenhum 41 20.5 196.1,226.1 12 6 nenhum 42 21 196.1:182.1.226.1 i 2 6.5 nenhum 43 21.5 182.1,226.1,209.1 14 7 nenhum 44 22 182.1,209.1 15 7.5 nenhum 45 22.5 182.1;235.2,209.1 109 198.1 16 8 nenhum 46 23 235.2, 198.1 17 8.5 nenhum 47 23.5 235.2, 198.1 18 9 nenhum 48 24 235.2; I98.I. 218.1 19 9.5 nenhum 49 24.5 218.1 20 10 nenhum 50 25 218.1 21 10.5 nenhum 51 25.5 nenhum 22 11 nenhum 52 26 nenhum 23 1.1.5 nenhum 53 26.5 nenhum 24 12 nenhum 54 27 nenhum 25 12.5 nenhum 55 27.5 nenhum 26 13 nenhum 56 28 nenhum 27 13.5 nenhum 57 28.5 nenhum 28 14 nenhum 58 29 nenhum 29 14.5 nenhum 59 29.5 nenhum 30 15 nenhum 60 30 nenhum O aparecimento temporal dos marcadores para o conjunto #1 c 212.1, 200.1, 196.1, 182.1, 235.2, 218.1, 199,1, 227.1 e o aparecimento temporal dos marcadores para o conjunto U2 é 199.1, 227.1, 179.1, 226.1, 209.1, 198.1. Uma vez que 212.1 amu indica o derivado do ácido 4-metoxibenzóico, 200.1 indica o derivado do ácido 4-fluorobenzóico, 196.1 amu indica o derivado do ácido toluico, 182.1 amu indica o derivado do ácido benzóico, 235.2 amu indica o derivado do ácido indole-3-acético, 218.1 amu indica o derivado do ácido 2,t>-diriuorobenzóico, 199.1 amu indica o derivado do ácido N-óxido nicotinico, 277.1 amu indica a 2-nitrobenzamida, 179.18 amu indica o derivado do ácido acetilsalicílico. 226.1 amu indica o derivado do ácido 4-etoxibenzóico, 209.1 amu indica μ deiivado do ácido cinâmico, c 198.1 amu indica o ácido aminonicotínico, a primeira sequência pode ser deduzida como -5 -TATGCA-3'- e a segunda sequência pode ser deduzida como -5'-CGTACC-3'Assim, é possível sequenciar mais do que uma mostra de DNA por passo de separação. 110 EXEMPLO 7 PREPARAÇÃO DE UM CONJUNTO DE COMPOSTOS DA FÓRMULA R,or,-LYS (ε- INIP)-ANP-Tfr A Figura 3 ilustra a síntese paralela de lun conjunto de 36 compostos T-L-X (X-L|,), onde Li, é um éster activado (especificamente, tetrafluorofenil éster), L2 c um grupo orto-nifrobenzilamina com L3 sendo um grupo metileno que liga Lh e L2, T tem uma estrutura modular onde o grupo de ácido carboxílico da lisina foi ligado ao átomo de azoto do grupo benzilamina L2 para formar uma ligação amida, e um componente de peso variável Ri.y, (onde estes grupos R correspondem a T2 como aqui definido, e podem ser introduzidos através de qualquer um dos ácidos carboxílicos específicos aqui listados) é ligado através do grupo amina-a da lisina, enquanto um grupo aumentador da sensibilidade de espec de massa (intoroduzido via ácido N-metilisonipecótico) é ligado através do grupo ε-amina da lisina.
Referindo-se à Figura 3:
Passo A. A resina Novasyn ΗΜΡ (disponível na Nova Biochem; l eq.) é suspendida com l)MF no vaso de recolha do ACT357. O composto I (ANP disponível de ACT; 3 eq,), HATU (3 eq.) e NMM (7.5 eq.) em DMF são adicionados e o vaso de recolha agitado durante 1 hora. O solvente é removido e a resina é lavada com NMP (2X), MeOFl (2X), e DMF (2X). A união dc I à resina e os passos de lavagem são repetidos, para dar o composto II.
Passo B. A resina (composto II) é misturada com piperidina 25% em DMF e agitada durante 5 min. A resina é filtrada, e em seguida misturada com piperidina 25% em DMF e agitada durante 10 min. O solvente é removido, a resina lavada com NMP (2Χ), MeOI-I (2X), e DMF (2X). e usada directamente no passo C.
Passo C. Λ resina não protegida do passo B é suspendida em DMF e é lhe adicionado um aminoácido FMOC-protegido, contendo uma funcionalidade amina protegida na sua cadeia lateral (Fmoc-Lysina(Aloc)-OH, disponível em PerSeplive Biosystems; 3 eq.), HATU (3 eq.), e NMM (7.5 eq.) em DMF. O vaso é agitado durante 1 hora. O solvente é removido e a resina e lavada com NMP (2X), MeOH (2X), e DMF (2X). A união de Fmoc-Lysina(Aloc)-OH à resina e os passos de lavagem são repetidos, para dar o composto IV.
Passo Γ>. A resina (composto IV) é lavada com CH2CI? (2X), e em seguida suspendida numa solução de (PPh;,)4 Pd (0) (0.3 eq.) e PI1SÍH3 (10 eq.) em CH2CI2. A mistura é agitada durante I hora. O solvente é removido e a resina é lavada com CH2CI2. O passo do paládio é repetido. O solvente é removido e a resina é lavada com CH2CI2 (2X), N,N- diisopropiletilamónia dictilditiocarbamato em DMF (2X), DMF (2X) para dar 0 composto V.
Passo E. A resina não protegida do passo D é ligada com ácido N-metilisonipecótico como descrito no passo C para dar o composto VI.
Passo F. A resina VI protegida com Fmoc é dividida igualmente pelo ACT357 do vaso de recolha cm 36 vasos de reacção para dar os compostos VI 1.3(,.
Passo (1. A resina (compostos VI 1.3(,) é tratada com piperidina como descrito no passo B para remover 0 grupo FMOC.
Passo 1-1. As 36 alíquotas de resina não protegida do passo G são suspendidas em DMF. A cada vaso de reacção é adicionado 0 ácido carboxílico apropriado (R1.3CCO2H; 3 et].), I-1ATU (3 eq.), e NMM (7.5 eq.) em DMF. Os vasos são agitados durante 1 hora. O solvente é removido e as alíquotas de resina são lavadas com NMP (2X), MeOH (2X), e DMF (2X). A união de R 1-3(,CO2H às alíquotas de resina e os passos de lavagem são repetidos, para dar os compostos VIIl|-3(,.
Passo I, As alíquotas de resina (VIIIua) são lavadas com CHbCb (3X). A cada um dos vasos de reacção é adicionado TFAd hOtCFhCb em 90:5:5 e os vasos agitados durante 120 min. O solvente é filtrado dos vasos de reacção para tubos individuais. As alíquotas de resina são lavadas com CI-I2CI2 (2X) e MeOl-l (2X) e os filtrados combinados nos tubos individuais. Os tubos individuais são evaporados em vácuo, fornecendo compostos IXinr,-
Passo J. Cada um dos ácidos carboxílicos livres IXj.36 é dissolvido em DMF. A cada solução c adicionada piridina (1.05 eq.), seguida de tetrafluorofenil trifluoroacetato (.1.1 eq.). As misturas são agitadas durante 45 min à temperatura ambiente. As soluções são diluídas com 112
EtOAc, lavadas com NaHCCb aq. 5% (3X), secas em Na2S04, filtradas, e evaporadas em vácuo, fornecendo compostos X 1.3(,. EXEMPLO 8 PREPARAÇÃO DE UM CONJUNTO DE COMPOSTOS DA FÓRMULA Rior.-LYS (ε- ΙΝΙΡ)-ΝΒΑ-Ί>|. A Figura 4 ilustra a síntese paralela de um conjunto de 36 compostos T-L-X (X=.Lh), onde L|,é um éster activado (especificamente, tetrafluorofenil éster). I.2 é um grupo orto-nitrobenzilamina com L' sendo uma ligação directa entre Li, e L2, onde L|, está ligado directamente ao anel aromático do grupo L2, T tem uma estrutura modular onde o grupo de ácido earboxilico da lisina foi ligado ao átomo de azoto do grupo benzilamina L2 para formar uma ligação amida, e um componente de peso variável R|..v, (onde estes grupos R correspondem a T2 como aqui definido, e podem ser introduzidos através de qualquer um dos ácidos carboxílicos específicos aqui listados) é ligado através do grupo α-amina da lisina, enquanto um grupo aumentador da sensibilidade de espc de massa (introduzido via ácido N-metilisonipecótico) é ligado através do grupo ε-amina da lisina.
Referindo-se à Figura 4:
Passo Λ. A resina Novasyn HMP é ligada com o composto I (NBA preparado de acordo com o procedimento de Brown et al., Molecular Diversity, 1, 4 (1995)) de acordo com 0 procedimento descrito no passo A do Exemplo 7, para dar 0 composto II.
Passo 13. A resina (composto II) é tratada como descrito nos passos B-J do Exemplo 7 para dar os compostos X1-3&. EXEMPLO 9 PREPARAÇÃO DE UM CONJUNTO DE COMPOSTOS DA FÓRMULA lNIP-LYS (ε-R,. 36)-ANP-Tfi> A Figura 5 ilustra a síntese paralela de um conjunto de 36 compostos T-L-X (X=Li,), onde-Li, é um éster activado (especifícamente, tetrafluorofenil éster), L2 é um grupo orto-nitiObenzilamina com LJ sendo um grupo meti leno que liga Lj, e L2, T tem uma estrutura modular onde o grupo de ácido carboxílico da lisina foi ligado ao átomo de azoto do grupo benzilamina L2 para formar uma ligação amida, e um componente de peso variável R|.36 (onde estes grupos R correspondem a T2 como aqui definido, e podem ser introduzidos através de qualquer um dos ácidos carboxílicos específicos aqui listados) é ligado através do grupo i:-amina lisina, enquanto um grupo aumentador da sensibilidade de espc de massa (introduzido via ácido N-metilisonipecótico) é ligado através do grupo α-amina da lisina.
Referindo-se à Figura 5:
Passos A-C, O mesmo que no exemplo 7.
Passo D. A resina (composto IV) é tratada com piperidina como descrito no passo B do Exemplo 7 para remover o grupo FMOC.
Passo E. A α-amina desprotegida na resina no passo D é ligada com ácido Ν-metilisonipecótico como descrito no passo C do Exemplo 7 para dar o composto V.
Passo Γ. O mesmo que no exemplo 7.
Passo 0. A resina (compostos VImo) é tratada com paládio como descrito no passo D do Exemplo 7 para remover o grupo Aloc.
Passo l l-J. Os compostos Xio6 são preparados da mesma maneira como no Exemplo 7. I 14 EXEMPLO 10 PREPARAÇÃO DE UM CONJUNTO DE COMPOSTOS DA FÓRMULA R,.36-GLU (y-DIAEA)-ANP-T,,. A Figura 6 ilustra a síntese paralela de um conjunto de 36 compostos T-L-X (X-=L|,), onde Li, é um éster activado (especificamente, tetrafluorofenil éster), L2 c um grupo orto-nitrobenzilamina com L3 sendo um grupo metileno que liga Li, e L2, T tem uma estrutura modular onde o grupo de α-ácido carboxílico do ácido glutâmico foi ligado ao átomo de azoto do grupo benzi lamina L2 para formar uma ligação amida, e um componente de peso variável Ri-> (onde estes grupos R correspondem a T2 como aqui definido, e podem ser introduzidos através de qualquer um dos ácidos carboxílicos específicos aqui listados) é ligado através do grupo α-amina do ácido glutâmico, enquanto um grupo aumentador da sensibilidade de espc de massa (introduzido via 2-(diisopropilamino)etilamina) é ligado através do grupo γ-ácido carboxílico do ácido glutâmico.
Referindo-se à Figura 6:
Passos A-B. O mesmo que no exemplo 7.
Passo C. A resina desprotegida (composto III) é ligada a Fmoc-Glu-(OAl)-OH usando o método de ligação descrito no passo C do Exemplo 7 para dar o composto IV.
Passo D O éster alílico na resina (composto IV) é lavado com CI-I2CI2 (2X) e misturado com uma solução de (PPIpfi Pd (0) (0.3 eq.) e N-metilanilina (3 eq.) em CITCL. A mistura é agitada durante I hora. O solvente é removido e a resina é lavada com Cl I2CI2 (2X). O passo do paládio é repetido. O solvente é removido e a resina é lavada com CITCh (2X), N,N-diisopropiletilamónia dietilditiocarbamato em DMF (2X), DMF (2X) para ciar o composto V.
Passo E. A resina não protegida do passo D é suspendida em DMF e activada misturando I-IATU (3 eq.) e NMM (7.5 eq.). Os vasos sáo agitados durante 15 minutos. O solvente é removido e a resina lavada com NMP(IX). A resina é misturada com 2-(diisopropilamina)etilamonia (3 eq.) e NMM (7.5 eq.). Os vasos são agitados duiunte 1 hora. Λ ligação de 2-(diisopropilamina)etilamina à resina e os passos de lavagem são repetidos, para dar o composto VI. 115
Passos F-.l. O mesmo que no exemplo 7. EXEMPLO 11 PREPARAÇÃO DE UM CONJUNTO DE COMPOSTOS DA FÓRMULA R,J6-LYS (s-lINIP)-ANP-LYS (ε-ΝΗ2)-ΝΗ2 A Figura 7 ilustra a síntese paralela de um conjunto dc 36 compostos T-L-X (X=Lh), onde Lh é uma amina (especificamente, o grupo ε-amino de um grupo derivado da li si na), L2 é um grupo orto-nitrobenzilamina com L'’ sendo um grupo nkpiilenoaminoacilalquileno carboxamida substituído que liga L|, e L2, T tem uma estrutura modular onde o grupo ácido carboxílico da lisina foi ligado ao átomo de azoto do grupo benzilamina L2 para formar uma ligação amida, e um componente de peso variável R|.36 (onde estes grupos R correspondem a T2 como aqui definido, e podem ser introduzidos através de qualquer um dos ácidos carboxílicos específicos aqui listados) é ligado através do grupo α-amina da lisina, enquanto um grupo aumentador da sensibilidade de espe de massa (introduzido via ácido N-metilisonipecótico) é ligado através do grupo ε-amina da lisina. Referindo-se à Figura 7:
Passo A.. A resina Fmoe-Lys(Boc)-SRAM (disponível de ACT; composto I) é misturada com piperidina 25% em DMF e agitada durante 5 min. A resina é filtrada, e cm seguida misturada com piperidina 25% em DMF e agitada durante 10 min. O solvente é removido, a resina lavada com NMP(2X), MeOH(2X), e DMF(2X), e usada directamente no passo B.
Passo B. A resina (composto II), ANP (disponível de ACT; 3 eq.), HATU (3 eq.) e NMM (7.5 eq.) em DMF são adicionados e o vaso de recolha agitado durante I hora. O solvente é removido e a resina lavada com NMP(2X), MeOH(2X), e DMF(2X). A ligação de I à resina e os passos de lavagem são repetidos, para dar o composto 111.
Passos (.'-.I. A resina (composto (II) é tratada como nos passos B-I do exemplo 7 para dar os COmpOSfOS X|.;,f,. EXEMPLO 12 PREPARAÇÃO DE UM CONJUNTO DE COMPOSTOS DA FÓRMULA R,.36-LYS(8-TfA)-LYS (ε-ΐΙΝΡ)-ΑΝΡ-Τ,.·,> A Figura 8 ilustra a síntese paralela de um conjunto de 36 compostos T-L-X (X=Lh), onde Lh é um éster activado (especifícamente, tetrafluorofeniléster), L2 é um grupo oilo-nilrobenzilamina com L3 sendo um grupo metileno que liga Li, e L2, T tem uma estrutura modular onde o grupo ácido carboxílico de uma primeira lisina foi ligado ao átomo de azoto tio grupo benzilamina L2 para formar uma ligação amida, um grupo aumentador da sensibilidade de espec de massa (introduzido via ácido N-metilisonipecótico) é ligado através do grupo r.-amina da primeira lisina, uma segunda molécula de lisina foi ligada à primeira lisina através do grupo α-amina da primeira lisina, um grupo ajustador do peso molecular (lendo uma estrutura trifluoroacetil) é ligado através do grupo ε-amina da segunda lisina e um componente de peso variável R|_36 (onde estes grupos R correspondem a T2 como aqui definido, e podem ser introduzidos através de qualquer um dos ácidos carboxílicos específicos aqui listados) é ligado através do grupo α-amina da segunda lisina.
Refcrindo-se à Figura 8:
Passos A-E. Estes passos são idênticos aos passos A-E no Exemplo 7.
Passo F. A resina (composto VI) é tratada com piperidina como descrito no passo B no exemplo 7 para remover o grupo FMOC.
Passo A resina desprotegida (composto VII) é ligada a Fmoc-Lys(Tfa)-OH usando o método de ligação descrito no passo C do Exemplo 7 para dar o composto VIU.
Passos 1-1-K. A resina (composto VIII) é tratada como nos passos F-J do Exemplo 7 para dar os compostos Xlior,· 117 EXEMPLO 13
PREPARAÇÃO DE UM CONJUNTO DE COMPOSTOS DA FÓRMULA R,.36-LYS(e-lNIP)-ANP-5'-AH-ODN A Figura 9 ilustra a síntese paralela de um conjunto de 36 compostos T-L-X (X=MOI, onde MOI é um fragmento de ácido nucleico, ODN), derivado dos ésteres do Exemplo 7 (o mesmo procedimento pode ser usado com outros compostos T-L-X onde X é um éster activado). O MOI é conjugado a T-L através da extremidade 5'do MOI. através de um grupo fosfodiéster-alquilenamina.
Referindo-se à Figura 9:
Passo A. Os compostos XIIi-36 são preparados de acordo com um procedimento de hiotinilação modificado em Van Ness et al., Nucleic Acids Res., 19, 3345 (1991). A uma solução de um dos oligonucleótidos 5'-aminohexil (compostos XI 1.35, 1 mg) em borato de sódio 200 111M (pFI 8.3, 250 mL) é adicionado um dos ésteres tetralluorofenílicos (compostos X 1.35 do Exemplo A, com um excesso molar de 100 vezes em 250 mL de NMP). A reacção é incubada durante a noite à temperatura ambiente. Os ésteres tetrafluorofenílicos não reagidos c hidrolizados são removidos dos compostos XII 1.35 por cromatografia Sephadex G-50: EXEMPLO 14
PREPARAÇÃO DE UM CONJUNTO DE COMPOS TOS
DA FÓRMULA Ri.36-LYS(e-iNIP)-ANP-LYS(s-(MCT-5'-A1I-ODN))-NI I A Figura 10 ilustra a síntese paralela de um conjunto de 36 compostos T-L-X (X----MOI. onde MOÍ é um fragmento de ácido nucleico, ODN), derivado das aminas do Exemplo 1 1 ( 0 mesmo procedimento pode ser usado com outros compostos T-L-X onde X é uma amina). O MOI c conjugado a T-L através da extremidade 5'do MOI, através de um grupo fosfodiéster-alquilenamina.
Referindo-se á Figura 10:
Passo A. Os oligonucleótidos 5'-[6-(4,6-dicloro-l,3,5-triazina-2-ilamina)hexilo] XII1.35 são preparados como descrito em Van Ness et al., Nucleic Acids Res., 19, 3345 (1991). 118
Passo B. A uma solução de um dos oligonucleótidos 5'-[6-(4,6-dicloro-l,3,5-triazina-2-ilaminajhexilo] (compostos ΧΠ1.36) a uma concentração de 1 mg/ml em borato de sódio 100 mM (pll 8.3) foi adicionado um excesso molar de 100 vezes de uma amina primária seleccionada de R|.36-Lys(B-iNIP)-ANP-Lys(e-NH2)-NH2 (compostos X 1.3(, do Exemplo 11). A solução é misturada durante a noite à temperatura ambiente. A amina não reagida é removida por ultrafiltração através de uma membrana com cutoff de peso molecular 3000 (Amicon, Beverly, MA) usando H2O como solução de lavagem (3 X). Os compostos XIH1.36 são isolados por redução do volume a 100 mL. EXEMPLO 15
DEMONSTRAÇÃO DA SEQUENCIAÇÃO USANDO UM MÉTODO DE SEPARAÇÃO CE. RECOLHENDO FRACÇÕES, QUEBRANDO O MARCADOR, DETERMINANDO A MASSA (E ASSIM A IDENTIDADE) DO MARCADOR E EM SEGUIDA DEDUZINDO A
SEQUÊNCIA
Neste exemplo, duas amostras de DNA são sequenciadas num único método de separação.
Instrumentação CE O instrumento CE é uma versão experimental do instrumento disponível comercialmente em Applied Biosystems, Inc. (Foster City, CA). Consiste em caixas de Plexiglas que incluem duas câmaras tampão, que podem ser mantidas a temperatura constante com uma unidade de controlo de calor. A voltagem necessária para a electroforese é fornecida por uma fonte de potência de alta voltagem (Gamma High Voltage Research, Ormond Beach, FL) com um travão de segurança magnético, e uma unidade de controlo para variar 0 potencial aplicado. As injecções da amostra para tubos capilares abertos são realizadas por uso dc uma bomba dc vácuo manual para gerar um diferencial de pressão aliavés do capilar (injccção por vácuo). Para capilares cheios com gel, as amostras são sujeitas a electroforese no interior do tubo por aplicação de um cumpo cléctrico (injccção clcctrocinctica).
Preparação de Capilares Cheios com Gel
Capilares de sílica fundida com 50 centímetros (375 mm d.e., 50 mm d.i., PolymiciO Technologies, Phoenix, AZ) com janelas de detecção (onde o revestimento de pol iimicla foi removido do capilar) a 25 cm são usados na separação. As superfícies internas dos capilares são derivatizadas com (metilacriloxipropil)trimetoxisilano (MAPS) (Sigma, St. Louis. MO) para permitir a ligação covalente do gel à parede do capilar (Nashabch et al., Anal ('hem (15:2148. 1994). Resumidamente, os capilares são limpos fluindo sucessivamente ácido trilluoroacético, água desionizada, e acetona através da coluna. Depois da lavagem com acetona, uma solução de MAPS 0.2% em água/etanol 50/50 é passada através do capilar e deixada à temperatura ambiente durante 30 min. A solução é removida por aspiração e os lubos são secos durante 30 min sob uma lâmpada de calor de infravermelho.
Os capilares cheios com gel são preparados sob elevada pressão por uma modificação do procedimento descrito por Huang et al. (,/. Chromatography 600:289, 1992). Géis de poliacrilamida quatro por cento com ligante cruzado 5% de e 8.3 de ureia são usados para todos os estudos aqui reportados. Uma solução de reserva (stock solution) é feita dissolvendo 3.8 g de acrilamida, 0.20 g de Ν,Ν'-metilenebis (acrilamida), e 50 g de ureia em 100 ml., de tampão TBE (Tris borato 90 mM, pl-l 8.3, EDTA 0.2 mM). A ligação cruzada é iniciada com 10 mL de Ν,Ν,Ν',Ν'-tetrametiletiienodiamina (TtíMED) e 250 mL de solução dc pcrsulfato de amónia 10%. A solução polimerizante é passada rapidamente na coluna derivatizada. Os capilares cheios são então colocados num tubo dc aço 1 x m x 1/8 in. d.i. x I /4 in. d.c. cheio com água, e a pressão é aumentada a 400 Bar usando uma bomba de HPLC e mantida a essa pressão durante a noite. A pressão é gradualemnte libertada e os capilares são removidos. Uma pequena secção do capilar de cada extremidade da coluna é removida antes do uso.
Separação c Pctcccão dc Fragmentos dc DNA
As análises de reacções de sequenciaçâo de DNA separadas por electroforese convencional é realizada num sequenciador de DNA ABI 370Λ. Este instrumento usa uma latia de um gel de poli(acrilamida) ureia desnaturada dc espessura 0.4 mm com uma distância de 26 cm do poço da amostra até à região de detecção, preparado dc acordo com as instruções dos fabricantes. As reacções de sequenciaçâo de DNA são preparadas como descrito pelos fabricantes utilizando polimerases Taq (Pmmega C.orp., WI) e são realizadas num padrão de 120 I>NA de cadeia única M13mpl9 preparado por procedimentos modelo. As reacções de sequenciaçâo são armazenadas a -20°C no escuro e aquecidas a 90°C durante 3 min em formamida mesmo antes do carregamento da amostra. Elas são carregadas no 370A com uma pipeta de acordo com as instruções dos fabricantes e na CE por injecção electrocinética a 10000 V durante 10 segundos. Fracções de dez μΐ são colectadas durante a corrida removendo todo o líquido no eléctrodo inferior e substituindo-o com novo electrólito.
Para cortar o marcador do oligonucleótido, 100 μΐ de ditiotreitol (DTT) 0.05M é adicionado a cada fracção. A incubação é durante 30 minutos à temperatura ambiente. NaCl é então adicionado até 0.1M e são adicionados 2 volumes de EtOH para precipitar os ODNs. Os ODNs são removidos da solução por centrifugação a 14000 x G a 4°C durante 15 minutos. Os sobrenadardes são guardados, integralmente secos sob vácuo com centrifugação. Os sedimentos são então dissolvidos em 25 μΐ de MeOH. O sedimento é então testado por espectrometria de massa para a presença de marcadores. A mesma técnica MALD.I é empregue como descrito no Exemplo 4. Os seguintes pesos moleculares (marcadores) são observados no espectro de massa em função do tempo:
Fracção # Tempo Mws Fracção# Tempo Mws Pesos moleculares Pesos moleculares 1 1 Nenhum 31 31 212.1 ? 2 Nenhum 32 32 212.1, 199.1 .·) Nenhum Λ O -n -» JJ> 212.1, 199.1 4 4 Nenhum 34 34 212.1 ;200.1, 199.1 227.1 5 5 Nenhum 35 35 200.1, 199.1,227.1 6 6 Nenhum 36 36 200.1,227.1 7 7 Nenhum 37 37 200.1,227.1,179.18 X 8 Nenhum 38 38 200.1:196.1.179.18 9 9 Nenhum 39 39 200.1; 196.1,1 79.18 10 10 Nenhum 40 40 196.1,179.18,226.1 1 1 11 Nenhum 41 41 196.1,226.1 12 12 Nenhum 42 42 196.1 ;182.1,226.1 121 13 13 Nenhum 43 43 182.1,226.1.209.1 14 14 Nenhum 44 44 182.1,209.1 15 15 Nenhum 45 45 182.1;235.2,209.1 198.1 16 16 Nenhum 46 46 235.2,198.1 17 17 Nenhum 47 47 235.2, 198.1 IS 18 Nenhum 48 48 235.2; 198.1,218.1 19 19 Nenhum 49 49 218.1 20 20 Nenhum 50 50 218.1 21 21 Nenhum 51 51 nenhum OO 22 Nenhum 52 52 nenhum 23 23 Nenhum 53 53 nenhum 24 24 Nenhum 54 54 nenhum 25 25 Nenhum 55 55 nenhum 26 26 Nenhum 56 56 nenhum 27 27 Nenhum 57 57 nenhum 28 28 Nenhum 58 58 nenhum 29 29 212.1 59 59 nenhum 30 30 212.1 60 60 nenhum
O aparecimento temporal dos marcadores para o conjunto #1 é 212.1, 200.1. 106.1, 1X2.1, 235.2, 218.1, 199.1, 227.1 e o aparecimento temporal dos marcadores para o conjunto #2 c 199.1, 227.1, 179.1, 226.1, 209.1, 198.1. Uma vez que 212.1 anui indica o derivado do ácido 4-metoxibenzóico, 200.1 indica o derivado do ácido 4-fluorobenzóico, 196.1 anui indica o derivado do ácido toluico, 182.1 amu indica o derivado do ácido benzóico, 235.2 amu indica o derivado do ácido indole-3-acético, 218.1 amu indica o derivado do ácido 2,6-difluorobenzóico, 199.1 amu indica o derivado do ácido N-oxido nicotínico. 277.1 amu indica a 2-nitrobenzamida, 179.18 amu indica o derivado do 5-ácido acctilsalicílico, 226.1 amu indica o derivado do ácido 4-etoxibenzóico, 209.1 amu indica o derivado do ácido oinàmico, c 198.1 amu indica o ácido 3 aminonicotínico, a primeira sequência pode ser deduzida como -5'-TATGCA-3'- e a segunda sequência pode ser deduzida como -5'- 122 CGTACC-3'-. Assim, é possível sequenciar mais do que uma amostra de DNA por passo de separação. EXEMPLO 16
DEMONSTRAÇÃO DA DETECCÁO SIMULTÂNEA DE MÚLTIPLOS MARCADORES POR ESPECTROMETRIA DE MASSA
Este exemplo fornece uma descrição da capacidade de deteclar simultaneamente múltiplos compostos (marcadores) por espectrometria de massa. Neste exemplo particular, 31 compostos são misturados com uma matriz, depositados e secos a um suporte sólido e depois desorvidos com um laser. Os iões resultantes são então introduzidos num espcctrómetro de massa.
Os seguintes compostos (comprados da Aldrich, Milwaukee, WI) são misturados juntamente numa base molar igual até uma concentração final de 0.002 M (numa base por composto): benzamida (121.14), nicotinamida (122.13), pirazinamida (123.12), ácido 3-amino-4-pirazolcarboxílico (127.10), 2-liofenecarboxamida (127.17), 4-aminobenzamida (135.15), lolumida (135.17), 6-metilnicotinamida (136.15), 3-aminonieotinamida (137.14), nicotinamida N-oxido (138.12), 3-hidropicolinamida (138.13), 4-fiuorobanzamida (139.13), cinamamida (147.18), 4-metoxibanzamida (151.17), 2,6-difluorbenzamida (157.12), 4-amino-5-imidazole-carboxiamida (162.58), 3,4-piridina-dicarboxiamida (165.16), 4-etoxibenzamida (165.19), 2,3-pirazinadicarboxamida (166.14), 2-nitrobenzamida (166.14), ácido 3-fluoro-4-metoxibenzóico (170.4), indole-3-acetamida (174.2), 5-acetilsalicilamida (179.18), 3,5-dimetoxibenzamida (181.19), 1-naftalenoacetamida (185.23), 8-cloro-3.5-diamino-2-pirazinacarboxiamida (187.59), 4-lrifiuorometil-benzamida (189.00), 5-amino-5-fenil-4-pirazole-carboxamida (202.22), l-mctil-2-benzil-malonamato (207.33), 4-amino-2,3,5,6-leiralluorobenzamida (208.11), ácido 2,3-iiaflaleuudieaiboxnico (212.22). Os compostos são colocados em DMSO na concentração acima descrita. Um μΐ do material é então misturado com a matriz dc ácido alfa-ciano-4-hidroxi cinâmico (depois de uma diluição de 1.10000) e depositado num suporte sólido de aço inoxidável. (.) material é em seguida desorvido por um laser usando o Espcctrómetro dc Massa Proteína TOF (Bruker, Manning Park, MA) e os iões resultantes são medidos em
ambos os modos de operação linear e reflexão. São observados os seguintes valores m/z (Figura 11): 121.1 —> benzamida (121.14) 122.1—-> nicotinamida (122.13) 123.1—-> pirazinamida (123.12) 124.1 125.2 127.3—> ácido 3-amino-4-pirazolcarboxílico (127.10) 127.2—-> 2-tiofenocarboxamida (127.17) 135.1—-> 4-aminobenzaxnida (135.15) 135.1 -—> tolumida (135.17) 136.2—> 6-metilnicotinamida (136.15) 137.1—> 3-aminonicotinamida (137.14) 138.2—> nicotinamida N-óxido (138.12) 138.2—> 3-hidropicolinamida (138.13) 139.2—> 4-fluorobanzamida (139.13) 140.2 147.3—-> cinamamida (147.18) 148.2 140.2 4-metoxibanzamida (153.17) 152.2 2,6-diíluorbenzamida (157.12) 158.3 4-amino-5-imidazole-carboxiamida (162. 163.3 165.2—> 3,4-piridina-dicarboxiamida (165.16) 165.2—> 4-etoxibenzamida (165.19) 166.2—> 2,3-pirazinadicarboxamida (166.14) 1 66.2—·-> 2-nitrobenzamida (166.14) ácido 3-íluoro-4-metoxibenzóico (170/1) 124 171.1 172.2 173.4 178.3 I 79.3—> 181.2—-> 182.2 186.2 188.2 189.2—-> 190.2 191.2 192.3 203.2 203.4 indole-3-acetamida (174.2) 5-acetilsalicilamida (179.18) 3,5-d i metoxibenzamida (181.19) 1 -naftalenoacetamida (185.23) 8-eloro-3,5-diamino-2-pirazinacarboxiamida (187.59) 4-triíluorometil-benzamida (189.00) 5-amino-5-fenil-4-pirazole-carboxamida (202.22) 1 -metil-2-benzilmalonamato (207.33) 4-amino-2,3,5,6-tetrafluorobenzamida (208.1 1) ácido 2,3-naftalenodicarboxilico (212.22). 219.3 221.2 228.2 234.2 237.4 241.4
Os resultados indicam que 22 dos 31 compostos apareceram no espectro com a massa antecipada. 9 dos 31 compostos apareceram no espectro com uma massa η + Η (1 unidade de massa atómica, atomic mass unit = amu) sobre a massa antecipada. O ultimo 125 "Ή*'P ·***> ;«'··;·»' ·.- fenómeno é provavelmente devido à protonação de uma amina dentro dos compostos. Assim, 3 1 dos 31 compostos são detectados por Espectroscopia de Massa MALDl. Mais importante, o exemplo demonstra que múltiplos marcadores podem ser detectados simultaneamente por um método espectroscópico. A matriz alfa-ciano sozinha (Figura 12) deu picos a 146.2, 164.1, 172.1, 173.1, 189.1, 190.1, 191.1, 192.1, 212.1, 224.1, 228.0, 234.3. Outras massas identificadas no espectro são devidas a contaminantes nos compostos comprados uma vez que nenhum estorço loi .leito para posterior purificação dos compostos. EXEMPLO 17
UM PROCEDIMENTO PARA SEQUENCIAÇÃO COM INICIADORES MARCADOS IDENTIFICADORES DE PESO MOLECULAR, INICIADORES MARCADOS R Λ Dl OACTIVAMENTE, TERM1NADORES D1DESOXI MARCADOS IDENTIFICADORES DE PESO MOLECULAR, INICIADORES FLUORESCENTES E TERMINADORES DIDESOXI FLUORESCENTES A. Preparação dc tiéis de seouênciacão e electroforese O protocolo é como se segue. Preparar ureia 8M, géis de poliacrilamida de acordo com as seguintes receitas (100 ml) para 4%, 6% ou 8% de poliacrilamida. 4% 5% 6% Ureia 48 g 48 48 g 40% 10 ml 12.5 ml 15 ml acrilamida/bisacrilamida 1OX MTBE 10 ml 10 ml 10 ml ddl-LO 42 ml 39.5 ml 37 ml 15% APS 500 μΐ 500 μΐ 500 μΐ TF, MED 50 μΐ 50 μΐ 50 μΐ A ureia (5505UA) é obtida da Gibco/BRL (Gaithersburg, MD). Todos os outros materiais são obtidos em Fisher (Fair Lawn, NJ). Resumidamente, ureia, tampão MTBE e água são combinados, incubados durante 5 minutos a 55°C. e agitados para dissolver a ureia. Λ mistura é ligeiramente arrefecida, e é adicionada e misturada a uma solução de ncrilamida/bis-acrilamida, e a mistura total é desgaseificada sob vácuo durante 5 minutos. Os 126 agentes de polimerização APS e TEMED são adicionados com agitação. A mistura completa do gel é imediatamente deitada entre as placas de vidro cobertas com fita com espaçadores de 0.15 mm. As placas são preparadas em primeiro lugar limpando com detergente ALCONOXIim (New York, NY) e água quente, e enxaguadas com água bidestilada, e secas. Tipicamente, a placa de vidro dentada é tratada com um reagente de silanização e depois enxaguada com água bidestilada. Depois de deitado, o gel é imediatamente colocado horizontalmente, o pente que forma o poço é inserido, preso ao local, e o gel deixado a polimerizar durante pelo menos 30 minutos. Antes do carregamento, a fita à volta da zona inferior do gel e o pente que forma o poço são removidos. Um aparelho de electroforese vertical é em seguida montado prendendo as câmaras tampão superior e inferior às placas de gel. e adicionando tampão de electroforese IX MTBE às câmaras. Os poços das amostras são descarregados com uma seringa contendo tampão de corrida, e imediatamente antes do carregamento de cada amostra, o poço é descarregado com tampão de corrida usando pontas de carregamento do gel para remover a ureia. Um a dois microlitros de amostra são carregados em cada poço usando uma Pipetteman (Rainin, Emeryville, CA) com pontas de carregamento de gel, e em seguida sujeita a electroforese de acordo com as seguintes regras (durante a electroforese, o gel é arrefecido com um ventilador):
condições de electroforese 2.25 horas a 22 mA 8-V horas a 15 mA 20-24 horas a 15 mA reaeção de terminação gel de poliacrilamida curto longo longo 5%, 0.15 mm x 50 cm x 20 cm 4%, 0.15 mm x 70 cm x 20 cm 4%, 0.15 mm x 70 cm x 20 cm
Cada mistura de reaeção de sequenciação base-específica terminada (com a curta terminação) é carregada num gel dc poliacrilamida 5% desnaturada 0.15 mm x 50 cm x 20 cm: Λ mistura das reacções terminadas com a mistura de terminação longa são divididas ao meio e carregadas em géis de poliacrilamida 4% desnaturada 0.15 mm x 70 cm x 20 cm.
Depois da electroforese, o tampão é removido dos poços, a fita é removida, e as placas dc gel separadas. O gel é transferido para uma folha de 40 cm x 20 cm de papel 3MM Whaíman. coberto com um revestimento de plástico, e seco num secador de gel Iloefer (San Prancisco. CA) durante 25 minutos a 80 °C. O gel seco é exposto a um filme Kodak (New Haven. CT) XRP-1. Dependendo da intensidade do sinal e se o marcador radioactivo é '12P ou !,\S. os tempos de exposição variam entre 4 horas e vários dias. Depois da exposição, os 127 ί Η lllmes são revelados por processamento em soluções reveladoras e fixadoras, enxaguadas por água, e secas ao ar. O autoradiograma é então colocado numa caixa com luz, a sequência é lida manualmente e os resultados dactilografados num computador. A sequenciação do ciclo catalizado por polimerase Taq usando iniciadores marcados. Cada reacção de sequenciação do ciclo base-específico inclui normalmente aproximadamente 100 ou 200 ng de DNA de cadeia única isolado para reacções A e C ou G e T, respectivamente. Reacções de sequenciação do ciclo dupla cadeia de forma semelhante contêm aproximadamente 200 ou 400 ng de DNA plasmídico isolado usando quer o procedimento da lisc alcalina padrão quer o da lise alcalina modificada de terra de diatomáceas. Todos os reagentes excepto o DNA modelo são adicionados num passo de pipetagem de um pré-mistura de soluções de reserva (stock) previamente dividida em alíquotas armazenadas a -20°C. As prc-misturas de reacção são preparadas por combinação do tampão de reacção com as misturas de nucleótidos base-específicas. Antes do uso, as misturas de reacção base-específicas são descongeladas e combinadas com a DNA polimerase Taq e os iniciadores universais marcados na extremidade para formarem as misturas de reacção finais. Uma vez preparadas as misturas acima, quatro alíquotas de DNA de cadeia simples ou dupla são pipetadas para a parte de baixo de cada tubo de reacção de parede fina de 0.2 ml, correspondendo às reacções A, C, G, e T e em seguida uma alíquota das respectivas misturas dc reacção é adicionada ao lado de cada tubo. Estes tubos fazem parte de um tabuleiro com um conjunto de 96 tubos/retentores num formato de placa de microtitulação. que se ajusta a um Perkin Elmer Cetus Cycler 9600 (Foster City, CA). Tampas de fita são colocadas no conjunto de tubos/retentores e a placa é brevemente centrifugada. A placa c em seguida colocada no cycler cujo bloco de aquecimento foi pré aquecido a 95 °C, e o programa dc cycling é imediatamente começado. Q protocolo do cycling consiste cm 15-30 ciclos de: desnaturação a 95°C, amolecimento a 55°C; extensão a 72 °C; desnaturação a 95°C; extensão a 72 ”C: desnaturação a 95°C e extensão a 72 °C, ligado a um programa final a 4°C.
Nesta altura, as reacções podem ser congeladas e armazenadas a -20"C até vários dias. Antes do agrupamento e ptecipitação, a placa c centrifugada brevemente para corrigir a condensação. O iniciador e as reacções base-específicas são agrupados em etanol, e o DNA precipitado c recolhido por centrifugação c scco. Estas reacções de sequenciação podem ser armazenadas durante vários dias a -20°C. 128 O protocolo para as reacções de sequenciação é como se segue. Para reacções A e C, I μΙ. e para reacções G e T, 2 μΐ de cada amostra de DNA (100 ng/μΐ para modelos M13 c 200 nu/μΙ para modelos pUC) são pipetados para a zona inferior dos tubos de reacção de parede lina com 0.2 ml. A polímevase AmpliTaq (N801-0060) é da Perkin-Elmer Cetus (Póster City, CA). E preparada uma mistura de 30 μΐ de AmpliTaq (5 I.J/μΙ), 30 μΐ de tampão da reacção 5X Taq, 130 μΐ ddl-frO. e 190 μΐ Taq diluído, para 24 clones.
As misturas especificas das bases A, C, G e T sã preparadas adicionando o iniciador especifico da base e o Taq diluído a cada uma das pré-misturas nucleótidos específicos da base/tampão:
A,C/G,T 60/120 μΙ mistura de sequenciação cycle 5X Taq 30/60 μιΐ Taq polimerase diluída 30/60 μΐ respectivo iniciador marcado tluorescentemente na extremidade 120/240 μΐ R. Sequenciação nor ciclo catalizada por polimerase Tau usando reacções de lemiinador marcado identificador de peso molecular
Ura problema na sequenciação ciclo de DNA é que quando são usados iniciadores as condições de reacção são tais que a distribuição do conjunto de fragmentos embutidos c muito dependente da concentração do modelo na mistura da reacção. Tem 3Ído leccntemente observado que a distribuição do conjunto de fragmentos embutidos para as reacções de sequenciação ciclo de DNA usando os terminadores marcados é muito menos sensível à concentração de DNA do que a obtida com as reacções dos iniciadores marcados como descrito acima. Adicionalmente, as reacções dos terminadores requerem apenas um lubo de reacção por modelo enquanto que as reacções dos iniciadores marcados requerem um tubo de reacção por cada um dos quatro terminadores. O protocolo abaixo descrito é faeialmentc integrado com o isolamento padrão de 96 poços e com os procedimentos de limpeza da reacção de 96 poços também aqui descritas.
Colocar 0.5 pg de DNA de cadeia única ou 1 pg de DNA de dupla cadeia em iiihns PCR de 0.2 ml. Adicionarl μΐ (para modelos de cadeia única) ou 4 μΙ (para modelos de 129 dupla cadeia) de iniciador 0.8 μΜ e 9.5 μΐ de pré-mistura fornecida ABI a cada tubo, e perfazer o volume até 20 μΐ com ddH20. Centrifugar brevemente e realizar o ciclo como habitual usando o programa terminador como descrito pelo fabricante (i.e., pré-aquecer a 96 "C seguido de 25 ciclos de 96°C durante 15 segundos, 50°C durante 1 segundo, 60°C durante 4 minutos, e depois ligado a uma espera a 4°C). Prosseguir com a purificação da coluna de rotação usando quer os procedimentos das colunas Centri-Sep (Amicon, Beverly, MA) quer os procedimentos da placa de inicrotitulação G-50 dados abaixo. C. Limpeza da Reaccão do Terminador através da Coluna Centri-Sep
Uma coluna é preparada cobrindo suavemente a coluna para provocar a sedimentação do material do gel para a zona inferior da coluna. A tampa da coluna é removida e são adicionados 0.75 ml de dH20. Tapar a coluna e invertê-la várias vezes para misturar. Permitir que o gel hidrate durante pelo menos 30 minutos à temperatura ambiente. As colunas podem ser armazenadas durante alguns dias a 4°C. Permitir que as colunas que foram armazenadas a 4°C aqueçam até à temperatura ambiente antes de usar. Remover quaisquer bolhas de ar por inversão da coluna e permitindo que o gel se deposite. Remover primeiro a tampa da extremidade de cima e a seguir remover a tampa da extremidade de baixo. Permitir que a coluna escorra completamente, por gravidade. (Nota: se o fluxo não começar imediatamente aplicar uma ligeira pressão à coluna com um bolbo de pipeta). Inserir a coluna no tubo de lavagem fornecido. Rodar numa microcentrífuga de velocidade variável a 1500 x g durante 2 minutos para remover o fluido. Retirar a coluna do tubo de lavagem e inseri-la num tubo de recolha da amostra. Remover a mistura da reacção (20 μΐ) cuidadosamente e carregá-la no topo do material de gel. Se as amostras forem incubadas num instrumento cyciing que requereu um revestimento com óleo, remover a reacção cuidadosamente da superfície do óleo. Evitar retirar óleo com a amostra, apesar de pequenas quantidades de óleo (< 1 μΐ) na amostra não afectarem os resultados. O óleo na extremidade da ponta da pipeta contendo a amostra pode ser removido tocando com a ponta cuidadosamente numa superfície limpa (e.g., o tubo de reacção). Usar cada coluna apenas uma vez. Rodar numa microcentrífuga de velocidade variável com um rotor de ângulo fixo, colocando a coluna na mesma orientação como estava na primeira rotação. Secar a amostra 130 numa centrífuga de vácuo. Não aplicar calor ou sobre secagem. Se desejado, as reacções podem ser precipitadas com etanol. O. Limpeza da Reaccão do Terminador através de Placas de Filtro com Formato de Microtitulacão Cheias Sephadex G-50 A Sephadex (Pharmacia, Piscataway, NJ) sedimenta; assim, tem que ressuspendê-la antes de adicionar à placa e também depois de encher 8 a 10 poços. Adicionar 400 μ! de Sephadex G-50 misturada a cada poço da placa de filtro de microtitulação. Colocar a placa de filho de microtitulação no topo de uma placa de microtitulação para recolher a água c cobrir os lados para que não se percam durante a centrifugação. Rodar a 1500 rpm durante 2 minutos. Descarregar a água que foi colectada na placa de microtitulação. Colocar a placa de filtro de microtitulação no topo de uma placa de microtitulação para recolher a água e cobrir os lados para que não se percam durante a centrifugação. Adicionar mais 100-200 μΐ de Sephadex G-50 para encher os poços da placa de microtitulação. Rodar a 1500 rpm durante 2 minutos. Rejeitar a água que foi recolhida na placa de microtitulação. Colocar a placa de filtro de microtitulação no topo de uma placa de microtitulação com tubos para recolher a água c cobrir os lados para que não se percam durante a centrifugação. Adicionar 20 μΐ de terminador da reacção a cada poço contendo Sephadex G-50. Rodar a 1500 rpm durante 2 minutos. Colocar o efluente recolhido num Speed-Vac durante aproximadamente 1-2 horas.
Sequenciação calalizada por Sequcna.se1M (UDS, Clevelancl OH) com icrminadorex marcados. Reacções de terminador de cadeia única requerem aproximadamente 2 pg de DNA modelo M13-baseado extraído com fenol. O DNA é desnaturado e o iniciador amolecido por incubação de DNA, iniciador, e tampão a 65 °C, Depois da reacção arrefecer ale à temperatura ambiente, alfa-tio-desoxinucleótidos, terminadores marcados, c DNA polimerases Sequenases TM diluídas são adicionados e a mistura é incubada a 37°C. A reacção é parada adicionando acetato de amónia e etanol, e os fragmentos de DNA são precipitados e secos. Para ajudar a remoção dos terminadores não incorporados, o sedimento (pellel) de DNA é enxaguado duas vezes com etanol. As reacções de sequenciação secas podem ser armazenadas até vários dias a -20 "C. 131
As reacções de terminadores de cadeia dupla requerem aproximadamente 5 μ« de DNA plasmídico purificado midi-prep com lise alcalina modificada com tema de diatomaceas em hidróxido de sódio a 65 °C, e depois da incubação, o iniciador é adicionado e a reacção é neutralizada por adição de um tampão ácido. Em seguida são adicionados tampão da reacção, alía-tio-desoxinucleótidos, terminadores corantes marcados, e DNA polimerase Sccjuenase TM diluida e a reacção é incubada a 37°C. Acetato de amónia é adicionado para parar a reacção e os fragementos de DNA são precipitados, enxaguados, secos, e armazenados.
Para reacções de cadeia única:
Adicionar o seguinte a um tubo de microcentrífuga de 1.5 ml: 4 μΐ ssDNA (2 pg) 4 μΐ iniciador 0.8 μΜ
2 μΐ 1 Οχ tampão MOPS 2 μΐ 1 Οχ tampão Mn2 Visocitrato 12 μΐ
Para desnaturar o DNA e amolecer o iniciador, incubar a reacção a 65°C-70°C durante 5 minutos. Permitir que a reacção arrefeça até à temperatura ambiente durante 15 minutos-, c então centrifugar levemente para corrigira condensação. A cada reacção, adicionar os seguintes reagentes c incubar durante 10 minutos a 37°C. 7μ1 mistura de terminador ABI (Catalogue No. 401489) 2μ1 Sequenase TM (3.25 U/μΙ) diluida 1 μΐ α-S dNTPs 2 mM 22 μΙ A Sequenase TM (Catalogue No. 70775, United States Biocbemicals, Cleveland, OH) não diluída é 13 U/μΙ e é diluída de 1:4 com tampão de diluição USB, antes do uso. Adicionar 20 μΙ de acetato de amónia 9.5 M e 100 μΙ de etanol 95% para parar a reacção e misturar. 132
Precipitar o DNA num banho de água gelada durante 10 minutos. Centrifugar durante 15 minutos a 10000 xg numa microcerttrífuga a 4°C. Decantar o sobrenadante cuidadosamente, e enxaguar o sedimento (pellet) adicionando 300 μΐ de etanol 70-80%. Misturar e centrifugar de novo durante 15 minutos e decantar cuidadosamente o sobrenadante.
Repetir o passo de enxaguamento para assegurar uma remoção eficiente dos terminadores não incorporados. Secar o DNA durante 5-10 minutos (ou até secura) numa Speed-Vac, e armazenar as reacções secas a -20°C.
Para reacções de cadeia dupla:
Adicionar o seguinte a um tubo de microcentrífuga de 1.5 ml: 5 μΐ dsDNA (5 pg) 4 μΙ NaOH 1 N 3 μ] ddH30
Incubar a reacção a 65°C-70°C durante 5 minuto, e então centrifugar levemente para corrigir a condensação. Adicionar os seguintes reagentes a cada reacção, misturar em vortex. e centrifugar levemente:
3 μΐ iniciador 8 μΜ 9 μΐ ddH20 4 μΙ Tampão Ácido MOPS A cada reacção, adicionar os seguintes reagentes e incubar durante 10 minutos a
10X tampão Mn2+/isocitrato mistura de terminador ABI ( SequenaseTM (3.25 U/μΙ) diluída [alfa]-S dNTPs 2 mM 4 μΐ 6 μΐ 2 Hl 1 μΐ 22 μΐ A Scqucnase TM não diluída de United States Biochemicals é 13 U/μΙ e deve ser diluída de 1:4 com tampão de diluição USB, antes do uso. Adicionar 60 μΙ de acetato de amónia 8 M c 300 μΐ de etanol 95% para parar a reacção e misturar por vortex. Precipitar o DNA num banho dc água gelada durante 10 minutos. Centrifugar durante 15 minutos a 10000 133 xg numa microcentríluga a 4°C. Decantar o sobrenadante cuidadosamente, e enxaguar o sedimento (pellet) adicionando 300 μΐ de etanol 80%. Misturar a amostra e centrifugar de novo durante 15 minutos, e decantar cuidadosamente o sobrenadante. Repetir o passo de enxaguamento para assegurar uma remoção eficiente dos terminadores não incorporados. Secar o DNA durante 5-10 minutos (ou até secura) numa Speed-Vac.
!'. Preparação do gel de sequenciação. pré-electroforese, carregamento da amostra, electroforese. recolha de dados, e análise no sequenciador de DNA ABI 373A
Os géis de poliacrilamida para sequenciação de DNA são preparados como descrito acima, excepto que a mistura do gel é filtrada antes da polimerização. As placas de vidro são cuidadosamente limpas com água quente, água destilada, e etanol para remover possíveis contaminantes fluorescentes antes de cobertas. Géis de poliacrilamida 6% desnaturados são colocados em placas cobertas 0.3 mm x 89 cm x 52 cm e ajustado com um pente de 36 poços. Depois da polimerização, a fita e o pente são removidos do gel e as superfícies exteriores das placas de vidro são limpas com água quente, c enxaguadas com água destilada e etanol. O gel é montado num sequenciador ABI, e verificado por varrimento com laser. Se forem observadas alterações da linha de base no écran do computador Macintosh associado a ABI, as placas são limpas de novo. Em seguida, os poços tampão são ligados, o tampão de electroforese é adicionado, e o gel é sujeito a uma pré-electroforese durante 10-30 minutos a 30 W. Antes do carregamento da amostra, os produtos da reacção agrupados c secos são ressuspendidos em tampão de carregamento formamida/EDTA por vorlex e em seguida aquecidos a 90°C. E criada uma folha da amostra no software dc recolha de dados ABI no computador Macintosh que indica o numero de amostras carregadas e o ficheiro de mobilidade marcado por fluorescência a usar para o processamento dos dados de scquenciaçáo. Depois de limpar os poços da amostra com uma seringa, as ícacções de sequenciação numeradas impares são carregadas nos respectivos poços usando um micropipetador equipado com pontas de carregamento de gel de ponla plana. O gel é então sujeito a electroforese durante 5 minutos antes dos poços serem limpos de novo e as amostras iiuinenidas pares são carregadas. A ioda de filtro usada para iniciadores-corantes c terminadores-corantes é especificada no CPU de ABI 373A. Electroforeses e colheita de (.lados típicas duram 10 horas a 30 W no ABI 373A que é ajustado com uma placa de alumínio 134 distribuidora de calor. Depois da recolha dos dados, é criada um ficheiro de imagem pelo software ABI que relaciona o sinal de fluorescência detectado com o numero de varrimento (scan number) correspondente. O software determina então as posições na faixa das amostras baseado nas intensidades do sinal. Depois das faixas serem trilhadas, as secções transversais dos dados para cada faixa são extraídas e processados por subtraeção da linha dc base, calculo de mobilidade, desconvolução espectral, e correcção do tempo. Depois do processamento, os ficheiros dos dados da sequência são transferidos para uma SPARCstation 2 usando NFS Nhare.
Protocolo: preparar ureia 8M, géis de poliacrilamida 4.75%, como acima descrito, usando um pente com 36 poços. Antes do carregamento, limpar a superfície externa rias placas dc gel. Montar as placas de gel num sequenciador de DNA ABI 373 A (Foster City, CA) tal que a linha do varrimento mais baixo (usualmente o azul) corresponda a um valor de intensidade de 800-1000 como mostrado na janela da recolha de dados do computados. Se a linha de base das linhas de varrimento das quatro cores não for plana, limpar as placas de vidro de novo. Fixar a placa de distribuição de calor de alumínio. Sujeitar o gel a uma pré-ejectroforese durante 10-30 minutos. Preparar as amostras para carregar. Adicionar 3 μΐ de FE :i parte inferior de cada tubo, agitar por vortex, aquecer a 90°C durante 3 minutos, e cenl ri lugar para corrigir a condensação. Despejar os poços da amostra com tampão de electroíorcse usando uma seringa. Usando pontas de pipetas de carregamento de gel de ponta plana, carregar cada amostra numerada ímpar. Sujeitar o gel a uma pré-electroforese durante pelo menos 5 minutos, despejar os poços de novo, e depois carregar cada amostra numerada par. Iniciar a clectroforese (30 W durante 10 horas). Depois da recolha dos dado, o software ABI abrirá automaticamente o software de analise de dados, que criará o ficheiro da imagem do gel. extrairá os dados de cada faixa de cada amostra, e processará os dados. I·. Scciuenciacáo de dupla cadeia de clones de cDNA contendo caudas poIi(A) lontras usando iniciadores poli(dT) ancorados
Padrões de dupla cadeia de cDNAs contendo extensões poli(A) longas são difíceis de sequenciar com iniciadores vectores que amolecem a separação da cauda do poli(A). A sequenciação com estes iniciadores resulta numa progressão poIi(T) longa seguida de uma sequência que pode ser difícil de ler. Para circunscrever este problema, três iniciadores que contêm (dT)17 c também (dA) ou (dC) ou (dG) na extremidade 3' foram 135 desenhados para 'ancorar' os iniciadores e permitir a sequenciação da região imediatamente antes da região poli(A). Usando este protocolo, mais de 300 pb de sequência capaz de ser lida pode scr obtida. A sequência da cadeia oposta destes cDNAs loi determinada usando iniciadores específicos de inserção a montante da região poli(A). A capacidade de obter directamente sequenciação imediatamente a montante da cauda poli(A) dos cDNAs deve ser de importância particular para esforços de grande escala para gerar locais de sequência marcados ((STSs) sequence-tagged sites) dos cDNAs. O protocolo é como se segue. Sintetizar poli (dT)i7 ancorados com âncoras de (dA) ou (dC) ou (dG) na extremidade 3' num sintetizador de DNA e usar depois de purificação em Oligonucleotides Purification Cartridges (Amicon, Beverly, MA). Para sequenciação com iniciadores ancorados, desnaturar 5-10 pg de DNA plasmídico num volume total de 50 μΐ contendo hidróxido de sódio 0.2M e EDTA 0.16 mM por incubação a 65°C. durante 10 minutos. Adicionar os três iniciadores poli(dT) ancorados (2 pmol de cada) e colocar imediatamente a mistura em gelo. Neutralizar a solução por adição de 5 ml de acetato de amónia 5 M, pH 7.0.
Precipitar o DNA por adição de 150 μΐ de etanol 95% frio e lavar o sedimento duas vezes com etanol 70% frio. Secar o sedimento durante 5 minutos e em seguida ressuspender em tampão MOPS. Amolecer os iniciadores por aquecimento da solução durante 2 minutos a 65 °C seguido de arrefecimento lento até à temperatura ambiente durante 15-30 minutos. Realizar as reacções de sequenciação usando DNA polimerase T7 modificada e a-| ’2P |dATP (> lOOOCi/mmole) usando o protocolo acima descrito. (i. Seouenciacão de cDNA baseado em PCR e clonaiiem shotaun aleatória
Segue-se um método para sequenciar cDNAs clonados. Baseado em amplificação por PCR, clonagem shotgun aleatória, e sequenciação fluorescente automatizada. Esta abordagem baseada em PCR usa um par dc iniciadores entre os usuais locais de iniciação posteriores ou anteriores “universais” e os múltiplos locais de clonagem do vecior Slratagene Bluescript. Estes dois iniciadores PCR, com a sequência 5'-TCCiAGGTCGACGGTATCG'3’ (Seq. ID No.15) para o anterior ou iniciador -16bs e 5'-GCCGCTCTAGAACTAG TG-3' (Seq. ID No.16) para o anterior ou iniciador +l%s, podem ser usados para amplificar quantidades suíicientes de inserções cDNA na gama de tamanho 1.2 até 3.4 kb tal que a abordagem de sequenciação shotgun aleatória mais abaixo descrita possa ser implementada. O protocolo é o seguinte. Incubar quatro reacções de PCR delOO μΐ. cada uma contendo aproximadamente 100 ng de DNA plasmídico, 100 pmoles de cada iniciador, KC1 50 miM. Tris-HCl 10 mM pH 8.5, MgCL1.5 mM, 0.2mM de cada dNTP, e 5 unidades de PE-('ctus Amplitaq em tubos fechados de 0.5 ml durante 25 ciclos de 95°C durante 1 minuto, 55"C durante 1 minuto e 72°C durante 2 minutos num Cycler Térmico DNA PE-Cetus de 48 tubos. Depois de agrupar as quatro reacções, a solução aquosa contendo o produto do PCR é colocada num nebulizador perfeito a 2.0 ml por adição de aproximadamente 0.5 a 1.0 ml de glicerol, e equilibrada a -20°C colocando-a num banho de álcool isopropílico/gelo seco ou num banho de NaCl aquoso saturado/gelo seco durante 10 minutos. A amostra é nebulizada a -20"C aplicando pressão com azoto a 25 - 30 psi durante 2.5 min. A seguir à precipitação por ctanol para concentrar o produto PCR cortado, os fragmentos foram cegados no fim e losforilados por incubação com o fragmento Klenow da DNA polimerase B.Coli e a T4 polinucleótido kinase como descrito prcviamente. Fragmentos na gama 0.4 a 0.7 kb foram obtidos por eluiçâo de um gel de agarose de baixa fusão.
LISTAGEM DE SEQUÊNCIA (I) INFORMAÇÃO GERAL: (i) REQUERENTES: Van Ness, Jeffrey Tabone, John C. Howbert, J. Jeffry Mulligan, John 1.
(ii) TITULO DA INVENÇÃO: MÉTODOS E COMPOSIÇÕES PARA DETERMINAR A SEQUÊNCIA DE MOLÉCULAS DE ÁCIDO NtJCLEICO (iii) NÚMERO DE SEQUÊNCIAS: 16
(iv) MORADA PARA CORRESPONDÊNCIA
(A) DESTINATÁRIO: SEED AND BERRY 137 (B) RUA: 6300 Columbia Center, 701 Fifth Avenue (C) CIDADE: Seattle (D) ESTADO: Washington
(E) PAÍS: USA (F) CÓDIGO POSTAL: 98104-7092 (v) COMPUTADOR: (A) TTPO DE AMBIENTE: Disquete (B) COMPUTADOR: PC IBM compatível
(C) SISTEMA OPERATIVO: PC-DOS/MS-DOS (D) SOFTWARE: Patentln Release #1.0, versão #1.30
(vi) DADOS DE PEDIDO ACTUAIS (A) NUMERO DE PEDIDO: (B) DATA DE DEPÓSITO: 22-JAN-1997
(C) CLASSIFICAÇÃO (viii) INFORMAÇÃO DO REPRESENTANTE/AGENTE: (A) NOME: McMasters, David D. (B) NUMERO DE REGISTO: 33963 (C) NUMERO DE REFERÊNCIA/DOCUMENTO: 240052.416 (ix) INFORMAÇÃO DE TELECOMUNICAÇÕES: (A) TELEFONE: (206) 622-4900 (B) TELEFAX: (206) 682-6031 (2) INFORMAÇÃO PARA SEQ. ID No: 1:
(i) CARACTCRÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 18 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: única (D) TOPOLOGIA: linear 138 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:l: TGTAAAACGA CGGCCAGT (2) INFORMAÇÃO PARA SEQ. ID No:2:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 19 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: única (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:2: TGTAAAACGA CGGCCAGTA (2) INFORMAÇÃO PARA SEQ. ID No:3:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 20 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: única (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:3: TGTAAAACGA CGGCCAGTAT (2) INFORMAÇÃO PARA SEQ. ID No:4:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 21 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: única (D) TOPOLOGIA: linear 139 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQID NO:4 rCTAAAACGA CGGCCAGTAT G (2) INFORMAÇÃO PARA SEQ ID No:5:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nncleico (C) TIPO DE CADEIA: única (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:5 TGTAAAACGA CGGCCAGTAT GC (2) INFORMAÇÃO PARA SEQ ID No:6:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: única (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:6 TGTAAAACGA CGGCCAGTAT GCA (2) INFORMAÇÃO PARA SEQ ID No:7:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 24 pares de bases (D) TIPO: ácido nucleico (C) TIPO DE CADEIA: única (D) TOPOLOGIA: linear 140 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:7: TCiTAAAACGA CGGCCAGTAT GCAT (2) INFORMAÇÃO PARA SEQ ID No:8:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 25 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: única (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:8: TGTAAAACGA CGGCCAGTAT GCATG (2) INFORMAÇÃO PARA SEQ. ID No:9:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 18 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: única (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:9: I (i IAAAACGA CGGCCACG (2) INFORMAÇÃO PARA SEQ. IDNo:10:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 19 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: única (D) TOPOLOGIA: linear
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 10: TGTAAAACGA CGGCCAGCG 141 (2) INFORMAÇÃO PARA SEQ ID No: I I:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 20 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: única (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 11 TGTAAAACGA CGGCCAGCGT (2) INFORMAÇÃO PARA SEQ ID No: 12:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 21 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: única (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 12 TGTAAAACGA CGGCCAGCGT A (2) INFORMAÇÃO PARA SEQ IDNo:13:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: única (D) TOPOLOGIA: linear íf (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ IDNO:13
ΊGIAAAACGA CGGCCAGCGF AC 142 (2) INFORMAÇÃO PARA SEQ ID No: 14:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: única (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ IDNO:14: TGTAAAACGA CGGCCAGCGT ACC (2) INFORMAÇÃO PARA SEQ ID No:15:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 18 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: única (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 15: TCGAGGTCGA CGGTATCG (2) INFORMAÇÃO PARA SEQ. ID No: 16:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 18 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: única (D) TOPOLOGIA: linear
(xi) DESCRIÇÃO DA SEQUÊNCIA; SEQ ID NO. 16: GCCGCTCTAG AACTAGTG 7 JUL. 2000
Lisboa,
143

Claims (50)

  1. REIVINDICAÇÕES .1- Um método para determinar a sequência de uma molécula de ácido nucleico, caracterízado pelo facto de compreender: (a) geração dos fragmentos de ácido nucleico marcados que são complementares a um molécula de ácido nucleico alvo seleccionada, onde o marcador é um grupo orgânico que é correlacionado com um nucleótido particular e detectável por espectrometria ou potenciometria; (b) separação dos fragmentos marcados por comprimento sequencial; (c) corte dos marcadores dos fragmentos marcados; e (d) detecção dos marcadores por espectrometria ou potenciometria, e a partir daí determinar a sequência da molécula da ácido nucleico.
  2. 2- O método, conforme reivindicado na reivindicação 1, caracterízado pelo facto de a detecção dos marcadores ser por espectrometria de massa, espectrometria de infravermelho, espectrometria de ultravioleta ou amperometria potenciostática.
  3. 3- O método, conforme reivindicado em qualquer uma das reivindicações 1-2, caracterízado pelo facto de os fragmentos marcados serem separados no passo (b) por um método seleccionado de electroforese em gel, electroforese capilar, electroforese em micro-canais e l-IPLC.
  4. 4- O método, conforme reivindicado em qualquer uma das reivindicações 1-3, caracterízado pelo facto de os fragmentos marcados serem cortados no passo (c) por um método seleccionado dos métodos de oxidação, redução, instável a ácido, instável a base, cnzimático, electroquímico, térmico, permuta de tiol e foto instável.
  5. 5- Q método, conforme reivindicado em qualquer uma das reivindicações 1-4, caracterízado pelo facto de os marcadores serem detectados por espectrometria de massa tempo-de-voo, espectrometria de massa quadrupulo, espeoliomelna de massa de sector magnético ou espectrometria de massa de sector eléctrico.
  6. 6- O método, conforme reivindicado cm qualquer uma das reivindicações 1-4, caracterízado pelo facto de os marcadores serem detectados por detectores colomctricos ou detectores amperométricos. 1
  7. 7- O método, conforme reivindicado em qualquer uma das reivindicações 1-6, caracterizado pelo facto de os fragmentos de ácido nucleico marcados serem gerados no passo (a) de uma terminação 5' para uma terminação 3'.
  8. 8- O método, conforme reivindicado em qualquer uma das reivindicações 1-7, caracterizado pelo facto de o passo (a) gerar mais de quatro dos fragmentos de ácido nucleico marcados e sendo cada marcador único para um fragmento de ácido nucleico.
  9. 9- O método, conforme reivindicado em qualquer uma das reivindicações 1-8, caracterizado pelo facto de os passos (b), (c) e (d) serem realizados de uma forma contínua.
  10. 10- O método, conforme reivindicado em qualquer uma das reivindicações 1-9, caracterizado pelo facto de os passos (b), (c) e (d) serem realizados de uma forma contínua num sistema. 11- 0 método, conforme reivindicado em qualquer uma das reivindicações 1-10, caracterizado pelo facto de um ou mais passos serem automatizados.
  11. 12- O método, conforme reivindicado em qualquer uma das reivindicações 1-11, caracterizado pelo facto de os fragmentos marcados serem gerados a partir de iniciadores de oligonucleótidos que são conjugados a um marcador, a outra extremidade que não a extremidade 3'do iniciador. 1.3- O método, conforme reivindicado em qualquer uma das reivindicações 1-11, caracterizado pelo facto de os fragmentos marcados serem gerados a partir de didesoxinucleótidos marcados terminadores.
  12. 14- O método, conforme reivindicado em qualquer uma das reivindicações 1-13, caracterizado pelo facto de pelo menos um fragmento de ácido nucleico marcado ser um composto de acordo com qualquer uma das reivindicação 16 a 34.
  13. 15- O método, conforme reivindicado em qualquer uma das reivindicações I. 3-4. e 7-14, caracterizado pelo facto de a detecção dos marcadores ser por espectrometria não tluorescente ou potenciomeli ia.
  14. 16- Um composto com a fórmula: Tms - L - X caracterizado pelo facto de, Tms ser um grupo orgânico detectável por espectrometria de massa, comprendendo carbono, pelo menos um átomo de hidrogénio e fluoreto, e átomos opcionais xeleecionados do oxigénio, azoto, enxofre, fósforo e iodo; 2 L ser um grupo orgânico que permite que um único grupo contendo Tms seja cortado do resto do composto, em que o grupo contendo Tms compreende um grupo funcional que suporta um único estado de carga ionizado quando o composto é sujeito a espectrometria de massa e é uma amina terciária, amina quaternária ou ácido orgânico; e X ser um fragmento de ácido nucleico; com a condição de que o composto não esteja ligado a um suporte sólido através de X nem tenha uma massa inferior a 250 daltons.
  15. 17- Um composto, conforme reivindicado na reivindicação 16, caracterizado pelo facto de T",s ter uma massa de 15 a 10.000 daltons e uma fórmula molécular de Ci-sooNo-i (ιοί))). looSo-ioPo-ioHuFpIg, onde a soma de α, β e δ é suficiente para satisfazer as valências por outro lado não satisfeitas dos átomos se C, N, O, P e S.
  16. 18- Um composto, conforme reivindicado em qualquer uma das reivindicações 16-17, caracterizado pelo facto de os Tms e L estarem ligados através de um grupo funcional seleccionado de amida, éster, éter, amina, sulfureto, tioéster, disuifureto, tioéter, ureia, tioureia, carbamato, tiocarbamato, base de Schiff, base de Schiff reduzida, imina, oxima, hidrazona, fosfato, fosfonato, fosforamida, fosfonamida, sulfonato, sulfonamida ou ligação carbono-carbono.
  17. 19- Um composto, conforme reivindicado em qualquer uma das reivindicações 16-18, caracterizado pelo facto de o grupo funcional, através do qual Tms e L estão unidos, ser seleccionado de amida, éster, amina, ureia e carbamato.
  18. 20- Um composto, conforme reivindicado em qualquer uma das reivindicações 16-19, caracterizado pelo facto de L ser seleccionado de Lhv, L1’®’0, L[°] ,L[K1. Lenz, Lelc, La e L.s\ onde radiação actínica, ácido, base, oxidação, redução, enzima, electroquímica, temperatura elevada (“térmica”) e permuta de tiol, respectivamente, causam o corte do grupo contendo T"'‘s do restante da molécula.
  19. 21- Um composto, conforme reivindicado em qualquer uma das reivindicações 16-20. caracterizado pelo facto de L ser Lhv e ter a fórmula L1- L2-L3, onde L2 é um fragmento molecular que absorve radiação actínica para promover o corte de Tms dc X, e L1 e 1/ são independentemente uma ligação directa ou um grupo orgânico, onde L1 separa L2 de Γ"' e L' separa L2 de X, e nem L1 nem L3 sofrem corte de ligação quando L2 absorve a radiação actínica. λ,. ·· ·- ···
  20. 22- Um composto, conforme reivindicado em qualquer uma das reivindicações 16-21, caracterizado pelo facto de L ser Lhv, Lhv ter a fórmula L!-L2-I/ e -L2-LJ ter a fórmula: d
    com um átomo de carbono nas posições a, b, c, d ou e substituído com L’- X e opcionalmente uma ou mais posições b, c, d, ou e substituídas com alquilo, alcoxi, fluoreto, cloreto, hidroxiio, carboxilalo ou aiuida, e R1 é hidrogénio ou hidrocarbilo.
  21. 23- Um composto, conforme reivindicado na reivindicação 22, caracterizado pelo facto de -LJ-X estar localizado na posição a.
  22. 24- Um composto, conforme reivindicado na reivindicação 21, caracterizado pelo facto dc LJ ser seleccionado de uma ligação directa, um hidrocarbileno, -O-hidrocarbilcno e hidrocarbileno-(0- hidrocarbileno)„-H, e n ser um número inteiro de 1 a 10.
  23. 25- Um composto, conforme reivindicado em qualquer uma das reivindicações 16-24. caracterizado pelo facto de -L-X ter a fórmula: d
    onde uma ou mais posições b, c, d ou e é substituída com hidrogénio, alquilo, alcoxi, lluoreto. cloreto, hidroxiio, carboxilato ou arnida, R1 é hidrogénio ou hidrocarbilo e R2 é um fragmento de ácido nucleico. 4 ι.·*·;· ι.·*·;·
  24. 26- Um composto, conforme reivindicado em qualquer uma das reivindicações 16-25, caracterizado pelo facto de Tms ter a fórmula: T2-(j-r-)„- T2 é um grupo orgânico formado de carbono e um ou mais de hidrogénio, íluoreto. iodeto, oxigénio, azoto, enxofre e fósforo, com uma massa de 15 a 500 dal tons; T:’ é um grupo orgânico formado de carbono e um ou mais de hidrogénio, lluoreto, iodeto, oxigénio, azoto, enxofre e fósforo, com uma massa de 50 a 1000 daltons; J é uma ligação directa ou um grupo funcional escolhido de amida, éster, amina, sufureto. éter. tioéster, disulfureto, tioéter, ureia, tioureia, carbamato, tiocarbamato, base de Schilf, base de Schiff reduzida, imina, oxima, hidrazona, fosfato, fosfonato, fosforamida, Ibsfonamida. sulfonato, sulfonamida ou ligação carbono-carbono; e n é um numero inteiro que varia entre 1 a 50, tal que quando n é maior que 1, cada T’ e .1 é seleccionado independentemente.
  25. 27- Um composto, conforme reivindicado na reivindicação 26, caracterizado pelo lacto dc T2 ser seleccionado de hidrocarbil, hidrocarbil-O-hidrocarbilcno. hidrocarbil-S-hidroearbilcno, hidrocarbil-NH-hidrocarbileno, hidrocarbil-amida-hidrocarbilcno, N-(hidrocarbi l)hidrocarbileno, N,N-di(hidrocarbil)hidrocarbileno, hidrocarbilacil- hidrocarbileno, heterociclilhidrocarbil onde os hetero átomos são seleccionado(s) de oxigénio, azoto, enxofre e fósforo, e os substituintes são seleccionados de hidrocarbil, hidrocarbil-O-hidrocarbile.no, hidrocarbil-NH-hidrocarbileno, hidrocarbil-S-hidrocarbileno, N-(hitlrocarbil)hidrocarbileno, N,N-di(hidrocarbil)hÍdrocarbileno e hidrocarbilacil- hidrocarbileno, bem como derivados de cada um dos compostos acima mencionados, onde um ou mais hidrogénios são substituídos por um número igual de fluoretos.
  26. 28- Um composto, conforme reivindicado em qualquer uma das reivindicações 26-27. caracterizado pelo facto de T! ter a fórmula -G( R2)-, G ser uma cadeia alquileno C|.(, tendo um único substituinte, R2 e R2 é seleccionado de alquil, alquenil, alquinil, cicloalquil, cicloalquil unido a aril, cicloalquenil, aril, aralquil, alquenil ou alquinil aril substituído, alquil cicloalquil substituído, cicloalquil cicloalquenil substituído, biaril, alcoxi, alquenoxi, alcjuinoxi, aralcoxi, alquenoxi ou alquinoxi aril substituído, alquilamino, alquenilamino ou alquinilamino. alquilamino aril substituído, alquenilamino ou alquinilamino aril substituído, ariloxi, arilamino, alquilo N-alquilureia substituído, alquilo N-arilureia substituído, alquilo alquilcarbomlamina substituído, alquilo aminacarbonil substituído, hetcrocielil, alquil 5 heterociclil substituído, amino heterociclil substituído, aralquil carboxialquil substituído, aril oxocarbociclil ligado e heterociclilalquil; cicloalquenil, alquilo aril substituído e, aralquilo, alquilo hidroxi substituído, alquilo alcoxi substituído, alquilo aralcoxi substituído, alquilo alcoxi substituído, alquilo aralcoxi substituído, alquilo amina substituído, alquilo (arlquiloxicarbonilamino aril substituído) substituído, alquilo tiol substituído, alquilo alquilsulfonil substituído, alquilo (alquiltio hidroxi substituído) substituído, alquilo tiolalcoxi substituído, alquilo hidrocarbilacilamino substituído, alquilo heterociclilacilamino substituído, alquilo hidrocarbil substituído heterociclilacilamino substituído, alquilo alquilsulfonilamino substituído, alquilo arilsulfonilamino substituído, morfolina-alquilo, tiomorfolina-alquilo, morfolina alquilo carbonil substituída, alquilo tiomorfolinacarbonil substituído, alquilo [N-(alquilo. alquenilo, alquinilo)- ou N,N-[dialquilo, dialquenilo, dialquinilo ou (alquilo, alqucnilo)-amino] carbonil substituído, heterociclilaminocarbonil, heterociclilalquilenoaminocarbonil, alquilo heterociclilaminocarbonil substituído, alquilo heterociclilalquilenoaminocarbonil substituído, N,N-[dialquilo] alquilenoaminocarbonil, alquilo N,N-|dialquilo] alquilenoaminocarbonil substituído, heterociclilcarbonil alquilo substituído, heterociclilcarbonil-alquilo alquilo substituído, alquilo carboxil substituído, acilaminoalquilo dialquilamino substituído e cadeias laterais de aminoácidos seleccionadas de nrginina, asparagina, glutamina, S-metil cisteína, metionina e dos seus correspondentes derivados sulfoxi e sulfona, glicina, leucina, isoleucina, alo-isoleucina, tert-leucina, norleueina, íenilalanina, tirosina, triptofano, prolina, alanma, ormtina, histidina, glutamina, valina, trconina. serina, ácido aspártico, beta-cianoalanina, e alotreonina: alinil e íicterocici tlcarbonil, aminocarbonil, amido, mono- ou dialquilaminocarbonil, mono- ou diarilaminocarbonil, alquilarilaminocarbonil, diarilaminocarbonil. mono- ou iliacilaminocarbonil, acilo aromático ou alifático, alquilo opcionalmente substituído por substituintes seleccionados de amino, carboxi, hidroxi, mercapto, mono- ou dialquilamina, mono- ou diarilamina, alquilarilamina, Uiarilamiiia, mono- ou diacilamina, alcoxi, alquenoxi, ariloxi, tioalcoxi. tioalquenoxi, tioalquinoxi, tioariloxi e heterociclil.
  27. 29- Um composto, conforme reivindicado em qualquer uma das reivindicações 26-2S, caracterizado pelo facto de ter a fórmula: 6
    em que G é (CH?)]-;,, em que um hidrogénio num e só num dos grupos Cl U representado por um único "Cr” é substituído com - (CHhVAmida-T4; T2 e T4 são grupos orgânicos de fórmuJa Ci^sNo-gOo-ySo-sPooH tal que a soma de α ,β e δ é suficiente para satisfazer as valências de outra forma insatisfeitas dos átomos de C, N, O; S e P; O O II II Amidaé —N—C— ou —C—N — I I R1 R1 R1 ò hidrogénio ou alquilo Cm»; e é um inteiro variando de 0 a 4; X é definido de acordo com a reivindicação 1; e n é um número inteiro variando de 1 a 50 tal que quando n é maior do que 1, G, c Amidn. R1 e T4 são seleccionndos independentemente.
  28. 30- Um composto, conforme reivindicado em qualquer uma das reivindicações 26-29. caracterizado pelo facto de ter a fórmula: 7 X rp| I Amida
    T5 onde Τ' é um grupo orgânico de fórmula C|-25No.yO().ySo-3Po-3H(xFpIs tal que a soma de α ,β e δ é suficiente para satisfazer as valências de outra fornia insatisfeitas dos átomos de C, N, O; S e P; e Τ' inclui uma amina terciária ou quaternária ou um ácido orgânico; e m ó um inteiro variando de 0 a 49.
  29. 31- Um composto, conforme reivindicado em qualquer uma das reivindicações 26-29, cnracterr/ado pelo facto de ter a fórmula: yd Amida
    X onde T5 é um grupo orgânico de fórmula C|.25N0.<>Oo.<)So.3Po-3HKF|d,s tal que a soma de α ,β e δ é suficiente para satisfazer as valências dc outra forma insatisfeitas dos átomos dc C, N, O, S e P; e T' inclui uma amina terciária ou quaternária ou um ácido orgânico; e m é um número inteiro variando de 0 a 49. 8
  30. 32- Um composto, conforme reivindicado em qualquer uma das reivindicações 30-31. caracterizado pelo lacto de -Amida-T5 ser seleccionada de:
    O O
  31. 33- Um composto, conforme reivindicado em qualquer uma das reivindicações 30-31. caracterizado pelo facto de -Amida-T3 ser seleccionada de:
    O (C|-CK)) ,N.
    CNH (C|-Cl0 II o -CNH— (CrCl0>— N(CrCl0)2 . —CNH—(CrC10).....-N O -CN N(C’i-C10) · e O O ' C"I! O •NH 9
  32. 34- Um composto, conforme reivindicado em qualquer uma das reivindicações 26-33. caracterizado pelo facto de T2 ter a estrutura que resulta quando um dos seguintes ácidos orgânicos é condensado com um grupo amina para formar T"-C(=0)-N(R )-: Acido lórmico. Ácido acético, Ácido propiólico, Ácido propiónico. Ácido fluoracético. Ácido 2-hiitinóico. Ácido ciclopropanocarboxílico. Ácido butírico. Ácido metoxiacético, Ácido diiluoracctico. Ácido 4-pentinóico, Ácido ciclobutanocarboxílico, Ácido 3,3-dimetilacrílico, Ácido valérico, Ν,Ν-dimetilglicina, N-formil-Gly-OH, Ácido etoxiacético. Ácido (metiltio)acético. Ácido pirrole-2-carboxílico, Ácido 3-furóico, Ácido isoxazole-5-carboxílico. Ácido trans 3-hexenóico, Ácido trifluoracético, Ácido hexanóico, Ac-Gly-OH, Ácido 2-hidroxi-2-metilbutírico, Ácido benzóico, Ácido nicotínico. Ácido 2-pirazinocarboxílico, Ácido l-metil-2-pirrolecarboxílico. Ácido 2-cicIopenteno-1-acético, Ácido eiclopentilacético, Ácido (S)-(-)-2-pirrolidona-5-carboxílico, N-metil-L-prolina, Ácido hcptanóico, Ac-b-Ala-OH, Ácido 2-etil-2-hidroxibutírico, Ácido 2-(2-metoxietoxi)acético, Ácido p-toluico. Ácido 6-metilnicotínico, Ácido 5-metil-2-pirazinocarboxílico, Ácido 2,5-dimelilpirrole-3-carboxílico, Ácido 4-fluorobcnzóico, Ácido 3,5-dimelilisoxazole-4-carboxílico. Ácido 3-ciclopentilpropiónico, Ácido octanóico, Ácido Ν,Ν-dimetilsuccinâmico, Acido leniIpropiólico. Ácido cinâmico, Ácido 4-etilbenzóico, Ácido p-anísico, Ácido 1,2,5-trimetilpirvole-3-carboxílico. Ácido 3-fluoro-4-metilbenzóico, Ac-DL-propargilglicina, Ácido 3-(trifluorometil)butírico, Ácido 1-piperidinapropiónico, N-acetilprolina. Ácido 3,5-difluorobenzóico, Ac-L-Val-OH, Ácido indole-2-carboxílico. Ácido 2-bcnzoluranocarboxílico. Acido benzotriazole-5-carboxílico, Ácido 4-n-propil benzóico, Ácido 3-dimetilaminobenzóico, Ácido 4-etoxíbenzóico. Ácido 4-(metiltio)benzóico, N-(2-l'uroil)glicina. Ácido 2-(metiltio)nicotínico, Ácido 3-fluoro-4-metoxibenzóico. Tfa-Gly-OH, Ácido 2-nattoico, Ácido quináldico, Ac-L-Ile-OH, Ácido 3-metilindeno-2-carhoxílico, Ácido 2-quinoxalinecarboxílico, Ácido l-metilindole-2-carboxílico, Ácido 2,3,6-trifluorobenzóico, N-Formil-U-Met-OH, Ácido 2-[2-(-2-metoxietoxi)etoxi)acéiico, Ácido 4-n-butilbcnzóico, N-benzoilglicina. Ácido 5-fluoroindole-2-carboxílico, Ácido 4-n-propoxibenzóico. Ácido 4-acetil-3.5-dimetiI-2-pirrolecarboxílico, Ácido 3,5-dimctoxibcnzóico, Ácido 2,6-dimctoxinicotínico, Ácido ciclohexanopentanóico, Ácido 2-naftilacético. Ácido 4-( I H-pírrol-I-iUbenzóico, Acido indole-3-propiónico, Ácido m-trifluoromctilbenzóico. Ácido 5-mctoxiindole-2-carboxílico, Ácido 4-pcntilbenzóico, Bz-b-Ala-OH, Ácido 4-dictilaminobcnzóico, Ácido 3 -n-butoxibenzóico. Ácido 3-metil-5-CF3-isoxazole-4- 10
    carboxílico. Ácido (3,4-dimetoxifenil)acético, Ácido 4-bifenilcarboxílico. Pivaloil-Pro-OH, Octanoil-GJy-OH, Ácido (2-nafloxi)acético, Ácido indole-3-butírico. Ácido 4- ((rHliioroinetil)fenilacético, Ácido 5-metoxindole-3-acético, Ácido 4-(IriihioiOmetoxi)benzóico, Ac-L-Phe-OH, Ácido 4-pentiloxibenzóico, Z-Gly-OH, 4-carboxi-N-(rur-2-ilmetil)pirrolidina-2-ona, Ácido 3,4-dietoxibenzóico, Ácido 2,4-dimetil-5-C02Et-pirrole-3-carboxílico. Ácido N-(2-fluorofenil)succinâmico, Ácido 3,4,5-trimetoxibenzóico, Acido N-lenilantranílico, Ácido 3-fenoxibenzóico, Nonanoil-Gly-OH. Ácido 2- l'cnoxipiridina-3-carboxílico. Ácido 2,5-dimetil-l-fenilpirrole-3-carboxílico, Ácido trans-4-(Irifluorometil)cinâmico, Ácido (5-metil-2-feniloxazol-4-il)acético, Ácido 4-(2-ciclohexeniloxi)benzóico. Ácido 5-metoxi-2-metilindole-3-acético, Ácido trans-4-cotininocarboxílico, Ácido Βζ-5-aminovalérico, Ácido 4-hexiloxibenzóico, Acido N-(3-metoxifcnil)succinâmico, Z-Sar-OH, Ácido 4-(3,4-dimetoxifeni])butírico, Ac-o-Fluoro-DL-Plie-OII. Ácido N-(4-fluorofenil)glutarâmico , Ácido 4'-etil-4-bifenilcarboxílico, Ácido 1,2.3.4-tetialiidroacridinocarboxílico, Ácido 3-fenoxiíenilacético, Ácido N-(2,4-dilluorofenil)succinâmico, N-Decanoil-Gly-OH, Ácido (+)-6-raetoxi-a-metil-2-naftalenoacctico, Ácido 3~(trifluorometoxi)cinâmico, N-formil-DL-Trp-OH, Ácido (R)-(+)-a-nietoxi-a-(t.rifluorometil)feniIacético. Bz-DL-Leu-OH, Ácido 4- (trifluorometoxi)fenoxiacético, Ácido 4-heptiloxibenzóico, Ácido 2,3,4-tnmetoxicinâmico, 2.6-Dimetoxibenzoii-Gly-OH, Ácido 3-(3,4,5-trimetoxifenil)propiónico. Ácido 2,3,4,5,6-pentafluorofcnoxiacétíco, N-(2,4-difluorofenil)glutarâmico, N-Undecanoil-Gly-OH. Ácido 2-(4-llaorobenzoil)benzóico, Ácido 5-triíluorometoxindole-2-carboxílico, Ácido N-(2,4-dillLiorolenil)cliglicolâmico, Ac-L-Trp-OH, Tfa-L-Fenilglicina-OH, Ácido 3-iodobenzóico. Ácido 3-(4-n-pentilbenzoil)propiónico, Ácido 2-fenil-4-quinolinocarboxílico, Ácido 4-octiloxibenzóico, Bz-L-Met-OH, Ácido 3,4,5-trietoxibenzóico, N-Lauroil-Gly-OH, Ácido ’,5-bis(tiifluorometil)benzóico, Ac-5-Metil-DL-Trp-OH, Ácido 2-iodofenilacético. Ácido 3-iodo-4-nietilbenzóico, Ácido 3-(4-n-hexilbenzoil)propiónico, N-Hexanoil-L-Phe-UH, Ácido 4-noniloxibenzóico, Ácido 4'-(trifluorometi])-2-bifeni]carboxílico, Bz-L-Phe-OH, N-Tridecanoil-Gly-OH, Ácido 3,3-bis(triíluorometil)fenÍlacético, Ácido 3-(4-n-heptilbcnzoil)propiónico, N-Hepitanoil-L-Phe-OH, Ácido 4- deciloxibenzóico. Ácido N-(a, (X. a -(rifluoro-m-tolil)antranílico, Ácido mflúmico, Ácido 4-(2-hidroxiliexafluoroisopropil)bcnzóico, N-Miristoil-Gly-OH, Ácido 3-(4-n- 11 octilbenzoil)propiónico, N-Octanoil-L-Phe-OH, Ácido 4-undeciloxibenzóico, 3-(3,4,5-|TÍmetoxiieni])piOpionil-Gly-OH, Ácido 8-iodonaftóico, Ácido N-pentadecanoil-GIy-OH, Ácido 4-dodeciloxibenzóico, N-Palmitoil-Gly-OH e N-Stearoil-Gly-OH.
  33. 35- Uma composição compreendendo uma pluralidade de compostos, conforme reivindicado em qualquer uma das reivindicações 16-34, caraeterizada pelo facto de não existirem dois compostos ou com o mesmo Tms ou com o mesmo X, e onde, se a composição compreende um par dos ditos componentes, os meios X diferem em mais de uma base não idêntica.
  34. 36- Uma composição, conforme reivindicado na reivindicação 35, caraeterizada pelo lacto de a pluralidade ser maior que 2.
  35. 37- Uma composição, conforme reivindicado na reivindicação 35, caraeterizada pelo tacto de a pluralidade ser maior que 4.
  36. 38- Uma composição, conforme reivindicado em qualquer uma das reivindicações 35-37, caraeterizada pelo facto de o fragmento de ácido nucleico ter uma sequência complementar a uma porção de um vector, onde o fragmento é capaz de iniciar sínteses nucleotídicas.
  37. 39- Uma composição, conforme reivindicado em qualquer uma das reivindicações 35-38, caraeterizada pelo facto de os grupos T"15, de membros da pluralidade diferem em pelo menos 2 amu.
  38. 40- Uma composição, conforme reivindicado em qualquer uma das reivindicações 35-38, caraeterizada pelo facto de os grupos Tms de membros da pluralidade diferirem em, pelo menos, 4 amu.
  39. 41- Uma composição, caraeterizada pelo facto dc compreender água e um composto, conforme reivindicado em qualquer uma das reivindicações 16-34.
  40. 42- Uma composição, conforme reivindicado na reivindicação 41, caraeterizada pelo Cacto dc compreender ainda um tamp3o, de pH de cerca de 5 a cerca dc 9.
  41. 43- LJma composição, conforme reivindicado em qualquer uma das reivindicações 41-42, caraeterizada pelo facto dc compreender ainda uma enzima e um de d/V1P. dGTP. dCTP. e dTTP.
  42. 44- Uma composição, conforme reivindicado em qualquer urna das reivindicações 41-42. e sendo caraeterizada pelo facto de compreender ainda uma enzima e um dc ddATP. ddGTP, ddCTP, e ddTTP. 12
  43. 45- Uma composição compreendendo uma pluralidade de conjuntos de compostos, conforme reivindicado em qualquer uma das reivindicações 16-34; caracterizada pelo facto de, dentro de um conjunto, todos os membros terem o mesmo grupo T'"\ e os fragmentos de ácidos nucleicos terem comprimentos variáveis que terminam com o mesmo didesoxinucleótido escolhido de ddAMP, ddOMP, ddCMP, e tltlTMP: e onde entre conjuntos, os grupos Tms diferem em, pelo menos, 2 amu.
  44. 46- Uma composição, conforme reivindicado na reivindicação 45. caracterizada peio facto de a pluralidade ser. pelo menos. 3.
  45. 47- Uma composição, conforme reivindicado na reivindicação 45, caracterizada pelo facto de a pluralidade ser, pelo menos, 5.
  46. 48- Uma composição compreendendo uma primeira pluralidade de conjuntos de compostos, conforme reivindicado na reivindicação 45, e uma segunda pluralidade de conjuntos de compostos de acordo com qualquer uma das reivindicações 16-34; caracterizada pelo facto de todos os membros dentro da segunda pluralidade terem uma sequência de ácido nucleico que termina com o mesmo didesoxinucleótido escolhido de ddAMP, ddGMP, ddCMP, e ddTMP; com a condição que o didesoxinucleótido presente nos compostos da primeira pluralidade não é o mesmo que o didesoxinucleótido presente nos compostos da segunda pluralidade.
  47. 49- Um kit para análise de sequenciação de DNA que compreende uma pluralidade de conjuntos de contentores, cada conjunto de contentores compreendendo pelo menos cinco contentores, caracterizado pelo facto de o primeiro contentor conter um vector, um segundo, terceiro, quarto e quinto contentores conterem compostos, conforme reivindicado em qualquer uma das reivindicações 16-34; e o fragmento de ácido nucleico no segundo, terceiro, quarto e quinto contentores é idêntico e complementar a uma porção do vector dentro do conjunto de contentores, e o grupo Tms dentro de cada contentor é diferente dos outros grupos Tms no kit.
  48. 50- Um kit, conforme reivindicado na reivindicação 49, caracterizado pelo facto de a pluralidade ser, pelo menos, 3.
  49. 51- Um kit, conforme reivindicado na reivindicação 49, caracterizado pelo facto de a pluralidade scr, pelo menos, 5. π
  50. 52- Um sistema adequado para uso no método, conforme reivindicado em qualquer uma das reivindicações 1-15, caracterizado pelo facto de compreender um equipamento de separação que separa fragmentos de ácido nucleico marcado, um equipamento que corta, de um fragmento de ácido nucleico marcado, um marcador que é correlacionado com um nucleótido particular e que é detectável por detecção electroquímica, e um equipamento para amperometria potenciostática.
    Lisboa, -7M.m
    Γ 14
PT97905634T 1996-01-23 1997-01-23 Metodos e composicoes para a determinacao de sequencias de moleculas de acido nucleico PT868535E (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US1046296P 1996-01-23 1996-01-23
US58926096A 1996-01-23 1996-01-23

Publications (1)

Publication Number Publication Date
PT868535E true PT868535E (pt) 2000-12-29

Family

ID=26681206

Family Applications (1)

Application Number Title Priority Date Filing Date
PT97905634T PT868535E (pt) 1996-01-23 1997-01-23 Metodos e composicoes para a determinacao de sequencias de moleculas de acido nucleico

Country Status (17)

Country Link
EP (1) EP0868535B9 (pt)
JP (2) JP2001501449A (pt)
KR (1) KR100482917B1 (pt)
CN (1) CN1163619C (pt)
AT (2) ATE191750T1 (pt)
AU (1) AU717435B2 (pt)
BR (1) BR9707056B1 (pt)
CA (1) CA2243560A1 (pt)
CZ (1) CZ218498A3 (pt)
DE (2) DE69739304D1 (pt)
ES (1) ES2144846T5 (pt)
GR (1) GR3033733T3 (pt)
HU (1) HUP9901321A3 (pt)
NZ (1) NZ331044A (pt)
PL (1) PL328271A1 (pt)
PT (1) PT868535E (pt)
WO (1) WO1997027331A2 (pt)

Families Citing this family (74)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6401267B1 (en) 1993-09-27 2002-06-11 Radoje Drmanac Methods and compositions for efficient nucleic acid sequencing
PT840804E (pt) * 1996-01-23 2000-10-31 Qiagen Genomics Inc Metodos e composicoes para a analise de moleculas de acidos nocleicos usando tecnicas de separacao por dimensoes
DE69700902T2 (de) * 1996-01-23 2000-07-20 Rapigene Inc Verfahren zur erkennung von ligandenpaar bindung mit erhöter empfindlichkeit
WO1998037242A1 (en) * 1997-02-24 1998-08-27 Tm Technologies, Inc. Process for selecting anti-sense oligonucleotides
NZ502088A (en) * 1997-07-11 2002-05-31 Brax Group Ltd Characterising nucleic acids using mass spectroscopy
CN1270598A (zh) * 1997-07-22 2000-10-18 拉普吉恩公司 用于质谱分析核酸的方法和组合物
US6444422B2 (en) 1997-07-22 2002-09-03 Qiagen Genomics, Inc. Computer method and system for correlating data
GB9718921D0 (en) * 1997-09-05 1997-11-12 Brax Genomics Ltd Catalytically generated mass labels
WO1999014362A1 (en) * 1997-09-15 1999-03-25 Brax Group Limited Characterising nucleic acid by mass spectrometry
US6607878B2 (en) * 1997-10-06 2003-08-19 Stratagene Collections of uniquely tagged molecules
GB9815163D0 (en) * 1998-07-13 1998-09-09 Brax Genomics Ltd Compounds
GB2335035B (en) 1998-03-03 2003-05-28 Brax Genomics Ltd Screening for functional antisense agents
CA2325399A1 (en) * 1998-03-23 1999-09-30 Invitrogen Corporation Modified nucleotides and methods useful for nucleic acid sequencing
EP1068216B1 (en) 1998-05-15 2003-12-10 Isis Innovation Limited Libraries of oligomers labelled with different tags
US6074831A (en) * 1998-07-09 2000-06-13 Agilent Technologies, Inc. Partitioning of polymorphic DNAs
US6270976B1 (en) * 1998-09-15 2001-08-07 Brax Group Limited Characterizing nucleic acid by mass spectrometry
US6480791B1 (en) 1998-10-28 2002-11-12 Michael P. Strathmann Parallel methods for genomic analysis
BR0013024A (pt) * 1999-08-31 2002-06-18 Qiagen Genomics Inc Comtostos enantiomiericamente enriquecidos tendo ligação( ões ) fotoclivável( is ) e métodos relacionados aos mesmos
GB0006141D0 (en) 2000-03-14 2000-05-03 Brax Group Ltd Mass labels
US6716634B1 (en) 2000-05-31 2004-04-06 Agilent Technologies, Inc. Increasing ionization efficiency in mass spectrometry
DE10036743A1 (de) * 2000-07-27 2002-02-07 Max Planck Gesellschaft Verfahren zur Bestimmung einer partiellen Nukleotidsequenz eines Nukleinsäuremoleküls
US6706162B1 (en) * 2000-09-25 2004-03-16 Applera Corporation High speed, high resolution compositions, methods, and kits for capillary electrophoresis
EP1950305A1 (en) 2001-05-09 2008-07-30 Monsanto Technology, LLC Tyr a genes and uses thereof
US6613523B2 (en) * 2001-06-29 2003-09-02 Agilent Technologies, Inc. Method of DNA sequencing using cleavable tags
EP2246438B1 (en) 2001-07-12 2019-11-27 Illumina, Inc. Multiplex nucleic acid reactions
DE60223696T2 (de) * 2001-09-14 2009-01-29 Electrophoretics Ltd., Cobham Massenmarker
EP1448800A4 (en) * 2001-11-21 2007-05-16 Applera Corp DIGITAL ASSAY
IL160869A0 (en) 2004-03-15 2004-08-31 Dnr Imaging System Ltd Integrated system for real time gel electrophoresis running and documenting
MXPA06012236A (es) 2004-04-22 2007-01-31 Talecris Biotherapeutics Inc Plasmina modificada en forma recombinante.
US20070054345A1 (en) 2004-05-19 2007-03-08 Hunter Christie L Expression quantification using mass spectrometry
US20070048752A1 (en) 2004-07-12 2007-03-01 Applera Corporation Mass tags for quantitative analyses
CA2572754A1 (en) * 2004-07-12 2006-02-16 Applera Corporation Mass tags for quantitative analyses
US20060183238A1 (en) 2005-02-09 2006-08-17 Applera Corporation Amine-containing compound analysis methods
US7396676B2 (en) 2005-05-31 2008-07-08 Agilent Technologies, Inc. Evanescent wave sensor with attached ligand
GB0515323D0 (en) 2005-07-26 2005-08-31 Electrophoretics Ltd Mass labels
GB0518585D0 (en) 2005-09-12 2005-10-19 Electrophoretics Ltd Mass labels
US7501254B2 (en) 2006-07-20 2009-03-10 Ghc Technologies, Inc. Methods and compositions for amplification and capture of nucleic acid sequences
GB0704764D0 (en) 2007-03-12 2007-04-18 Electrophoretics Ltd Isobarically labelled reagents and methods of their use
US8017403B2 (en) * 2007-06-14 2011-09-13 Quest Diagnostics Investments Incorporated Mass spectrometry method for measuring vitamin B6 in body fluid
NZ585715A (en) 2007-11-29 2011-11-25 Talecris Biotherapeutics Inc Recombinantly modified plasmin
GB0809488D0 (en) 2008-05-23 2008-07-02 Electrophoretics Ltd Mass spectrometric analysis
JP2011522538A (ja) 2008-06-04 2011-08-04 タレクリス・バイオセラピユーテイクス・インコーポレーテツド プラスミン製造のための組成物、方法およびキット
ES2552337T3 (es) 2009-03-03 2015-11-27 Grifols Therapeutics Inc. Procedimientos para la preparación de plasminógeno
PL2499165T3 (pl) 2009-11-13 2017-04-28 Grifols Therapeutics Inc. Preparaty zawierające czynnik von willenbranda (vwf) oraz sposoby, zestawy i zastosowania z nim powiązane
GB0921665D0 (en) 2009-12-10 2010-01-27 Trillion Genomics Ltd Phobes
DK2588144T3 (en) 2010-07-02 2018-07-23 Ventana Med Syst Inc Detection of targets using mass markers and mass spectrometry
CN103675303B (zh) 2010-07-23 2016-02-03 贝克曼考尔特公司 传感器系统
JP5683706B2 (ja) 2010-08-23 2015-03-11 ポステック アカデミー‐インダストリー ファウンデーション ラベリング剤とこれを用いたアミノ酸配列およびタンパク質多重定量同時分析方法
KR101207742B1 (ko) 2010-10-14 2012-12-03 포항공과대학교 산학협력단 라벨링제 및 이를 이용한 아미노산 서열 및 단백질 다중 정량 동시 분석방법
CN102140524A (zh) * 2011-03-23 2011-08-03 山东农业大学 多微卫星位点检测试剂盒及检测方法
EP2776846B1 (en) 2011-11-07 2019-08-21 Beckman Coulter, Inc. Aliquotter system and workflow
JP2014532881A (ja) 2011-11-07 2014-12-08 ベックマン コールター, インコーポレイテッド 標本輸送システムのための磁気制動
US9482684B2 (en) 2011-11-07 2016-11-01 Beckman Coulter, Inc. Centrifuge system and workflow
EP2776844B1 (en) 2011-11-07 2020-09-30 Beckman Coulter, Inc. Specimen container detection
ES2778054T3 (es) 2011-11-07 2020-08-07 Beckman Coulter Inc Sistema y método para transportar recipientes de muestras
US9446418B2 (en) 2011-11-07 2016-09-20 Beckman Coulter, Inc. Robotic arm
AU2012340501A1 (en) 2011-12-19 2013-07-11 Grifols, S.A. Compositions, methods, and kits for preparing sialylated recombinant proteins
WO2013130487A2 (en) 2012-02-29 2013-09-06 Duke University Novel oxidoreductases for enantioselective reactions
CN103849617A (zh) * 2013-12-16 2014-06-11 复旦大学 用于基因组dna永久保存的接头及方法
GB201322567D0 (en) 2013-12-19 2014-02-05 Electrophoretics Ltd Mass labels
CN103966210B (zh) * 2014-05-29 2016-06-29 江苏省农业科学院 桃ssap分子标记引物组合、分子标记组合及其在桃品种遗传多样性分析上的应用
WO2016049531A1 (en) 2014-09-26 2016-03-31 Purecircle Usa Inc. Single nucleotide polymorphism (snp) markers for stevia
US10732092B2 (en) 2015-12-22 2020-08-04 University Of Maryland, College Park Analysis of single cell mechanical phenotyping for metastatic detection
EP3394939A4 (en) 2015-12-22 2019-08-07 Canon U.S. Life Sciences, Inc. SYSTEM AND METHOD FOR MARKER-FREE CYTOMETRY BASED ON BRILLOUIN DIFFUSION
US10598594B2 (en) 2015-12-22 2020-03-24 University Of Maryland Cell classification based on mechanical signature of nucleus
WO2018170436A1 (en) 2017-03-16 2018-09-20 Jacobs Farm Del Cabo Basil with high tolerance to downy mildew
CN106905399B (zh) * 2017-03-27 2019-07-09 武汉大学 一种双链dna b-z构象相互转换的光控方法
JP7396902B2 (ja) * 2017-06-06 2023-12-12 ユニバーシティ オブ メリーランド,カレッジ パーク 転移検出のために単一細胞の機械的フェノタイピングを行う分析
CN111801350A (zh) * 2018-01-30 2020-10-20 拉什大学医学中心 用于组织和细胞的多重分析的顺序染色
EP4153564A4 (en) 2020-05-19 2024-06-19 Cybin IRL Limited DEUTERATED TRYPTAMINE DERIVATIVES AND METHODS OF USE
CN112229892B (zh) * 2020-10-22 2021-09-28 中国科学院化学研究所 一种酚醛树脂组成测试和定量分析方法及应用
CN114984032B (zh) * 2022-06-27 2023-07-07 四川大学 Dna四面体框架核酸-绿原酸复合物及其在制备治疗肝纤维化的药物中的用途
CN115337916B (zh) * 2022-07-29 2023-10-24 福建卫生职业技术学院 一种水凝胶型细胞膜半制备色谱柱及其制备方法与应用
CN117269287A (zh) * 2023-11-20 2023-12-22 中国计量科学研究院 一种喷墨进样-毛细管电泳-质谱联用装置及工作方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5118605A (en) * 1984-10-16 1992-06-02 Chiron Corporation Polynucleotide determination with selectable cleavage sites
US5346670A (en) * 1986-12-24 1994-09-13 British Technology Group U.S.A. Inc. Phthalocyanine and tetrabenztriazaporphyrin reagents
US5003059A (en) 1988-06-20 1991-03-26 Genomyx, Inc. Determining DNA sequences by mass spectrometry
GB8910880D0 (en) * 1989-05-11 1989-06-28 Amersham Int Plc Sequencing method
GB9208733D0 (en) * 1992-04-22 1992-06-10 Medical Res Council Dna sequencing method
US5565324A (en) * 1992-10-01 1996-10-15 The Trustees Of Columbia University In The City Of New York Complex combinatorial chemical libraries encoded with tags
US5547835A (en) * 1993-01-07 1996-08-20 Sequenom, Inc. DNA sequencing by mass spectrometry
GB9315847D0 (en) * 1993-07-30 1993-09-15 Isis Innovation Tag reagent and assay method
US5849542A (en) * 1993-11-17 1998-12-15 Amersham Pharmacia Biotech Uk Limited Primer extension mass spectroscopy nucleic acid sequencing method
WO1995025737A1 (en) * 1994-03-23 1995-09-28 The Penn State Research Foundation Method for identifying members of combinatorial libraries

Also Published As

Publication number Publication date
WO1997027331A2 (en) 1997-07-31
CZ218498A3 (cs) 1998-12-16
JP2008183012A (ja) 2008-08-14
KR100482917B1 (ko) 2005-11-11
NZ331044A (en) 1999-02-25
CN1212021A (zh) 1999-03-24
CA2243560A1 (en) 1997-07-31
DE69739304D1 (de) 2009-04-23
KR19990081925A (ko) 1999-11-15
ATE191750T1 (de) 2000-04-15
DE69701671D1 (de) 2000-05-18
DE69701671T3 (de) 2006-08-17
EP0868535B1 (en) 2000-04-12
JP2001501449A (ja) 2001-02-06
ES2144846T3 (es) 2000-06-16
ATE425175T1 (de) 2009-03-15
BR9707056B1 (pt) 2009-05-05
AU2247397A (en) 1997-08-20
HUP9901321A3 (en) 2001-10-29
DE69701671T2 (de) 2000-08-10
CN1163619C (zh) 2004-08-25
BR9707056A (pt) 1999-12-28
PL328271A1 (en) 1999-01-18
ES2144846T5 (es) 2006-07-16
EP0868535A2 (en) 1998-10-07
EP0868535B9 (en) 2007-05-09
WO1997027331A3 (en) 1998-04-02
GR3033733T3 (en) 2000-10-31
HUP9901321A2 (hu) 1999-07-28
AU717435B2 (en) 2000-03-23
EP0868535B2 (en) 2006-01-04

Similar Documents

Publication Publication Date Title
PT868535E (pt) Metodos e composicoes para a determinacao de sequencias de moleculas de acido nucleico
US6623928B2 (en) Methods and compositions for determining the sequence of nucleic acid molecules
CA2243546C (en) Methods and compositions for analyzing nucleic acid molecules utilizing sizing techniques
EP0850320B1 (en) Methods for detecting binding of ligand pair with enhanced sensitivity
US6815212B2 (en) Methods and compositions for enhancing sensitivity in the analysis of biological-based assays
US7052846B2 (en) Methods and compositions for analyzing nucleic acid molecules utilizing sizing techniques
JP4414086B2 (ja) 質量分析によって核酸を分析するための方法および化合物
WO1997027331A9 (en) Methods and compositions for determining the sequence of nucleic acid molecules
EP0992511B1 (en) Methods and compositions for determining the sequence of nucleic acid molecules
EP0962464A2 (en) Methods and compositions for detecting binding of ligand pair using non-fluorescent label
MXPA98005955A (en) Methods and compositions to analyze nucleic acid molecules by using classification techniques