PT840804E - Metodos e composicoes para a analise de moleculas de acidos nocleicos usando tecnicas de separacao por dimensoes - Google Patents

Metodos e composicoes para a analise de moleculas de acidos nocleicos usando tecnicas de separacao por dimensoes Download PDF

Info

Publication number
PT840804E
PT840804E PT97905603T PT97905603T PT840804E PT 840804 E PT840804 E PT 840804E PT 97905603 T PT97905603 T PT 97905603T PT 97905603 T PT97905603 T PT 97905603T PT 840804 E PT840804 E PT 840804E
Authority
PT
Portugal
Prior art keywords
group
nucleic acid
tms
labeled
acid
Prior art date
Application number
PT97905603T
Other languages
English (en)
Inventor
Jeffrey Van Ness
John C Tabone
James Jeffry Howbert
John T Mulligan
Original Assignee
Qiagen Genomics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qiagen Genomics Inc filed Critical Qiagen Genomics Inc
Publication of PT840804E publication Critical patent/PT840804E/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07BGENERAL METHODS OF ORGANIC CHEMISTRY; APPARATUS THEREFOR
    • C07B2200/00Indexing scheme relating to specific properties of organic compounds
    • C07B2200/11Compounds covalently bound to a solid support
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures

Description

DESCRIÇÃO EPÍGRAFE: MÉTODOS E COMPOSIÇÕES PARA A ANÁLISE DE MOLÉCULAS DE ÁCIDOS NUCLEICOS USANDO TÉCNICAS DE SEPARAÇÃO POR DIMENSÕES”
Campo técnico O presente invento refere-se, de modo geral, com métodos e composições para análise de moléculas de ácidos nucleicos, e mais especificamente com o uso de marcadores que podem ser utilizados numa larga variedade de ensaios biológicos quando se pretende separar moléculas de ácidos nucleicos com base nas suas dimensões.
Antecedentes do invento
As técnicas de detecção e análise de moléculas de ácidos nucleicos são das mais importantes no campo da biologia. Estas técnicas desempenham um papel, central na área da biologia molecular e a sua relevância nas restantes áreas da biologia cresce rapidamente.
Genericamente, um dos tipos de análise de reacções de ácidos nucleicos envolve a separação das moléculas de ácidos nucleicos com base na sua extensão. Por exemplo, uma técnica largamente divulgada, a reacção em cadeia por polimerase (PCR) (ver Patentes dos EUA nos. 4.683.195, 4.683.202 e 4.800.159), tornou-se uma técnica muito utilizada na identificação de sequências presentes numa amostra e na síntese de moléculas de DNA para posterior manipulação.
Brevemente, na PCR, as sequências de DNA são amplificadas por uma reacção enzimática que sintetiza novas cadeias de DNA de forma geométrica ou linear. Após a amplificação,é necessário detectar e identificar as sequências de DNA. Devido às amplificações inespecíficas, que de outra forma interfeririam na análise, ou devido à necessidade de obter produtos puros, os produtos da reacção 1 de PCR são geralmente submetidos a separação antes da detecção. A separação baseada na dimensão (i.e., extensão) dos produtos proporciona as informações de maior utilidade. O método que confere o mais elevado grau de resolução das moléculas de ácidos nucleicos é a separação electroforética. Neste método, cada reacção de PCR individual é aplicada a um gel apropriado e submetida a um potencial de voltagem. O número de amostras que é possível processar é limitado pelo número de poços no gel. Na maioria dos dispositivos de gel, podem separar-se aproximadamente de 10 a 64 amostras num só gel. Assim, o processamento de um elevado número de amostras exige um grande gasto de tempo e material.
Para que possam obter-se dados, é necessário que a separação electroforética seja acoplada a qualquer sistema de detecção. Os sistemas de detecção de ácidos nucleicos utilizam normalmente, e quase exclusivamente, um corante ou um marcador radioactivo intercalantes, e menos frequentemente um marcador não radioactivo. Os corantes intercalantes, tais como o brometo de etídio, são de simples utilização. O corante é incluído na matriz do gel durante a electroforese ou, após a electroforese, o gel é embebido numa solução que contém o corante. Em alguns casos o corante pode ser visualizado directamente, mas mais frequentemente, e no caso particular do brometo de etídio, este é excitado pela luz (i.e., UV), produzindo fluorescência. A despeito desta aparente facilidade de utilização, tais corantes apresentam algumas desvantagens dignas de nota. Em primeiro lugar, os corantes têm uma baixa sensibilidade e é necessário que esteja presente uma grande quantidade de moléculas de ácidos nucleicos para que os produtos possam ser visualizados. Em segundo lugar, os corantes são tipicamente mutagénicos ou carcinogénicos.
Uma técnica de detecção mais sensível que o uso de corantes utiliza um marcador radioactivo (ou não radioactivo). Tipicamente, é incluído um nucleótido radiomarcado ou um primer radiomarcado na .reacção de PCR. Após a separação, o marcador radioactivo é “visualizado” por autoradiografia. Se bem que esta técnica seja mais sensível, a detecção sofre de limitações inerentes à película, tais como a falha de reciprocidade e a não-linearidade. Estas limitações da película podem ser ultrapassadas através da detecção do marcador por análise imagiológica de fosforescência. No entanto, os requisitos de segurança ligados ao uso de
radiomarcadores obrigam a uma utilização aumentada dos recursos, à disponibilização de equipamento especializado e ao treino de pessoal. Por estas razões, o uso de marcadores não radioactivos tem conhecido uma popularidade crescente. Nestes sistemas, os nucleótidos contêm um marcador, tal como um fluoróforo, a biotina ou a digoxina, que pode ser detectado por um anticorpo ou por outra molécula (i.e., o outro membro de um par de ligandos), marcado com um enzima que reage com um substrato cromogénico. Alternativamente, poderão usar-se marcadores fluorescentes. Estes sistemas não levantam os problemas de segurança acima descritos, mas utilizam componentes que são frequentemente lábeis e que poderão dar origem a reacções inespecíficas, resultando num elevado efeito de fundo (i.e., baixa razão sinal-ruído). A Patente WO-A-9 504 160 apresenta um reagente marcador composto por uma porção molecular de analito, formada por dois resíduos de analito, ligada a uma porção molecular de marcador que possui um grupo repórter. É utilizada uma colecção destes reagentes para a sequenciação de ácidos nucleicos.
Jacobson et al. (G.A.T.A., Vol. 8, p.223-29, 1991), expõe o uso de um reagente marcador que compreende um marcador inorgânico. A Patente WO-A-9 528 640 apresenta um reagente marcador e um sistema de ensaio em que os grupos nucleotídicos relevantes e os grupos repórter correspondentes são adicionados a cada um dos lados de um só linker. A Patente US-A-5 324 231 apresenta um método de detecção de RFLP utilizando primers específicos marcados com marcadores não radioactivos, tais como cromóforos. O presente invento fornece novas composições e métodos que podem ser utilizados numa larga variedade de reacções de ácidos nucleicos e proporciona ainda outras vantagens relacionadas.
Sumário da Invenção
Abreviadamente, o presente invento fornece composições e métodos que podem ser utilizados numa grande variedade de reacções de pares de ligandos no âmbito das quais é pretendida a separação de moléculas de interesse, tais como moléculas de ácidos nucleicos, com base nas suas dimensões. Os exemplos 3 representativos de métodos que podem ser melhorados tendo em conta a exposição aqui apresentada incluem as técnicas de PCR, apresentação diferencial, “fingerprinting” de RNA, PCR-SSCP, ensaios de ligação de oligonucleótidos, métodos de digestão por nucleases (i.e., ensaios baseados em exonucleases e endonucleases) e “fingerprinting” por didesoxi. Os métodos aqui descritos poderão ser utilizados numa grande variedade de campos, incluindo, por exemplo, o desenvolvimento de métodos de diagnóstico de aplicação na clínica ou em investigação, a determinação de polimorfismos e o desenvolvimento de mapas genéticos.
Num dos aspectos do invento é facultado um método para a determinação da identidade de uma molécula de ácido nucleico, compreendendo os passos de: (a) produzir moléculas de ácido nucleico marcadas a partir de uma ou mais moléculas-alvo de ácido nucleico seleccionadas, sendo que um marcador é correlacionável com um fragmento de ácido nucleico em particular e é detectável por meio de espectrometria não-fluorescente ou potenciometria, (b) separar .os fragmentos marcados segundo as suas dimensões, (c) cortar e remover os marcadores dos fragmentos marcados, e (d) detectar os marcadores através de espectrometria não-fluorescente ou potenciometria, determinando deste modo a identidade das moléculas de ácido nucleico.
Segundo um aspecto derivado do invento, são fornecidos métodos para a detecção de uma molécula de ácido nucleico seleccionada, compreendendo os passos de (a) combinar sondas marcadas de ácido nucleico com moléculas-alvo de ácido nucleico, sob condições e durante o tempo suficiente para permitir a hibridização de uma sonda marcada de ácido nucleico com uma sequência-alvo complementar seleccionada de ácido nucleico, sendo que uma sonda marcada de ácido nucleico é detectável por espectrometria não fluorescente ou potenciometria, (b) alterar as dimensões das sondas marcadas hibridizadas, das sondas ou moléculas-alvo não hibridizadas ou dos híbridos de sonda:molécula-alvo, (c) separar as sondas marcadas por dimensões, (d) cortar e remover os marcadores das sondas marcadas, e (e) detectar os marcadores através de espectrometria não-fluorescente ou potenciometria, determinando deste modo a identidade da molécula de ácido nucleico seleccionada. 4 !
Segundo outros aspectos do invento, são fornecidos métodos para a genotipagem de um organismo seleccionado, compreendendo os passos de (a) produzir moléculas de ácido nucleico marcadas a partir de uma molécula-alvo seleccionada. sendo que um marcador é correlacionável com um fragmento em particular e é detectável por meio de espectrometria não-fluorescente ou potenciometria, (b) separar as moléculas marcadas pelo comprimento sequencial, (c) cortar e remover o marcador da molécula marcada, e (d) detectar o marcador através de espectrometria não-fluorescente ou potenciometria, determinando deste modo o genotipo do organismo.
Em outro aspecto, são fornecidos métodos para a genotipagem de um organismo seleccionado, compreendendo os passos de (a) combinar uma molécula marcada de ácido nucleico com uma molécula-alvo seleccionada, sob condições e durante o tempo suficiente para permitir a hibridização da molécula marcada à molécula-alvo, sendo que um marcador é correlacionável com um fragmento em particular e é detectável por espectrometria não fluorescente ou potenciometria, (b) separar os fragmentos marcados pelo comprimento sequencial, (c) cortar e remover o marcador do fragmento marcado, e (d) detectar o marcador através de espectrometria não-fluorescente ou potenciometria, determinando deste modo o genotipo do organismo.
Dentro do contexto do presente invento, deve considerar-se que a expressão 'amostras biológicas” abrange não só as amostras provenientes de organismos vivos (i.e., mamíferos, peixes, bactérias, parasitas, vírus, fungos e semelhantes) ou do meio ambiente (i.e., ar, água ou amostras sólidas), como também os materiais biológicos que podem ser produzidos artificialmente ou por síntese (p.ex., colecções de fagos, colecções de moléculas orgânicas, “pools” de clones genómicos, clones de cDNA, clones de RNA ou semelhantes). Os exemplos representativos de amostras biológicas incluem os fluidos biológicos (p.ex., sangue, sémen, liquido cefaloraquidiano, urina), células biológicas (p.ex., células pluripotentes, células B ou T, células hepáticas, fibroblastos e semelhantes) e tecidos biológicos. Finalmente, os exemplos representativos de organismos que podem ser genotipados incluem virtualmente qualquer organismo unicelular ou multicelular, tal como animais de sangue quente, mamíferos ou vertebrados (p.ex., seres humanos, chimpanzés, 5 macacos, cavalos, vacas, porcos, ovelhas, cães, gatos, ratos e ratinhos, assim como células de qualquer um destes animais), bactérias, parasitas, vírus, fungos e plantas.
No âmbito das diversas formas de realização dos métodos acima descritos, as sondas e/ou moléculas de ácidos nucleicos do presente invento poderão ser geradas através de, por exemplo, uma reacção de ligação, de corte ou de extensão (p.ex.. PCR). Segundo outros aspectos, as sondas ou moléculas de ácidos nucleicos poderão ser marcadas por primers oligonucleotídicos marcados em outro local que não a extremidade 3’ (p.ex., primers oligonucleotídicos marcados em 5’) ou terminadores didesoxinucleotídicos.
Em outras formas de realização do invento, poderão ser utilizadas em simultâneo numa dada reacção 4, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100, 200, 250, 300, 350, 400, 450 ou um número superior a 500 moléculas diferentes e marcadas com um marcador específico, em que cada marcador é único para uma molécula ou fragmento de ácido nucleico, ou sonda, seleccionados e pode ser identificado em separado.
Ainda em outras formas de realização do invento, o(s) marcador(es) pode(m) ser detectado(s) por fluorometria, espectrometria de massa, espectrometria de infravermelhos, espectrometria de ultravioleta ou amperometria potenciostática (p.ex., utilizando detectores coulométricos ou amperométricos). Os exemplos representativos de técnicas espectrométricas adequadas incluem a espectrometria de massa de tempo-de-voo, espectrometria de massa quadrupolar, espectrometria de massa de sector magnético e espectrometria de massa de sector eléctrico. As formas específicas de realização destas técnicas incluem a espectrometria de massa por captura de iões, espectrometria de massa com ionização por electrospray, espectrometria de massa com spray de iões, espectrometria de massa com ionização em líquido, espectrometria de massa com ionização a pressão atmosférica, espectrometria de massa com ionização electrónica, espectrometria de massa de ionização por bombardeamento com átomos acelerados, espectrometria de massa MALDI, espectrometria de massa de tempo-de-voo com fotoionização, espectrometria de massa com micro-sonda de laser, espectrometria de massa MALDI-TOF, espectrometria de massa APCI , espectrometria de massa com nanospray, espectrometria de massa com ionização em spray nebulizado, espectrometria de massa com ionização química, espectrometria de massa com ionização por ressonância, espectrometria de massa com ionização secundária e espectrometria de massa com termospray.
No contexto de outras formas de realização do invento, as moléculas-alvo, as sondas marcadas hibridizadas, as sondas ou moléculas-alvo não hibridizadas, os híbridos de sonda:molécula-alvo ou as moléculas ou sondas de ácidos nucleicos marcadas poderão ser separadas de outras moléculas utilizando métodos que discriminam as dimensões das moléculas (tanto em dimensões lineares como tridimensionais). Os exemplos representativos de tais métodos incluem a electroforese em gel, electroforese capilar, electroforese em microcanais, HPLC, cromatografia de exclusão por dimensão, filtração, electroforese em gel de poliacrilamida, cromatografia líquida, cromatografia reversa de exclusão por dimensão, cromatografia de troca iónica, cromatografia líquida de fase reversa, electroforese em campo pulsado, electroforese de inversão de campo, diálise e separação de gotículas líquidas activadas por fluorescência. Alternativamente, as moléculas-alvo, as sondas marcadas hibridizadas, as sondas ou moléculas-alvo não hibridizadas. os híbridos de sonda:molécula-alvo ou as moléculas ou sondas de ácidos nucleicos marcadas poderão ser ligados a um suporte sólido [p.ex., fibras ocas (Amicon Corporation, Danvers, Mass.), esferas (Polysciences, Warrington, Pa.), esferas magnéticas (Robbin Scientific, Mountain View, Calif.), suportes, placas e matrazes (Corning Glass Works, Corning, N.Y.), crivos (Becton Dickinson. Mountain View, Calif.), écrans e fibras sólidas (ver Edelman et al., Patente dos E.U.A. n° 3.843.324; ver também Kuroda et al., Patente dos E.U.A. n° 4.416.777), membranas (Millipore Corp., Bedford, Mass.) e tiras]. Se o primeiro ou o segundo membros, ou os ácidos nucleicos expostos, forem ligados a um suporte sólido, em certas formas de realização do invento os métodos aqui apresentados poderão ainda compreender o passo de lavagem para retirar o material não ligado do suporte sólido.
Em outras formas de realização, os primeiros membros marcados poderão ser removidos por métodos químicos, de oxidação, redução, labilidade a ácidos, labilidade a bases, enzimáticos, electroquímicos, térmicos e de fotolabilidade. Ainda em outras formas de realização, os passos de separação, remoção e detecção poderão ser realizados de modo contínuo, por exemplo, num só dispositivo que poderá ser automatizado.
No âmbito de certas formas de realização do invento, a dimensão das sondas hibridizadas marcadas, das sondas ou moléculas-alvo não hibridizadas ou dos híbridos de sonda:molécula-alvo é alterada através de um método seleccionado a partir do grupo que abrange a extensão por polimerase, ligação, digestão por exonuclease, digestão por endonuclease, digestão por enzimas de restrição, digestão por recombinase específica de local, ligação, digestão por nuclease específica de locais de emparelhamento incorrecto, digestão por nuclease específica para a metilação, ligação covalente da sonda à molécula-alvo e hibridização.
Os métodos e composições aqui descritos poderão ser utilizados numa grande variedade de aplicações, incluindo, por exemplo, a identificação de amplicons resultantes de PCR, “fingerprinting” de RNA, apresentação diferencial, detecção de polimorfismos em configurações de cadeia simples, “fingerprinting” por didesoxi, mapas de restrição e polimorfismos de extensão dos fragmentos de restrição, “fingerprinting” de DNA, genotipagem, detecção de mutações, ensaio de ligação de oligonucleótidos, amplificações específicas de sequência, em diagnóstico, na área forense, em identificação, biologia de desenvolvimento, biologia, medicina molecular, toxicologia e apuramento de raças em animais.
Estes e outros aspectos do presente invento tornar-se-ão evidentes por consulta da descrição detalhada que se segue e das figuras em anexo. Adicionalmente, são aqui apresentadas várias referências que descrevem em maior detalhe certos procedimentos ou composições (p.ex., plasmídeos, etc.), e que são, deste modo. incorporadas integralmente para fins de referência.
Breve descrição das figuras A Figura 1 representa o diagrama de síntese de ésteres de pentafluorofenilo de marcadores para espectrometria de massa removíveis por via química, libertando-se marcadores com terminações de amida carboxílica. A Figura 2 representa o diagrama de síntese de ésteres de pentafluorofenilo de marcadores para espectrometria de massa removíveis por via química, libertando-se marcadores com terminações de ácido carboxílico. 8
As Figuras 3-6 e 8 representam os diagramas de síntese de ésteres de tetrafluorofenilo de um conjunto de 36 marcadores para espectrometria de massa removíveis por via fotoquímica. A Figura 7 representa o diagrama de síntese de um conjunto de 36 marcadores para espectrometria de massa cujas moléculas possuem uma terminação de amina e são removíveis por via fotoquímica. A Figura 9 representa a síntese de 36 oligonucleótidos marcados com marcadores para espectrometria de massa removíveis por via fotoquímica, produzidos a partir do conjunto correspondente de 36 ésteres de tetrafluorofenilo de marcadores ácidos para espectrometria de massa removíveis por via fotoquímica. A Figura 10 representa a síntese de 36 oligonucleótidos marcados com marcadores para espectrometria de massa removíveis por via fotoquímica, produzidos a partir do conjunto correspondente de 36 marcadores para espectrometria de massa com uma terminação amina e removíveis por via fotoquímica. A Figura 11 ilustra a detecção em simultâneo de múltiplos marcadores através de espectrometria de massa. A Figura 12 apresenta o espectrograma de massa da matriz alfa-ciano isolada. A Figura 13 representa um fragmento de ácido nucleico marcado construído de forma modular.
Descrição detalhada do invento
Tal como assinalado acima, o presente invento fornece composições e métodos para a análise de moléculas de ácidos nucleicos, sendo que a separação das moléculas de ácidos nucleicos é feita com base nas suas dimensões. Estes métodos permitem a detecção em simultâneo de moléculas de interesse, as quais incluem ácidos nucleicos e fragmentos, proteínas, péptidos, etc.
Resumidamente, o presente invento fornece métodos que compreendem o uso de compostos nos quais a molécula de interesse, ou um seu precursor, se 9 encontra ligada por meio de uma ligação lábil (ou ligações lábeis) a um marcador, Assim, poderá definir-se para os compostos do invento a seguinte fórmula geral:
T-L-X em que o T corresponde ao componente marcador, L é o componente de linker, o qual tanto poderá conter uma ligação lábil como corresponder à própria ligação, e X poderá ser tanto o componente da molécula de interesse (MOI) como um componente de grupo funcional (U) através do qual a MOI se pode ligar aos componentes T-L. Deste modo, os compostos do invento poderão ser representados através das fórmulas gerais mais específicas: T-L-MOI e T-L-Lh
Por razões que são abaixo descritas em detalhe, os conjuntos de compostos T-L-MOI poderão ser propositadamente submetidos a condições que causem a quebra da(s) ligação(ões) lábil(eis), libertando-se deste modo uma porção molecular de marcador a partir da restante porção molecular do composto. A porção molecular de marcador é então caracterizada através de uma ou mais técnicas analíticas de modo a se obterem informações directas sobre a estrutura da porção molecular de marcador, e (o que é mais importante) informações indirectas sobre a identidade da MOI correspondente. A título de simples exemplo ilustrativo de um composto representativo em que L corresponde a uma ligação directa, é feita referência à seguinte estrutura (i):
O
.^(Fragmento de Acido s . Nucleico)
Estrutura (i)
Componente de Linker (L):
.......— -y—:-' ---y_'
Componente-Marcador Componénte da Molécula de Interesse 10
Na estrutura (i), T é uma molécula aromática policíclica contendo azoto que se encontra ligada a um grupo carbonilo, X é uma MOI (e especificamente um fragmento de ácido nucleico que termina num grupo amina) e L é a ligação que forma um grupo amida. A ligação amida é lábil relativamente às ligações presentes em T, uma vez que, tal como é conhecido da técnica, uma ligação amida pode ser quimicamente quebrada em condições básicas ou acídicas que deixam inalteradas as ligações no interior do componente marcador. Assim, poderá libertar-se uma porção molecular de marcador (i.e., o produto da reacção de quebra de ligações que contém T), tal corno abaixo exposto:
Estrutura (i)
O II Λ
^(Fragmento de Y Acido Nucleico) H Ácido ou base
No entanto, o linker L poderá constituir mais do que uma ligação directa, tal como mostra o exemplo seguinte, em que é feita referência a outro composto representativo que possui a estrutura (ii) abaixo apresentada:
11 É bem sabido que os compostos que possuem um grupo o/to-benzilamina (ver átomos contidos no quadrado no interior da estrutura (ii)) são fotoliticamente instáveis, já que a exposição de tais compostos a radiação actínica com um comprimento de onda específico causará o corte selectivo da ligação benzilamina (ver a ligação assinalada com uma linha mais carregada na estrutura (ii)). Assim, a estrutura (ii) possui os mesmos grupos T e MOI que a estrutura (i), mas o grupo de linker contém múltiplos átomos e ligações no interior dos quais existe uma ligação particularmente lábil. A fotólise da estrutura (ii) liberta, deste modo, uma porção molecular de marcador (porção molecular oue contém T) da porção restante do composto, tal como mostrado abaixo.
Estrutura (ii)
O
NO-,
(Fragmento de Acido Nucleico)
O
‘NH, Porção Molecular de Marcador
(Fragmento de Acido Nucleico) H
Porção Restante dô Composto
Deste modo, o invento proporciona métodos que compreendem o uso de compostos que, por exposição a condições apropriadas à quebra de ligações, sofrem reacções de quebra de ligações que libertam uma porção molecular de marcador da porção restante do composto. Os compostos do invento podem ser descritos em termos da porção molecular de marcador, da MOI (ou do seu precursor, Lh) e da(s) ligação(ões) Jáb l(eis) que unem os dois grupos. Alternativamente, os compostos do invento podem ser descritos em termos dos 12
componentes a partir dos quais são formados. Assim, os compostos podem ser descritos como o produto de reacção de um reagente de marcador, de um reagente de linker e de um reagente de MOI, tal como se segue. O reagente de marcador é constituído por uma "âncora” química (Th) e um componente variável (Tvc), de tal modo que é atribuída ao reagente de marcador a seguinte estrutura geral:
Tvc-Th
Para ilustrar esta nomenclatura, é feita referência à estrutura (iii), que apresenta um reagente de marcador que poderá ser usado para preparar o composto com a estrutura (ii). O reagente de marcador que possui a estrutura (iii) contém um componente variável do marcador e uma âncora do marcador, tal como apresentado abaixo:
Estrutura (iii) t,1'
O
Componente Ancora do Varia'vel do Marcador Marcador
Na estrutura (iii), a âncora do marcador (-C(=0)-A) proporciona simplesmente uma via de reacção do reagente de marcador com o reagente de linker, de modo a formar uma porção molecular T-L. O grupo "A" na estrutura (iii) indica que o grupo, cárboxilo se encontra num estado quimicamente activo, pelo que se encontra pronto pâra se ligar a outras âncoras. "A” poderá corresponder, por exemplo, a um grupo hidroxilo ou a um grupo pentafluorofenoxi, entre muitas outras possibilidades. Existe um grande número de possibilidades para as âncoras de marcador que poderão ligar-se a um componente variável de marcador, tal como se expõe abaixo em detalhe. O componente variável de marcador constitui, assim, uma parte de "Ή na fórmula T-L-X, e fará igualmente parte da porção molecular de marcador que se forma a partir da reacção que quebra L. 13
Tal como se expõe igualmente em detalhe abaixo, o componente variável de marcador é assim denominado porque, na preparação de conjuntos de compostos que serão, usados nos métodos do invento, é desejável que os membros de um conjunto possuam componentes variáveis individualizados, de modo a que os membros individuais possam ser distinguidos entre si através de uma técnica analítica. Como exemplo, o componente variável do marcador na estrutura (iii) poderá corresponder á um membro do conjunto que se segue, sendo que os membros do conjunto podem diferenciar-se através do seu espectro em UV ou do espectro de massa:
Do mesmo modo, o reagente de linker pode ser descrito em termos das suas âncoras químicas (são necessárias pelo menos duas, cada uma das quais se pode designar por Lu), as quais flanqueiam um componente lábil do linker, sendo que o componente lábil do linker consiste na porção lábil requerida (L2) e em porções lábeis opcionais (L1 e L3), que as porções lábeis opcionais servem para separar L2 das âncoras Lh. e que a porção lábil requerida se destina a proporcionar uma ligação lábil no seio do componente lábil do linker. Assim, poderá considerar-se que o reagente de linker possui a fórmula geral de:
Lh -L1-L2- L3- Lh A nomenclatura usada para descrever o reagente de linker pode ser ilustrada em função da estrutura (iv), a qual se baseia de novo no composto com a estrutura
Estrutura (iv) Âncora do linker
Âncora do linker 14 (ii):
I
Tal como ilustra a estrutura (iv), os átomos poderão possuir mais do que um papel funcional. Assim, na estrutura (iv), o azoto do grupo benzilo' funciona como âncora química ao possibilitar a ligação entre o reagente de linker e o reagente de marcador através de uma reacção em que se forma uma amida, e posteriormente funciona também como uma parte necessária da estrutura da porção lábil L2, uma vez que a ligação carbono-azoto do grupo benzilo é particularmente susceptível ao corte fotolítico. A estrutura (iv) ilustra igualmente o facto de que um reagente de linker poderá possuir um grupo L3 (neste caso, um grupo metileno) ainda que não possua um grupo L1. Do mesmo modo, os reagentes de linker poderão possuir um grupo L1 e não um grupo L3, ou poderão ter grupos L1 e L3, ou poderão ainda não possuir grupos L1 nem L3. Na estrutura (iv), a presença do grupo “P" junto ao grupo carbonilo indica que o grupo carbonilo se encontra protegido da reacção. Dada esta configuração, o grupo carboxilo activado do reagente de marcador (iii) poderá facilmente reagir com o grupo amina do reagente de linker (iv) para formar uma ligação amida e originar um composto com a fórmula T-L-U. O reagente de MOI corresponde a uma forma adequadamente reactiva de uma molécula de interesse. No caso de a molécula de interesse ser um fragmento de ácido nucleico, um reagente de MOI adequado será um fragmento de ácido nucleico ligado através do seu grupo 5’ hidroxilo a um grupo fosfodiéster e em seguida a uma cadeia de alquileno que termina num grupo amino. Este grupo amíno poderá então reagir com o grupo carbonilo da estrutura (iv) (após, como é evidente, se ter procedido à desprotecção do grupo carbonilo, e de preferência após activar o grupo carbonilo para a reacção com o grupo amina), para, deste modo, se reunir a MOI ao linker.
Quando examinada por ordem cronológica, a preparação dos compostos do invento requer um reagente de marcador (possuindo uma âncora química do marcador e um componente variável do marcador), um reagente de linker (possuindo duas âncoras químicas do linker, uma porção lábil requerida e de 0 a 2 porções lábeis opcionais) e um reagente de MOI (possuindo um componente de molécula de interesse e uma âncora química da molécula de interesse) para formar a molécula T-L-MOI. Deste modo, para formar T-L-MOI, tanto se poderá fazer reagir inicialmente o reagente de marcador com o reagente de linker para formar T-L-Lh e 15 de seguida fazer reagir o reagente de MOI com a molécula T-L-Lh para formar T-L-MOI, como (com menor grau de preferência) fazer reagir inicialmente o reagente de linker e o reagente de MOI para originar a molécula Lh-L-MOI e de seguida promover a reacção de Lh-L-MOI com o reagente marcador para formar T-L-MOI. Por uma questão de conveniência, os compostos que possuam a fórmula T-L-MOI serão descritos em termos do reagente de marcador, do reagente de linker e do reagente de MOI que tenham sido utilizados na formação destes compostos. Evidentemente, os mesmos compostos com a fórmula T-L-MOI poderão ser preparados por meio de outros métodos (tipicamente, mais laboriosos), mantendo-se assim mesmo no âmbito dos compostos T-L-MOI do invento.
Em qualquer dos casos, o invento prevê que um composto T-L-MOI seja submetido a condições de quebra de ligações, de modo a que uma porção molecular de marcador se liberte da porção restante do composto. A porção molecular de marcador compreenderá pelo menos o componente variável do marcador, e tipicamente incluirá ainda alguns ou todos os átomos da âncora do marcador, alguns ou todos os átomos da âncora do linker que foi utilizada para reunir o reagente de marcador ao reagente de linker, a porção lábil opcional L1 se este grupo estiver presente em T-L-MOI, e poderá também conter uma parte da porção lábil requerida L2 , dependendo da própria estrutura de L2 e da natureza da reacção química de quebra de ligações. Por uma questão de conveniência, a porção molecular de marcador poderá ser referida como a porção molecular contendo T, uma vez que T constituirá tipicamente a porção principal (em termos de massa) da porção molecular de marcador.
Após esta introdução a um dos aspectos do presente invento, os vários componentes T, L e X serão descritos em detalhe. Esta descrição inicia-se com as definições de certos termos que serão doravante utilizados para descrever T, L e X.
Tal como aqui é usado, o termo “fragmento de ácido nucleico" designa uma molécula que é complementar a uma molécula-alvo de ácido nucleico seleccionada (i.e., complementar a toda a molécula ou a uma porção desta), e que pode derivar da natureza ou ser produzida por via sintética ou recombinante. incluindo moléculas que não ocorrem na natureza, e que poderão encontrar-se sob a forma de cadeia simples ou dupla, segundo apropriado; o termo inclui um oligonucleótido (DNA ou RNA), um primer, uma sonda, um análogo de ácido nucleico (p.ex., PNA), um oligonucleótido que sofre uma extensão na direcção 5’ para 3’ por acção de uma polimerase, um ácido nucleico que é cortado quimicamente ou enzimaticamente, um ácido nucleico que é terminado por um terminador didesoxi ou recebe na extremidade 3’ ou 5’ uma cauda de um composto que impede a polimerização a nível da extremidade 5’ ou 3’, e combinações destes elementos. A complementaridade de um fragmento de ácido nucleico para uma molécula-alvo de ácido nucleico seleccionada significa geralmente que o emparelhamento específico de bases corresponde no mínimo a 70% ao longo de toda a extensão do fragmento. De preferência, o fragmento de ácido nucleico exibe um emparelhamento específico de bases de pelo menos 80%; e mais preferencialmente de pelo menos cerca de 90%. Os ensaios destinados a determinar a percentagem de não emparelhamento (e, deste modo, a percentagem de emparelhamento específico de bases) são bem conhecidos da técnica e baseiam-se na percentagem de não emparelhamento como função do Tm por comparação com o controlo que possui um emparelhamento total de bases.
Tal como aqui é usado, o termo “alquilo", aplicado isoladamente ou em combinação, refere-se a um radical de hidrocarboneto saturado de cadeia linear ou ramificada contendo de entre 1 a 10, de preferência de 1 a 6. e mais preferencialmente de 1 a 4 átomos de carbono. Os exemplos de tais radicais incluem, de modo não limitativo, os radicais metilo, etilo, n-propilo, iso-propilo, n-butilo, iso-butilo, sec-butilo, tert-butílo, pentilo, iso-amilo, hexilo, decilo e semelhantes. O termo “alquileno” refere-se a um di-radical de hidrocarboneto saturado de cadeia linear ou ramificada contendo de entre 1 a 10, de preferência de 1 a 6, e mais preferencialmente de 1 a 4 átomos de carbono. Os exemplos de tais di-radicais incluem, de modo não limitativo, os di-radicais metileno, etileno (-CH2-CH2-), propileno e semelhantes. O termo “alquenilo", aplicado isoladamente ou em combinação, refere-se a um radical de hidrocarboneto de cadeia linear ou ramificada que possui pelo menos uma ligação dupla carbono-carbono num total de 2 a 10, de preferência de 2 a 6, e mais preferencialmente de 2 a 4 átomos de carbono. Os exemplos de tais radicais incluem, de forma não limitativa, os radicais etenilo, E- e Z-propenilo, isopropenilo, 17 E- e Z-butenilo, E- e Z-isobutenilo, E- e Z-pentenilo, decenilo e semelhantes. O termo “alquenileno” refere-se a um di-radical de hidrocarboneto de cadeia linear ou ramificada que possui pelo menos uma ligação dupla carbono-carbono num total de 2 a 10, de preferência de 2 a 6, e mais preferencialmente de 2 a 4 átomos de carbono. Os exemplos de tais di-radicais incluem, de modo não limitativo, os di-radicais metilideno (=CH2), etilideno (-CH=CH-), propilideno (-CH2-CH=CH-) e semelhantes. O termo “alquinilo”, utilizado isoladamente ou em combinação, refere-se a um radical de hidrocarboneto de cadeia linear ou ramificada que possui pelo menos uma ligação tripla carbono-carbono num total de 2 a 10, de preferência de 2 a 6, e mais preferencialmente de 2 a 4 átomos de carbono. Os exemplos de tais radicais incluem, de modo não limitativo, os radicais etinilo (acetilenilo), propinilo (propargilo), butinilo, hexinilo, decinilo e semelhantes. O termo “alquinileno”, usado isoladamente ou em combinação, refere-se a um di-radical de hidrocarboneto de cadeia linear ou ramificada que possui pelo menos uma ligação tripla carbono-carbono num total de 2 a 10, de preferência de 2 a 6, e mais preferencialmente de 2 a 4 átomos de carbono. Os exemplos de tais di-radicais incluem, de modo não limitativo, os di-radicais etinileno (-C^C-), propinileno (-CH2-C=C-) e semelhantes. O termo “cicloalquilo”, usado isoladamente ou em combinação; refere-se a um arranjo saturado e cíclico de átomos de carbono compreendendo de entre 3 a 8, e preferencialmente de 3 a 6, átomos de carbono. Os exemplos de tais radicais cicloalquílicos incluem, de forma não limitativa, os radicais ciclopropilo, ciclobutilo, ciclopentilo, ciclohexilo e semelhantes. O termo “cicloalquileno" refere-se a uma forma di-radical de um cicloalquilo. O termo “cicloalquenilo”, aplicado isoladamente ou em combinação, refere-se a um radical cíclico de carbono contendo de entre 4 a 8, e preferencialmente 5 ou 6, átomos de carbono e uma ou mais ligações duplas. Os exemplos de tais radicais cicloalquenílicos incluem, de forma não limitativa, os radicais ciclopentenilo, ciclohexenilo, ciclopentadienilo e semelhantes. O termo “cicloalquenileno” refere-se a uma forma di-radical de um cicloalquenilo. O termo “arilo” refere-se a um grupo carbociclico (consistindo inteiramente em carbono e hidrogénio) aromático, seleccionado a partir do grupo'formado pelos 18 radicais fenilo, naftilo, indenilo, indanilo, azulenilo, fluorenilo e antracenilo; ou a um grupo heterocíclico aromático seleccionado a partir do grupo formado pelos radicais furilo, tienilo, piridilo, pirrolilo, oxazolilo, tiazolilo, imidazolilo, pirazolilo, 2-pirazolinilo, pirazolidinilo, isoxazolilo, isotiazolilo, 1,2,3-oxadiazolilo, 1,2,3-triazolilo, 1,3,4-tiodiazolilo, piridazinilo, pirimidinilo, pirazinilo, 1,3,5-triazinilo, 1,3,5-tritianilo, indolizinilo, indolilo, isoindolilo, 3H-indolilo, indolinilo, benzo[b]furanilo, 2,3-dihidrobenzofuranilo, benzo[b]tiofenilo, 1H-indazolilo, benzimidazolilo, benztiazolilo, purinilo, 4H-quinolizinilo, quinolinilo, isoquinolinilo, cinolinilo, ftalazinilo, quinazolinilo, quinoxali nilo, 1,8-naftiridinilo, pteridinilo, carbazolilo, acridinilo, fenazinilo, fenotiazinilo e fenoxazinilo.
Os grupos “arilo”, tal como definido neste pedido de patente, poderão conter independentemente de um a quatro substituintes que são seleccionados independentemente a partir do grupo formado por hidrogénio, halogénio, hidroxilo, amino, nitro, trifluorometil, trifluorometoxi, alquilo, alquenilo, alquinilo, ciano, carboxi, carboalcoxi, 1,2-d ioxietileno, alcoxi, alquenoxi ou alquinoxi, alquilamino, alquenilamino, alquinilamino, acilo aromático ou alifático, alcoxi-carbonilamino, alquilsulfonilamino, morfolinocarbonilamino, tiomorfolinocarbonilamino, N-alquilguanidino, aralquilaminosulfonilo; aralcoxialquilo; N-aralcoxiureia; N-hidroxilureia; N-alquenilureia; N,N-(alquil,hidroxil)ureia; heterociclilo; arilo tioariloxi-substituído; N,N-(aril,alquil)hidrazino; sulfonilheterociclilo Ar’-substituído; heterociclilo aralquil-substituído; heterociclilo cicloalquilo-substituído e cicloalquenilo-substituído; arilo cicloalquil-fundido; alquilo ariloxi-substituído; heterociclilamino; acilaminocarbonilo alifático ou aromático; alquenilo alifático ou aromático acil-substituído; aminocarboniloxi Ar’-substituído; arilo Ar’,Ar’-disubstituído; acilo alifático ou aromático acil-substituído; cicíoalquilcarbonilalquilo; amino cicloalquil-substituído; ariloxicarbonilalquilo; ácido ou éster fosforodiamidílico. “Ar" é um grupo arilo carbocíclico ou heterocíclico tal como definido acima, possuindo de um a três substituintes seleccionados a partir do grupo constituído por hidrogénio, halogénio, hidroxilo, amino, nitro, trifluorometilo, trifluorometoxi, alquilo, alquenilo, alquinilo, 1,2-dioximetileno, 1,2-dioxietileno, alcoxi, alquenoxi, alquinoxi, alquilamino, alquenilamino ou alquinilamino, alquilcarboniloxi, acilo alifático ou 19 aromático, alquilcarbonilamino, alcoxicarbonilamino, alquilsulfonilamino, N-alquil-ureia ou Ν,Ν-dialquilureia. O termo “alcoxi", usado isoladamente ou em combinação, refere-se a um radical de éter alquílico, tendo o termo “alquilo” sido já acima definido. Os exemplos de radicais de éter alquílico adequados incluem, de modo não limitativo, os radicais metoxi, etoxi, n-propoxi, iso-propoxi, n-butoxi, iso-butoxi, sec-butoxi, tert-butoxi e semelhantes. O termo “alquenoxi", utilizado isoladamente ou em combinação, refere-se a um radical com a fórmula alquenil-O, em que o termo “alquenilo” corresponde à definição acima, com a ressalva de que o radical não corresponda a um éter de enol. Os exemplos de radicais alquenoxi adequados incluem, de modo não limitativo, os radicais aliloxi, E- e Z-3-metil-2-propenoxi e semelhantes. O termo “alquiniloxi”, utilizado isoladamente ou em combinação, refere-se a um radical com a fórmula alquinil-O, em que o termo “alquinilo” corresponde à definição acima, com a ressalva de que o radical não corresponda a um éter de inol. Os exemplos de radicais alquinoxi adequados incluem, de modo não limitativo, os radicais propargiloxi, 2-butiniloxi e semelhantes. O termo “tioalcoxi” refere-se a um radical de tioéter com a fórmula alquil-S-, em que o alquilo corresponde à definição acima apresentada. O termo “alquilamino”, usado isoladamente ou em combinação, refere-se a um radical amino mono- ou di-alquilsubstituído (i.e., um radical com a fórmula alquil-NH- ou (alquil)2-N-), em que o termo “alquilo” corresponde à definição acima. Os exemplos de radicais alquilamino adequados incluem, de modo não limitativo, os radicais metilamino, etilamino, propilamino, isopropilamino. t-butilamino, N,N-dietilamino e semelhantes. O termo “alquenilamino”, aplicado isoladamente ou em combinação, refere-se a um radical com a fórmula alquenil-NH- ou (alquenilhN-, em que o termo “alquenilo” corresponde à definição acima, com a ressalva de que o radical não corresponda a uma enamina. Um exemplo de tais radicais alquenilamino é dado pelo radical alilamino. O termo “alquilinamino”, usado isoladamente ou em combinação, refere-se a um radical com a fórmula alquinil-NH- ou (alquinil^N-, em que o termo “alquinilo” 20 corresponde à definição acima, com a ressalva de que o radical não corresponda a uma inamina. Um exemplo de tais radicais alquinilamino é dado pelo radical propargilamino. O termo “amida” refere-se a radicais -N(R’)-C(=0)- ou -C(=0)-N(R’)-, em que R' é aqui definido como incluindo hidrogénio, assim como outros grupos. O termo "amida substituída” refere-se à situação em que R’ não é o hidrogénio, enquanto que o termo ‘amida não substituída” se refere à situação em que R’éo hidrogénio. O termo “ariloxi”, usado isoladamente ou em combinação, refere-se a um radical de fórmula aril-O, em que o aril corresponde à definição acima. Os exemplos de radicais ariloxi adequados incluem, de modo não limitativo, os radicais fenoxi, naftoxi, piridiloxi e semelhantes. O termo “arilamino”, aplicado isoladamente ou em combinação, refere-se a um radical com a fórmula aril-NH-, em que o grupo arilo corresponde à definição acima. Os exemplos de radicais arilamino adequados incluem, de modo não limitativo, os radicais fenilamino (anilido), naftilamino, 2-, 3- e 4-piridilamino e semelhantes. O termo “cicloalquilo aril-fundido”, usado isoladamente ou em combinação, refere-se a um radical cicloalquilo que partilha dois átomos adjacentes com um radical arilo, sendo que os termos “cicloalquilo” e “arilo” correspondem às definições acima apresentadas. Um exemplo de um radical cicloalquilo aril-fundido é dado pelo radical ciclobutilo benzofundido. O termo “alquilcarbonilamino”, usado isoladamente ou em combinação, refere-se a um radical com a fórmula alquil-CONH, em que o termo “alquilo” corresponde à definição acima exposta. O termo “alcoxicarbonilamino”, usado isoladamente ou em combinação, refere-se a um radical com a fórmula alquil-OCONH-, em que o termo “alquilo” corresponde à definição acima exposta. O termo “alquilsulfonilamino”, usado isoladamente ou em combinação, refere-se a um radical com a fórmula alquil-SC^NH-, em que o termo “alquilo” corresponde à definição acima exposta. 21
O termo “arilsulfonilamino”, usado isoladamente ou em combinação, refere-se a um radical com a fórmula aril-S02NH-, em que o termo “arilo” corresponde à definição acima exposta. O termo “N-alquilureia”, usado isoladamente ou em combinação, refere-se a um radical com a fórmula alquil-NH-CO-NH-, em que o termo “alquilo" corresponde à definição acima exposta. O termo “N-arilureia”, usado isoladamente ou em combinação, refere-se a um radical com a fórmula aril-NH-CO-NH-, em que o termo “arilo” corresponde à definição acima exposta. O termo “halogénio” designa os radicais fluoreto, cloreto, brometo e iodeto. O termo “radical de hidrocarboneto” refere-se a um arranjo de átomos de carbono e hidrogénio que necessita apenas de um átomo de hidrogénio para se tornar numa molécula estável independente. Assim, um radical de hidrocarboneto possui um local de valência aberta sobre um átomo de carbono, através do qual o radical de hidrocarboneto se pode ligar a outro(s) átomo(s). Os radicais alquilo, alquenilo, cicloalquilo, etc., constituem exemplos de radicais de hidrocarboneto. O termo “di-radical de hidrocarboneto” refere-se a um arranjo de átomos de carbono e hidrogénio que necessita de dois átomos de hidrogénio para se tornar numa molécula estável independente. Assim, um di-radical de hidrocarboneto possui dois locais de valência aberta sobre um ou dois átomos de carbono, através do qual o di-radical de hidrocarboneto se pode ligar a outro(s) átomo(s). Os radicais alquileno, alquenileno, alquinileno, cicloalquileno, etc., constituem exemplos de di-radicais de hidrocarboneto. O termo “hidrocarbilo” refere-se a qualquer arranjo estável constituído inteiramente por carbono e hidrogénio e com um só local de valência através do qual se liga a outra porção molecular, incluindo, desta forma, radicais conhecidos como alquilo, alquenilo, alquinilo, cicloalquilo, cicloalquenilo, arilo (sem incorporação de heteroátomos no anel de arilo), arilalquilo, alquilarilo e semelhantes. “Radical de hidrocarboneto” constitui outro nome para hidrocarbilo. O termo “hidrocarbileno” refere-se a qualquer arranjo estável constituído inteiramente por carbono e hidrogénio e com dois locais de valência através do qual se liga a outras porções moleculares, incluindo, desta forma, os radicais alquileno, 22
alquenileno, alquinileno, cicloalquileno, cicloalquenileno, arileno (sem incorporação de heteroátomos no anel de arileno), arilalquileno, alquilarileno e semelhantes. “Di-radical de hidrocarboneto” constitui outro nome para hidrocarbileno. O termo “hidrocarbil-O-hidrocarbileno” refere-se a um grupo hidrocarbilo ligado a um átomo de oxigénio, em que o átomo de oxigénio se encontra igualmente ligado a um grupo hidrocarbileno a nível de um dos dois locais de valência através dos quais o grupo hidrocarbileno se liga a outras porções moleculares. Os termos “hidrocarbil-S-hidrocarbileno”, “hidrocarbil-NH-hidrocarbileno” e “hidrocarbil-amida-hidrocarbileno" têm significados equivalentes, sendo o oxigénio substituído por enxofre, -NH- ou um grupo amida, respectivamente. O termo N-(hidrocarbil)hidrocarbileno refere-se a um grupo hidrocarbileno em que um dos dois locais de valência se encontra ligado a um átomo de azoto, estando este átomo de azoto simultaneamente ligado a um hidrogénio e a um grupo hidrocarbilo. O termo N,N-di(hidrocarbil)hidrocarbileno refere-se a um grupo de hidrocarbileno em que um dos dois locais de valência se encontra ligado a um átomo de azoto, estando este átomo de azoto simultaneamente ligado a dois grupos hidrocarbilo. O termo “hidrocarbilacil-hidrocarbileno” refere-se a um grupo hidrocarbilo ligado através de um grupo acilo (-C(=0)-) a um de dois locais de valência de um grupo hidrocarbileno.
Os termos “heterociclilhidrocarbilo” e “heterociclilo” referem-se a um arranjo cíclico estável de átomos que inclui átomos de carbono e até quatro átomos (designados por heteroátomos) de oxigénio, azoto, fósforo ou enxofre. O arranjo cíclico poderá encontrar-se sob a forma de um anel monocíclico de 3-7 átomos, ou de um anel bicíclico de 8-11 átomos. Os anéis poderão ser saturados ou insaturados (incluindo anéis aromáticos), e opcionalmente poderão ser benzofundidos. Os átomos de azoto e enxofre presentes no anel poderão encontrar-se sob qualquer forma oxidada, incluindo a forma quaternária do azoto. Poderá existir uma ligação entre um heterociclilhidrocarbilo e qualquer carbono, ou heteroátomo. endocíclico que resulte na criação de uma estrutura estável. Os heterociclilhidrocarbilos preferidos incluem heterociclos monocíclicos de 5-7 membros contendo um ou dois heteroátomos de azoto. 23 O termo “heterociclilhidrocarbilo substituído” refere-se a um heterociclilhidrocarbilo tal como acima definido, em que pelo menos um átomo do anel se encontra ligado a um substituinte indicado que se prolonga para fora do anel.
Em referência a grupos hidrocarbilo e hidrocarbileno, o termo “derivados de qualquer das moléculas seguintes em que ocorre a substituição de um ou mais hidrogénios por igual número de átomos de flúor” refere-se a moléculas que contêm átomos de carbono, hidrogénio e flúor mas não contêm nenhum outro átomo. O termo “éster activado” designa um éster contendo um “grupo de partida” que é facilmente deslocado por um nucleófilo, tal como uma amina, um álcool ou um tiol. Tais grupos de partida são bem conhecidos e incluem, de modo não limitativo, N-hidroxisuccinimida, N-hidroxibenzotriazol, halogénios (haletos), grupos alcoxi, incluindo tetrafluorofenolatos, grupos tioalcoxi e semelhantes. O termo “éster protegido” refere-se a um grupo éster que se encontra oculto ou se mostra de outra forma não reactivo. Ver, p.ex., Greene, “Protecting Groups In Organic Synthesis”.
Tendo em consideração as definições acima, outros termos químicos que serão usados ao longo deste pedido de patente poderão ser facilmente compreendidos pelos peritos na técnica. Os termos poderão ser usados isoladamente ou em qualquer combinação pretendida. As extensões preferidas e mais preferidas para as cadeias dos radicais aplicam-se a todas estas combinações. A.
CRIAÇÃO DE FRAGMENTOS DE ÁCIDO NUCLEICO MARCADOS
Tal como assinalado acima, um dos aspectos do presente invento fornece um esquema geral para a sequenciação de DNA que permite o uso de mais do que 16 marcadores em cada carreira; com uma detecção contínua, os marcadores poderão ser detectados e a sequência lida à medida que ocorre a separação por dimensões, tal como acontece com a sequenciação convencional baseada em florescência. Este esquema é aplicável a qualquer uma das técnicas de sequenciação de DNA que se baseiam na separação por dimensões das moléculas marcadas. São abaixo expostos em maior detalhe marcadores e linkers apropriados para utilização com o presente invento, assim como métodos para a sequenciação de ácidos nucleicos. 24 1. Marcadores O termo “marcador”, tal como aqui é usado, refere-se genericamente a uma espécie química que é usada para identificar de modo individual uma “molécula de interesse", e refere-se mais especificamente ao componente variável do marcador, assim como a qualquer parcela do reagente de marcador, do componente de marcador ou da porção molecular do marcador que possa estar estreitamente ligada a este componente variável.
Um marcador útil no âmbito do presente invento possui diversos atributos: 1) Tem a capacidade de se distinguir de todos os outros marcadores. Esta discriminação a partir de outras espécies químicas poderá basear-se no comportamento cromatográfico do marcador (particularmente após a reacção de corte de ligações), nas suas propriedades espectroscópicas ou potenciométricas ou numa combinação destes factores. Os métodos espectroscópicos através dos quais se podem distinguir os marcadores incluem a espectroscopia de massa (MS), de infravermelhos (IR), de ultravioleta (UV) e de fluorescência, sendo o MS, o IR e o UV os métodos espectroscópicos preferidos e o MS o mais preferido. A amperometria potenciométrica constitui um método potenciométrico preferido. 2) O marcador tem a capacidade de ser detectado quando se encontra presente em concentrações de 10'22 a 10'6 mole. 3) O marcador possui uma âncora química através da qual se pode ligar à MOI que se pretende que seja identificada de modo individual pelo marcador. A ligação poderá ser estabelecida directamente entre o marcador e a MOI, ou indirectamente através de um grupo de “linker". 4) O marcador é quimicamente estável face a todas as manipulações a que é submetido, incluindo as reacções de ligação à MOI e de separação desta, mantendo-se igualmente estável face a quaisquer manipulações da MOI enquanto a esta se mantém ligado. 5) O marcador não interfere de modo significativo com as manipulações da MOI enquanto se mantém ligado a esta. Por exemplo, se o marcador estiver ligado a um oligonucleótido, o marcador não interferirá de modo significativo com quaisquer reacções de hibridização ou enzimáticas (p.ex., reacções 25
de sequenciação por PCR) que sejam realizadas sobre o oligonucleótido. De forma similar, se o marcador se encontrar ligado a um anticorpo, não interferirá de modo significativo com o reconhecimento do antigénio por parte do anticorpo.
Uma porção molecular de marcador que se destine a ser detectada através de um dado método espectroscópico ou potenciométrico deverá possuir propriedades que aumentem a sensibilidade e a especificidade de detecção através desse método. Tipicamente, a porção molecular de marcador possuirá estas propriedades porque estas fizeram parte da concepção do componente variável do marcador, o qual constitui tipicamente a parte principal da porção molecular de marcador. Na exposição que se segue, o uso da palavra “marcador” refere-se tipicamente à porção molecular de marcador (i.e., o produto de quebra de ligações que contém o componente variável do marcador); no entanto, este termo pode também considerar-se como designando o próprio componente variável do marcador, uma vez que esta parte da porção molecular de marcador é tipicamente responsável pelas propriedades de detectabilidade individualizada. Nos compostos com a fórmula T-L-X, a porção “T” contém o componente variável de marcador. Nos casos em que o componente variável de marcador foi concebido para ser caracterizado por, p.ex., espectrometria de massa, a porção “T” da T-L-X poderá ser designado por TMS. Do mesmo modo, o produto da quebra de ligações de T-L-X que contém T poderá ser designado por porção molecular que contém TMS. Poderão utilizar-se os métodos espectroscópicos e potenciométricos que se seguem para
MS
caracterizar as porções moleculares que contêm T a. Características dos Marcadores MS Quando um marcador é analisável por espectrometria de massa (i.e., é um marcador legível por MS, aqui também designado por marcador MS ou “porção molecular contendo TMS”), a característica principal deste marcador é a de que pode ser ionizado. Deste modo, constitui um elemento preferido na concepção de marcadores legíveis por MS a incorporação nestes de uma funcionalidade química que poderá exibir uma carga positiva ou negativa sob condições de ionização em MS. Esta característica proporciona a melhoria da eficiência de formação de iões e uma maior sensibilidade global de detecção, particularmente na ionização por 26 electrospray. A funcionalidade química que suporta uma carga ionizada poderá derivar de TMS, ou de L, ou de ambos. Os factores que poderão aumentar a sensibilidade relativa de um analito que se destina a detecção por espectrometria de massa são expostos em, p.ex., Sunner, J. et éil., Anal. Chem. 60:1300-1307 (1988).
Uma funcionalidade preferida para facilitar a produção de uma carga negativa é um ácido orgânico, tal como hidroxifenol, ácido carboxilico, fosfonato, fosfato, tetrazol, sulfonilureia, perfluoroálcool o ácido sulfónico.
As funcionalidades preferidas para facilitar a produção de uma carga positiva sob condições de ionização são as aminas alifáticas ou aromáticas. Os exemplos de grupos funcionais de aminas que proporcionam uma melhoria da detectabilidade dos marcadores MS incluem aminas quaternárias (i.e., aminas que possuem quatro ligações, cada uma a átomos de carbono; ver Aebersold, Patente dos E.U.A. n° 5.240.859) e aminas terciárias (i.e., aminas que possuem três ligações, cada uma a átomos de carbono, o que inclui grupos C=N-C tais como os presentes na piridina; ver Hess et ai., Anal. Biochem. 224:373, 1995; Bures et al., Anal. Biochem. 224:364, 1995). As aminas terciárias bloqueadas são particularmente preferidas. As aminas terciárias e quaternárias poderão ser constituídas por grupos alquilo ou arilo. Uma porção molecular contendo TMS terá de conter pelo menos uma espécie ionizável, mas poderá possuir mais do que uma espécie ionizável. O estado de carga preferido é o de uma só espécie ionizada por marcador. Do mesmo modo. é preferido que cada porção molecular contendo TMS (e cada componente variável do marcador) contenha apenas um grupo de amina bloqueada ou de ácido orgânico.
Os radicais adequados contendo aminas que poderão fazer parte da porção molecular contendo TMS incluem os seguintes elementos:
(C|-Cl0)
—(C| C io)— N
27
—CC,—C|0)
—"(C!—C10)
N—\ f~”(Ci C|0)—/ y y~C|o) | (C, C10) ^ ; I—(C,—Cjo)— N(CrC|0)2; \—(CI—C10)—
( Çi C,o) \—(C|—Cj0)
\—(c i—cj0)—
> ./“"λ _^N(C|—C|0) ; and A identificação de um marcador po‘ espectrometria de massa baseia-se preferencialmente na sua razão de massa molecular/carga (m/z). O intervalo preferido de massas moleculares dos marcadores MS corresponde a cerca de 100 a 2.000 daltons, e de preferência a porção molecular contendo TMS possui uma massa de pelo menos cerca de 250 daltons, mais preferencialmente pelo menos cerca de 300 daltons, e ainda mais preferencialmente pelo menos cerca de 350 daltons. É geralmente difícil, com os espectrómetros de massa, distinguir entre porções moleculares que possuam iões-mãe com massas abaixo de cerca de 200-250 daltons (dependendo do instrumento usado), e deste modo as porções moleculares contendo TMS preferidas para este invento exibem massas superiores às deste intervalo.
Tal como se explica acima, a porção molecular contendo TMS poderá conter átomos diferentes dos presentes no componente variável de marcador, e até do que os presentes no próprio TMS. Assim, a massa do T1'·''3 poderá ser inferior a cerca de 250 daltons, desde que a a porção molecular contendo TMS possua uma massa de pelo menos cerca de 250 daltons. Assim, a massa do TMS poderá variar desde 15 (i.e., um radical metilo) até cerca de 10.000 daltons, de preferência de 100 a cerca 28
de 5.000 daltons, e mais preferencialmente de cerca de 200 a cerca de 1.000 daltons. É relativamente difícil distinguir marcadores por espectrometria de massa quando estes marcadores incorporam átomos que possuem mais do que um isótopo em abundância significativa. Assim, os grupos T preferidos que se destinam a determinação por espectroscopia de massa (grupos TMS) contêm carbono, pelo menos um átomo de hidrogénio e flúor, e átomos opcionais seleccionados a partir do grupo consistindo em oxigénio, azoto, enxofre, fósforo e iodo. Se bem que possam estar presentes outros átomos no TMS, a sua presença poderá dificultar a análise dos dados do espectro de massa. De preferência, os grupos TMS possuirão apenas átomos de carbono, azoto e oxigénio, para além de hidrogénio e/ou flúor. O flúor constitui um átomo opcional, se bem que preferido, para inclusão num grupo TMS. Em comparação com o hidrogénio, o flúor é, evidentemente, muito mais pesado. Assim, a presença de átomos de flúor em lugar de átomos de hidrogénio leva a grupos TMS de massas superiores, permitindo assim que o grupo TMS atinja e exceda uma massa de 250 daltons, o que está conforme o pretendido, tal como se explicou acima. Para além disto, a substituição de hidrogénio por flúor confere uma maior volatilidade à porção molecular contendo TMS, e uma maior volatilidade do analito aumenta a sensibilidade quando a espectrometria de massa é usada como método de detecção. A fórmula molecular de TMS encontra-se no intervalo de C1-500N0.100O0-100S0-ioPo-ioH„Fpls, em que a soma de α, β e δ é suficiente para satisfazer as valências de outro modo não satisfeitas dos átomos de C, N, O, S e P. A designação C1.500N0-iooOo-iooSo-ioPo-ioHaF(ilfi significa que TMS contém pelo menos um átomo de carbono, e poderá conter qualquer número destes átomos dentro do intervalo de 1 a 500, para além de conter opcionalmente um número de átomos de azoto de até 100 (“Ν0-“ significa que TMS não necessita de conter quaisquer átomos de azoto), até 100 átomos de O, até 10 átomos de enxofre e até 10 átomos de fósforo. Os símbolos a, β e δ representam o número de átomos de hidrogénio, flúor e iodo presentes em TMS, sendo que qualquer conjunto de dois destes números poderá corresponder a zero e que a soma destes números equivale ao total das valências de outro modo 29 não satisfeitas dos átomos de C, N, O, S e P. De preferência, TMS possui uma fórmula molecular que se encontra no âmbito da fórmula Ci_5oNo-ioOo-ioHwFp„ em que a soma de n e β equivale ao número de átomos de hidrogénio e flúor, respectivamente, que se encontram presentes na porção molecular.
b. Características dos Marcadores IR
Existem duas formas primárias de detecção por IR de grupos químicos orgânicos: IR de deslocamento Raman e IR de absorção. Os espectros IR de deslocamento Raman e os espectros IR de absorção constituem métodos espectroscópicos complementares. Em geral, a excitação de Raman depende das alterações da polarizabilidade das ligações, enquanto que a absorção em IR depende das alterações do momento dipolar das ligações. As linhas fracas de absorção em IR tornam-se linhas Raman fortes, e vice-versa. O número de onda é a unidade característica dos espectros IR. Existem 3 regiões espectrais para os marcadores IR que possuem aplicações distintas: IR próximo, de 12500 a 4000 cm'1, IR médio, de 4000 a 600 cm'1, e IR afastado, de 600 a 30 cm'1. Para os usos aqui descritos, em que se pretende que um composto sirva como marcador para identificação de uma MOI, sonda ou primer, as regiões médias do èspectro são as preferidas. Por exemplo, o alongamento carbonílico (1850 a 1750 cm'1) seria medido para os ácidos carboxílicos, para os ésteres e amidas carboxílicos e para os carbonatos, carbamatos e cetonas alquílicos e arílicos. A deformação N-H (1750 a 160 cm"1) seria usada para identificar as aminas, os iões de amónio e as amidas. No intervalo de 1400 a 1250 cm'1, a deformação R-OH é detectada juntamente com o alongamento C-N nas amidas. Os padrões de substituição aromática são detectados no intervalo de 900 a 690 cm"1 (deformação C-H, deformação N-H para ArNH2). As ligações C-H saturadas, as olefinas, os anéis aromáticos, ligações duplas e triplas, ésteres, acetais, cetais, sais de amónio, compostos N-0 tais como as oximas, compostos nitro, N-óxidos e nitratos, os compostos azo, as hidrazonas, quinonas, ácidos carboxílicos, amidas e lactams possuem dados de correlação vibracional em infravermelhos (ver Pretsch et al., Spectral Data for Structure Determination of Orgartic Compounds, Springer-Verlag, Nova Iorque, 1989). Os compostos preferidos 30 incluiriam um nitrilo aromático que exibe uma vibração de alongamento muito forte no intervalo de 2230 a 2210 cm'1. Outros tipos de compostos úteis são os alquinos aromáticos, os quais apresentam uma forte vibração de alongamento que dá origem a uma forte banda de absorção entre 2140 e 2100 cm'1. Um terceiro tipo de composto preferido corresponde às tiazidas aromáticas, que exibem uma banda intensa de absorção na região de 2160 a 2120 cm'1. Os tiocianatos constituem elementos representativos dos compostos que exibem uma forte absorção na região de 2275 a 2263 cm'1.
c. Características dos Marcadores UV
Scott (Interpretation ofthe UV Spectra of Natural Products, Pergamon Press, Nova Iorque, 1962) apresenta uma compilação dos tipos cromóforos orgânicos e das suas respectivas propriedades em UV-visível. Um cromóforo é um átomo, ou grupo de átomos ou electrões, que é responsável pela absorção de luz. Existem regras empíricas para os máximos de π para π* em sistemas conjugados (ver Pretsch et al., Spectra! Data for Structure Determinador) of Organic Compounds, p.B65 e B70, Springer-Verlag, Nova Iorque, 1989). Os compostos preferidos (com sistemas conjugados) possuiriam transições de n para π* e de π para π*. Como exemplos de tais compostos encontram-se o Violeta Ácido 7, Laranja de Acridina, Amarelo de Acridina G, Azul Brilhante G, Vermelho do Congo, Cristal Violeta, oxalato de Verde Malaquita, Amarelo de Metanilo, Azul de Metileno, Laranja de Metilo, Violeta de Metilo B, Verde de Naftol B, Oil Blue N, Oil Red O, 4-fenilazofenol, Safranie O, Verde de Solvente 3 e Laranja do Sudão G, sendo que todos estes compostos se encontram disponíveis no mercado (Aldrich, Milwaukee, Wl). Outros compostos adequados encontram-se listados em, p.ex., Jane, I., et al., J. Chrom. 323:191-225 (1985). d. Características de um Marcador Fluorescente As sondas fluorescentes são identificadas e quantificadas directamente através dos seus comprimentos de onda e intensidades de absorção e de emissão de fluorescência. Os espectros de emissão (fluorescência e fosforescência) são 31 muito mais sensíveis e permitem medições mais específicas do que os espectros de absorção. Outras características fotofísicas, tais como o tempo de vida em estado excitado e a anisotropia de fluorescência, são menos utilizadas. Os parâmetros de intensidade genericamente mais úteis são o coeficiente de extinção molar (ε) para a absorção e o rendimento quântico (QY) para a fluorescência. O valor de ε é especificado para um só comprimento de onda (que corresponde geralmente ao máximo de absorção da sonda), enquanto que o QY constitui uma medida da emissão total de fotões ao longo de todo o perfil do espectro de fluorescência. É geralmente utilizada uma banda óptica estreita (< 20 nm) para a excitação da fluorescência (através da absorção), enquanto que a largura de banda para a detecção da fluorescência é muito mais variável, abrangendo desde a totalidade do espectro, para garantir uma sensibilidade máxima, até uma banda estreita (~20 nm), para obter uma resolução máxima. A intensidade de fluorescência por molécula de sonda é proporcional ao produto de ε e QY. O intervalo abrangido por estes parâmetros, entre os fluoróforos de importância prática, é de aproximadamente 10.000 a 100.000 cm'1M'1 para ε e de 0,1 a 1,0 para QY. Como compostos que podem funcionar como marcadores fluorescentes encontram-se os seguintes: fluoresceína, rodamina, azul Lambda 470, verde Lambda, vermelho Lambda 664, vermelho Lambda 665, laranja de acridina e iodeto de propídio, os quais são comercializados pela Lambda Fluorescence Co. (Pleasant Gap, PA). Os compostos fluorescentes vermelho-nilo, Vermelho Texas, lissamine™ e BODIPY™ podem ser adquiridos à empresa Molecular Probes (Eugene, OR). e. Características dos Marcadores Potenciométricos O princípio da detecção electroquímica (ECD) baseia-se na oxidação ou redução de compostos, sendo que ao aplicar certas voltagens estes compostos se comportam como dadores ou aceitadores de electrões, produzindo-se desta forma uma corrente que pode ser medida. Quando certos compostos são submetidos a uma diferença de potencial, as moléculas sofrem um rearranjo molecular a nível da superfície de trabalho dos eléctrodos, verificando-se uma perda (oxidação) ou ganho (redução) de electrões; tais compostos são designados por electrónicos e sofrem 32 reacções electroquímicas. Os detectores electroquímicos aplicam uma voltagem sobre a superfície de um eléctrodo pela qual passa o fluxo do eluente de uma HPLC. Os compostos electroactivos que são eluídos a partir da coluna poderão doar electrões (oxidando-se) ou adquirir electrões (reduzindo-se), gerando um pico de corrente em tempo real. É importante notar que a quantidade de corrente gerada depende tanto da concentração do analito como da voltagem aplicada, sendo que a cada composto corresponde uma voltagem específica a partir da qual se inicia a sua redução ou oxidação. O detector electroquímico actualmente mais popular é o detector amperométrico, em que o potencial se mantém constante e é medida a corrente produzida a partir da reacção electroquímica. Este tipo de espectrometria é designado por “amperometria potenciostática’’. Estes amperómetros são comercializados pela empresa ESA, Inc., Chelmford, MA.
Quando a eficiência de detecção corresponde a 100%, os detectores especializados são designados por “coulométricos”. Os detectores coulométricos apresentam diversas vantagens práticas a nível de selectividade e sensibilidade, vantagens essas que tornam útil a utilização destes tipos de detectores num conjunto para análise. Nos detectores coulométricos, para uma dada concentração de analito, a corrente de sinal é representada em gráfico como uma função do potencial aplicado ao eléctrodo de trabalho (voltagem). O gráfico sigmoidal resultante é designado por curva de corrente-voltagem, ou voltamagrama hidrodinâmico (HDV). O HDV permite fazer a melhor escolha do potencial a aplicar ao eléctrodo de trabalho de modo a obter a maximização do sinal observado. Uma grande vantagem da ECD consiste na sua sensibilidade inerente, obtendo-se níveis de detecção na gama subfemtomolar.
Existem numerosas substâncias químicas e compostos que apresentam actividade electroquímica, incluindo muitas substâncias bioquímicas, produtos farmacêuticos e pesticidas. Os compostos co-eluídos por cromatografia podem ser resolvidos de modo eficaz mesmo que os seus potenciais de semi-onda (o potencial correspondente a metade do máximo de sinal) difiram em apenas 30-60 mV.
Os sensores coulométricos recentemente desenvolvidos proporcionam selectividade, identificação e resolução de compostos co-eluídos quando são utilizados como detectores em separações por cromatografia líquida. Deste modo, 33 1 1
este conjunto de detectores adiciona um outro conjunto de separações que são realizadas no próprio detector. Os instrumentos actuais possuem 16 canais que em princípio são limitados apenas pela velocidade a que se dá a aquisição de dados. O número de compostos que podem ser resolvidos no conjunto electroquímico é cromatograficamente limitado (i.e., limitado pelas contagens por placa). No entanto, se um ou mais compostos cromatograficamente co-eluídos possuírem uma diferença de potenciais de semi-onda de 30-60 mV, o conjunto tem a capacidade de distinguir os compostos. A actividade electroquímica exibida por um composto depende da existência de um grupo electroquimicamente activo neste composto (i.e., -OH, -O, -N, -S).
Os compostos que foram detectados com sucesso através do uso de detectores coulométricos incluem a 5-hidroxitriptamina, 3-metoxi-4-hidroxifenilglicol, ácido homogentísico, dopamina, metanefrina, 3-hidroxiquinurenina, acetaminofeno, 3-hidroxitriptofol, ácido 5-hidroxi-indolacético, ácido octanosulfónico/fenol, o-cresol, pirogalhol, 2-nitrofenol, 4-nitrofenol, 2,4-dinitrofenol, 4,6-dinitrocresol, 3-metil-2-nitrofenol, 2,4-diclorofenol, 2,6-diclorofenol, 2,4,5-triclorofenol, 4-cloro-3-metilfenol, 5-metilfenol, 4-metil-2-nitrofenol, 2-hidroxianilina, 4-hidroxianilina, 1,2-fenilenodiamina, benzocatequina, buturon, clortoluron, diuron, isoproturon, linuron, metobromuron, metoxuron, monolinuron, monuron, metionina, triptofano, tirosina, ácido 4-aminobenzóico, ácido 4-hidroxibenzóico, ácido 4-hidroxicumárico, 7-metoxicumarina, apigenina, baicaleína, ácido cafeico, catequina, centaureína, ácido clorogénico, daidzeína, datiscetina, diosmetina, galhato de epicatequina, epigalhocatequina, galhato de epigalhocatequina, eugenol, eupatorina, ácido ferúlico, fisetina, galangina, ácido gálhico, gardenina, genisteína, ácido gentísico, hesperidina, irigenina, kaemferol, leucocianidina, luteolina, mangostina, morina, miricetina, naringina, narirutina, pelargondina, peonidina, floretina, pratenseina, ácido protocatecuico, ramnetina, quercetina, sakuranetina, escutelareína, escopoletina, siringaldeído, ácido siríngico, tangeritina, troxerutina, umbeliferona, ácido vanílico, 1.3-dimetiltetrahidroisoquinolina, 6-hidroxidopamina, r-salsolinol, N-metil-r-salsolinol, tetrahidroisoquinolina, amitriptilina, apomorfina, capsaicina, clordiazepóxido, clorpromazina, daunorubicina, desipramina, doxepina, fluoxetina, flurazepam, imipramina, isoprotenerol, metoxamina, morfina, morfina-3-glucuronido, nortriptilina, 34 oxazepam, fenilefrina, trimipramina, ácido ascórbico, N-acetilserotonina, 3,4-dihidroxibenzilamina, ácido 3,4-dihidroximandélico (DOMA), ácido 3,4-dihidroxifenilacético (DOPAC), 3,4-dihidroxifenilalanina (L-DOPA), 3,4-dihidroxifenilglicol (DHPG), ácido 3-hidroxiantranílico, ácido 2-hidroxifenilacético (2HPAC), ácido 4-hidroxibenzóico (4HBAC), ácido 5-hidroxiindol-3-acético (5-HIAA), 3-hidroxiquinurenina, ácido 3-hidroximandélico, 3-hidroxi-4-metoxifeniletilamina, ácido 4-hidroxifenilacético (4HPAC), ácido 4-hidroxifenil-láctico (4HPLA), 5-hidroxitriptofano (5HTP), 5-hidroxitriptofol (5HTOL), 5-hidroxitriptamina (5HT), sulfato de 5-hidroxitriptamina, 3-metoxi-4-hidroxifenilglicol (MHPG), 5-metoxitriptamina, 5-metoxitriptofano, 5-metoxitriptofol, 3-metoxitiramina (3MT), 3-metoxitirosina (3-OM-DOPA), 5-metilcisteína, 3-metilguanina, bufotenina, dopamina, dopamina-3-glucuronido, dopamina-3-sulfato, dopamina-4-sulfato, epinefrina, epinina, ácido fólico, glutationa (reduzida), guanina, guanosina, ácido homogentísico (HGA), ácido homovanílico (HVA), álcool homovanilílico (HVOL), ácido homoverático, sulfato de HVA, hipoxantina, indol, ácido indol-3-acético, ácido indol-3-láctico, quinurenina, melatonina, metanefrina, N-metiltriptamina, N-metiltiramina, N,N-dimetiltriptamina, Ν,Ν-dimetiltiramina, norepinefrina, normetanefrina, octopamina, piridoxal, fosfato de piridoxal, piridoxamina, sinefrina, triptofol, triptamina, tiramina, ácido úrico, ácido vanilmandélico (VMA), xantina e xantosina. Encontram-se listados outros compostos adequados em, p.ex., Jane, I., et al., J. Chrom. 323:191-225 (1985) e Musch, G., et al., J. Chrom. 348:97-110 (1985). Estes compostos poderão ser incorporados em compostos com a fórmula T-L-X recorrendo a métodos conhecidos da técnica. Por exemplo, os compostos que contenham um grupo de ácido carboxílico poderão ser colocados em reacção com uma amina, hidroxilo, etc., para formar ligações amida, éster e outras entre T e L.
Para além das propriedades acima expostas, e independentemente do método de detecção pretendido, prefere-se que o marcador possua uma estrutura química modular. Esta estrutura facilita a construção de grandes quantidades de marcadores estruturalmente relacionados por meio de técnicas de química combinatorial. Por exemplo, é desejado que o grupo TMS possua diversas propriedades. Será de desejar que TMS possua um grupo funcional que suporte um único estado ionizado de carga quando a porção molecular contendo TMS for 35 submetida a espectrometria de massa (mais simplesmente, este será um grupo “de melhoria da sensibilidade da espectrometria de massa”, ou MSSE). Adicionalmente, é desejado que o grupo TMS constitua um dos membros de uma família de porções moleculares contendo TMS, em que cada membro da família possui uma razão massa/carga diferente mas todos apresentam aproximadamente a mesma sensibilidade no espectrómetro de massa. Assim, é desejado que todos os membros da família tenham o mesmo MSSE. Para possibilitar a criação de famílias de compostos, verificou-se ser conveniente a criação de reagentes de marcador através de um esquema de síntese modular, de tal modo que os próprios componentes do marcador se possam considerar como formados por módulos.
Numa abordagem modular preferida à estrutura do grupo TMS , TMS apresenta a fórmula T2-(J-T3)n- em que T2 é uma porção molecular orgânica formada a partir de carbono e um ou mais átomos de hidrogénio, flúor, iodo, oxigénio, azoto, enxofre e fósforo, possuindo uma massa contida no intervalo de 15 a 500 daltons; T3 é uma porção molecular orgânica formada a partir de carbono e um ou mais átomos de hidrogénio, flúor, iodo, oxigénio, azoto, enxofre e fósforo, possuindo uma massa contida no intervalo de 50 a 1000 daltons; J é uma ligação directa ou um grupo funcional como um grupo amida, éster, amina, sulfureto, éter, tioéster, dissulfureto, tioéter, ureia, tioureia. carbamato, tiocarbamato, base de Schiff, base de Schiff reduzida, imina, oxima, hidrazona, fosfato, fosfonato, fosforamida, fosfonamida, sulfonato, sulfonamida ou uma ligação carbono-carbono; e n é um índice que varia entre 1 e 50, de tal modo que, quando n é superior a 1, cada um dos elementos T3 e J é seleccionado independentemente. A estrutura modular T2-(J-T3)n- proporciona uma entrada conveniente para as famílias de compostos T-L-X, em que cada membro da família possui um grupo T diferente. Por exemplo, quando T corresponde a TMS e todos os membros da família têm o mesmo MSSE, tal como desejado, um dos grupos T3 poderá fornecer esta estrutura MSSE. De modo a tornar possível a variabilidade entre os membros de uma família no que diz respeito à massa de TMS , o grupo T2 poderá variar entre os membros da família. Por exemplo, um membro da família poderá ter T2 = metilo enquanto outro tem T2 = etilo e outro ainda tem T2 = propilo, etc.
Para proporcionar saltos grandes, ou “grosseiros” de massa, poderá ser concebido um grupo T3 que adicione uma quantidade significativa de unidades de massa (p.ex.. uma centena ou várias centenas) a T-L-X. Um tal grupo T3 poderá ser designado como grupo ajustador do peso molecular (“WRA”). Um WRA torna-se bastante útil se se estiver a trabalhar com um só conjunto de grupos T2, que possuem massas inseridas num intervalo limitado. Poderá ser usado um só conjunto de grupos T2 para criar grupos TMS que possuam um vasto intervalo de massas incorporando simplesmente um ou mais grupos T3 WRA no TMS. Assim, usando um exemplo simples, se um conjunto de grupos T2 proporcionar um intervalo de massas de 250-340 daltons ao TMS, se for feita a adição de um só WRA que tenha, por exemplo, uma massa de 100 daltons, este grupo (que funcionará como T3) proporcionará o acesso ao intervalo de massas de 350-440 daltons ao ser utilizado o mesmo conjunto de grupos T2. Do mesmo modo, a adição de dois grupos WRA com 100 daltons (cada um na qualidade de grupo T3) proporciona o acesso ao intervalo de massas de 450-540 daltons, podendo prosseguir-se esta adição de grupos WRA de modo a proporcionar o acesso a um intervalo bastante vasto de· massas para o grupo TMS. Os compostos preferidos com a fórmula T2-(J-T3-)n-L-X possuem a fórmula Rvwc-ÍRwraVRmsse-L-X , em que VWC é um grupo “T2” e cada um dos grupos WRA e MSSE são grupos “T3". Esta estrutura é ilustrada na Figura 12 e representa uma abordagem modular à preparação de TMS.
Na fórmula T2-(J-T3-)n-, T2 e T3 são preferencialmente seleccionados a partir do grupo formado por hidrocarbilo, hidrocarbil-O-hidrocarbileno, hidrocarbil-S-hidrocarbileno, hidrocarbil-NH-hidrocarbileno, hidrocarbil-amida-hidrocarbileno, N-(hidrocarbil)hidrocarbileno, N,N-di(hidrocarbil)hidrocarbileno, hidrocarbilacil- hidrocarbileno, heterociclilhidrocarbilo em que o(s) heteroátomo(s) é(são) seleccionado(s) a partir dos átomos de oxigénio, azoto, enxofre e fósforo, heterociclilhidrocarbilo substituído em que o(s) heteroátomo(s) é(são) seleccionado(s) a partir dos átomos de oxigénio, azoto, enxofre e fósforo e os substituintes são seleccionados a partir do grupo constituído por hidrocarbilo, hidrocarbil-O-hidrocarbileno, hidrocarbil-NH-hidrocarbileno, hidrocarbil-S- 37 hidrocarbileno, N-(hidrocarbil)hidrocarbileno, N,N-di(hidrocarbil)hidrocarbileno e hidrocarbilacil-hidrocarbileno. Adicionalmente, T2 e/ou T3 poderão constituir derivados de um dos grupos T2/T3 potenciais previamente listados, em que um ou mais hidrogénios são substituídos por átomos de flúor.
Também em relação à fórmula T2-(J-T3-)n-, um grupoT3 preferido possui a fórmula -G(R2)-, em que G é uma cadeia de alquileno C-i-6 possuindo um só substituinte R2. Assim, se G for o etileno (-CH2-CH2-), um dos dois átomos de etileno poderão possuir um substituinte R2, e R2 é seleccionadó a partir do grupo constituído por alquilo, alquenilo, alquinilo, cicloalquilo, cicloalquilo aril-fundido, cicloalquenilo, arilo, aralquilo, alquenilo aril-substituído ou alquinilo, alquilo cicloalquil-substituído, cicloalquilo cicloalquenil-substituído, biarilo, alcoxi, alquenoxi, alquinoxi, aralcoxi, alquenoxi ou alquinoxi aril-substituídos, alquilamino, alquenilamino ou alquinilamino, alquilamino aril-substituído, alquenilamino ou alquinilamino aril-substituído, ariloxi, arilamino, alquilo N-alquilureia-substituído, alquilo N-arilureia-substituído, alquilo alquilcarbonilamino-substituído, alquilo aminocarbonil-substituído, heterociclilo, alquilo heterociclil-substituído, amino heterociclil-substituído, aralquilo carboxialquil-substituído, arilo e heterociclilalquilo oxocarbociclil-fundidos; cicloalquenilo, alquilo e aralquilo aril-substituídos, alquilo hidroxi-substituído, alquilo alcoxi-substituido, alquilo aralcoxi-substituído, alquilo amino-substituído, alquilo(alquiloxicarbonilamino aril-substituído)-substituído, alquilo tiol-substituido, alquilo alquilsulfonil-substituído, alquilo(alquitio hidroxi-substituído)-substituído alquilo tioalcoxi-substituído, alquilo hidrocarbilacilamino-substituído, alquilo heterociclilacilamino-substituído, alquilo substituído por heterociclilacílamino hidrocarbil-substituído, alquilo alquilsulfonilamino-substituído, alquilo arilsulfonilamino-substituído, morfolinoalquilo, tiomorfolinoalquilo, alquilo morfolinocarbonil-substituído, alquilo tiomorfolinocarbonil-substituído, alquilo [N-(alquil. alquenil ou alquinil)- ou N,N-[dialquil, dialquenil, dialquinil ou (alquil, alquenil)-aminojcarbonil-substituído, heterociciilaminocarbonilo, heterociclilalquilenoaminocarbonilo, alquilo heterociclilaminocarbonil-substituído, alquilo heterociclilalquilenoaminocarbonil-substituído, N,N- [dialquil]alquilenoaminocarbonilo, alquilo N,N-[dialquil]alquilenoaminocarbonil-substituído, heterociclilcarbonilo alquil-substituído, heterociclilcarbonil-alquilo alquil-
substituído, alquilo carboxil-substituído, acilaminoalquilo dialquilamino-substituído e cadeias laterais de aminoácidos seleccionadas a partir do grupo constituído por arginina, asparagina, glutamina, S-metilcisteína, metionina e seus derivados de sulfóxido e sulfona, glicina, leucina, isoleucina, alo-isoleucina, tert-leucina, norleucina; fenilalanina, tirosina. triptofano. prolina. alanina, orriitina, histidina, glutamina, valina, treonina, serina, ácido aspártico, beta-cianoalanina e alotreonina; alinilo e heterociclilcarbonilo, aminocarbonilo, amido, mono- ou dialquilaminocarbonilo, mono- ou diarilaminocarbonilo, alquilarilaminocarbonilo, diarilaminocarbonilo, mono- ou diacilaminocarbonilo, acilo aromático ou alifáticc, alquilo opcionalmente substituído por substituintes seleccionados a partir do grupo constituído por amino, carboxi, hidroxi, mercapto, mono- ou díalquilamíno, mono- ou diarilamino, alquilarilamino, diarilamino, morio- ou diacilamino, alcoxi, alquenoxi, ariloxi, tioalcoxi, tioalquenoxi, tioalquinoxi, tioariloxi e heterociclílo.
Um composto preferido com a fórmula T2-(J-T3-)n-L-X possui a estrutura:
Amida.
R
em que G corresponde a (CH2)i-6, de tal modo que um hidrogénio em um e só um dos grupos CH2 representado por um ió “G" é substituído por-(CH2)c-Amida-T4; "Γ e T4 são porções moleculares orgânices com a fórmula C1.25N0-aO0-9Ho.Ff3 , de tal modo que a soma de α e β é suficiente para satisfazer as valências de outro modo não satisfeitas dos átomos de C, N e O; a amida é
O
O N-C— ou
II c-n-; I ,
R 39
R1 é um hidrogénio ou um alquilo Cm3; c é um índice variando de 0 a 4; e n é um índice que varia de 1 a 50, de tal forma que; quando n é superior a 1. G, c. Amida, R1 e Γ1 são seleccionados de modo independente.
Numa outra forma de realização preferida, um composto com a fórmula T2-(J-T3-)n-L-X possui a seguinte estrutura:
Amida
em que T5 é uma porção moleculai orgânica com a fórmula C1.25N0.9O0. 9H,(F|:$ , de tal modo que a soma de a e β é suficiente para satisfazer as valências de outro modo não satisfeitas dos átomos de C, N e O; T5 incluí uma amina terciária ou quaternária ou um ácido orgânico; m é um índice que varia de 0-49, e T2, Τ'1, R1, L e X foram já previamente definidos.
Outro composto preferido com a fórmula T2-(J-T3-).rL-X possui a estrutura:
Amida
X em que T5 é uma porção molecular orgânica com a fórmula C1-25N0-9O0-9H(,Fp , de tal modo que a soma de a e β é suficiente para satisfazer as valências de outro modo não satisfeitas dos átomos de C, N e O; T5 inclui uma amina terciária ou 40
I quaternária ou um ácido orgânico; m é um índice que varia de 0-49, e T2, T4, c, R1, "Amida:', L e X foram já previamente definidos.
Nas estruturas acima que possuem um grupo T5, o conjunto -Amida-T5 traduz-se preferencialmente por um dos seguintes grupos, que são facilmente produzidos fazendo reagir ácidos orgânicos com grupos amino livres que se estendem a partir de “G”: NHC- I 0 / \ ; - I --NHC- Ó i O o NHC- li n r -(C, — C,o)— V _y — NHC-- l! 0
(Cr-C;0;--N(C v. \r)-i
Cio)’ — NHC —
O \ N — (C i ~/
NHC- I! O cc j c, o) N >I___i
Nos casos em que os compostos acima possuem um grupo T5 e o grupo “G" inclui um grupo carboxilo livre (ou um seu equivalente reactivo), sáo então preferidos os seguintes grupos -Amida-T5, que são facilmente produzidos fazendo reagir as aminas orgânicas apropriadas com um grupo carboxilo livre que se estende a partir de ‘G’?:
-CNH—(C;—C!0)-6 O ry ÇN H — (C o C, 0)— N 0; Çi C,q) - ÇNH (C,—-C, 0)—S O l--
CNH (C2—C|0)—N(C|-C10)2;
O /-\ —CN N(C,—C,o) ; e o '—' 41
Em três formas de realização preferdas para o invento, T-L-MOI possui a estrutura: r1 i 1-1
Amida. I i | N\ ,
0 (CH2j, R1 V(C,—C:,o)—ODN-3—OH .NO-, R1 0 ou a estrutura:
Amida.
NO 2 H / N\ N(C|—C10)—0DN-3-0H ou a estrutura: (Amici
H N \ (C|—C'l0)~-ODN-3—OH r em que T2 e T4 são porções moleci lares orgânicas com a fórmula C1.25N0. 9O0.9S0.3P0.3HUF11IS, em que a soma de a, β e δ é suficiente para satisfazer as 42 valências de outro modo não satisfeitas dos átomos de C, N, 0: S e P; G corresponde a (CH2)i-6. de tal modo que um e só um hidrogénio dos grupos CH2 representado por cada "G” é substituído por -(CH?)c-Amida-T4; a Amida é O 0
li H — N - C — ou — C - N — f, I, R1 R! R1 é um hidrogénio ou um alquilo Gr.id; c é um índice variando entre 0 e 4; “C2-C10" representa um grupo hidrocarbileno possuindo entre 2 a 10 átomos de carbono; ODN-3'-OH" representa um fragmento de ácido nucleico com um grupo hidroxilo na extremidade 3’ (i.e., um fragmento de ácido nucleico ligado a (C1-C10) por outro local que não a extremidade 3’ deste mesmo ácido nucleico); e n é um índice que varia de 1 a 50, de tal modo que quando n é superior a 1, então G, c, Amida, R1 e T4 são seleccionados de modo independente. De preferência, não se verifica a ligação de três heteroátomos a um só átomo de carbono.
Nas estruturas acima expostas que contêm um grupo T2-C(=0)-N(R1)-, este grupo poderá ser formado através da reacção de uma amina de fórmula HN(R1)-com um ácido seleccionado a partir da lista que se segue, a qual se apresenta como exemplo e não pretende constituir uma lista exaustiva de ácidos orgânicos potenciais: Ácido fórmico, ácido acético, ác=do propíólico, ácido propióníco, ácido fluoroacético, ácido 2-butinóico, ácido ciclopropanocarboxílico, ácido butírico, ácido metoxiacético,ácido difluoroacético, ácido 4-pentinóico, ácido ciclobutanocarboxílico. ácido 3,3-dimetilacrílico, ácido valérico. Ν,Ν-dimetilglicina, N-formil-Gly-OH, ácido etoxiacético, ácido (metiltio)acético, ácido pirol-2-carboxílico. ácido 3-furóico, ácido isoxazol-5-carboxílico, ácido trans-3-hexenóico, ácido trifluoroacético, ácido hexanóico, Ac-Gly-OH, ácido 2-hidroxi-2-:metilbutírico, ácido benzóico, ácido nicotínico, ácido 2-pirazinacarboxílico, ácido 1-metil-2-pirrolcarboxílico, ácido 2-ciclopenteno-1-acético, ácido ciclopentilaoético, ácido (S)-(-)-2-pirrolidona-5-carboxílico, N-metil-L-prolina, ácido heptímóico, Ac-b-Ala-OH, ácido 2-etil-2-hidroxibutírico, ácido 2-(2-metoxietoxi)ac ático, ácido p-toluico. ácido 6-metilnicotínico, ácido5-metil-2-pirazinacarboxílico, ácido 2,5-dimetilpirrol-3-çarboxílico, ácido 4-fluorobenzóico, ácido 3,5-dimetilisoxazol-4-carboxílico, ácido 3-ciclopentilpropiónico, ácido octanóico. ácido Ν,Ν-dimetilsuccinâmico, ácido 43 fenilpropilólico, ácido cinâmico, ácido 4-etilbenzóico, ácido p-anísico, ácido 1,2,5-trimetilpirrol-3-carboxílico, ácido 3-fluoro-4-metilbenzóico, Ac-DL-propargilglicina, ácido 3-(Trifluorometil)butírico, ácido 1-piperidinapropiónico, N-acetilprolina, ácido 3,5-difluorobenzóico, Ac-L-Val-OH, ácido indol-2-carboxílico, ácido 2-benzofuranocarboxílico, ácido benzotriazol-5-carboxílico, ácido 4-n-propilbenzóico, ácido 3-dimetilaminobenzóico, ácido 4-etoxibenzóico, ácido 4-(metiltio)benzóico, N-(2-furoil)glicina, ácido 2-(metiltio)nicotínico, ácido 3-fluoro-4-metoxibenzóico, Tfa-Gly-OH, ácido 2-naftóico, ácido quinalídico, Ac-L-lle-OH, ácido 3-metilindeno-2-carboxílico, ácido 2-quinoxalinacarboxílico, ácido 1-metilindol-2-carboxílico, ácido 2,3,6-trifluorobenzóico, N-formil-L-Met-OH, ácido 2-[2-(2-metoxietoxi)etoxi]acético, ácido 4-n-butilbenzóico, n-benzoilglicina, ácido 5-fluoroindol-2-carboxílico, ácido 4-n-propoxibenzóico, ácido 4-acetil-3,5-dimetil-2-pirrolcarboxílico, ácido 3,5-dimetoxibenzóico, ácido 2,6-dimetoxinicotínico, ácido ciclohexanopentanóico, ácido 2-naftilacético, ácido 4-(1H-pirrof-1-il)benzóico, ácido indol-3-propiónico, ácido m-trifluorometilbenzóico, ácido 5-metoxiindol-2-carboxílico, ácido 4-pentilbenzóico, Bz-b-Ala-OH, ácido 4-dietilaminobenzóico, ácido 4-n-butoxibenzóico, ácido 3-metil-5-CF3-isoxazol-4-carboxílico, ácido (3,4-dimetoxifenil)acético, ácido 4-bifenilcarboxílico, pivaloil-Pro-OH, octanoil-Gly-OH, ácido (2-naftoxi)acético, ácido indol-3-butírico, ácido 4-(trifluorometil)fenilacético, ácido 5-metoxiindol-3-acético, ácido 4-(trifluorometoxi)benzóico, Ac-L-Phe-OH, ácido 4-Pentiloxibenzóico, Z-Gly-OH, 4-carboxi-N-(fur-2-ilmetil)pirrolidin-2-ona, ácido 3,4-dietoxibenzóico, ácido 2,4-dimetil-5-C02Et-pirrol-3-carboxílico, ácido N-(2-fluorofenil)succinâmico, ácido 3,4,5-trimetoxibenzóico, ácido N-fenilantranílico, ácido 3-fenoxibenzóico, nonanoil-Gly-OH, ácido 2-fenoxipiridina-3-carboxílico, ácido 2,5-dimetil-1 -fenifpirrol-3-carboxílico, ácido trans-4-(trifluorometil)cinâmico, ácido (5-metil-2-feniloxazol-4-il)acético, ácido 4-(2-ciclohexeniloxi)benzóico, ácido 5-metoxi-2-metilindol-3-acético, ácido trans-4-cotininacarboxílico, ácido Βζ-5-aminovalérico, ácido 4-hexiloxibenzóico, ácido n-(3-metoxifenil)succinâmico, Z-Sar-OH, ácido 4-(3,4-dimetoxifenil)butírico, Ac-o-fluoro-DL-Phe-OH, ácido N-(4-fluorofenil)glutarâmico, ácido 4-etil-4-bifenilcarboxílico, ácido 1,2,3,4-tetrahidroacridinacarboxílico, ácido 3-fenoxifenilacético, ácido N-(2,4-difluorofenil)succinâmico, N-decanoil-Gly-OH, ácido (+)-6-metoxi-a-metil-2-naftalenoacético, ácido 3-(trifluorometoxi)cinâmico, N-formil-DL-Trp-OH, ácido 44 (R)-(+)-a-metoxi-a-(trifluorometil)fenilacético, Bz-DL-Leu-OH, ácido 4-(trifluorometoxi)fenoxiacético,ácido 4-heptiloxibenzóico,ácido 2,3,4-trimetoxicinâmico, 2.6-dimetoxibenzoil-Gly-OH, ácido 3-(3,4,5-trimetoxifenil)propiónico, ácido 2,3,4,5,6-pentafluorofenoxiacético, ácido N-(2,4-difluorofenil)glutarâmico, N-undecanoil-Gly-OH, ácido 2-(4-fluorobenzoil)benzóico, ácido 5-trifluorometoxiindol-2-carboxílico, ácido N-(2,4-difluorofenil)diglicolâmico, Ac-L-Trp-OH, Tfa-L-fenilglicina-OH, ácido 3-iodobenzóico, ácido 3-(4-n-pentilbenzoil)propiónico, ácido 2-fenil-4-quinolinacarboxílico, ácido 4-octiloxibenzóico, Bz-L-Met-OH: ácido 3,4,5-trietoxibenzóico, N-lauroil-Gly-OH, ácido 3,5-bis(trifluorometil)benzóico, Ac-5-metil-DL-Trp-OH, ácido 2-iodofenilacético, ácido 3-iodo-4-metilbenzóico, ácido 3-(4-n-hexilbenzoil)propiónico, N-hexanoil-L-Phe-OH, ácido 4-noniloxibenzóico, ácido 4’-(trifluorometil)2-bifenilcarboxílico, Bz-L-Phe-OH, N-tridecanoil-Gly-OH, ácido 3,5-bis(trifluorometil)fenilacético, ácido 3-(4-n-heptilbenzoil)propiónico, N-heptanoil-L-Phe-OH, ácido 4-deciloxibenzóico, ácido N-(a,a,a-trifluoro-m-tolil)antranílico, ácido niflumico, ácido 4-(2-hidroxihexafluoroisopropil)benzóico, N-miristoil-Gly-OH, ácido 3-(4-n-octilbenzoil)propiónico, N-octanoil-L-Phe-OH, ácido 4-undeciloxibenzóico, 3-(3,4,5-trimetoxifenil)propionil-Gly-OH, ácido 8-iodonaftóico, N-pentadecanoil-Gly-OH, ácido 4-dodeciloxibenzóico, N-palmitoil-Gly-OH e N-estearoil-Gly-OH. Estes ácidos orgânicos são comercializados por uma ou várias das seguintes empresas: Advanced ChemTech, Louisville, KY; Bachem Bioscience, Inc.,' Torrance, CA; Calbiochem-Novabiochem Corp., San Diego, CA; Farchan Laboratories Inc., Gainesville FL; Lancaster Synthesis, Wyndham, NH; e MayBridge Chemical Company (c/o Ryan Scientific), Columbia, SC. Os catálogos destas companhias usam as abreviaturas indicadas acima para identificar os ácidos. f. A Química Combinatorial como Meio para a Preparação de Marcadores A química combinatorial constitui um tipo de estratégia de síntese que conduz à produção de grandes colecções químicas (ver, por exemplo, a Publicação do Pedido de Patente PCT N° WO 94/08051). Estas colecções combinatoriais podem ser usadas como marcadores para a identificação de moléculas de interesse (MOIs). A química combinatorial pode definir-se como a ligação covalente 45 sistemática e repetitiva de um conjunto de diversos “blocos de construção” com estruturas que variam entre si, por forma a originar um vasto conjunto de diversas entidades moleculares. Os blocos de construção podem tomar muitas formas, tanto naturais como sintéticas, tais como nucleófilos, electrófilos, dienos, agentes alquilantes ou adiantes, diaminas, nucleótidos, aminoácidos, açúcares, lípidos, monómeros orgânicos, synthons e combinações de todos estes. Como reacções químicas de ligação dos blocos de construção poderão usar-se a alquilação, acilação, oxidação, redução, hidrólise, substituição, eliminação, adição, ciclização, condensação e outras. Este processo pode produzir colecções de compostos oligoméricos. não-oligoméricos ou resultantes de combinações destes. No caso dos compostos oligoméricos, estes poderão ser ramificados, não ramificados ou cíclicos. Os exemplos de estruturas oligoméricas que podem ser preparadas através de métodos combinatoriais incluem oligopéptidos, oligonucleótidos, oligossacáridos, polilípidos, poliésteres, poliamidas, poliuretanos, poliureias, poliéteres, poli(derivados de fósforo), p.ex., fosfatos, fosfonatos, fosforamidas, fosfonamidas, fosfitos, fosfinamidas, etc., e poli(derivados de enxofre), p.ex., sulfonas, sulfonatos, sulfitos, sulfonamidas, sulfenamidas.
Um tipo comum de colecção combinatorial oligomérica corresponde à colecção combinatorial de péptidos. As inovações recentes na química de péptidos e na biologia molecular possibilitaram a preparação e utilização de colecções formadas por dezenas a centenas de milhões de sequências peptídicas diferentes. Tais colecções podem dividir-se em três categorias gerais. Um das categorias de colecções envolve a síntese química de colecções de péptidos solúveis não ligados a suportes (p.ex., Houghten et al., Nature 354:84, 1991). Uma segunda categoria envolve a síntese química de colecções de péptidos ligados a suportes, apresentados em suportes sólidos como alfinetes de plástico, esferas de resina ou algodão (Geysen et al., Moí. Immunol. 23:709, 1986; Lam et al., Nature 354:82, 1991: Eichler e Houghten, Biochemistry 32:11035, 1993). Nestas primeiras duas categorias, os blocos de construção correspondem tipicamente a L-aminoácidos, D-aminoácidos, aminoácidos não naturais ou a uma mistura ou combinação destes. Uma terceira categoria utiliza abordagens da biologia molecular para preparar péotidos ou proteínas à superfície de partículas de fagos filamentosos ou plasmideos (Scott e Craig, Curr. Opinion Biotech. 5:40, 1994). As colecções de péptidos solúveis não ligados a suportes parecem ser adequadas a diversas aplicações, incluindo o uso como marcadores. O repertório disponível de diversidades químicas em colecções de péptidos pode ser expandido através de passos como a permetilação (Ostresh et al., Proc. Natl. Acad. Sei. USA 91:11138, 1994). É possível obter numerosas variantes de colecções combinatoriais de péptidos em que a cadeia principal do péptido é modificada e/ou as ligações amina são substituídas por grupos miméticos. Os grupos miméticos de amina que podem ser utilizados incluem ureias, uretanos e grupos de carbonilmetileno. A reestruturação da cadeia principal de tal modo que as cadeias laterais emanem dos azotos de amida de cada aminoácido, em lugar dos carbonos alfa, fornece colecções de compostos conhecidos por peptóides (Simon et al., Proc. Natl. Acad. Sei. USA 89\9367, 1992).
Outro tipo comum de colecção combinatorial oligomérica corresponde à colecção combinatorial de oligonucleótidos, em que os blocos de construção constituem derivados de nucleótidos ou de polissacáridos, de ocorrência natural ou sintéticos, incluindo compostos em que vários grupos orgânicos e inorgânicos poderão substituir a ligação fosfato, e o azoto ou o enxofre poderão substituir o oxigénio numa ligação éter (Schneider et al., Biochem. 34:9599, 1995; Freier et al., J. Med. Chem. 38:344, 1995; Frank, J. Biotechnology 41:259, 1995; Schneider et al., PCT Publicada N° WO 942052; Ecker et al., Nucleic Acids Res. 21:1853, 1993).
Mais recentemente, tem sido descrita a produção combinatorial de colecções de compostos não oligoméricos de moléculas pequenas (DeWitt et al., Proc. Natl. Acad. Sei. USA 90:690, 1993; Bunin et al., Proc. Natl. Acad. Sei. USA 91:4708, 1994). As estruturas adequadas a elaboração em colecções de moléculas pequenas incluem uma grande variedade de moléculas orgânicas, por exemplo estruturas heterocíclicas, aromáticas, alicíclicas, alifáticas, esteróides, antibióticos, inibidores enzimáticos, ligandos, hormonas, fármacos, alcaloides, opióides, terpenos, porfirinas, toxinas, catalisadores, assim como combinações destes. 47 g. Métodos Específicos de Síntese Combinatorial de Marcadores São abaixo expostos dois métodos de preparação e uso de um conjunto de diversos marcadores MS contendo o grupo amina. Em ambos os métodos é utilizada a síntese em fase sólida de modo a permitir a síntese simultânea e em paralelo de um grande número de linkers marcados, utilizando as técnicas da química combinatorial. No primeiro método, o eventual corte da ligação entre o marcador e o oligonucleótido resulta na libertação de uma amida carboxílica. No segundo método, o corte da ligação com o marcador produz um ácido carboxílico. Os componentes químicos e elementos de ligação usados nestes métodos são abreviados tal como se segue: R — resina FMOC = grupo protector fluorenilmetoxicarbonilo All = grupo protector alilo co2h = grupo de ácido carboxílico conh2 = grupo de amida carboxílica nh2 = grupo amino OH = grupo hidroxilo CONH = ligação amida COO = ligação éster NH2 -Rink- C02H ácido 4-[(a-amino)-2,4-dimetoxibenzil]-fenoxibutírico (linker de Rink) OH -1MeO- C02H - ácido (4-hidroximetil)fenoxibutírico OH -2MeO- C02H - ácido (4-hidroximetil-3-metoxi)fenoxiacético NH2-A-COOH = aminoácido com uma funcionalidade de amina alifática ou aromática na cadeia lateral X1.....Xn-COOH conjunto de diversos (n) ácidos carboxílicos com pesos moleculares individualizados oligol.....oligo(n) = conjunto de n oligonucleótidos HBTU = hexafluorofosfato de 0-benzotriazol-1-il-N,N,N',N’-Tetrametilurónio 48
A sequência de passos do Método 1 é a seguinte:
OH - 2MeO- CONH-R i FMOC - NH - Rink - C02H; acoplamento (p.ex., HBTU) FMOC - NH - Rink - COO - 2MeO - CONH - R i piperidina (remoção de FMOC)
NH2 - Rink - COO - 2MeO - CONH - R i FMOC - NH - A - COOH; acoplamento (p.ex., HBTU) FMOC - NH - A - CONH - Rink - COO - 2MeO - CONH - R I piperidina (remoção de FMOC) NH2 - A - CONH - Rink - COO - 2MeO - CONH - R i dividir em n alíquotas
Í^sLnU acoplar a diferentes ácidos X1 ....Xn - COOH X1 ....Xn - CONH - A - CONH - Rink - COO - 2MeO - CONH - R illi! Separar os linkers marcados da resina com TFA a 1% ·
X1 ....Xn - CONH - A-CONH - Rink - C02H acoplar a n oligos (oligol.....oligo(n)) (p.ex., através de ésteres Pfp) X1 .. .Xn - CONH - A - CONH - Rink - CONH - oligol____oligo(n) I fazer um “pool” dos oligos marcados I realizar a reacção de sequenciação i separar os fragmentos de diferentes extensões resultantes da reacção de sequenciação (p.ex., por HPLC ou CE) 49 1 separar os marcadores dos linkers com TFA a 25%-100%
X1.....Xn - CONH - A - CONH Ί- analisar por espectrometria de massa A sequência de passos do Método 2 é a seguinte: OH - 1 MeO - C02 - All I FMOC - NH - A - CO2H; acoplamento (p.ex., HBTU) FMOC - NH - A - COO - 1MeO - C02 - All i Paládio (remoção do Alilo)
FMOC - NH - A - COO - 1 MeO - C02H I OH - 2MeO - CONH - R; acoplamento (p.ex., HBTU) FMOC - NH - A - COO - 1 MeO - COO - 2MeO - CONH - R ύ piperidina (remoção de FMOC) NH2 - A - COO - 1 MeO - COO - 2MeO - CONH - R i dividir em n alíquotas
acoplar a diferentes ácidos X1....Xn - C02H X1. ...Xn - CONH - A - COO - 1MeO - COO - 2MeO - CONH - R Separar os linkers marcados da resina com TFA a 1%
Χ1....ΧΠ - CONH - A - COO - 1MeO - C02H UUi acoplar a n oligos (oligol.....oligo(n)) (p.ex., através de ésteres Pfp) X1....Xn - CONH - A - COO - 1MeO - CONH - oligol ....oligo(n) i fazer um “pool” dos oligos marcados i realizar a reacção de sequenciação 50 ϊ i separar os fragmentos de diferentes extensões resultantes da reacção de sequenciação (p.ex., por HPLC ou CE) I separar os marcadores dos linkers com TFA a 25%-100%
X1.....Xn - CONH - A - C02H i analisar por espectrometria de massa 2. Linkers
Um componente de “linker” (ou L) tal como aqui é usado, tanto pode traduzir uma ligação covalente directa como um grupo químico orgânico que é utilizado para ligar um “marcador” (ou T) a uma “molécula de interesse” (MOI) através de ligações químicas covalentes. Adicionalmente, a ligação directa em si, ou uma ou mais ligações no seio do componente de linker, são passíveis de corte sob condições que permitem que T seja libertado (por outras palavras, cortado) a partir da porção remanescente do composto T-L-X (incluindo o componente MOI). O componente variável do marcador que se encontra presente no seio de T deverá ser estável face às condições de corte de ligações. De preferência, a reacção de corte é efectuada rapidamente, no espaço de alguns minutos, e de preferência em cerca de 15 segundos ou menos.
Em geral, um linker é usado para ligar um elemento pertencente a um grande conjunto de marcadores a um elemento de um conjunto similarmente vasto de MOIs. Tipicamente, uma só combinação de marcador-linker é ligada a cada MOI (originando diversos T-L-MOI), mas em alguns casos poderá ser ligada mais do que uma combinação de marcador-linker a cada MOI individual (originando diversos (T-L)n-MOI). Em outra forma de realização do presente invento, são ligados dois ou mais marcadores a um só linker através de locais múltiplos e independentes no linker, e esta combinação múltipla de marcador-linker é então ligada a uma MOI individual (originando diversos (T)n-L-MOI). 51
Após diversas manipulações do conjunto de MOIs marcadas, são usadas condições químicas e/ou físicas especiais para cortar uma ou mais ligações covalentes no seio do linker, resultando na libertação dos marcadores a partir das MOIs. A(s) ligação(ões) passível(eis) de corte poderão corresponder ou não a algumas das ligações que se formaram quando o marcador, o linker e a MOI foram ligados entre si. A concepção do linker determinará em grande medida o conjunto de condições sob as quais será realizada a reacção de corte de ligações. Assim, os linkers poderão também ser identificados segundo as condições de corte a que são particularmente susceptíveis. Quando um linker é fotolábil (i.e., susceptível a corte de ligações por exposição a radiação actínica), o linker pode ser designado por Lhv. Do mesmo modo, poderão usar-se as designações |_acid0, Lbase, L[01, L[R1, Lenz, Lelc, Ι_Λ e Lss para designar linkers que são particularmente susceptíveis a corte de ligações por ácido, base, oxidação química, redução química, a actividade catalítica de uma enzima (mais simplesmente “enzima"), oxidação ou redução electroquímica, temperatura elevada (“térmica”) e troca de tióis, respectivamente.
Certos tipos de linker são lábeis a um só tipo de reacção de corte de ligações, enquanto que outros são lábeis face a vários tipos de condições de corte. Adicionalmente, em linkers que têm a capacidade de se ligar a múltiplos marcadores (originando estruturas do tipo (T)n-L-MOI), cada um dos locais de ligação ao marcador poderá ser lábil face a diferentes condições de corte. Por exemplo, num linker que esteja ligado a dois marcadores, um dos marcadores poderá ser lábil apenas a bases e o outro apenas a fotólise.
Um linker com utilidade no âmbito deste invento possui vários atributos: 1) O linker possui uma âncora química (Lh) através da qual se pode ligar a uma MOI. 2) O linker possui uma segunda âncora química separada (Lh) através da qual o marcador se liga ao linker. Se ocorrer a ligação de diversos marcadores a um só iinker (estruturas de tipo (T)n-L-MOI), existirá uma âncora química separada para cada marcador. 3) O linker é estável face a todas as manipulações a que é submetido, com a excepção das condições que permitem o corte das ligações de modo a que uma 52 porção molecular contendo T se liberte da porção remanescente do composto, incluindo a MOI. Assim, o linker é estável durante os passos de ligação do marcador ao linker, de ligação do linker à MOI e de quaisquer manipulações da MOI enquanto o marcador e o linker (T-L) se encontram ligados a esta. 4) O linker não interfere de modo significativo com as manipulações efectuadas sobre a MOI enquanto o conjunto T-L se mantém ligado a esta. Por exemplo, se T-L estiver ligado a um oligonucleótido, o T-L não poderá interferir de forma significativa com quaisquer reacções de hibridização ou reacções enzimáticas (p.ex., PCR) realizadas sobre o oligonucleótido. Do mesmo modo, se T-L estiver ligado a um anticorpo, não poderá interferir significativamente com o reconhecimento do antigénio pelo anticorpo. 5) O corte do marcador a partir da porção remanescente do composto ocorre de modo altamente controlado, usando processos físicos ou químicos que não afectam adversamente a detectabilidade do marcador.
Para qualquer linker, é preferido que o linker se possa ligar a uma grande variedade de MOIs, e que uma grande variedade de marcadores se possa ligar ao linker. Esta flexibilidade é vantajosa porque permite que uma colecção de conjugados T-L, uma vez preparada, possa ser usada com vários conjuntos diferentes de MOIs.
Tal como acima foi exposto, um linker preferido possui a fórmula
Lh-L1-L2-L3-Lh em que cada Lh é uma âncora química que pode ser usada para ligar o linker a um reagente de marcador e a um reagente de molécula de interesse. L2 forma uma parte essencial do linker, uma vez que L2 confere labilidade ao linker. L1 e L3 são grupos opcionais que servem, na realidade, para separar L2 das âncoras Lh. L1 (que. por definição, se encontra mais próximo de T do que L3) serve para separar T da porção lábil requerida L2. Esta separação poderá ser útil quando a reacção de corte origina espécies particularmente reactivas (p.ex., radicais livres) que poderão causar alterações aleatórias na estrutura da porção molecular contendo 53 T. Uma vez que o local de corte de ligações se encontra mais separado da porção molecular contendo T, existe uma menor probabilidade de que a espécie reactiva formada ao nível do local de corte quebre a estrutura da porção molecular contendo T. Adicionalmente, uma vez que os átomos de L1 se encontrarão tipicamente presentes na porção molecular contendo T, estes átomos de L1 poderão conferir uma qualidade desejável à porção molecular contendo T. Por exemplo, nos casos em que a porção molecular contendo T corresponde a uma porção molecular contendo TMS, e uma amina bloqueada se encontra desejavelmente presente como parte da estrutura da porção molecular contendo TMS (para servir, p.ex., como um MSSE), a amina bloqueada poderá encontrar-se presente na porção lábil L1.
Em outros casos, L1 e/ou L3 poderão encontrar-se presentes num componente de linker simplesmente por o fornecedor comercial do linker optar por comercializar o linker sob uma forma que inclua um grupo L1 e/ou L3. Em tal caso, não existe inconveniente em utilizar linkers que possuam grupos L1 e/ou L3 (desde que esse grupo não iniba a reacção de corte de ligações), mesmo que estes grupos possam não contribuir com qualquer vantagem particular de performance para os compostos que os incorporam. Assim, o presente invento permite que estejam presentes no componente de linker grupos L1 e/ou L3.
Os grupos L1 e/ou L3 poderão corresponder a uma ligação directa (caso em que o grupo não estará efectivamente presente), a um grupo hidrocarbileno (p.ex., alquileno, arileno, cicloalquileno, etc.), -O-hidrocarbileno (p.ex., -O-CH2-, O-CH2CH(CH3)-, etc.) ou hidrocarbileno-(0-hidrocarbileno)w-, em que.w é um índice que varia entre 1 e 10 (p.ex., -CH2-0-Ar-, -CH2-(0-CH2CH2)4-, etc.).
Com 0 advento da síntese em fase sólida, foi desenvolvido um grande volume de publicações que se debruçam sobre linkers lábeis a condições de reacção específicas. Numa reacção típica de síntese em fase sólida, um suporte sólido é ligado através de um linker a um local reactivo, e uma molécula a ser sintetizada é gerada a nível do local reactivo. Quando a síntese da molécula se encontra completa, a construção de suporte sólido-linker-molécula é submetida a condições de corte de ligações que libertam a molécula do suporte sólido. Os linkers lábeis que foram desenvolvidos para uso neste contexto (ou que podem ser usados neste contexto) poderão também ser usados como reagente de linker neste invento. 54
Lloyd-Williams, P., et al., “Convergent Solid-Phase Peptide Synthesis”, Relatório Tetrahedron N° 347, 49(48):11065-11133 (1993) fornece uma extensa lista de linkers lábeis à radiação actínica (i.e., à fotólise), assim como a ácidos, bases e outras condições de quebra de ligações. São bem conhecidas da técnica outras fontes de informação sobre linkers lábeis.
Tal como se descreveu acima, as diferentes concepções do linker farão com que a sua susceptibilidade ao corte fiabilidade") se verifique sob diferentes condições específicas, físicas ou químicas. Os exemplos de condições que proporcionam o corte de ligações em diversos tipos de linker incluem as condições ácidas, básicas, de oxidação, redução, fluoretos, troca de tióis, fotólise e acção enzimática.
Os exemplos de linkers susceptíveis ao corte que satisfazem os critérios gerais para linkers acima apresentados são bem conhecidos dos técnicos e incluem os compostos listados no catálogo de Pierce (Rockford, JL). Os exemplos incluem: • glicobis(succinimidilsuccinato) de etileno (EGS), um reagente de “cross-linking" (que estabelece ligações cruzadas) reactivo a aminas e que sofre quebra de ligações por acção da hidroxilamina (1 M a 37°C durante 3-6 horas); • tartarato de disuccinimidilo (DST) e sulfo-DST, que são reagentes de cross-linking reactivos a aminas, susceptíveis ao corte por periodato de sódio a 0,015 M; » bis[2-(succinimidiloxicarboniloxi)etil]sulfona (BSOCOES) e sulfo-BSOCOES, que são reagentes de cross-linking reactivos a aminas, susceptíveis ao corte por base (pH 11,6); • 1,4-di-[3’-(2’-piridilditio(propionamido))butano (DPDPB), um piridilditiol, reagente de crosslinking susceptível ao corte por troca de tióis ou por redução; • N-[4-(p-azidosalicilamido)-butil]-3’-(2’-piridilditio)propionamida (APDP), um piridilditiol, reagente de crosslinking susceptível ao corte por troca de tióis ou por redução; 55 * Bis-[beta-4-(azidosalicilamido)etil]disulfureto, um reagente de crosslinking fotoreactivo que é susceptível ao corte por troca de tióis ou por redução: * N-succinimidil-(4-azidofenil)-1,3’ditiopropionato (SADP), um reagente de crosslinking fotoreactivo que é susceptível ao corte por troca de tióis ou por redução; • sulfosuccinimidil-2-(7-azido-4-metilcumarina-3-acetamida)etil-1,3-ditiopropionato (SAED), um reagente de crosslinking fotoreactivo que é susceptível ao corte por troca de tióis ou por redução; • sulfosuccinimidil-2-(m-azido-o-nitrobenzamido)-etil-1,3’-ditiopropionato (SAND), um reagente de crosslinking fotoreactivo que é susceptível ao corte por troca de tióis ou por redução. São em seguida fornecidos outros exemplos de linkers susceptíveis a corte e de condições que podem ser usadas para libertar os marcadores. Um grupo linker de sililo pode ser cortado por fluoretos ou por condições acídicas. O linker 2-nitrobenziloxi 3-, 4-, 5- ou 6-substituído ou o 4-nitrobenziloxi 2-, 3-, 5- ou 6-substituído podem ser cortados por uma fonte de fotões (fotólise). O linker 2-alcoxifenoxi 3-, 4-, 5- ou 6-substituído ou o 4-alcoxifenoxi 2-, 3-, 5- ou 6-substituído podem ser cortados por Ce(NH4)3(N03)6 (oxidação). Um linker de NC02 (uretano) pode ser cortado por hidróxido (base), ácido ou LiAIH4 (redução). Um' grupo linker de 3-pentenilo, 2-butenilo ou 1-butenilo pode ser cortado por O3, 0504/l04' ou KMn04 (oxidação). Um linker de 2-[furil 3-, 4- ou 5-substituído]oxi pode ser cortado por 02, Br2, MeOH ou ácido.
As condições para o corte de outros linkers lábeis incluem: os linkers de t-alquiloxi podem ser cortados por ácido; os linkers de metil(dialquil)metoxi ou 2-alquil-1.3-dioxano-2-ilo 4-substituído podem ser cortados por H30+; os grupos 2-sililetoxi podem ser cortados por fluoretos ou ácido; os linkers 2-(X)-etoxi (em que X = ceto, amida de éster, ciano, N02, sulfureto, sulfóxido, sulfona) podem ser cortados sob condições alcalinas; os linkers benziloxi 2-, 3-, 4-, 5- ou 6-substituídos podem ser cortados por condições acídicas ou de redução; os linkers de buteniloxi podem ser cortados por (Ph3P)3RhCI(H); os linkers 2-bromofenoxi 3-, 4-, 5- ou 6-substituídos 56
podem ser cortados por Li, Mg ou BuLi; os linkers de metiltiometoxi podem ser cortados por Hg2+; os linkers de 2-(X)-etiloxi (em que X = um halogénio) podem ser cortados por Zn ou Mg; os linkers de 2-hidroxietiloxi podem ser cortados por oxidação (p.ex., com Pb(OAc)4).
Os linkers preferidos são os susceptíveis a corte por ácido ou por fotólise. Diversos linkers que foram desenvolvidos para a síntese de péptidos em fase sólida têm utilidade na ligação de marcadores às MOIs. Alguns destes linkers estão descritos numa publicação recente de Lloyd-Williams et al. (Tetrahedron 49:11065-11133, 1993). Um tipo útil de linker é baseado em álcoois p-alcoxibenzílicos, dois dos quais, o ácido 4-hidroximetilfenoxiacético e o ácido 4-(4-hidroximetil-3-metoxifenoxi)butírico, são comercializados pela Advanced ChemTech (Louisville, KY). Ambos os linkers se podem ligar a um marcador através de uma ligação éster ao benzilálcool, e a uma MOI que contenha uma amina através de uma ligação amida ao ácido carboxílico. Os marcadores ligados a estas moléculas são libertados da MOI por acção de concentrações variáveis de ácido trifluoroacético. O corte de ligações destes linkers resulta na libertação de um ácido carboxílico no marcador. O corte por ácido das ligações entre marcadores e linkers como o 2,4-dimetoxi-4’-(carboximetiloxi)-benzidrilamina (fornecido pela Advanced ChemTech sob forma protegida por FMOC) resulta na libertação de uma amida carboxílica no marcador libertado.
Na sua maioria, os linkers fotolábeis com utilidade no âmbito deste pedido de patente foram também desenvolvidos para a síntese de péptidos em fase sólida (ver a publicação de Lloyd-Williams). Estes linkers têm geralmente por base os 2-nitrobenzilésteres ou as 2-nitrobenzilamidas. Como exemplos de linkers fotolábeis recentemente referidos na literatura encontram-se o ácido 4-(4-(1-Fmoc-amino)etil)-2-metoxi-5-nitrofenoxi)butanóico (Holmes e Jones, J. Org. Chem. 60:2318-2319, 1995) e o ácido (3-Fmoc-amino)3-(2-nitrofenil)propiónico (Brown et al., Molecular Diversity 1:4-12, 1995). Ambos os linkers se podem ligar por meio do ácido carboxílico a uma amina presente na MOI. A ligação do marcador ao linker é efectuada através da formação de uma amida entre um ácido carboxílico do marcador e a amina do linker. O corte de ligações dos linkers fotolábeis é geralmente efectuado por meio de radiação UV com um comprimento de onda de 57 350 nm, usando intensidades e períodos de tempo conhecidos da técnica. O corte de ligações dos linkers resulta na libertação de uma amida primária no marcador. Os exemplos .de linkers fotolábeis incluem ésteres de nitrofenil-glicina. cloretos e metanosulfonatos de exo- e endo-2-benzonorborneilo e o ácido 3-amino-3(2-nitrofenil)propiónico. Como exemplos de corte enzimático de ligações encontram-se o corte de ligações éster pelas esterases, o corte das ligações fosfodiéster por acção das nucleases, o corte das ligações peptídicas pelas proteases, etc.
Um componente de linker preferido possui uma estrutura orto-nitrobenzílica, tal como se mostra abaixo: d
em que um átomo de carbono numa das posições a, b, c, d ou e é substituído por -L3-X, e L1 (que corresponde de preferência a uma ligação directa) está presente à esquerda de N(R1) na estrutura acima. Um tal componente de linker é susceptível ao corte selectivo foto-induzido da ligação entre o carbono marcado como "a" e N(R1). Tipicamente, a identidade de R1 não é critica para a reacção de corte da ligação; no entanto, R1 corresponde preferencialmente a hidrogénio ou hidrocarbilo. O presente invento prevê que, na estrutura acima, -N(R1)- possa ser substituído por -0-. Igualmente na estrutura acima, uma ou maís das posições b, c, d ou e poderá opcionalmente ser substituída com um grupo alquilo, alcoxi, fluoreto, cloreto, hidroxilo, carboxilato ou amida, sendo estes substituintes seleccionados de modo independente em cada ocorrência.
Um outro componente de linker preferido que possui uma âncora química Lh apresenta a seguinte estrutura: d
58 em que uma ou mais das posições b, c, d ou e é substituída com hidrogénio, alquilo, alcoxi, fluoreto, cloreto, hidroxilo, carboxilato ou amida, R1 corresponde a hidrogénio ou hidrocarbilo e R2 corresponde a -OH ou a um grupo que protege ou activa um ácido carboxílico para a ligação com outra porção molecular. Os grupos de fluorocarbono e hidrofluorocarbono constituem grupos preferidos que activam um ácido carboxílico para a ligação a outra porção molecular. 3. Molécula de Interesse (MOI)
Os exemplos de MOIs incluem ácidos nucleicos ou análogos de ácidos nucleicos (p.ex., PNA), fragmentos de ácidos nucleicos, ácidos nucleicos sintéticos ou seus fragmentos, oligonucleótidos (p.ex., DNA ou RNA), proteínas, péptidos, anticorpos ou fragmentos de anticorpos, receptores, ligendos de receptores, membros de um par de ligandos, citoquinas, hormonas, oligossacáridos, moléculas orgânicas sintéticas, fármacos e combinações de todos estes elementos.
As MOIs preferidas correspondem a fragmentos de ácidos nucleicos. Os fragmentos de ácidos nucleicos preferidos constituem sequências de primer que são complementares de sequências presentes em vectores, sendo os vectores usados em sequenciação de bases. De preferência, um fragmento de ácido nucleico é ligado directa ou indirectamente a um marcador num local distinto da extremidade 3’ do fragmento; e mais preferencialmente a nível da extremidade 5’ do fragmento. Os fragmentos de ácidos nucleicos podem ser adquiridos comercialmente ou preparados a partir de bases de dados genéticas (p.ex., Dib et al., Nature 380:152-154, 1996 e CEPH Genotype Database, http://www.cephb.fr) e fornecedores comerciais (p.ex., Promega, Madison, Wl).
Tal como aqui é usado, o termo MOI inclui derivados de uma MOI que contêm funcionalidades úteis para a ligação da MOI ao composto T-L-U. Por exemplo, uma molécula de ácido nucleico que possui uma ligação fosfodiéster a nível da extremidade 5’, em que o fosfodiéster se encontra igualmente ligado a uma alquilenoamina, constitui uma MOI. Uma tal MOI encontra-se descrita, p.ex., na Patente dos EUA n° 4.762.779, que é aqui incorporada para referência. Um ácido nucleico contendo uma modificação interna constitui igualmente uma MOI. Um exemplo de modificação interna de um fragmento de ácido nucleico ocorre quando 59 uma base (p.ex., adenina, guanina, citosina, timidina, uracilo) é modificada para adicionar um grupo funcional reactivo. Tais fragmentos de ácidos nucleicos com uma modificação interna são comercializados, p.ex., pela empresa Glen Research, Herndon, VA. Outro exemplo de modificação interna de um fragmento de ácido nucleico ocorre quando um fosforamidato abásico é usado para sintetizar um fosfodiéster modificado que é interposto entre um grupo açúcar e um grupo fosfato de um fragmento de ácido nucleico. O fosforamidato abásico contém um grupo reactivo que possibilita a ligação de um fragmento de ácido nucleico contendo esta porção molecular derivada do fosforamidato a uma outra porção molecular, p.ex. um composto T-L-U. Tais fosforamidatos abásicos são comercializados, p.ex., pela empresa Clonetech Laboratories, Inc., Paio Alto, CA. 4. Âncoras químicas (Lh)
Uma âncora química constitui um arranjo atómico estável mas reactivo presente como parte de uma primeira molécula, sendo que a âncora pode sofrer uma reacção química com uma âncora química complementar presente como parte de uma segunda molécula de modo a se formar uma ligação covalente entre as duas moléculas. Por exemplo, a âncora química poderá ser um grupo hidroxilo e a âncora química complementar poderá ser um grupo de ácido carboxílico (ou um seu derivado activado, p.ex., um éster de hidrofluoroarilo), sendo que a reacção entre estas duas âncoras forma uma ligação covalente (especificamente, uma ligação éster) que une as duas moléculas.
As âncoras químicas poderão ser usadas num grande número de reacções formadoras de ligações covalentes que são adequadas para ligar marcadores a linkers, e linkers a MOIs. Tais reacções incluem a alquilação (p.ex.. para formar éteres, tioéteres), acilação (p.ex., para formar ésteres, amidas, carbamatos, ureias, tioureias), fosforilação (p.ex., para formar fosfatos, fosfonatos, fosforamidas, fosfonamidas), sulfonilação (p.ex. para formar sulfonatos, sulfonamidas), condensação (p.ex., para formar iminas, oximas, hidrazonas), sililação, formação de dissulfuretos e geração de intermediários reactivos, tais como nitrenos e carbenos, por fotólise. Em geral, as âncoras e as reacções de formação de ligações que são adequadas para a ligação de marcadores a linkers são também apropriadas para a
ligação de linkers a MOIs, e vice-versa. Em alguns casos, a MOI poderá sofrer uma prévia modificação ou derivatização para se obter a âncora necessária à ligação com o linker.
Um tipo de ligação especialmente útil para a ligação de linkers a MOIs é a ligação dissulfureto. A sua formação requer a presença de um grupo tiol (“âncora”) no linker e de outro grupo tiol na MOI. É então suficiente utilizar condições suaves de oxidação para ligar os dois tióis sob a forma de dissulfureto. A formação da ligação dissulfureto poderá também ser induzida através do uso de um excesso de um reagente apropriado de transferência de dissulfuretos, p.ex., disulfuretos de piridilo. Uma vez que a formação de dissulfuretos é facilmente reversível, o dissulfureto poderá também ser usado como ligação susceptível de corte para libertar o marcador, se desejado. Tal é tipicamente realizado sob condições suaves semelhantes, usando um excesso de um reagente apropriado de transferência de tióis, p.ex., ditiotreitol. A formação de ligações amida reveste-se de particular interesse na ligação de marcadores (ou marcadores com linkers) a oligonucleótidos. Podem introduzir-se facilmente âncoras de aminas alifáticas primárias em oligonucleótidos sintéticos com fosforamiditos, tal como o 6-monometoxitritilhexilcianoetil-N,N-diisopropil-fosforamidito (disponível através da Glenn Research, Sterling, VA). As aminas encontradas em nucleótidos naturais como a adenosina e a guanosina são virtualmente não reactivas quando comparadas com a amina primária introduzida. Esta diferença de reactividade faz com que seja possível a formação selectiva de amidas e grupos de ligação relacionados (p.ex., ureias, tioureias, sulfonamidas) com a amina primária introduzida e não com as aminas nucleotídicas.
Tal como listado no catálogo de Sondas Moleculares (Eugene, OR), uma enumeração parcial de grupos funcionais reactivos com aminas inclui ésteres carboxílicos activados, isocianatos, isotiocianatos, haletos de sulfonilo e diclorotriazenos. Os ésteres activos constituem excelentes reagentes para a modificação de aminas, uma vez que os produtos de amida que se formam são muito estáveis. Adicionalmente, estes reagentes exibem uma boa reactividade com as aminas alifáticas e baixa reactividade com as aminas nucleotídicas dos oligonucleótidos. Os exemplos de ésteres activos incluem os ésteres de N- 61 hidroxisuccinimida, os ésteres de pentafluorofenilo, os ésteres de tetrafluorofenilo e os ésteres de p-nitrofenilo. Os ésteres activos são também úteis por poderem ser produzidos a partir de virtualmente qualquer molécula que contenha um ácido carboxílico. Os métodos de produção de ésteres activos encontram-se listados em Bodansky (Principies ofPeptide Chemistry (2a ed.), Springer Verlag, Londres, 1993). 5. Ligação ao Linker
Tipicamente, é usado apenas um tipo de linker para ligar um conjunto ou família particular de marcadores a um conjunto ou família particular de MOIs. Numa forma de realização preferida para o invento, pode seguir-se um procedimento único e uniforme para criar todas as variantes de estruturas T-L-MOI. Tal torna-se especialmente vantajoso quando o conjunto de estruturas T-L-MOI é vasto, uma vez que permite a preparação do conjunto através da utilização dos métodos da química combinatorial ou de outra tecnologia de processamento em paralelo. De forma similar, o uso de um só tipo de linker permite a utilização de um procedimento único e uniforme para o corte de ligações em todas as variantes de estruturas T-L-MOI. De novo, isto torna-se vantajoso quando se tem um conjunto vasto de estruturas T-L-MOI, uma vez que o conjunto pode ser processado de forma paralela, repetitiva e/ou automatizada.
Existe, no entanto, outra forma de realização do presente invento segundo a qual são usados dois ou mais tipos de linker para ligar diferentes subconjuntos de marcadores a subconjuntos correspondentes de MOIs. Neste caso, poderão utilizar-se condições de corte selectivo de ligações para cortar cada um dos linkers de modo independente, sem cortar os linkers presentes em outros subconjuntos de MOIs.
Existem muitas reacções de formação de ligações covalentes que são adequadas para ligar os marcadores aos linkers, e os linkers às MOIs. Estas reacções incluem a alquilação (p.ex., para formar éteres, tioéteres), acilação (p.ex., para formar ésteres, amidas, carbamatos, ureias, tioureias), fosforilação (p.ex., para formar fosfatos, fosfonatos, fosforamidas, fosfonamidas), condensação (p.ex., para formar iminas, oximas, hidrazonas), sililação, formação de dissulfuretos e geração de intermediários reactivos, tais como os nitrenos ou carbenos, por fotólise. Em geral, as âncoras e as reacções de formação de ligações que são adequadas para 62
1 "Τ "Ο" efectuar a ligação dos marcadores aos linkers são também apropriadas para ligar os linkers às MOI, e vice-versa. Em alguns casos, a MOI poderá sofrer uma prévia modificação ou derivatização para fornecer a âncora necessária à ligação com o linker.
Um tipo de ligação especialmente útil para a ligação de linkers a MOIs é a ligação dissulfureto. A sua formação requer a presença de um grupo tiol (“âncora”) no linker e de outro grupo tiol na MOI. É então suficiente utilizar condições suaves de oxidação para ligar os dois tióis sob a forma de dissulfureto. A formação da ligação dissulfureto poderá também ser induzida através do uso de um excesso de um reagente apropriado de transferência de dissulfuretos, p.ex., disulfuretos de piridilo. Uma vez que a formação de dissulfuretos é facilmente reversível, o dissulfureto poderá também ser usado como ligação susceptível de corte para libertar o marcador, se desejado. Tal é tipicamente realizado sob condições suaves semelhantes, usando um excesso de um reagente apropriado de transferência de tióis, p.ex., ditiotreitol. A formação de ligações amida reveste-se de particular interesse na ligação de marcadores a oligonucleótidos. Podem introduzir-se facilmente âncoras de aminas alifáticas primárias em oligonucleótidos sintéticos com fosforamiditos, tal como o 6-monometoxitritilhexilcianoetil-N,N-diisopropil-fosforamidito (disponível através da Glenn Research, Sterling, VA). As aminas encontradas em nucleótidos naturais como a adenosina e a guanosina são virtualmente não reactivas quando comparadas com a amina primária introduzida. Esta diferença de reactividade faz com que seja possível a formação selectiva de amidas e grupos de ligação relacionados (p.ex., ureias, tioureias, sulfonamidas) com a amina primária introduzida e não com as aminas nucleotídicas.
Tal como listado no catálogo de Sondas Moleculares (Eugene, OR), uma enumeração parcial de grupos funcionais reactivos com aminas inclui ésteres carboxílicos activados, isocianatos, isotiocianatos, haletos de sulfonilo e diclorotriazenos. Os ésteres activos constituem excelentes reagentes para a modificação de aminas, uma vez que os produtos de amida que se formam são muito estáveis. Adicionalmente, estes reagentes exibem uma boa reactividade com as aminas alifáticas e baixa reactividade com as aminas nucleotídicas dos 63 1 oligonucleótidos. Os exemplos de ésteres activos incluem os ésteres de N-hidroxisuccinimida, os ésteres de pentafluorofenilo, os ésteres de tetrafluorofenilo e os ésteres de p-nitrofenilo. Os ésteres activos são também úteis por poderem ser produzidos a partir de virtualmente qualquer molécula que contenha um ácido carboxílico. Os métodos de produção de ésteres activos encontram-se listados em Bodansky (Principies of Peptide Chemistry(2a ed.), Springer Verlag, Londres, 1993).
Existem numerosos reagentes comerciais de cross-linking que podem usar-se como linkers (p.ex., ver Cross-linkers no Catálogo Pierce, Pierce' Chemical Co., Rockford, IL). Entre estes encontram-se reagentes de cross-linking homobifuncionais reactivos com aminas que são exemplificados por imidoésteres homobifuncionais e ésteres de N-hidroxisuccinimidilo (NHS). Existem igualmente reagentes heterobifuncionais de cross-linking possuindo dois ou mais grupos reactivos diferentes que são responsáveis pelas reacções sequenciais. Os imidoésteres reagem rapidamente com aminas a pH alcalino. Os ésteres NHS geram produtos estáveis por reacção com aminas primárias ou secundárias. As maleimidas, os haletos de alquilo e arilo, os alfa-haloacilos e os dissulfuretos de piridilo reagem com tióis. As maleimidas são específicas para os grupos sulfidrilo dos tióis a pH 6,5-7,5, e a pH alcalino podem tornar-se reactivas com aminas. A ligação tioéter é estável sob condições fisiológicas. Os reagentes de cross-linking de tipo alfa-haloacetilo contêm o grupo iodoacetilo e são reactivos face aos sulfidrilos. Os imidazóis têm a capacidade de reagir com a porção molecular de iodoacetilo, mas a reacção é muito lenta. Os dissulfuretos de piridilo reagem com os grupos tiol para formar uma ligação dissulfureto. As carbodiimidas estabelecem a ligação de carboxilos com aminas primárias de hidrazidas, o que dá origem à formação de uma ligação acil-hidrazina. As arilazidas constituem reagentes de fotoafinidade que são quimicamente inertes até serem expostas a radiação UV ou a luz visível. Quando estes compostos são fotolisados a 250-460 nm, forma-se um nitreno de arilo reactivo. O nitreno de arilo reactivo é relativamente não específico. Os glioxais são reactivos face à porção de guanidinilo da arginina.
Numa forma de realização típica do presente invento, um marcador é inicialmente ligado a um linker; em seguida, a combinação de marcador e linker é ligada a uma MOI para criar a estrutura T-L-MOI. Alternativamente, a mesma 64
estrutura é criada ligando inicialmente um linker a uma MOI, e ligando então o conjunto de linker e MOI a um marcador. Como exemplo temos a situação em que a MOI é um primer de DNA ou um oligonucleótido. Neste caso, o marcador é tipicamente ligado em primeiro lugar a um linker, sendo então o T-L ligado a um primer de DNA ou a um oligonucleótido, usando-se posteriormente o conjunto, por exemplo, numa reacção de sequenciação.
Um modo útil de ligar reversivelmente um marcador a uma MOI (p.ex., um oligonucleótido ou um primer para sequenciação de DNA) consiste em utilizar um linker quimicamente lábil. Uma concepção preferida para o linker permite-lhe ser cortado quando é exposto a um ácido orgânico volátil, por exemplo, ácido trifluoroacético (TFA). O TFA, em particular, é compatível com a maioria dos métodos de ionização em espectrometria de massa, incluindo o electrospray.
Tal como descrito em detalhe abaixo, o invento proporciona métodos de genotipagem para a análise de mutações. Uma composição útil pará um método de genotipagem compreende um conjunto de compostos com a fórmula:
Tms-L-MOI em que TMS é um grupo orgânico detectável por espectrometria de massa, formado por carbono, pelo menos um átomo de hidrogénio e de flúor, e átomos opcionais seleccionados a partir do grupo formado por oxigénio, azoto, enxofre, fósforo e iodo. Na fórmula, L é um grupo orgânico que permite que se dê o corte da ligação entre a porção molecular contendo TMS e a porção remanescente do composto, sendo que a porção molecular contendo TMS compreende um grupo funcional que suporta um estado ionizado de carga única quando o composto é submetido a espectrometria de massa e é seleccionado a partir do grupo de amina terciária, amina quaternária e ácido orgânico. Na fórmula, MOI corresponde a um fragmento de ácido nucleico, sendo que L é conjugado com MOI em outro local que não a extremidade 3'da MOI. Na composição, pelo menos dois compostos possuem o mesmo TMS mas os grupos MOI destas moléculas possuem extensões nucleotídicas não idênticas. 65
1' V"f
Outra composição com utilidade para o método de genotipagem compreende uma pluralidade de compostos possuindo a fórmula:
Tms-L-MOI em que TMS é um grupo orgânico detectável por espectrometria de massa, formado por carbono, pelo menos um átomo de hidrogénio e de flúor, e átomos opcionais seleccionados a partir do grupo formado por oxigénio, azoto, enxofre, fósforo e iodo. Na fórmula, L é um grupo orgânico que permite que se dê o corte da ligação entre a porção molecular contendo TMS e a porção remanescente do composto, sendo que a porção molecular contendo TMS compreende um grupo funcional que suporta um estado ionizado de carga única quando o composto é submetido a espectrometria de massa e é seleccionado a partir do grupo de amina terciária, amina quaternária e ácido orgânico. Na fórmula, MOI corresponde a um fragmento de ácido nucleico, sendo que L é conjugado com MOI em outro local que não a extremidade 3'da MOI. Na composição, pelo menos dois compostos possuem o mesmo TMS mas estes compostos possuem tempos de eluição não idênticos em cromatografia em coluna.
Outra composição com utilidade para o método de genotipagem compreende uma pluralidade de compostos possuindo a fórmula:
Tms-L-MOI em que TMS é um grupo orgânico detectável por espectrometria de massa, formado por carbono, pelo menos um átomo de hidrogénio e de flúor, e átomos opcionais seleccionados a partir do grupo formado por oxigénio, azoto, enxofre, fósforo e iodo. Na fórmula, L é um grupo orgânico que permite que se dê o corte da ligação entre a porção molecular contendo TMS e a porção remanescente do composto, sendo que a porção molecular contendo TMS compreende um grupo funcional que suporta um estado ionizado de carga única quando o composto é submetido a espectrometria de massa e é seleccionado a partir do grupo de amina terciária, amina quaternária e ácido orgânico. Na fórmula, MOI corresponde a um 66 fragmento de ácido nucleico, sendo que L é conjugado com MOI em outro local que não a extremidade 3'da MOI. Na composição, quaisquer dois compostos que possuam a mesma extensão nucleotídica da MOI não possuem o mesmo Tms.
Na composição acima, a pluralidade é de preferência superior a 2, e preferencialmente superior a 4. Adicionalmente, o fragmento de ácido nucleico da MOI possui uma sequência complementar a uma porção de um vector. sendo que o fragmento tem a capacidade de servir como primer na síntese de polinucleótidos. De preferência, os grupos Tms dos membros da pluralidade diferem em pelo menos 2 amu, e poderão diferir em pelo menos 4 amu. O invento proporciona ainda uma composição que compreende uma pluralidade de conjuntos de compostos, possuindo cada conjunto de compostos a fórmula:
Tms-I_-MOI em que TMS é um grupo orgânico detectável por espectrometria de massa, formado por carbono, pelo menos um átomo de hidrogénio e de flúor, e átomos opcionais seleccionados a partir do grupo formado por oxigénio, azoto, enxofre, fósforo e iodo. Na fórmula, L é um grupo orgânico que permite que se dê o corte da ligação entre a porção molecular contendo TMS e a porção remanescente do composto, sendo que a porção molecular contendo TMS compreende um grupo funcional que suporta um estado ionizado de carga única quando o composto é submetido a espectrometria de massa e é seleccionado a partir do grupo de amina terciária, amina quaternária e ácido orgânico. Na fórmula, MOI corresponde a um fragmento de ácido nucleico, sendo que L é conjugado com MOI em outro local que não a extremidade 3'da MOI. Na composição, os membros de um primeiro conjunto de compostos possuem grupos Tms idênticos mas os seus grupos MOI não são idênticos, verificando-se diferenças nos números de nucleótidos dos MOI, e existem pelo menos dez membros no primeiro conjunto de compostos, sendo que, entre os conjuntos, os grupos Tms diferem em pelo menos 2 amu. A pluralidade corresponde de preferência a pelo menos 3, e mais preferencialmente a pelo menos 5. 67 O invento fornece ainda uma composição que compreende uma pluralidade de conjuntos de compostos, possuindo cada conjunto de compostos a fórmula:
Tms-L-MOI em que TMS é um grupo orgânico detectável por espectrometria de massa, formado por carbono, pelo menos um átomo de hidrogénio e de flúor, e átomos opcionais seleccionados a partir do grupo formado por oxigénio, azoto, enxofre, fósforo e iodo. Na fórmula, L é um grupo orgânico que permite que se dê o corte da ligação entre a porção molecular contendo TMS e a porção remanescente do composto, sendo que a porção molecular contendo TMS compreende um grupo funcional que suporta um estado ionizado de carga única quando o composto é submetido a espectrometria de massa e é seleccionado a partir do grupo de amina terciária, amina quaternária e ácido orgânico. Na fórmula, MOI corresponde a um fragmento de ácido nucleico, sendo que L é conjugado com MOI em outro local que não a extremidade 3'da MOI. Na composição, os membros de um mesmo conjunto possuem o mesmo tempo de eluição mas os seus grupos Tms não são idênticos.
Adicionalmente, o invento fornece um kit para genotipagem. O kit compreende uma pluralidade de pares de primers de amplificação, em que pelo menos um dos primers possui a fórmula:
Tms-L-MOI em que TMS é um grupo orgânico detectável por espectrometria de massa, formado por carbono, pelo menos um átomo de hidrogénio e de flúor, e átomos opcionais seleccionados a partir do grupo formado por oxigénio, azoto, enxofre, fósforo e iodo. Na fórmula, L é um grupo orgânico que permite que se dê o corte da ligação entre a porção molecular contendo TMS e a porção remanescente do composto, sendo que a porção molecular contendo TMS compreende um grupo funcional que suporta um estado ionizado de carga única quando o composto é submetido a espectrometria de massa e é seleccionado a partir do grupo de amina terciária, amina quaternária e ácido orgânico. Na fórmula, MOI corresponde a um 68 fragmento de ácido nucleico, sendo que L é conjugado com MOI em outro local que não a extremidade 3'da MOI; e cada par de primers se associa a um locus diferente. No kit, a pluralidade corresponde de preferência a pelo menos 3, e mais preferencialmente a pelo menos 5.
Tal como referido acima, o presente invento fornece composições e métodos para a determinação da sequência de moléculas de ácido nucleico. Abreviadamente, tais métodos compreendem de maneira geral os passos de (a) produzir fragmentos de ácido nucleico marcados que são complementares a uma molécula de ácido nucleico seleccionada (p.ex., fragmentos marcados) desde uma primeira extremidade a uma segunda extremidade de uma molécula de ácido nucleico, sendo que um marcador é correlacionável com um fragmento em particular e pode ser detectado por qualquer um de diversos métodos, (b) separar os fragmentos marcados pelo comprimento sequencial, (c) cortar e remover o marcador de um fragmento marcado, e (d) detectar os marcadores, determinando deste modo a sequência da molécula de ácido nucleico. Cada um destes aspectos será apresentado abaixo em maior detalhe.
B. MÉTODOS DE DIAGNÓSTICO 1. Introdução
Tal como salientado acima, o presente invento apresenta igualmente uma grande variedade de métodos no âmbito dos quais os marcadores e/ou linkers acima descritos podem ser utilizados em substituição dos marcadores tradicionais (p.ex., marcadores radioactivos ou enzimáticos), de modo a aumentar, para um dado método, a especificidade, a sensibilidade ou o número de amostras que podem ser analisadas em simultâneo. Os exemplos representativos de métodos que podem ser melhorados incluem, por exemplo, a amplificação de RNA (ver Lizardi et al., Bio/Technology 6:1197-1202, 1988; Krameretal., Nature 339:401-402, 1989; Lomeli et al., Clinicai Chem. 35(9):1826-1831, 1989; Patente dos EUA N° 4.786.600) e amplificação de DNA utilizando a LCR ou a reacção em cadeia por polimerase ("PCR") (ver Patentes dos EUA nos. 4.683.195, 4.683.202 e 54.800.159). 69
Num dos aspectos do invento, é facultado um método para a determinação da identidade de uma molécula ou fragmento de ácido nucleico (ou para a detecção da presença de uma molécula ou fragmento de ácido nucleico -seleccionados), compreendendo os passos de: (a) produzir moléculas de ácido nucleico marcadas a partir de uma ou mais moléculas-alvo de ácido nucleico seleccionadas, sendo que um marcador é correlacionável com um fragmento de ácido nucleico em particular e é detectável por meio de espectrometria não-fluorescente ou potenciometria, (b) separar os fragmentos marcados segundo as suas dimensões, (c) cortar e remover os marcadores dos fragmentos marcados, e (d) detectar os marcadores através de espectrometria não-fluorescente ou potenciometria, determinando deste modo a identidade das moléculas de ácido nucleico.
Segundo um aspecto derivado do invento, são fornecidos métodos para a detecção de uma molécula de ácido nucleico seleccionada, compreendendo os passos de (a) combinar sondas marcadas de ácido nucleico com moléculas-alvo de ácido nucleico, sob condições e durante o tempo suficiente para permitir a hibridização de uma sonda marcada de ácido nucleico com uma sequência-alvo complementar seleccionada de ácido nucleico, sendo que uma sonda marcada de ácido nucleico é detectável por espectrometria não fluorescente ou potenciometria, (b) alterar as dimensões das sondas marcadas hibridizadas, das sondas ou moléculas-alvo não hibridizadas ou dos híbridos de sonda:molécula-alvo, (c) separar as sondas marcadas por dimensões, (d) cortar e remover os marcadores das sondas marcadas, e (e) detectar os marcadores através de espectrometria não-fluorescente ou potenciometria, determinando deste modo a identidade da molécula de ácido nucleico seleccionada. Estas e outras técnicas relacionadas são abaixo descritas em maior detalhe.
2. PCR A PCR tem a capacidade de amplificar uma sequência de DNA desejada proveniente de qualquer fonte (vírus, bactéria, planta ou humano) em centenas de milhões de vezes num espaço de horas. A PCR é especialmente valiosa porque a reacção é altamente específica, facilmente automatizada e consegue amplificar quantidades mínimas de amostra. Por estas razões, a PCR teve um vasto impacto 70 sobre a medicina clínica, o diagnóstico de doenças genéticas, a ciência forense e a biologia da evolução.
Abreviadamente, a técnica de PCR é um processo baseado numa polimerase especializada, que tem a capacidade de sintetizar uma cadeia complementar a uma dada cadeia de DNA presente numa mistura que contenha as 4 bases de DNA e 2 fragmentos de DNA (primers, cada um com uma extensão de cerca de 20 bases) a flanquear a sequência-alvo. A mistura é aquecida para separar as cadeias do DNA de dupla cadeia que contém a sequência-alvo, sendo então arrefecida para permitir que (1) os primers encontrem e se liguem às suas sequências complementares nas cadeias separadas e (2) a polimerase realize a extensão dos primers até se formarem novas cadeias complementares. Os ciclos repetidos de aquecimento e arrefecimento multiplicam exponencialmente o DNA-alvo, uma vez que cada nova dupla cadeia se separa para formar dois moldes para nova síntese. Em cerca de 1 hora, 20 ciclos de PCR conseguem amplificar o alvo em 1 milhão de vezes.
No âmbito de uma das formas de realização do invento, são fornecidos métodos para a determinação da identidade de uma molécula de ácido nucleico, ou para a detecção da molécula de ácido nucleico seleccionada em, por exemplo, uma amostra biológica, utilizando a técnica de PCR. Abreviadamente, tais métodos compreendem os passos de produção de uma série de fragmentos ou moléculas de ácido nucleico marcados durante o PCR e de separação dos fragmentos resultantes segundo as suas dimensões. O passo de separação por dimensões pode ser realizado por meio de qualquer das técnicas aqui descritas, incluindo,· por exemplo, a electroforese em gel (p.ex., a electroforese em gel de poliacrilamida), ou preferencialmente a HPLC. Os marcadores são então cortados e removidos dos fragmentos separados e são detectados através da respectiva tecnologia de detecção. São aqui descritos exemplos de tais tecnologias, as quais incluem, por exemplo, a espectrometria de massa, a espectrometria em infravermelhos, a amperometria potenciostática ou a espectrometria em UV. 3. “Finqerprintinq” de RNA e Apresentação Diferencial
Quando o molde é constituído por RNA, o primeiro passo do “fingerprinting” é a transcrição reversa. Liang e Pardee (Science 257:967, 1992) foram os primeiros a 71 descrever um protocolo de “fingerprinting” de RNA, usando um primer para a transcrição reversa com base em oligo(dT) mas com uma “âncora” dé duas bases na extremidade 5’ (p.ex., oligo 5’-(dTn)CA-3’). A reacção de priming ocorre principalmente a nível da extremidade 5’ da cauda de poli(rA), e principalmente em sequências que acabam em 5’-UpG-poli(rA)-3\ com uma selectividade que se aproxima de um em 12 RNAs poliadenilados. Após a transcrição reversa e a desnaturação, é realizado um priming arbitrário sobre a primeira cadeia resultante de cDNA. A PCR pode então ser usada para produzir um “fingerprint” dos produtos que melhor correspondem aos primers e que derivam da extremidade 3’ dos mRNAs e dos RNAs heterogéneos poliadenilados. Este protocolo foi designado por “apresentação diferencial”.
Alternativamente, pode utilizar-se um primer arbitrário no primeiro passo da transcrição reversa, seleccionando as regiões internas do RNA que possuam correspondências de 6-8 bases com a extremidade 3’ do primer. A este passo segue-se o priming arbitrário da primeira cadeia resultante de cDNA, utilizando o mesmo primer arbitrário ou outro, e em seguida uma PCR. Este protocolo em particular pesquisa qualquer zona do RNA, incluindo os moldes abertos de leitura (Welsh et al., Nucl. Acids Res. 20:4965, 1992). Adicionalmente, o protocolo pode ser utilizado em RNAs que não estão poliadenilados, tais como muitos dos RNAs bacterianos. Esta variante do “fingerprinting” do RNA por PCR com primers arbitrários foi designada por RAP-PCR.
Se o “fingerprinting” do RNA por PCR com primers arbitrários for executado em amostras derivadas de células, tecidos ou outro material biológico que tenha sido submetido a diferentes tratamentos experimentais ou possua diferentes histórias de desenvolvimento, poderão detectar-se diferenças entre as amostras quanto à sua expressão genética. Para cada reacção, parte-se do princípio de que ocorre o mesmo número de eventos eficazes de duplicação por PCR, e que quaisquer diferenças nas concentrações iniciais dos produtos de cDNA são preservadas sob a forma de uma razão de intensidades no “fingerprint” final. Não existem relações significativas entre as intensidades das bandas encontradas numa só carreira de um gel, as quais são função do grau de correspondência e da abundância. No entanto, a razão entre as carreiras é preservada para cada RNA analisado, o que permite a detecção de RNAs de expressão diferencial. A razão de materiais de partida entre as amostras é mantida mesmo quando o número de ciclos é suficiente para saturar a reacção de PCR. Isto ocorre porque o número de duplicações requeridas para atingir a saturação é quase completamente controlado pelos produtos não variantes que formam a maior parte do “fingerprint”. Neste sentido, o “fingerprinting” por PCR difere do PCR convencional de um só produto, no qual a razão de materiais de partida entre amostras não é conservada, a não ser que os produtos sejam analisados na fase exponencial da amplificação.
Em uma das formas de realização do invento, são fornecidos métodos para a determinação da identidade de uma molécula de ácido nucleico ou para a detecção de uma molécula de ácido nucleico seleccionada proveniente de, por exemplo, uma amostra biológica, utilizando a técnica de “fingerprinting” de RNA. Abreviadamente, tais métodos compreendem geralmente os passos de produção de uma série de fragmentos marcados de ácido nucleico. Os fragmentos são gerados por PCR ou por esquemas de amplificação similares e são subsequentemente separados segundo as suas dimensões. O passo de separação por dimensões pode ser realizado, por exemplo, através de qualquer das técnicas aqui descritas, incluindo, por exemplo, a electroforese em gel (p.ex., electroforese em gel de poliacrilamida) ou preferencialmente HPLC. Os marcadores são seguidamente cortados e removidos dos fragmentos separados, sendo os marcadores então detectados através da tecnologia de detecção respectiva. Os exemplos representativos de tecnologias adequadas incluem a espectrometria de massa, a espectrometria em infravermelho, a amperometria potenciostática ou a espectrometria em UV. As quantidades relativas de quaisquer dados fragmentos de ácidos nucleicos não são importantes, mas a dimensão da banda é informativa quando referenciada a uma amostra de controlo. 4, PCR Baseado em Fluorescência no Polimorfismo de Conformação de Cadeias Simples (PCR-SSCP)
Para além da abordagem de RFLP, estão disponíveis diversos métodos de análise de polimorfismos causados por substituição de bases. Orita et al. conceberam um método de análise destes polimorfismos com base nas diferenças 73 conformacionais verificadas no DNA desnaturado. Abreviadamente, é utilizada a digestão por enzimas de restrição ou a PCR para produzir fragmentos de DNA relativamente pequenos que são então desnaturados e resolvidos por electroforese em geles não desnaturantes de poliacrilamida. As diferenças conformacionais entre os fragmentos de DNA de cadeia simples, resultantes da substituição de bases, são detectadas por mudanças da mobilidade electroforética. O emparelhamento de bases intra-cadeia cria conformações da cadeia simples que são altamente específicas de sequência e distintas quanto à sua mobilidade electroforética. No entanto, as percentagens de detecção em diferentes estudos utilizando um SSCP convencional variam de 35% até quase 100%, sendo que as percentagens de detecção mais elevadas requerem frequentemente a ocorrência de várias condições diferentes. Em princípio, o método pode igualmente ser usado para analisar polimorfismos baseados em inserções ou delecções curtas. Este método constitui uma das ferramentas mais poderosas para a identificação de mutações e delecções pontuais no DNA (SSCP-PCR, Dean etal., Ce//67:863, 1990).
Segundo uma das formas de realização do invento, são fornecidos métodos para a determinação da identidade de uma molécula de ácido nucleico ou para a detecção de uma molécula de ácido nucleico seleccionada em, por exemplo, uma amostra biológica, utilizando a técnica de PCR-SSP. Abreviadamente, tais métodos compreendem geralmente os passos de produção de uma série de fragmentos de ácido nucleico marcados. Os fragmentos gerados por PCR são então separados por dimensões. De preferência, o passo de separação por dimensões é não desnaturante e os fragmentos de ácido nucleico são desnaturados antes da metodologia de separação. O passo de separação por dimensões poderá utilizar, por exemplo, a electroforese em gel (p.ex., electroforese em gel de poliacrilamida) ou, de preferência, a HPLC. Os marcadores são então cortados e removidos dos fragmentos separados, sendo os marcadores em seguida detectados através da respectiva tecnologia de detecção (p.ex., espectrometria de massa, espectrometria em infravermelho, amperometria potenciostática ou espectrometria em UV). 74
5. “Fingerprintinq" por didesoxi (ddF)
Foi descrito um outro método (ddF, Sarkaret al., Genomics "/3:441, 1992) que detecta 100% das alterações de uma só base no gene do factor IX humano, quando testado de um modo retrospectivo e prospectivo. No total, foram detectadas 84 em 84 alterações de sequência diferentes por análise do DNA genómico de pacientes com hemofilia B.
Abreviadamente, nos pedidos de patente relativos a marcadores para genotipagem ou para outros fins, um dos métodos que pode ser utilizado é o de "fingerprinting” por didesoxi. Este método utiliza um terminador didesoxi numa reacção de sequenciação de Sanger. O princípio do método é o que se segue: um ácido nucleico alvo que se pretende sequenciar é colocado numa reacção que possui um terminador didesoxi complementar à base que se sabe ter sofrido mutação no ácido nucleico alvo. Por exemplo, se a mutação tiver resultado numa alteração de A->G, o ácido nucleico será colocado numa reacção com um terminador C-didesoxi. São usados primers de PCR para localizar e amplificar a sequência-alvo de interesse. Se a hipotética sequência-alvo contiver a alteração A- >G, a dimensão de uma população de sequências será alterada devido à incorporação de um terminador didesoxi nas sequências amplificadas. Nesta aplicação particular dos marcadores, seria gerado um fragmento que possuiria uma dimensão previsível no caso de uma mutação. Os marcadores ligar-se-iam à extremidade 5’ dos primers de PCR e forneceriam um “mapa” para o tipo de amostra e para o tipo de terminador didesoxi. Efectuar-se-ia uma reacção de amplificação por « PCR e os fragmentos resultantes seriam separados por dimensões através de, por exemplo, HPLC ou PAGE. No final do procedimento de separação, os fragmentos de DNA são recolhidos numa estrutura temporal, os marcadores são cortados e a presença ou ausência de mutação é determinada pela extensão da cadeia após terminação prematura da cadeia por incorporação de um dado terminador didesoxi. É importante notar que a técnica de ddF resulta no ganho ou na perda de um segmento terminado por didesoxi e/ou na alteração da mobilidade de pelo menos um dos segmentos ou produtos de terminação. Assim, neste método, é feita uma pesquisa da alteração da mobilidade de um fragmento sobre um fundo elevado de fragmentos com outros pesos moleculares. Uma vantagem consiste no 75
conhecimento prévio da extensão do fragmento que está associado a uma dada mutação.
Segundo uma das formas de realização do invento, são fornecidos métodos para a determinação da identidade de uma molécula de ácido nucleico ou para a detecção de uma molécula de ácido nucleico seleccionada em, por exemplo, uma amostra biológica, utilizando a técnica de ddF. Abreviadamente, tais métodos compreendem geralmente os passos de produção de uma série de fragmentos de ácido nucleico marcados, seguindo-se a sua separação por dimensões. De preferência, o passo de separação por dimensões é não desnaturante e os fragmentos de ácido nucleico são desnaturados antes da metodologia de separação. O passo de separação por dimensões poderá utilizar, por exemplo, a electroforese em gel (p.ex., electroforese em gel de poliacrilamida) ou, de preferência, a HPLC. Os marcadores são então cortados e removidos dos fragmentos separados, sendo os marcadores em seguida detectados através da respectiva tecnologia de detecção (p.ex., espectrometria de massa, espectrometria em infravermelho, amperometria potenciostática ou espectrometria em UV). 6. Mapas de restrição e RFLPs
As endonucleases de restrição reconhecem sequências curtas de DNA e cortam as moléculas de DNA a nível destes locais específicos. Algumas enzimas de restrição cortam o DNA com uma frequência muito baixa, gerando um pequeno número de fragmentos muito extensos (com uma extensão de entre vários milhares a um milhão de pares de bases). A maioria das enzimas corta o DNA mais frequentemente, gerando assim um grande número de fragmentos pequenos (de menos de cem a mais do que mil pares de bases). Em média, as enzimas de restrição com locais de reconhecimento de 4 bases fornecerão fragmentos com uma extensão de 256 bases, os locais de reconhecimento de 6 bases produzirão fragmentos com 4000 bases e os locais de reconhecimento de 8 bases fornecerão fragmentos com uma extensão de 64.000 bases. Sabendo que foram já caracterizadas centenas de enzimas de restrição diferentes, o DNA pode ser cortado em muitos fragmentos pequenos diferentes. 76
Foi já desenvolvida uma grande variedade de técnicas para a análise de polimorfismos de DNA. O método mais divulgado, o polimorfismo de extensão do fragmento de restrição (RFLP), combina a digestão com enzimas de restrição, a electroforese em gel, a transferência (“blot”) para uma membrana e a hibridização com uma sonda de DNA clonado. Os polimorfismos são detectados sob a forma de variações na extensão dos fragmentos marcados presentes nos “blots”. A abordagem de RFLP pode ser utilizada para analisar substituições de bases quando a alteração da sequência se encontra contida no local de restrição de uma enzima, ou para analisar minisatélitesA/NTRs ao escolher enzimas de restrição que cortam fora das unidades repetitivas. Os geles de agarose não proporcionam geralmente a resolução necessária para distinguir entre alelos de minisatéliteA/NTR que difiram entre si por uma só unidade repetitiva, mas muitos dos minisatélitesA/NTRs são tão variáveis que é assim mesmo possível obter marcadores altamente informativos.
Segundo uma das formas de realização do invento, são fornecidos métodos para a determinação da identidade de uma molécula de ácido nucleico ou para a detecção de uma molécula de ácido nucleico seleccionada em, por exemplo, uma amostra biológica, utilizando a técnica de mapeamento por restrição ou RFLP. Abreviadamente, tais métodos compreendem geralmente os passos de produção de uma série de fragmentos de ácido nucleico marcados, sendo estes fragmentos digeridos por enzimas de restrição. Os fragmentos marcados são gerados através de um passo de hibridização das sondas marcadas com o ácido nucleico-alvo digerido. O passo de hibridização poderá ser efectuado antes ou depois da digestão com a nuclease de restrição. Os fragmentos digeridos de ácido nucleico resultantes são então separados segundo as suas dimensões. O passo de separação por dimensões poderá utilizar, por exemplo, a electroforese em gel (p.ex., electroforese em gel de poliacrilamida) ou, de preferência, a HPLC. Os marcadores são então cortados e removidos dos fragmentos separados, sendo os marcadores em seguida detectados através da respectiva tecnologia de detecção (p.ex., espectrometria de massa, espectrometria em infravermelho, amperometria potenciostática ou espectrometria em UV). 77
I
X I
7. “Fingerprintinq” de DNA O “fingerprinting” de DNA envolve a produção de um conjunto de fragmentos de DNA obtidos a partir de uma amostra específica de DNA. Estão presentemente disponíveis diversas técnicas de “fingerprinting” de DNA (Jeffries et al., Nature 314:67, 1985; Welsh e McClelland, Nucl. Acids Res. 19:861, 1991), a maioria das quais utiliza a PCR para gerar fragmentos. A escolha da técnica de “fingerprinting” a usar depende da aplicação pretendida (p.ex., tipagem de DNA, mapeamento de marcadores de DNA) e dos organismos em investigação, p.ex., procariotas, plantas, animais, humanos. Foram desenvolvidos diversos métodos de “fingerprinting” no decurso dos últimos anos, incluindo o método de DNA polimórfico. amplificado ao acaso (RAPD), o “fingerprinting" de amplificação de DNA (DAF) e PCR de priming arbitrário (AP-OCR). Estes métodos baseiam-se na amplificação ao acaso de fragmentos genómicos de DNA por meio de primers seleccionados arbitrariamente. Os padrões de fragmentos de DNA podem ser gerados a partir de qualquer DNA sem que haja o conhecimento prévio da sequência. Os padrões gerados dependem da sequência dos primers de PCR e da natureza do molde de DNA. O PCR é realizado a temperaturas baixas de annealing, de modo a permitir o annealing dos primers a locais múltiplos do DNA. Os fragmentos de DNA são gerados quando os locais de ligação dos primers se encontram a uma distância que permite a amplificação. Em princípio, um único primer é suficiente para gerar padrões de bandas.
Foi descrita uma nova técnica para o “fingerprinting” de DNA, designada por AFLP (Vos et al., Nucl. Acids Res. 23:4407, 1995). A técnica de AFLP baseia-se na detecção de fragmentos genómicos de restrição através de amplificação por PCR, e pode ser usada para DNAs de qualquer origem ou complexidade. Abreviadamente, são produzidos “fingerprints”, sem um conhecimento prévio da sequência, usando um conjunto limitado de primers genéricos. O número de fragmentos detectados numa só reacção podem servir como “sintonizadores” por selecção de conjuntos específicos de primers. A técnica de AFLP é robusta e fiável, uma vez que são usadas condições rigorosas para o annealing dos primers: a fiabilidade da técnica de RFLP é combinada com a solidez da técnica de PCR. 78 j
Em uma das formas de realização do invento, são fornecidos métodos para a determinação da identidade de uma molécula de ácido nucleico ou para a detecção de uma molécula de ácido nucleico seleccionada proveniente de, por exemplo, uma amostra biológica, utilizando a técnica de '‘fingerprinting" de RNA. Abreviadamente, tais métodos compreendem geralmente os passos de produção de uma série de fragmentos marcados de ácido nucleico, seguindo-se a separação dos fragmentos por dimensões. O passo de separação por dimensões pode ser realizado, por exemplo, através de, por exemplo, uma electroforese em gel (p.ex., electroforese em gel de poliacrilamida) ou preferencialmente por HPLC. Os marcadores são seguidamente cortados e removidos dos fragmentos separados, sendo os marcadores então detectados através da tecnologia de detecção respectiva (p.ex., espectrometria de massa, espectrometria em infravermelho, amperometria potenciostática ou espectrometria em UV). 8. Aplicação dos Marcadores Susceptíveis de Corte á Genotipaaem e à Detecção de Polimorfismos a. Introdução
Se bem que alguns polimorfismos conhecidos de DNA humano se baseiem em inserções, delecções ou outros rearranjos de sequências não repetitivas, a grande maioria dos polimorfismos baseia-se ou em substituições de uma só base ou em variações do número de repetições em série. As substituições de bases são muito abundantes no genoma humano, ocorrendo em média uma vez entre cada intervalo de 200-500 pares de bases (pb). As variações de extensão dos blocos das repetições em série são também comuns no genoma, existindo pelo menos dezenas de milhares de locais polimórficos dispersos (designador por “loci”). As extensões repetidas nos polimorfismos das repetições em série variam de 1 pb em sequências (dA)n(dT)n até pelo menos 170 pb em DNA a-satélite. Os polimorfismos de repetições em série podem dividir-se em dois grupos .principais: os minisatélites/número variável de repetições em série (VNTRs), com extensões de repetição típicas de dezenas de pares de bases e com um número total de dezenas a milhares de unidades repetidas, e os microsatélites, com extensões de repetição 79 de até 6 pb e com extensões máximas totais de cerca de 70 pb. A maioria dos polimorfismos de microsatélites identificados até ao presente baseia-se em sequências repetitivas dinucleotídicas de (dC-dA)n ou (dG-dT)n. A análise de polimorfismos em microsatélites envolve a amplificação, através de uma reacção em cadeia por polimerase (PCR), de um pequeno fragmento de DNA que contém um bloco de sequências repetitivas, seguindo-se a electroforese do DNA amplificado em gel desnaturante de poliacrilamida. Os primers de PCR são complementares a sequências específicas que flanqueiam os bolos de sequências repetitivas. Os geles de poliacrilamida, em lugar dos geles de agarose, são tradicionalmente usados para os microsatélites porque a diferença de dimensões entre os alelos se resume frequentemente a uma só sequência repetitiva.
Assim, segundo um aspecto do invento, são fornecidos métodos para a genotipagem de um organismo seleccionado, compreendendo os passos de (a) produzir moléculas de ácido nucleico marcadas a partir de uma molécula-alvo seleccionada, sendo que um marcador é correlacionável com um fragmento em particular e é detectável por meio de espectrometria não-fluorescente ou potenciometria, (b) separar as moléculas marcadas pelo comprimento sequencial, (c) cortar e remover o marcador da molécula marcada, e (d) detectar o marcador através de espectrometria não-fluorescente ou potenciometria, determinando deste modo o genotipo do organismo.
Em outro aspecto, são fornecidos métodos para a genotipagem de um organismo seleccionado, compreendendo os passos de (a) combinar uma molécula marcada de ácido nucleico com uma molécula-alvo seleccionada, sob condições e durante o tempo suficiente para permitir a hibridização da molécula marcada à molécula-alvo, sendo que um marcador é correlacionável com um fragmento em particular e é detectável por espectrometria não fluorescente ou potenciometria, (b) separar os fragmentos marcados pelo comprimento sequencial, (c) cortar e remover o marcador do fragmento marcado, e (d) detectar o marcador através de espectrometria não-fluorescente ou potenciometria, determinando deste modo o genotipo do organismo. b. Aplicação dos marcadores susceptíveis de corte à genotipagem Uma abordagem de PCR para a identificação do polimorfismo de extensão dos fragmentos de restrição (RFPL) combina a electroforese em gel è a detecção de marcadores associados a primers de PCR específicos. Em geral, cada primer de PCR possuirá um marcador específico. O marcador representará, desta forma, um conjunto de primers de PCR e, deste modo, uma extensão pré-determinada de fragmento de DNA. Os polimorfismos são detectados sob a forma de variações nas extensões dos fragmentos marcados presentes num gel ou que são eluídos de um gel. A electroforese em gel de poliacrilamida proporcionará geralmente a resolução necessária para distinguir entre alelos de minisatélite/VNTR que difiram por uma só unidade repetitiva. A análise de polimorfismos em microsatélites envolve a amplificação, através de uma reacção em cadeia por polimerase (PCR), de um pequeno fragmento de DNA contendo um bloco de sequências repetitivas, seguindo-se a electroforese do DNA amplificado em gel desnaturante de poliacrilamida ou a separação dos fragmentos de DNA por HPLC. O DNA amplificado será marcado usando primers que possuem nas suas extremidades 5’ marcadores susceptíveis de corte. Os primers são incorporados nas novas cadeias sintetizadas através de extensão da cadeia. Os primers de PCR são complementares a sequências específicas que flanqueiam os blocos de sequências repetitivas. Os polimorfismos de microsatéliteA/NTR podem igualmente ser amplificados, de modo bastante semelhante ao descrito acima para os microsatélites.
As descrições de muitos tipos de polimorfismos de sequências de DNA forneceram a base fundamental para o conhecimento da estrutura do genoma humano (Botstein et al., Am. J. Human Genetics 32:p314, 1980; Donis-Keller, Cell 51:319, 1987; Weissenbach et al., Nature 359:794). A construção de mapas extensos de ligação entre estruturas genómicas foi facilitada pelo uso destes polimorfismos de DNA e forneceu um meio prático de localizar os genes de doenças através destas ligações. Os marcadores dinucleotídicos de microsatélites têm provado constituir ferramentas bastante poderosas na identificação de genes humanos que se demonstrou conterem mutações e que em algumas circunstâncias são causa de doenças. As sequências repetitivas dinucleotídicas do genoma são altamente polimórficas (Weber, 1990, Genomic Analysis, Vol. 1, págs. 159-181, Cold 81
Spring Laboratory Press, Cold Spring Harbor, NY; Weber e Wong, 1993, Hum. Mol. Genetics, 2, p1123) e podem possuir até 24 alelos. As sequências repetitivas dinucleotídicas de microsatélites podem ser amplificadas por PCR usando primers complementares às regiões específicas que rodeiam a sequência repetitiva dinucleotídica. Após a amplificação, formam-se combinações (multiplexes) com vários loci amplificados antes de um passo de separação por dimensões. O processo de aplicar os fragmentos de microsatélite amplificados a um passo de separação por dimensões, identificando então o seu tamanhoe, consequentemente, o alelo é conhecido por genotipagem. Têm sido referidos marcadores específicos de cromossoma que permitem um elevado grau de formação de multiplexos, destinando-se à verificação da totalidade do genoma para análise de ligações (Davies et al., 1994, Nature, 371, p130). O uso de marcadores na genotipagem com microsatélites tem tido excelentes resultados. Abreviadamente, os primers de PCR são construídos de modo a transportar marcadores e são usados numa reacção de PCR cuidadosamente escolhida para amplificar sequências repetitivas di-, tri- ou tetranucleotídicas. Os produtos de amplificação são então separados segundo as suas dimensões através de métodos tais como a HPLC ou a PAGE. Os fragmentos de DNA são recolhidos temporalmente, os marcadores são cortados e removidos dos seus respectivos fragmentos de DNA e a sua extensão é deduzida por comparação com padrões internos no passo de separação por dimensões. A identificação de alelos é feita por referência à dimensão dos produtos amplificados.
Com o uso de marcadores susceptíveis de corte na genotipagem, é possível combinar múltiplas amostras num passo único de separação. Existem dois modos gerais de realizar este procedimento. O primeiro método geral para uma análise de alto rendimento corresponde à detecção de um único polimorfismo entre um vasto grupo de indivíduos. Neste cenário, é usado um só conjunto de primers de PCR e cada amplificação é realizada com um só tipo de amostra de DNA por reacção. O número de amostras que pode ser combinado no passo de separação é proporcional ao número de marcadores susceptíveis de corte que pode ser gerado por um processo de detecção (i.e., 400-600 para os marcadores de espectrometria de massa). Deste modo, é possível identificar de 1 a diversos polimorfismos em 82
simultâneo entre um vasto grupo de indivíduos. A segunda abordagem utiliza conjuntos múltiplos de primers de PCR que têm a capacidade de identificar numerosos polimorfismos numa só amostra de DNA (por exemplo, na genotipagem de um indivíduo). Nesta abordagem, os primers de PCR são combinados numa só reacção de amplificação que gera produtos de PCR com diferentes dimensões. Cada par de primers ou conjunto instalado é codificado por um marcador específico susceptível de corte, o que implica que cada fragmento de PCR se encontre codificado com um marcador específico. A reacção é efectuada com um só passo de separação (ver abaixo). O número de amostras que podem ser combinadas no passo de separação é proporcional ao número de marcadores susceptíveis de corte que podem ser gerados por cada tecnologia de detecção (i.e., 400-600 para os marcadores de espectrometria de massa). c. Detecção enzimática de mutações e a aplicação de marcadores Neste pedido de patente ou método em particular, são detectados emparelhamentos incorrectos em heteroduplexes através do corte enzimático dos pares de bases incorrectamente emparelhados num dado duplex de ácido nucleico. As sequências de DNA a ser testadas quanto à presença de uma mutação são amplificadas por PCR usando um conjunto específico de primers, os produtos amplificados são desnaturados e misturados com fragmentos de referência desnaturados, dando-se uma hibridização que resulta na formação de heteroduplexes. Os heteroduplexes são então tratados com enzimas que reconhecem e cortam o duplex se estiver presente um emparelhamento incorrecto. Estas enzimas são a nuclease S1, a nuclease de feijão Mung, “resolvases”, a endonuclease IV de T4, etc. Pode utilizar-se essencialmente qualquer enzima que reconheça emparelhamentos incorrectos in vitro e corte estes emparelhamentos incorrectos. Após o tratamento com a enzima apropriada, os duplexes de DNA são separados por dimensões, através de, por exemplo, HPLC ou PAGE. Os fragmentos de DNA são recolhidos temporalmente. Os marcadores são cortados e detectados. A presença de uma mutação é detectada pela alteração de mobilidade de um fragmento relativamente a um fragmento de referência, correspondente ao tipo selvagem. 83
d. Aplicações dos marcadores ao ensaio de ligação de oligonucleótidos (OLA) O ensaio de ligação de oligonucleótidos, tal como originalmente descrito por Landegren et al. (Landegren et al., Science 241:487, 1988), constitui uma técnica útil para a identificação de sequências (conhecidas) em genomas muito vastos e complexos. O princípio da reacção de OLA baseia-se na capacidade apresentada pela ligase de ligar covalentemente dois oligonucleótidos de diagnóstico quando estes se hibridizam em posição adjacente um ao outro sobre um dado DNA-alvo. Se as sequências a nível das junções das sondas não tiverem um emparelhamento perfeito de bases, as sondas não serão ligadas pela ligase. A capacidade que uma ligase termoestável demonstra para discriminar potenciais diferenças num só par de bases quando posicionada a nível da extremidade 3’ da sonda “a montante” possibilita uma resolução de até um só par de bases (Barony, PNAS USA 88:189, 1991). Na aplicação dos marcadores, os marcadores seriam ligados à sonda que se encontra ligada ao produto amplificado. Após terminada a a reacção de OLA, os fragmentos são separados com base nas suas dimensões e os marcadores são cortados e detectados por espectrometria de massa. e. Amplificação específica de sequência
Podem usar-se primers de PCR com uma extremidade 3’ complementar a um mutante ou a uma sequência oligonucleotídica normal para amplificar selectivamente um ou o outro alelo (Newton et al., Nucl. Acids Res., 17:2503-16, 1989; Nichols et al., Genomics 5:535-40, 1989; Okayama et al., J. Lab. Clin. Med., 114:15-13, 1989; Sommer et al., Mayo Clin. Proc.: 64:1361-72, 1989: e Wu et al., Proc. Nat'l. Acad. Sei. USA, 86:2757-60, 1989). Geralmente, os produtos de PCR são visualizados após a amplificação através de PAGE, mas o princípio da amplificação específica de sequência pode ser aplicado a formatos de ensaio em fase sólida. f. Aplicação potencial dos marcadores a alguns ensaios baseados em amplificação
Genotipagem de vírus: Uma aplicação potencial dos marcadores consiste na genotipagem ou identificação de vírus através da hibridização com sondas marcadas. Por exemplo, os colifagos RNA F+ poderão constituir úteis candidatos 84 como indicadores da contaminação entérica por vírus. A genotipagem através de métodos de hibridização de ácidos nucleicos constitui uma alternativa fiável, rápida, simples e pouco dispendiosa à serotipagem (Kafatos et al., Nucleic Acids Res. 7:1541, 1979). As técnicas de amplificação e as técnicas de hibridização de ácidos nucleicos foram utilizadas com êxito na classificação de diversos microorganismos, incluindo a E. coli (Feng, Mol. Cell Probes 7:151, 1993), o rotavírus (Sethabutr et al.; J. Med. Virol. 37:192, 1992), o vírus da hepatite C (Stuyver et al., J. Geri. Virol. 74:1093, 1993) e o vírus herpes simplex (Matsumoto et al., J. Virol. Methods 40:119, 1992).
Aplicações a nível de prognóstico para a análise mutacional em cancros: Foram descritas alterações genéticas em diversas neoplasias experimentais em mamíferos e em neoplasias em seres humanos; estas alteração representam a base morfológica para a sequência de alterações morfológicas observadas na carcinogénese (Vogelstein et al., NEJM 319:525, 1988). Nos anos mais recentes, com o advento das técnicas de biologia molecular, as perdas de alelos em certos cromossomas ou a mutação de genes supressores de tumores, assim como as mutações em diversos oncogenes (p.ex., c-myc, c-jun e a família ras) têm constituído as entidades mais estudadas. Os trabalhos anteriores (Finkelstein et al., Arch. Surg. 128:526, 1993) identificaram uma correlação entre tipos específicos de mutações pontuais no oncogene K-ras e o estágio à data de diagnóstico no carcinoma colorectal. Os resultados sugeriram que a análise mutacional poderia fornecer informações importantes sobre a agressividade do tumor, incluindo o padrão e a disseminação de metástases. Mais recentemente, foi demonstrado o valor prognóstico da análise mutacional de TP53 e de K-ras-2 no carcinoma do cólon de estádio III (Pricolo et al., Am. J. Surg. 171:41, 1996). Torna-se, deste modo, aparente que a genotipagem de tumores e das células pré-cancerosas, e a detecção de mutações específicas, se tornará cada vez mais importante para o tratamento de neoplasias em seres humanos.
C. SEPARAÇÃO DOS FRAGMENTOS DE ÁCIDOS NUCLEICOS
Uma amostra para análise é frequentemente constituída por uma mistura de muitos componentes numa matriz complexa. Para amostras que contêm compostos 85 desconhecidos, os componentes terão de ser separados entre si para que cada componente individual possa ser identificado por outros métodos analíticos. As propriedades de separação dos componentes numa mistura mantêm-se constantes sob condições constantes, e assim, uma vez determinadas, poderão ser usadas para identificar e quantificar cada um dos componentes. Tais procedimentos são típicos nas separações analíticas cromatográficas e electroforéticas. 1. Cromatoqrafia Líquida de Alto Rendimento (HPLC) A cromatografia líquida de alto rendimento (HPLC) constitui uma técnica de separação cromatográfica de compostos que se encontram dissolvidos em solução. Os instrumentos de HPLC são constituídos por um reservatório da fase móvel, uma bomba, um injector, uma coluna de separação e um detector. Os compostos são separados através da injecção de uma alíquota da mistura de amostra na coluna. Os diferentes componentes da mistura passam através da coluna a taxas de fluxo diferentes, devido às diferenças no seu comportamento de partição entre a fase móvel líquida e a fase estacionária.
Recentemente, as IP-RP-HPLC em partículas de PS/DVB não porosas ligadas por via química a cadeias alquilo têm-se evidenciado como alternativas rápidas à electroforese capilar na análise de ácidos nucleicos de cadeias simples e duplas, proporcionando níveis semelhantes de resolução (Hubér et al., Anal. Biochem., 212, p351; Huber et al., 1993, Nucl. Acids Res., 21, p 1061; Huber et al., 1993, Biotechniques, 16, p898). Em contraste com a cromatografia de troca iónica, que nem sempre retém o DNA de cadeia dupla em função da extensão das cadeias (uma vez que os pares de bases AT interagem com a fase estacionária carregada positivamente, mais fortemente do que os pares de bases G-C), a IP-RP-HPLC proporciona uma separação estritamente dependente da extensão das cadeias.
Foi desenvolvido um método que utiliza acetato de trietilamónio a 100 mM como reagente de emparelhamento de iões, em que os fosfodiéster-oligonucleótidos são separados de modo eficaz por utilização de partículas alquiladas não porosas de poli(estíreno-divinilbenzeno) a 2,3 μΜ numa cromatografia líquida de alto rendimento (Oefner et al., Anal. Biochem., 223:39, 1994). A técnica descrita permitiu a 86 separação de produtos de PCR com uma extensão diferindo em apenas 4 a 8 pares de bases dentro de um intervalo de dimensões de 50 a 200 nucleótidos. 2. Electroforese A electroforese constitui uma técnica separativa que se baseia na mobilidade de iões (ou de DNA, como no caso aqui descrito) num campo eléctrico. As moléculas de DNA carregadas negativamente migram em direcção a um eléctrodo positivo e os iões carregados positivamente migram em direcção a um eléctrodo negativo. Por razões de segurança, um dos eléctrodos está geralmente em terra e o outro está carregado positiva ou negativamente. As espécies carregadas possuem velocidades diferentes de migração, dependendo da sua carga total, dimensão e forma, e podem deste modo ser separadas. Um aparelho de electroforese é constituído por uma fonte de alimentação de alta voltagem, eléctrodos, tampão e um suporte para o tampão, tal como um gel de poliacrilamida ou um tubo capilar. São utilizados tubos capilares abertos para muitos tipos de amostras e os outros suportes de gel são utilizados para amostras biológicas, tais como misturas de proteínas ou fragmentos de DNA. 3. Electroforese Capilar (CE) A electroforese capilar (CE), nas suas variadas manifestações (solução livre, isotacoforese, focalização isoeléctrica, gel de poliacrilamida, “cromatografia” electrocinética micelar) encontra-se em desenvolvimento como método para separações rápidas de alta resolução para amostras de misturas complexas com volumes muito pequenos. Em combinação com a sensibilidade e selectividade inerentes à MS, a CE-MS constitui uma técnica potencialmente poderosa no campo da bioanálise. Na nova aplicação aqui apresentada, a ligação entre estes dois métodos conduzirá à obtenção de métodos superiores de sequenciação de DNA que ultrapassarão em diversas ordens de magnitude os actuais métodos de sequenciação. A correspondência entre as taxas de fluxo obtidas em CE e em ionização por electrospray (ESI), e o facto de que ambas as técnicas são facilitadas pela presença de (e primariamente usadas para) espécies iónicas em solução, fornece a base para 87 uma combinação extremamente apelativa. Foi já descrita a utilização de uma combinação de electroforese de zona capilar (CZE) e de isotacoforese capilar em associação ao uso de espectrómetros de massa quadrupolares baseados em ESI (Olivares et al.. Anal. Chem. 59:1230, 1987; Smith et al., Anal. Chem. 60:436, 1988; Loo et al, Anal. Chem. 179:404, 1989; Edmonds et al., J. Chroma. 474:21, 1989; Loo et al., J. Microcolumn Sep. 7:223, 1989; Lee et al., J. Chromatog. 458:313, 1988; Smith et al., J. Chromatog. 480:211, 1989; Grese et al., J. Am. Chem. Soc. 7 77:2835, 1989). Os péptidos pequenos são facilmente adaptáveis à análise por CZE, obtendo-se uma boa sensibilidade (da ordem das femtomoles). O método mais poderoso para a separação de fragmentos de DNA é a electroforese em gel de poliacrilamida (PAGE), geralmente num formato de placa de gel. No entanto, a principal limitação da tecnologia actual consiste no relativamente longo período de tempo que é necessário dispender na electroforese em gel de fragmentos de DNA produzidos nas reacções de sequenciação. Pode conseguir-se um aumento da velocidade (numa ordem de grandeza de 10 vezes) por meio do uso da electroforese capilar, que utiliza geles ultrafinos. Em solução livre, e numa primeira aproximação, todos os DNA migram com a mesma mobilidade, já que a adição de uma base resulta na compensação entre a massa e a carga. Nos geles de poliacrilamida, os fragmentos de DNA migram em função do tamanho, e esta abordagem foi agora aplicada à CE. Foi agora atingido um número notável de placas por metro através do uso de poliacrilamida com ligações cruzadas (10' placas por metro, Cohen et al., Proc. Natl. Acad. Sei. USA 85:9660, 1988). Tais colunas de CE, tal como descrito, podem ser utilizadas para a sequenciação de DNA. O método de CE é. em princípio, 25 vezes mais rápido do que a electroforese em placa de gel realizada num sequenciador convencional. Por exemplo, é possível ler cerca de 300 bases por hora. A velocidade de separação na electroforese em placa de gel é limitada pela intensidade do campo eléctrico que pode ser aplicado ao gel sem que ocorra uma produção excessiva de calor. Assim, a maior velocidade da CE é conseguida através do uso de forças de campo superiores (300 V/cm na CE versus 10 V/cm na electroforese em placa de gel). O formato capilar reduz a amperagem, e, deste modo, a potência e a geração de calor resultante. 88
Smith e outros (Smith et al., Nuc. Acids Res. 18:4417, 1990) sugeriram o uso de múltiplos capilares em paralelo para obter um aumento do rendimento. Do mesmo modo, Mathies e Huang (Mathies e Huang, Nature 359:167, 1992) introduziram a electroforese capilar em que as separações são realizadas em conjuntos de capilares em paralelo e demonstraram a ocorrência de uma sequenciação de alto rendimento (Huang et al., Anal. Chem. 64:967, 1992, Huang et al.. Anal. Chem. 64:2149, 1992). A principal desvantagem da electroforese capilar consiste na limitada quantidade de amostra com que é possível carregar o capilar. Ao concentrar uma grande quantidade de amostra no início do capilar, antes da separação, a capacidade de carga é aumentada e os níveis de detecção podem baixar em diversas ordens de grandeza. O método mais popular de pré-concentração na CE consiste no “empilhamento” de amostras. O empilhamento de amostras foi recentemente analisado numa publicação (Chien e Burgi, Anal. Chem. 64:489A, 1992). O empilhamento de amostras depende da diferença de matrizes (pH, força iónica) entre o tampão da amostra e o tampão do capilar, sendo o campo eléctrico ao longo da zona da amostra superior ao verificado na zona capilar. No empilhamento de amostras, um grande volume de amostra presente num tampão de baixa concentração é introduzido para pré-concentração na cabeça da coluna capilar. O capilar está cheio de um tampão com a mesma composição mas de concentração superior. Quando os iões da amostra atingem o tampão do capilar e o campo eléctrico mais baixo, eles empilham-se numa zona concentrada. O empilhamento de amostras possibilita um aumento de detectabilidade de 1-3 ordens de grandeza.
Um outro método de pré-concentração consiste na aplicação de isotacoforese (ITP) antes da separação dos analitos em CE de zona livre. A ITP é uma técnica electroforética que permite o carregamento do capilar com volumes de amostra da ordem do microlitro, em contraste com os baixos volumes de injecção (nL) tipicamente associados à CE. A técnica baseia-se na inserção da amostra entre dois tampões (electrólitos de vanguarda e de rectaguarda), de mobilidades respectivamente mais alta e mais baixa do que a do analito. A técnica constitui inerentemente uma técnica de concentração, em que os analitos se concentram em zonas puras que migram à mesma velocidade. A técnica é actualmente menos 89 popular do que os métodos de empilhamento acima descritos devido à necessidade de fazer diversas escolhas de electrólitos de vanguarda e rectaguarda, e ao facto de ser apenas possível separar espécies catiónicas ou aniónicas durante um processo de separação. A característica central do processo de sequenciação de DNA reside na separação notavelmente selectiva de DNA ou de fragmentos oligonucleotídicos. Esta separação é notável porque cada um dos fragmentos é resolvido e pode diferir dos outros em apenas um nucleótido. Têm já sido obtidas separações de até 1000 fragmentos (1000 bp). Uma vantagem adicional da sequenciação por meio de marcadores susceptíveis de corte é a seguinte: quando são usados marcadores susceptíveis de corte, não existe a necessidade de usar um formato de placa de gel na separação de fragmentos de DNA por gel de poliacrilamida. Uma vez que são combinadas numerosas amostras (4 a 2000), não há a necessidade de processar as amostras em paralelo, tal como acontece com os métodos actuais de corante-primer ou corante-terminador (i.e., sequenciador ABI373). Uma vez que nãoé necessário processar carreiras em paralelo no gel, não existe nenhuma razão para usar uma placa de gel. Deste modo, é possível utilizar um formato de gel em tubo no método de separação electroforética. Grossman e outros (Grossman et al., Genet. Anal. Tech. Appl. 9:9, 1992) demonstraram que se obtêm vantagens significativas por utilização de um formato de gel em tubo no lugar de um formato de gel em placa. Tal deve-se à maior facilidade em dissipar a energia calorífica de Joule quando se utiliza um formato de tubo, o que resulta na redução dos tempos de corrida (em 50%) e numa resolução muito mais elevada dos fragmentos de DNA de elevado peso molecular (superior a 1000 nt). As leituras extensas são críticas para a sequenciação genómica. Assim, o uso de marcadores susceptíveis de corte na sequenciação possui a vantagem adicional de facultar ao utilizador a utilização do método de separação de DNA que apresenta maior eficiência e sensibilidade e que possui igualmente a mais alta resolução. 4. Dispositivos Microfabricados A electroforese capilar (CE) constitui um poderoso método para sequenciação, análise forense, análise de produtos de PCR e separação dos 90 fragmentos de restrição por dimensões. A CE é bastante mais rápida do que a PAGE tradicional em placa, uma vez que em geles capilares se pode aplicar um potencial de campo bastante superior. No entanto, a CE apresenta a desvantagem de só permitir o processamento de uma amostra por gel. O método aqui descrito combina a maior rapidez dos tempos de separação da CE com a capacidade de analisar amostras múltiplas em paralelo. O conceito subjacente ao uso de dispositivos microfabricados é o de que a densidade da informação obtida na electroforese é aumentada ao miniaturizar a dimensão das carreiras do gel para cerca de 100 micrómetros. A indústria electrónica usa rotineiramente a microfabricação para produzir circuitos com estruturas de tamanho inferior a um micron. A densidade actual dos conjuntos de capilares é limitada pelo diâmetro exterior do tubo capilar. A microfabricação de canais possibilita a obtenção de uma maior densidade de conjuntos de capilares. A microfabricação permite igualmente a execução de montagens que não é possível realizar utilizando fibra de vidro, e liga os canais directamente a outros dispositivos num chip. Poucos dispositivos foram já produzidos em microchips para aplicação às tecnologias de separação. Foram fabricados um cromatógrafo de gás (Terry et al., IEEE Trans. Electron Device, ED-26:1880, 1979) e um cromatógrafo de líquido (Manz et al., Sens. Actuators B1:249, 1990) em chips de silicone, mas estes dispositivos não têm conhecido uma utilização muito alargada. Diversos grupos têm referido a separação de corantes fluorescentes e de aminoácidos em dispositivos microfabricados (Manz et al., J. Chromatography 593:253, 1992, Effenhauser et al., Anal. Chem. 65:2637, 1993). Recentemente, Woolley e Mathies (Woolley e Mathies, Proc. Natl. Acad. Sei. 9111348, 1994) demonstraram que a fotolitografia e a gravação química por acção de ácido podem ser usados para produzir grandes números de canais de separação em substratos de vidro. Os canais são preenchidos com matrizes de separação de hidroxietilcelulose (HEC). Foi demonstrado que é possível separar fragmentos de restrição de DNA em períodos de tempo tão breves como dois minutos.
D. CORTE DE MARCADORES
Tal como se descreveu acima, diferentes concepções do linker conferirão susceptibilidades ao corte fiabilidades”) sob diferentes condições físicas ou 91 químicas. Os exemplos de condições que servem para cortar diferentes tipos de linker incluem as condições de ácido, base, oxidação, redução, fluoretos, troca de tióis, fotólise e acção enzimática.
Os exemplos de linkers susceptíveis ao corte que satisfazem os critérios gerais para linkers acima expostos são bem conhecidos dos técnicos e incluem os compostos listados no catálogo de Pierce (Rockford, JL). Os exemplos incluem: • glicobis(succinimidilsuccinato) de etileno (EGS), um reagente de “cross-linking" (que estabelece ligações cruzadas) reactivo a aminas e que sofre quebra de ligações por acção da hidroxilamina (1 M a 37°C durante 3-6 horas); • tartarato de disuccinimidilo (DST) e sulfo-DST, que são reagentes de cross-linking reactivos a aminas, susceptíveis ao corte por periodato de sódio a 0,015 M; • bis[2-(succinimidiloxicarboniloxi)etil]sulfona (BSOCOES) e sulfo-BSOCOES, que são reagentes de cross-linking reactivos a aminas, susceptíveis ao corte por base (pH 11,6); • 1,4-di-[3’-(2’-piridilditio(propionamido))butano (DPDPB), um piridilditiol, reagente de crosslinking susceptível ao corte por troca de tióis ou por redução; • N-[4-(p-azidosalicilamido)-butil]-3’-(2’-piridilditio)propionamida (APDP), um piridilditiol, reagente de crosslinking susceptível ao corte por troca de tióis ou por redução; • Bis-[beta-4-(azidosalicilamido)etil]disulfureto, um reagente de crosslinking fotoreactivo que é susceptível ao corte por troca de tióis ou por redução; • N-succinimidil-(4-azidofenil)-1,3’ditiopropionato (SADP), um reagente de crosslinking fotoreactivo que é susceptível ao corte por troca de tióis ou por redução; • sulfosuccinimidil-2-(7-azido-4-metilcumarina-3-acetamida)etil-1,3-ditiopropionato (SAED), um reagente de crosslinking fotoreactivo que é susceptível ao corte por troca de tióis ou por redução; 92 • sulfosuccinimidil-2-(m-azido-o-nitrobenzamido)-etil-1,3’-ditiopropionato (SAND), um reagente de crosslinking fotoreactivo que é susceptível ao corte por troca de tióis ou por redução. São em seguida fornecidos outros exemplos de linkers susceptíveis a corte e de condições que podem ser usadas para libertar os marcadores. Um grupo linker de sililo pode ser cortado por fluoretos ou por condições acídicas. O linker 2-nitrobenziloxi 3-, 4-, 5- ou 6-substituído ou o 4-nitrobenziloxi 2-. 3-, 5- ou 6-substituído podem ser cortados por uma fonte de fotões (fotólise). O linker 2-alcoxifenoxi 3-, 4-, 5- ou 6-substituído ou o 4-alcoxifenoxi 2-, 3-, 5- ou 6-substituído podem ser cortados por Ce(NH4)3(N03)6 (oxidação). Um linker de NC02 (uretano) pode ser cortado por hidróxido (base), ácido ou LiAIH4 (redução). Um grupo linker de 3-pentenilo, 2-butenilo ou 1-butenilo pode ser cortado por 03, O5O4/IOZ ou KMn04 (oxidação). Um linker de 2-[furil 3-, 4- ou 5-substituído]oxi pode ser cortado por 02, Br2, MeOH ou ácido.
As condições para o corte de outros linkers lábeis incluem: os linkers de t-alquiloxi podem ser cortados por ácido; os linkers de metil(dialquil)metoxi ou 2-alquil-1 ;3-dioxano-2-ilo 4-substituído podem ser cortados por HsO+; os grupos 2-sililetoxi podem ser cortados por fluoretos ou ácido; os linkers 2-(X)-etoxi (em que X = ceto, amida de éster, ciano, N02, sulfureto, sulfóxido, sulfona) podem ser cortados sob condições alcalinas; os linkers de benziloxi 2-, 3-, 4-, 5- ou 6-substituídos podem ser cortados por condições acídicas ou de redução; os linkers de buteniloxi podem ser cortados por (Ph3P)3RhCI(H); os linkers de 2-bromofenoxi 3-, 4-, 5- ou 6-substituídos podem ser cortados por Li, Mg ou BuLi; os linkers de metiltiometoxi podem ser cortados por Hg2+; os linkers de 2-(X)-etiloxi (em que X = um halogénio) podem ser cortados por Zn ou Mg; os linkers de 2-hidroxietiloxi podem ser cortados por oxidação (p.ex., com Pb(OAc)4).
Os linkers preferidos são os susceptíveis a corte por ácido ou por fotólise. Diversos linkers que foram desenvolvidos para a síntese de péptidos em fase sólida têm utilidade na ligação de marcadores às MOIs. Alguns destes linkers estão descritos numa publicação recente de Lloyd-Williams et al. (Tetrahedron 49:11065-11133, 1993). Um tipo útil de linker é baseado em álcoois p-alcoxibenzílicos, dois 93 dos quais, o ácido 4-hidroximetilfenoxiacético e o ácido 4-(4-hidroximetil-3-metoxifenoxi)butírico, são comercializados pela Advanced ChemTech (Louisville, KY). Ambos os linkers se podem ligar a um marcador através de uma ligação éster ao benzilálcool, e a uma MOI que contenha uma amina através de uma ligação amida ao ácido carboxílico. Os marcadores ligados a estas moléculas são libertados da MOI por acção de concentrações variáveis de ácido trifluoroacético. O corte de ligações destes linkers resulta na libertação de um ácido carboxílico no marcador. O corte por ácido das ligações entre marcadores e linkers relacionados, como o 2,4-dimetoxi-4’-(carboximetiloxi)-benzidrilamina (fornecido pela Advanced ChemTech sob forma protegida por FMOC) resulta na libertação de uma amida carboxílica no marcador libertado.
Na sua maioria, os linkers fotolábeis com utilidade no âmbito deste pedido de patente foram também desenvolvidos para a síntese de péptidos em fase sólida (ver a publicação de Lloyd-Williams). Estes linkers têm geralmente por base os 2-nitrobenzilésteres ou as 2-nitrobenzilamidas. Como exemplos de linkers fotolábeis recentemente referidos na literatura encontram-se o ácido 4-(4-(1-Fmoc-amino)etil)-2-metoxi-5-nitrofenoxi)butanóico (Holmes e Jones, J. Org. Chem. 60:2318-2319, 1995) e o ácido (3-Fmoc-amino)3-(2-nitrofenil)propiónico (Brown et al., Molecular Diversity 1:4-12, 1995). Ambos os linkers se podem ligar por meio do ácido carboxílico a uma amina presente na MOI. A ligação do marcador ao linker é efectuada através da formação de uma amida entre um ácido carboxílico do marcador e a amina do linker. O corte de ligações dos linkers fotolábeis é geralmente efectuado por meio de radiação UV com um comprimento de onda de 350 nm, usando intensidades e períodos de tempo conhecidos da técnica. Como exemplos de fontes comerciais de instrumentos que podem ser utilizados para o corte fotoquímico citam-se a Aura Industries Inc. (Staten Island, NY) e Agrenetics (Wilmington, MA). O corte de ligações dos linkers resulta na libertação de uma amida primária no marcador. Os exemplos de linkers fotolábeis incluem ésteres de nitrofenil-glicina, cloretos e metanosulfonatos de exo- e endo-2-benzonorborneilo e o ácido 3-amino-3(2-nitrofenil)propiónico. Como exemplos de corte enzimático de ligações encontram-se o corte de ligações éster pelas esterases, o corte das 94 ligações fosfodiéster por acção das nucleases, o corte das ligações peptídicas pelas proteases, etc.
E.DETECCÂO DE MARCADORES
Os métodos de detecção baseiam-se tipicamente na absorção ou emissão em algum tipo de zona do espectro de radiações. Quando os átomos ou as moléculas absorvem luz, a energia recebida excita uma estrutura quântica, fazendo-a passar para um nível mais elevado de energia. O tipo de excitação depende do comprimento de onda da luz. Os electrões são promovidos a orbitais mais elevadas através da luz ultravioleta ou visível, as vibrações moleculares são excitadas pela luz infravermelha e as rotações são excitadas pelas microondas. Um espectro de absorção é dado pela absorção da luz em função do comprimento de onda. O espectro de um átomo ou molécula depende da sua estrutura de níveis de energia. Os espectros de absorção têm utilidade na identificação de compostos. Os métodos espectroscópicos de absorção incluem a espectroscopia de absorção atómica (AA), a espectroscopia de infravermelhos (IR) e a espectroscopia UV-vis (uv-vis).
Os átomos ou moléculas que são excitados até níveis energéticos elevados podem decair até níveis mais baixos através da emissão de radiações. Esta emissão de luz é designada por fluorescência se a transição ocorrer entre estados com o mesmo spin, e fosforescência se a transição ocorrer entre estados com spins diferentes. A intensidade de emissão de um analito é linearmente proporcional à concentração (para concentrações reduzidas), e é útil para a quantificação da espécie emissora. Os métodos espectroscópicos de emissão incluem a espectroscopia de emissão atómica (AES), a espectroscopia de fluorescência atómica (AFS), a fluorescência molecular induzida por laser (LIF) e a fluorescência a raios X (XRF).
Quando a matéria é atravessada por radiação electromagnética, a maior parte da radiação continua na sua direcção original mas uma pequena fracção é difractada em outras direcções. A luz que é difractada ao mesmo comprimento de onda que a luz incidente é designada por difracção de Rayleigh. A luz que é difractada em sólidos transparentes devido a vibrações (fonões) é designada por difracção de Brillouin. A luz difractada de Brillouin encontra-se desfasada de 0,1 a 1 número de 95 onda relativamente à luz incidente. A luz que é difractada devido a vibrações das moléculas ou de fonões ópticos em sólidos opacos é designada por difracção de Raman. A luz difractada de Raman encontra-se desfasada em até 4000 números de onda relativamente à luz incidente. Os métodos espectroscópicos de difracção incluem a espectroscopia de Raman. A espectroscopia de IR consiste na medição do comprimento de onda e da intensidade da luz absorvida na região média do infravermelho por uma amostra. A luz da região média do infravermelho (2,5 - 50 iim, 4000 - 200 cm'1) é suficientemente energética para excitar a transferência das vibrações moleculares para níveis energéticos mais elevados. Os comprimentos de onda das bandas de absorção em IR são característicos de tipos específicos de ligações químicas, e a espectroscopia de IR é geralmente muito útil para a identificação de moléculas orgânicas e organometálicas. A espectroscopia de absorção em infravermelho próximo (NIR) consiste na medição do comprimento de onda e da intensidade da luz absorvida na região do infravermelho próximo por uma amostra. A luz de infravermelho próximo abrange o intervalo de comprimentos de onda de 800 nm- 2,5 μιη (12.500 - 4000 cm'1), e é suficientemente energética para excitar sobretons e combinações de vibrações moleculares até níveis mais elevados de energia. A espectroscopia de NIR é tipicamente usada para a medição quantitativa de grupos funcionais orgânicos, especialmente O-H, N-H e C=0. Os componentes e a concepção dos instrumentos de NIR são similares aos dos espectrómetros de absorção uv-vis. A fonte de luz é geralmente uma lâmpada de tungsténio e o detector é geralmente um detector de PbS de fase sólida. Os suportes da amostra poderão ser de vidro ou quartzo e os solventes típicos são o CCU e o CS2. A instrumentação conveniente da espectroscopia de NIR torna esta técnica adequada à monitorização on-line e ao controlo de processos. A Espectroscopia de Absorção de Ultravioleta e Visível (uv-vis) constitui a medição do comprimento de onda e da intensidade da luz absorvida na região do ultravioleta próximo e da luz visível por uma amostra. A absorção no UV de vácuo ocorre a 100 - 200 nm (10s-50.000 cm'1); no UV de quartzo a 200-350 nm (50.000- 96
28.570 cm'1); e no visível a 350-800 nm (28.570-12.500 cm'1), e é descrita pela lei de Beer-Lambert-Bouguet. A luz ultravioleta e a luz visível são suficientemente energéticas para promover os electrões externos a níveis energéticos mais elevados. A espectroscopia UV-vis pode geralmente ser aplicada a moléculas e a iões ou complexos inorgânicos em solução. Os espectros uv-vis são limitados pelas características alargadas dos espectros. A fonte de luz corresponde geralmente a uma lâmpada de hidrogénio ou deutério para medições UV e a uma lâmpada de tungsténio para medições no visível. Os comprimentos de onda destas fontes de luz contínua são seleccionados através de um separador de comprimentos de onda, tal como um prisma ou um monocromador de grelha. Os espectros são obtidos através do varrimento do separador de comprimentos de onda, e as medições quantitativas podem ser feitas a partir de um espectro ou a um só comprimento de onda.
Os espectrómetros de massa usam a diferença entre as razões massa/carga (m/z) de átomos ou moléculas ionizados para os separar entre si. A espectrometria de massa é, deste modo, útil para a quantificação de átomos ou moléculas e também para a determinação de informações químicas e estruturais sobre moléculas. As moléculas possuem padrões distintos de fragmentaçãoque proporcionam informações estruturais para a identificação de compostos. As operações gerais de um espectrómetro de massa são a seguir descritas. São criados iões em fase gasosa, os iões são separados no espaço ou no tempo com base na sua razão massa/carga, e a quantidade de iões correspondentes a cada razão massa/carga é medida. A potência de separação de iões de um espectrómetro de massa é descrita pela resolução, a qual é definida pela fórmula R = m / delta m. em que m é a massa do ião e delta m é a diferença em massa entre dois picos resolúveis de um espectro de massa. Por exemplo, um espectrómetro de massa com uma resolução de 1000 pode distinguir um ião com uma m/z de 100,0 de outro ião com uma m/z de 100,1.
Em geral, um espectrómetro de massa (MS) consiste em uma fonte de iões, um analisador selectivo de massas e um detector de iões. Os espectrómetros de sector magnético, quadrupolar e de tempo-de-voo requerem igualmente sistemas ópticos de extracção e aceleração de iões para transferir os iões para a região de fonte do analisador de massas. Os detalhes dos diversos tipos de analisadores de 97 massa (para o MS de sector magnético, o MS quadrupolar ou o MS de tempo-de-voo) são abaixo expostos. Os analisadores de Focagem Simples para a MS de sector magnético utilizam uma trajectória para o feixe de partículas de 180, 90 ou 60 graus. As várias forças que influenciam as partículas separam os iões com diferentes razões massa/carga. Com os analisadores de focagem dupla, é adicionado um analisador electrostático a este tipo de instrumento para separar partículas com diferentes energias cinéticas.
Um filtro quadrupolar de massa para a MS quadrupolar consiste em quatro cilindros metálicos dispostos em paralelo. As voltagens aplicadas afectam a trajectória dos iões que percorrem a trajectória centrada entre os quatro cilindros. Para dadas voltagens AC e DC, apenas os iões com uma certa razão massa/carga passam através do filtro quadrupolar, e todos os outros iões são desviados da sua trajectória original. É obtido um espectro de massa através da monitorização dos iões que passam através do filtro quadrupolar à medida que se fazem variar as voltagens nos cilindros.
Um espectrómetro de massa de tempo-de-voo usa as diferenças no tempo de trânsito através de uma “região de flutuação” para separar os iões de diferentes massas. O aparelho funciona num modo pulsado, de tal forma que os iões terão de ser produzidos em impulsos e/ou extraídos em impulsos. Um campo eléctrico pulsado acelera todos os iões até que estes penetram numa região de flutuação subtraída à acção do campo com uma energia cinética de qV, em que q é a carga do ião e V é a voltagem aplicada. Uma vez que a energia cinética dos iões corresponde a 0,5 mV2, os iões mais leves adquirirão maior velocidade do que os iões mais pesados e atingirão mais depressa o detector localizado no final da região de flutuação. Os dados obtidos no detector de iões são visualizados num osciloscópio em função do tempo, produzindo-se o espectro de massa. O processo de formação de iões constitui o ponto de partida para as análises por espectrometria de massa. A ionização química é um método que utiliza um reagente formador de iões que reage com as moléculas de analito (marcadores) para formar iões através da transferência de um protão ou hidreto. Os reagentes formadores de iões são produzidos através da introdução de metano em grande excesso (relativamente ao marcador) numa fonte de iões de impacto electrónico (EI). 98
As colisões electrónicas produzem CH4+ e CH3+, que prosseguem a reacção com o metano para originar CH5+ e C2H5+. Outro método de ionização de marcadores consiste no uso de plasma e de uma descarga em tubo de electrões. O plasma é um gás quente parcialmente ionizado que excita e ioniza átomos de modo eficaz. Uma descarga em tubo de electrões corresponde a um plasma a baixa pressão mantido entre dois eléctrodos. A ionização por impacto electrónico utiliza um feixe de electrões, usualmente gerado a partir de um filamento de tungsténio, para ionizar átomos ou moléculas em fase gasosa. Um electrão do feixe retira, por colisão, um electrão dos átomos ou moléculas de analito, criando iões. A ionização por electrospray utiliza uma agulha muito fina e uma série de divisores de fluxo. Uma solução de amostra é vaporizada para a câmara de fonte, formando-se gotículas. As goticulas transportam uma carga ao sair do sistema capilar, e. à medida que o solvente se vaporiza, as gotículas desaparecem deixando moléculas de analito altamente carregadas. A ESI é particularmente útil para grandes moléculas biológicas que são difíceis de vaporizar ou ionizar. O bombardeamento por átomos rápidos (FAB) utiliza um feixe de elevada energia de átomos neutros, tipicamente Xe ou Ar, que atingem uma amostra sólida causando desadsorção e ionização. Esta técnica é usada para grandes moléculas biológicas que atingem dificilmente a fase gasosa. A técnica de FAB provoca um pequeno grau de fragmentação e proporciona geralmente um pico de um grande ião molecular, o que a torna útil para a determinação de pesos moleculares. O feixe atómico é produzido através da aceleração de iões provenientes de uma fonte de iões através de uma célula de conversão de cargas. Os iões captam um electrão em resultado de colisões com átomos neutros, formando-se um feixe de átomos de elevada energia. A ionização por laser (LIMS) é um método em que um impulso de laser remove material da superfície de uma amostra e cria um microplasma que ioniza alguns dos constituintes da amostra. A ionização por desadsorção com laser assistida por matriz (MALDI) constitui um método LIMS para vaporização e ionização de grandes moléculas biológicas, tais como proteínas ou fragmentos de DNA. As moléculas biológicas são dispersas numa matriz sólida, como o ácido nicotínico. Um impulso de laser UV remove a matriz, que arrasta algumas das moléculas de grandes dimensões para a fase gasosa sob uma forma ionizada, o que faz com que estas 99 moléculas possam ser extraídas para um espectrómetro de massa. A ionização por desadsorção em plasma (PD) utiliza o decaimento de 252Cf. o qual produz dois fragmentos de fissão que se deslocam em direcções opostas. Um dos fragmentos atinge a amostra, produzindo 1-10 iões de analito. O outro fragmento atinge o detector e desencadeia o processo de aquisição de dados. Este método de ionização é especialmente útil para grandes moléculas biológicas. A ionização por ressonância (RIMS) é um método em que um ou mais feixes de laser são sintonizados em ressonância com transições de um átomo ou molécula em fase gasosa de modo a promovê-lo, num processo em etapas, a um nível acima do seu potencial de ionização, criando-se um ião. A ionização secundária (SIMS) utiliza um feixe de iões, formado por 3He+, 160+ ou 40Ar+ , que é focado sobre a superfície de uma amostra e lança material para a fase gasosa. A ionização por faísca é um método que ioniza analitos em amostras sólidas através da aplicação de uma corrente eléctrica pulsada entre dois eléctrodos.
Um marcador poderá receber uma carga antes, durante ou após o seu corte a partir da molécula a que se encontra ligado. Os métodos de ionização que se baseiam na “desadsorção” de iões, a formação ou emissão directa de iões a partir de superfícies sólidas ou líquidas, têm permitido a utilização crescente de compostos não voláteis e termolábeis. Estes métodos eliminam a necessidade de volatilização das moléculas neutras antes da ionização e minimizam de maneira geral a degradação térmica das espécies moleculares. Estes métodos incluem a desadsorção em campo (Becky, Principies of Field lonization and Field Desorption Mass Spectrometry, Pergamon, Oxford, 1977), a desadsorção por plasma (Sundqvist e Macfarlane, Mass Spectrom. Rev. 4:421, 1985), desadsorção por laser (Karas e Hillenkamp, Anal. Chem. 60:2299, 1988); Karas et al., Angew. Chem. 101:805, 1989). bombardeamento por partículas rápidas (p.ex., bombardeamento por átomos rápidos, FAB, e espectrometria de massa de iões secundários, SIMS, Barber et al., Anal. Chem. 54:645A, 1982), e ionização por termospray (TS) (Vestal, Mass Spectrom. Rev. 2:447, 1983). A técnica de termospray é largamente utilizada em combinação on-line com a cromatografia líquida. Os métodos de FAB em fluxo contínuo (Caprioli et al., Anal. Chem. 58:2949, 1986) demonstraram igualmente possuir um potencial significativo. Uma lista mais completa de combinações de 100
ionização/espectrometria de massa inclui a espectrometria de massa por captura de iões, espectrometria de massa com ionização por electrospray, espectrometria de massa com spray de iões, espectrometria de massa com ionização em líquido, espectrometria de massa com ionização a pressão atmosférica, espectrometria de massa com ionização por electrões, espectrometria de massa com ionização por bombardeamento com átomos metaestáveis, espectrometria dè massa com ionização por bombardeamento com átomos rápidos, espectrometria de massa MALDI, espectrometria de massa de tempo-de-voo com fotoionização, espectrometria de massa com micro-sonda de laser, espectrometria de massa MALDI-TOF, espectrometria de massa APCI, espectrometria de massa por nanospray, espectrometria de massa com ionização em spray nebulizado, espectrometria de massa com ionização química, espectrometria de massa com ionização por ressonância, espectrometria de massa com ionização secundária, espectrometria de massa por termospray.
Os métodos de ionização adaptáveis a compostos biológicos não voláteis possuem intervalos de aplicabilidade sobreponíveis. As eficiências de ionização são altamente dependentes da composição da matriz e do tipo de composto. Os resultados actualmente disponíveis indicam que a massa molecular máxima analisável por TS é de cerca de 8000 daltons (Jones e Krolik, Rapid Comm. Mass Spectrom. 7:67, 1987). Uma vez que a TS é realizada principalmente em associação a espectrómetros quadrupolares de massa, a sensibilidade é tipicamente afectada de modo desproporcionado por elevadas razões de massa/carga (m/z). Os espectrómetros de massa de tempo-de-voo (TOF) estão disponíveis no mercado e possuem a vantagem de que o intervalo de razões m/z é limitado apenas pela eficiência do detector. Foram recentemente introduzidos dois outros métodos de ionização. Estes dois métodos são agora designados por desadsorção por laser assistida por matriz (MALDI, Karas e Hillenkamp, Anal. Chem. 60:2299, 1988; Karas et al.. Angew. Chem. 707:805, 1989) e ionização por electrospray (ESI). Ambas as metodologias exibem uma eficiência de ionização muito elevada (i.e.. uma razão de [iões moleculares produzidos]/[moléculas consumidas] muito elevada). A sensibilidade, que define em última análise o potencial da técnica, está dependente 101 da dimensão da amostra, da quantidade de iões, da taxa de fluxo, da eficiência de detecção e da eficiência real de ionização. A MS por electrospray baseia-se numa ideia inicialmente proposta nos anos 60 (Dole et ai., J. Chem. Phys. 49\2240, 1968). A ionização por electrospray (ESI) constitui um meio de produção de moléculas carregadas para análise por espectrometria de massa. Abreviadamente, a ionização por electrospray produz gotículas altamente carregadas através da nebulização de líquidos num campo electrostático forte. As gotículas altamente carregadas, geralmente formadas num banho seco de gás à pressão atmosférica, diminuem de tamanho por evaporação do solvente neutro até que a repulsão de cargas se sobrepõe âs forças de coesão, conduzindo a uma “explosão de Coulomb”. O mecanismo exacto de ionização é controverso, tendo sido sugeridas várias hipóteses por diversos grupos de trabalho (Blades et al, Anal. Chem. 63:2109-14, 1991; Kebarle et al., Anal. Chem. 65:A972-86, 1993; Fenn, J. Am. Soc. Mass Spectrom:524-35, 1993). Independentemente do processo de formação de iões utilizado, a ESI produz moléculas carregadas sob condições suaves a partir de uma solução. A capacidade de obter dados úteis por espectrometria de massa a partir de pequenas quantidades de uma molécula orgânica depende da produção eficiente de iões. A eficiência de ionização da ESI está relacionada com a extensão do processo de associação de uma carga positiva à molécula. O melhoramento da ionização a nível experimental tem geralmente envolvido o uso de condições acídicas. Um outro método de melhoramento da ionização consiste em usar aminas quaternárias quando tal se mostra possível (ver Aebersold et al., Protein Science 1:494-503, 1992; Smith etal., Anal. Chem. 60:436-41, 1988). A ionização por electrospray é em seguida descrita em maior detalhe. A produção de iões por electrospray requer dois passos: dispersão de gotículas altamente carregadas a pressão próxima da atmosférica, seguida de condições que induzem a evaporação. É passada uma solução de moléculas de analito através de uma agulha mantida a um potencial eléctrico elevado. Na extremidade da agulha, a solução dispersa-se num spray de gotículas pequenas e altamente carregadas contendo as moléculas de analito. As pequenas gotículas evaporam-se rapidamente e, através de um processo de desadsorção em campo ou de evaporação residual,
as moléculas protonadas de proteínas são libertadas para a fase gasosa. O electrospray é geralmente produzido por aplicação de um campo eléctrico elevado a um pequeno fluxo de líquido (geralmente 1-10 μΐ/min) num tubo capilar. É tipicamente aplicada uma diferença de potencial de 3-3 kV entre o capilar e um contra-eléctrodo situado a uma distância de 0,2-2 cm (zona a partir da qual os iões, os agregados moleculares carregados e até as gotículas carregadas, dependendo da extensão da dessolvatação, poderão ser recolhidos pelo MS através de um pequeno orifício). O campo eléctrico resulta numa acumulação de cargas à superfície do líquido na extremidade do capilar; desta forma, a taxa de fluxo do líquido, a resistividade e a tensão superficial são factores importantes na produção de gotículas. O elevado campo eléctrico resulta numa quebra de continuidade da superfície do líquido e na formação de gotículas líquidas altamente carregadas. Podem produzir-se gotículas com carga positiva ou negativa, dependendo da tendência conferida pelo capilar. O modo de iões negativos requer a presença de um captador de electrões, como o oxigénio, para inibir a descarga eléctrica.
Pode utilizar-se uma grande variedade de líquidos para produzir electrostaticamente um spray para um vácuo, sendo também possível utilizar um agente nebulizador. O uso de campos exclusivamente eléctricos para a nebulização debate-se com algumas restrições práticas a nível do intervalo de condutividade do líquido e da constante dieléctrica. É necessário ter uma condutividade da solução menor do que 1CT5 ohms à temperatura ambiente para que seja possível obter um electrospray estável a taxas de fluxo de líquido úteis correspondendo a uma solução aquosa de electrólito de concentração < 10"4 M. No modo considerado mais útil para a ESI-MS, uma taxa de fluxo de líquido apropriada resulta na dispersão do líquido numa névoa fina. A uma curta distância do capilar, o diâmetro das gotículas é frequentemente bastante uniforme e da ordem de 1 prn. Reveste-se de importância particular o facto de a corrente total de iões no electrospray sofrer apenas um aumento ligeiro com taxas de fluxo de líquido superiores. Existem indicações de que o aquecimento é útil para a manipulação do electrospray. Por exemplo, um ligeiro aquecimento possibilita uma produção rápida de electrospray a partir de soluções aquosas, presumivelmente devido à diminuição da viscosidade e da tensão 103 superficial. Tanto o electrospray termicamente assistido como o electrospray assistido por nebulização de gás permitem a utilização de taxas mais elevadas de fluxo de líquido, mas diminuem a intensidade da carga das gotículas. A formação de iões moleculares requer condições que proporcionem a evaporação da população inicial de gotículas. Isto pode ser conseguido a pressões mais elevadas através de um fluxo de gás seco a temperaturas moderadas (< 60°C), através de aquecimento durante o transporte através da interface, ou (particularmente no caso dos métodos de captura de iões) por colisões energéticas a pressão relativamente baixa.
Se bem que os processos detalhados subjacentes à ESI permaneçam obscuros, as gotículas muito pequenas produzidas pela ESI parecem possibilitar que praticamente qualquer espécie em solução que transporte uma carga residual seja transferida para a fase gasosa após a evaporação do solvente residual. A detecção por espectrometria de massa requer, então, que os iões possuam uma razão m/z apropriada (< 4000 daltons para os instrumentos quadrupolares) após a dessolvatação, e que a sua produção e transmissão sejam suficientemente eficientes. A larga gama de solutos que se verificou já adequar-se à ESI-MS, e a ausência de uma dependência substancial da eficiência de ionização relativamente ao peso molecular, sugerem que este processo de ionização é altamente não-discriminante e largamente aplicável. A "fonte" de iões do electrospray funciona a uma pressão próxima da atmosférica. A "fonte" de electrospray consiste tipicamente num capilar de vidro ou metal que incorpora um método para imprimir uma tendência eléctrica à solução líquida relativamente a um contra-eléctrodo. As soluções, tipicamente misturas de metanol-água que contêm o analito e frequentemente outros aditivos como o ácido acético, fluem para a extremidade do terminal. Foi descrita uma fonte de ESI (Smith et al., Anal. Chem. 62:885, 1990) que pode adaptar-se a essencialmente qualquer sistema de solventes. As taxas de fluxo típicas em ESI encontram-se entre 1-10 ul/min. O principal requisito de uma interface ESI-MS é o de que a recolha e transporte de iões a partir da região de alta pressão para o MS se faça da maneira mais eficiente possível. A eficiência da ESI pode atingir níveis muito elevados, fornecendo uma base para medições extremamente sensíveis, o que se torna útil no contexto do invento aqui descrito. A performance do instrumento pode fornecer uma corrente iónica total a nível do detector de cerca de 2 x 10'12 A, ou cerca de 107 contagens/s para as espécies de carga única. Com base na performance do instrumento, concentrações tão baixas como 10"10 M ou cerca de 10'18 mol/s de uma espécie de carga única fornecerão uma corrente iónica detectável (de cerca de 10 contagens/s) se o analito se encontrar completamente ionizado. Por exemplo, obtiveram-se limites de detecção da ordem das atomoles com iões de amónio quaternário usando uma interface entre ESI e a electroforese capilar de zona (Smith et al., Anal. Chem. 59:1230, 1988). Para um composto com um peso molecular de 1000, o número médio de cargas é igual a 1, o número aproximado de estados de carga é 1, a largura de picos (m/z) é 1 e a intensidade máxima (ião/s) é de 1 x1012. O consumo de amostra necessário para a obtenção de um espectro de ESI é notavelmente baixo (Smith et al., Anal. Chem. 60:1948, 1988). Poderão igualmente obter-se ganhos substanciais através do uso de um conjunto de detectores em instrumentos de sector, permitindo a detecção em simultâneo de porções do espectro. Uma vez que actualmente apenas cerca de 10'5 de todos os iões formados por ESI são detectados, a atenção dedicada aos factores que limitam a performance do instrumento poderão fornecer a base para uma sensibilidade melhorada. Tornar-se-á evidente aos peritos na técnica que o presente invento contempla e se adapta a melhoramentos das tecnologias de ionização e detecção. É preferencialmente colocada uma interface entre a instrumentação de separação (p.ex., gel) e o detector (p.ex., espectrómetro de massa). A interface possui preferencialmente as seguintes propriedades: (1) a capacidade para recolher os fragmentos de DNA em curtos intervalos de tempo, (2) concentrar os fragmentos de DNA, (3) remover os fragmentos de DNA a partir dos tampões de electroforese e do meio. (4) cortar as ligações entre o marcador e o fragmento de DNA, (5) separar o marcador do fragmento de DNA, (6) descartar o fragmento de DNA. (7) colocar o marcador numa solução volátil, (8) volatilizar e ionizar o marcador, e (9) colocar ou transportar o marcador para um dispositivo de electrospray que introduza o marcador no espectrómetro de massa. A interface possui também a capacidade de “recolher” os fragmentos de DNA à medida que estes vão sendo eluídos a partir do fundo de um gel. O suporte de gel 105
I
poderá ser composto por uma placa de gel, um gel tubular, um capilar, etc. Os fragmentos de DNA poderão ser recolhidos por meio de diversos métodos. O primeiro método corresponde ao uso de um campo eléctrico, sendo os fragmentos de DNA recolhidos a partir do eléctrodo ou na vizinhança deste. Num segundo método, os fragmentos de DNA são recolhidos fazendo passar um fluxo de líquido pelo fundo do gel. Poderão combinar-se aspectos dos dois métodos, sendo o DNA recolhido a partir de um fluxo de líquido que pode posteriormente ser concentrado através do uso de um campo eléctrico. O resultado final é o de que os fragmentos de DNA são removidos do meio ao qual foi aplicado o método de separação. Assim, os fragmentos de DNA poderão ser “arrastados”de um tipo de solução para outro através do uso de um campo eléctrico.
Uma vez colocados os fragmentos de DNA em solução apropriada (compatível com o electrospray ou a espectrometria de massa), o marcador pode ser cortado do fragmento de DNA. O fragmento de DNA (ou seus resíduos) pode então ser separado do marcador através da aplicação de um campo eléctrico (de preferência, o marcador possui uma carga oposta à do fragmento de DNA). O marcador é em seguida introduzido no dispositivo de electrospray por meio de um campo eléctrico ou de um fluxo de líquido.
Os marcadores fluorescentes podem ser identificados e quantificados mais directamente através dos seus comprimentos de onda e intensidades de absorção e de emissão de fluorescência.
Se bem que um espectrofluorómetro seja um aparelho extremamente flexível, fornecendo intervalos contínuos de comprimentos de onda de excitação e emissão (Iex, Isi, Is2), os instrumentos mais especializados, tais como os citómetros de fluxo e os microscópios de varrimento por laser, requerem sondas que sejam excitáveis a um único comprimento de onda fixo. Nos instrumentos actuais, isto corresponde geralmente à linha de 488 nm do laser de árgon. A intensidade da fluorescência por molécula de sonda é proporcional ao produto de ε por QY. O intervalo destes parâmetros, para os fluoróforos de importância prática, corresponde a cerca de 10.000 a 100.000 cm'1M"1 para ε e de 0,1 a 1,0 para QY. Quando a absorção é levada até à saturação através do uso de 106 iluminação de elevada intensidade, a destruição irreversível do fluoróforo excitado (fotolexiviação) torna-se o factor limitante da detectabilidade da fluorescência. O impacto prático da fotolexiviação depende da técnica de detecção de fluorescência envolvida.
Tornar-se-á evidente a um técnico que é possível colocar um dispositivo (uma interface) entre os passos de separação e de detecção para permitir o funcionamento contínuo da separação por dimensões e da detecção do marcador (em tempo real). Este procedimento reune a metodologia e instrumentação de separação com a metodologia e instrumentação de detecção, formando um só dispositivo. Por exemplo, é interposta uma interface entre uma técnica de separação e a detecção por espectrometria de massa ou amperometria potenciostática. A função da interface é primariamente a libertação do marcador (p.ex., de espectrometria de massa) a partir do anâlito. Existem diversas implementações representativas da interface. A concepção da interface está dependente da escolha dos linkers susceptíveis ao corte. No caso da luz ou dos linkers susceptíveis ao corte fotolítico. é necessária uma fonte de energia ou de fotões. No caso de um linker ácido-lábil, de um linker lábil a bases ou de um linker de dissulfureto, é necessária a adição do reagente à interface. No caso dos linkers lábeis ao calor, é necessária uma fonte de energia calorífica. É requerida a adição de enzimas para um linker sensível a enzimas, como acontece com uma protease especifica e um linker de péptidos, uma nuclease e um linker de DNA ou RNA, uma glicosilase, HRP ou fosfatase e um linker que é instável após o corte (p.ex., similar aos substratos quimioiuminescentes). Outras características da interface incluem um alargamento mínimo das bandas e a separação entre o DNA e os marcadores antes da injecção destes num espectrómetro de massa. As técnicas de separação incluem as que se baseiam em métodos e técnicas electroforéticas, técnicas de afinidade, retenção por dimensões (diálise), filtração e semelhantes. É igualmente possível concentrar os marcadores (ou a construção de ácido nucleico-linker-marcador), capturá-los electroforeticamente e libertá-los então para uma corrente alternativa de reagente que seja compatível com o tipo particular de método de ionização seleccionado. A interface poderá igualmente possuir a capacidade de capturar os marcadores (ou a construção de ácido nucleico-linker- 107
marcador) em microesferas, lançando a(s) esfera(s) para a câmara e realizando então a desadsorção por laser/vaporização. É também possível fazer uma extracção por fluxo para um tampão alternativo (p.ex., de um tampão de electroforese capilar para um tampão hidrofóbico através de uma membrana permeável). Em alguns casos poderá igualmente ser desejável a libertação intermitente de marcadores para o espectrómetro de massa, o que acrescentaria uma outra função à interface. Outra das funções da interface consiste na libertação de marcadores a partir de múltiplas colunas para um espectrómetro de massa, através de uma fenda de introdução rotativa em função do tempo para cada coluna. Adicionalmente, é possível promover a libertação de marcadores a partir de uma só coluna para detectores MS múltiplos, de uma forma espaçada no tempo, recolher cada conjunto de marcadores durante alguns milisegundos, e libertá-los em seguida pra um espectrómetro de massa. É a seguir apresentada uma lista de fornecedores representativos de tecnologias de separação e detecção que podem ser usadas no âmbito do presente invento. A Hoefner Scientific Instruments (San Francisco, CA) fabrica equipamentos de electroforese (Two Step™, Poker Face™ II) para aplicações em reacções de sequenciação. A Pharmacia Biotech (Piscataway, NJ) fabrica equipamentos de electroforese para separações e sequenciação de DNA (PhastSystem para análise por PCR-SSCP, MacroPhor System para a sequenciação de DNA). A Perkin Elmer/Applied Biosystems Division (ABI, Foster City, CA) fabrica sequenciadores semi-automatizados baseados em corantes fluorescentes (ABI373 e ABI377). A Analytical Spectral Devices (Boulder, CO) fabrica espectrómetros de UV. A Hitachi Instruments (Tóquio, Japão) fabrica espectrómetros de Absorção Atómica, espectrómetros de Fluorescência, Espectrómetros de Massa LC e GC, espectrómetros de NMR e Espectrómetros de UV-VIS. A PerSeptive Biosystems (Framingham, MA) produz Espectrómetros de Massa (Voyager™ Elite). A Bruker Instruments Inc. (Manning Park, MA) fabrica Espectrómetros FTIR (Vector 22), Espectrómetros FT-Raman, Espectrómetros de Massa de Tempo-de-Voo (Reflex 11™), Espectómetro de Massa de Captura de Electrões (Esquire™) e um Espectrómetro de Massa MALDI. A Analytical Technology Inc. (ATI, Boston, MA) produz unidades de Electroforese Capilar em Gel, detectores UV e Detectores de 108
Conjunto de Díodos. A Teledyne Electronic Technologies (Mountain View, CA) fabrica um Espectrómetro de Massa de Captura de Iões (3DQ Discovery™ e 3DQ Apogee™)· A Perkin Elmer/Applied Biosystems Division (Foster City.. CA) fabrica um Espectrómetro de Massa Sciex (quadrupolo triplo LC/MS/MS, API 100/300) que é compatível com o método de electrospray. A Hewlett-Packard (Santa Clara, CA) produz Detectores Selectivos de Massa (HP 5972A), Espectrómetros de Massa MALDI-TOF (HP G2025A), Detectores de Conjunto de Díodos, unidades de CE, unidades de HPLC (HP1090) e Espectrómetros de UV. A Finigan Corporation (San Jose, CA) fabrica espectrómetros de massa (de sector magnético (MAT 95 S™), quadrupolares (MAT 95SQ™) e quatro outros tipos de espectrómetros associados). A empresa Rainín (Emeryville, CA) fabrica instrumentos de HPLC.
Os métodos e composições aqui descritos possibilitam que os marcadores cortados sejam usados como mapas de um tipo de amostra em particular e da identidade de nucleótidos. No início de cada método de sequenciação, é atribuído um primer particular (seleccionado) a um marcador particular individualizado. Os marcadores mapeiam um tipo de primer, que por sua vez mapeia um tipo de vector, que por seu lado mapeia uma identidade de amostra. O marcador poderá também mapear um tipo de terminador didesoxi (ddTTP, ddCTP, ddGTP, ddATP), sendo o primer marcado colocado na respectiva reacção didesoxinucleotídica para funcionar como referência. A reacção de sequenciação é então realizada e os fragmentos resultantes são sequencialmente separados por dimensões ao longo do tempo.
Os marcadores são cortados a partir dos fragmentos numa estrutura temporal e são medidos e registados numa estrutura temporal. A sequência é construída através da comparação do mapa do marcador com a estrutura temporal. Isto significa que todas as identidades dos marcadores são registadas ao longo do tempo após o passo de separação por dimensões e se relacionam entre si numa estrutura temporal. O passo de separação por dimensões separa os fragmentos de ácido nucleico por incrementos de um nucleótido, e desta forma as identidades de marcador relacionadas encontram-se separadas entre si por um só· nucleótido. Por meio do conhecimento prévio do mapa do terminador didesoxi ou do mapa de 109 nucleótidos e do tipo de amostra, a sequência é prontamente deduzida de modo linear.
Os exemplos que se seguem são fornecidos com fins ilustrativos e não pretendem limitar o âmbito do invento.
Salvo indicação em contrário, os produtos químicos usados nos exemplos poderão ser adquiridos à Aldrich Chemical Company, Milwaukee, Wl. São usadas as abreviaturas que se seguem, com os significados indicados: ANP = ácido 3-(Fmoc-amino)-3-(2-nitrofenil)propiónico NBA = ácido 4-(Fmoc-aminometil)-3-nitrobenzóico HATU = Hexafluorofosfato de 0-7-azabenzotriazol-1-il-N,N,N’,N’-tetrametilurónio DIEA = diisopropiletilamina MCT = monoclorotriazina NMM = 4-metilpirrolidona
ACT357 = sintetizador de péptidos ACT357 da Advanced ChenTech, Inc., Louisville, KY
ACT = Advanced ChenTech, Inc., Louisville, KY
NovaBiochem = CalBiochem-NovaBiochem International, San Diego, CA TFA = Ácido trifluoroacético
Tfa = Trifluoroacetilo INIP = ácido N-metilisopecótico
Tfp = Tetrafluorofenilo DIAEA = 2(Diisopropilamino)etilamina MCT = monoclorotriazeno 5’~AH-ODN = oligonucleótido marcado com aminohexilo em 5'
EXEMPLOS EXEMPLO 1
PREPARAÇÃO DE LINKERS ÁCIDO-LÁBEIS PARA USO EM SEQUENCIAÇÃO COM IDENTIFICADORES DE PM SUSCEPTÍVEIS DE CORTE A. Síntese de Ésteres de Pentafluorofenilo de Marcadores de Espectroscopia de Massa Susceptíveis ao Corte por Via Química, para Libertar Marcadores com Extremidades de Amida Carboxílica A Figura 1 apresenta o esquema de reacção.
Passo A. A resina TentaGel S AC (composto II; comercializada pela ACT; 1 eq.) é suspensa em DMF no vaso de recolha do sintetizador de péptidos ACT357 (ACT). São adicionados o composto I (3 eq.), HATU (3 eq.) e DIEA (7,5 eq.) em DMF, e o vaso de recolha é agitado durante 1 h. O solvente é removido e a resina é lavada com NMP (2X), MeOH (2X) e DMF (2X). O acoplamento de I à resina e os passos de lavagem são repetidos para originar o composto III.
Passo B. A resina (composto III) é misturada com piperidina a 25% em DMF e agitada durante 5 min. A resina é filtrada, sendo então misturada com piperidina a 25% em DMF e agitada durante 10 min. O solvente é removido e a resina é lavada com NMP (2X), MeOH (2X) e DMF (2X), sendo então directamente usada no passo C.
Passo C- A resina desprotegida obtida no passo B é suspensa em DMF e é adicionada à suspensão um aminoácido protegido por FMOC, contendo uma funcionalidade amina na sua cadeia lateral (composto IV, p.ex. alfa-N-FMOC-3-(3-piridil)-alanina, comercializado pela Synthetech, Albany, OR; 3 eq.), HATU (3 eq.) e DIEA (7,5 eq.) em DMF. O vaso é agitado durante 1 hora. O solvente é removido e a resina é lavada com NMP (2X), MeOH (2X) e DMF (2X). O acoplamento do 111
V «Cl- composto IV à resina e os passos de lavagem são repetidos para originar o composto V.
Passo D. A resina (composto V) é tratada com piperidina tal como descrito no passo B para remover o grupo FMOC. A resina desprotegida é então dividida em 16 partes iguais pelo ACT357 a partir do vaso de recolha e passado para 16 vasos de reacção.
Passo E. As 16 alíquotas de resina desprotegida obtida no passo D'são suspensas em DMF. A cada vaso de reacção é adicionado o ácido carboxílico apropriado VI-m6 (Ri_i6 C02H; 3 eq.), HATU (3 eq.) e DIEA (7,5 eq.) em DMF. Os vasos de reacção são agitados durante 1 hora. O solvente é removido e as alíquotas de resina são lavadas com NMP (2X), MeOFI (2X) e DMF (2X). O acoplamento de Vh_i6 às alíquotas de resina e os passos de lavagem são repetidos para originar os compostos VIIm6.
Passo F. As alíquotas de resina (compostos Vll-t.16) são lavadas com CH2CI2 (3X). É adicionado a cada vaso de reacção TFA a 1% em CH2CI2 e os vasos de reacção são agitados durante 30 min. O solvente é filtrado a partir dos vasos de reacção para tubos individuais. As alíquotas de resina são lavadas com CH2CI2 (2X) e MeOH (2X) e os filtrados são combinados nos tubos individuais. Os tubos individuais são evaporados em vácuo, fornecendo os compostos VHI1-16-
Passo G. Cada um dos ácidos carboxílicos livres VI111_16 é dissolvido em DMF. A cada solução é adicionada piridina (1,05 eq.), seguindo-se a adição de trifluoroacetato de pentafluorofenilo (1,1 eq.). As misturas são agitadas durante 45 min. à temperatura ambiente. As soluções são diluídas com EtOAc, lavadas com ácido cítrico em solução aquosa a 1 Μ (3X) e com NaHC03 em solução aquosa a 5% (3X), secadas em Na2S04, filtradas e evaporadas em vácuo, fornecendo os compostos IXi_16. 112 B. Síntese de Ésteres de Pentafluorofenilo de Marcadores de Espectroscopia de Massa Susceptíveis ao Corte por Via Química, para Libertar Marcadores com Extremidades de Ácido Carboxílico A Figura 2 apresenta o esquema de reacção.
Passo A. O ácido 4-(hidroximetil)fenoxibutírico (composto I; 1 eq.) é combinado com DIEA (2,1 eq.) e brometo de alilo (2,1 eq.) em CHCI3 e aquecido até refluxo durante 2 h. A mistura é diluída com EtOAc, lavada com HCI 1 N (2X), tampão de carbonato a pH 9,5 (2X) e solução concentrada de sal (1X), secada em Na2S04 e evaporada em vácuo para fornecer o éster de alilo do composto I.
Passo B. O éster de alilo do composto I obtido no passo A (1,75 eq.) é combinado em CH2CI2 com um aminoácido protegido por FMOC contendo uma funcionalidade amina na sua cadeia lateral (composto II, p.ex. alfa-N-FMOC-3-(3-piridil)-alanina, comercializado pela Synthetech, Albany, OR; 1 eq.), N-metilmorfolina (2,5 eq.) e HATU (1,1 eq.), com agitação à temperatura ambiente durante 4 h. A mistura é diluída com CH2CI2, lavada com ácido cítrico em solução aquosa a 1 Μ (2X), água (1X) e NaHC03 em solução aquosa a 5% (2X), secada em Na2S04 e evaporada em vácuo. O composto III é isolado por cromatografia de flash (CH2CI2 -> EtOAc).
Passo C. O composto 3 é dissolvido em CH2CI2, adicionando-se então Pd(PPh3)4 (0,07 eq.) e N-metilanilina (2 eq.), sendo a mistura agitada à temperatura ambiente durante 4 horas. A mistura é diluída com CH2CI2, lavada com ácido cítrico em solução aquosa a 1 Μ (2X) e água (1X), secada em Na2S04 e evaporada em vácuo. O composto IV é isolado por cromatografia de flash (CH2CI2 -> EtOAc + HOAc).
Passo D. A resina TentaGel S AC (composto V; 1 eq.) é suspensa em DMF no vaso de recolha do sintetizador de péptidos ACT357 (Advanced ChemTech Inc. (ACT), Louisville, KY). São adicionados o composto IV (3 eq.), HATU (3 eq.) e DIEA (7,5 eq.) em DMF, e o vaso de recolha é agitado durante 1 h. O solvente é removido e a 113 resina é lavada com NMP (2X), MeOH (2X) e DMF (2X). O acoplamento de IV à resina e os passos de lavagem são repetidos para originar o composto VI.
Passo E. A resina (composto VI) é misturada com piperidina a 25% em DMF e agitada durante 5 min. A resina é filtrada, sendo então misturada com piperidina a 25% em DMF e agitada durante 10 min. O solvente é removido e a resina é lavada com NMP (2X), MeOH (2X) e DMF (2X). A resina desprotegida é então dividida em 16 partes iguais pelo ACT357 a partir do vaso de recolha e passado para 16 vasos de reacção.
Passo F. As 16 alíquotas de resina desprotegida obtida no passo E são suspensas em DMF. A cada vaso de reacção é adicionado o ácido carboxílico apropriado VII-m6 (R-i-16 C02H; 3 eq.), HATU (3 eq.) e DIEA (7,5 eq.) em DMF. Os vasos de reacção são agitados durante 1 hora. O solvente é removido e as alíquotas de resina são lavadas com NMP (2X), MeOH (2X) e DMF (2X). O acoplamento de VII-m6 às alíquotas de resina e os passos de lavagem são repetidos para originar os compostos VIIh.16·
Passo G. As alíquotas de resina (compostos VIIImõ) são lavadas com CH2CI2 (3X). É adicionado a cada vaso de reacção TFA a 1% em CH2CI2 e os vasos de reacção são agitados durante 30 min. O solvente é filtrado a partir dos vasos de reacção para tubos individuais. As alíquotas de resina são lavadas com CH2CI2 (2X) e MeOH (2X) e os filtrados são combinados nos tubos individuais. Os tubos individuais são evaporados em vácuo, fornecendo os compostos IXm6.
Passo H. Cada um dos ácidos carboxílicos livres IXi_i6 é dissolvido em DMF. A cada solução é adicionada piridina (1,05 eq.), seguindo-se a adição de trifluoroacetato de pentafluorofenilo (1,1 eq.). As misturas são agitadas durante 45 min. à temperatura ambiente. As soluções são diluídas com EtOAc, lavadas com ácido cítrico em solução aquosa a 1 Μ (3X) e com NaHC03 em solução aquosa a 5% (3X), secadas em Na2S04, filtradas e evaporadas em vácuo, fornecendo os compostos Xi_i6· 114 EXEMPLO 2
DEMONSTRAÇÃO DO CORTE FOTOLÍTICO DE T-L-X
Um composto T-L-X como o preparado no Exemplo 11 foi irradiado com luz de UV próximo durante 7 minutos à temperatura ambiente. É usada uma lâmpada de fluorescência UV Rayonett (Southern New England Ultraviolet Co„ Middletown, CT) com um pico de emissão a 350 nm como fonte de luz UV. A lâmpada é colocada a uma distância de 15 cm das caixas de Petri que contêm as amostras. A electroforese em gel de SDS mostra que >85% do conjugado é cortado nestas condições. EXEMPLO 3
PREPARAÇÃO DE PRIMERS COM MARCADOR FLUORESCENTE E DEMONSTRAÇÃO DO CORTE DO FLUORÓFORO Síntese e Purificação de Oliqonucleótidos
Os oligonucleótidos (ODNs) são preparados em sintetizadores automatizados de DNA usando os reagentes químicos convencionais de fosforamidito comercialmente disponíveis, ou os reagentes químicos de H-fosfonato (Glenn Research Sterling, VA). Os fosforamiditos de dA, dG, dC e T bloqueados encontram-se comercialmente disponíveis nestas formas, e os nucleósidos sintéticos podem facilmente ser convertidos a uma forma apropriada. Os oligonucleótidos são preparados usando o fosforamidito convencional existente no mercado ou o reagente químico de H-fosfonato. Os oligonucleótidos são purificados através de adaptações dos métodos convencionais. Os oligonucleótidos com grupos 5’-tritilo são submetidas a cromatografia de HPLC usando uma coluna de fase reversa de 12 micrómetros e 300 # Rainin (Emeryville, CA) Dynamax C-8 com 4,2x250 mm, usando um gradiente de 15% a 55% de MeCN em Et3NH+OAc" 0,1 N, pH 7,0, durante 20 minutos. Após a realização da destritilação, os oligonucleótidos são adicionalmente purificados por cromatografia de exclusão em gel. As verificações analíticas relativas à qualidade dos oligonucleótidos são efectuadas numa coluna de PRP (Alltech, Deerfield, IL) a pH alcalino e por PAGE. 115
Preparação de oligonucleótidos derivatizados com 2,4,6-triclorotriazina: fazem-se reagir 10 a 1000 ug de oligonucleótido ligado a amina pela extremidade 5’ com um excesso de cloreto cianúrico recristalizado em n-metil-pirrolidona a 10% em tampão alcalino (pH 8,3 a 8,5, de preferência), a 19 - 25°C, durante 30 a 120 minutos. As condições de final de reacção consistem em borato de sódio 0,15 M, pH 8,3, cloreto cianúrico recristalizado a 2 mg/ml e respectivo oligonucleótido a 500 rig/ml. O cloreto cianúrico que não reagiu é removido por cromatografia de exclusão por dimensões numa coluna de Sephadex G-50 (Pharmacia, Piscataway, NJ).
Em seguida, faz-se reagir o oligonucleótido activado purificado com um excesso molar de 100 vezes de cistamina em borato de sódio 0,15 M, pH 8,3, durante 1 hora à temperatura ambiente. A cistamina que não reagiu é removida por cromatografia de exclusão por dimensões numa coluna de Sephadex G-50. Fazem-se então reagir os ODNs derivatizados com fluorocromos reactivos a aminas. A preparação de ODNs derivatizados é dividida em três porções e cada porção é posta em reacção com (a) um excesso molar de 20 vezes de cloreto de sulfonilo de Texas Red (Molecular Probes, Eugene, OR), com (b) um excesso molar de 20 vezes de cloreto de sulfonilo de Lissamina (Molecular Probes, Eugene, OR) ou (c) um excesso molar de 20 vezes de isotiocianato de fluoresceína. As condições de final de reacção consistem em borato de sódio 0,15 M, pH 8,3, durante 1 hora à temperatura ambiente. Os fluorocromos que não reagiram são removidos por cromatografia de exclusão por dimensões numa coluna de Sephadex G-50.
Para cortar o fluorocromo a partir do oligonucleótido, os ODNs são ajustados a uma concentração de 1 x 10'5 molar e são então feitas diluições (diluições de 12,3 vezes) em TE (TE corresponde a Tris 0,01 M, pH 7,0, EDTA 5 mM). A volumes de 100 ui de ODNs são adicionados 25 μΙ de ditiotreitol (DTT) 0,01 Μ. A um conjunto idêntico de controlos não é adicionado DTT. A mistura é incubada durante 15 minutos à temperatura ambiente. A fluorescência é medida numa placa negra de microtitulação. A solução é removida dos tubos de incubação (150 microlitros) e colocada numa placa negra de microtitulação (Dynatek Laboratories, Chantilly, VA). As placas são então lidas directamente por meio de um fluorómetro Fluoroskan II (Flow Laboratories, McLean, VA) utilizando um comprimento de onda de excitação 116 de 495 nm e monitorizando a emissão a 520 nm para a fluoresceína, utilizando um comprimento de onda de excitação de 591 nm e monitorizando a emissão a 612 nm para o Texas Red, e utilizando um comprimento de onda de excitação de 570 nm e monitorizando a emissão a 590 nm para a lissamina.
Moles de Fluorocromo RFU não cortado RFU cortado RFU Livre 1,0 xTcFm CÓ 1200 1345 3,3 x 106 M 2,4 451 456 1,1 x 106 M 0,9 135 130 3,7 x 107 M 0,3 44 48 1,2 x 107 M 0,12 15,3 16,0 4,1 x 107 M 0,14 4,9 5,1 1,4 x 108 M 0,13 2,5 2,8 4.5 x 109 M 0,12 0,8 0,9
Os dados indicam que se verifica um aumento de cerca de 200 vezes na fluorescência relativa quando o fluorocromo é cortado a partir do ODN. EXEMPLO 4
PREPARAÇÃO DE PRIMERS DE SEQUÊNCIA M13 MARCADOS E DEMONSTRAÇÃO DO CORTE DOS MARCADORES
Preparação de oligonucleótidos derivatizados com 2,4,6-triclorotriazina. fazem-se reagir 1000 ug de oligonucleótido ligado a amina pela extremidade 5’ (5’-hexilamina-TGTAAAACGACGGCCAGT-3’) (ID da Seq. N° 1) com um excesso de cloreto cianúrico recristalizado em n-metil-pirrolidona a 10% em tampão alcalino (pH 8.3 a 8,5, de preferência), a 19 - 25°C, durante 30 a 120 minutos. As condições de final de reacção consistem em borato de sódio 0,15 M, pH 8,3, cloreto cianúrico recristalizado a 2 mg/ml e respectivo oligonucleótido a 500 pg/ml. O cloreto cianúrico 117
que não reagiu é removido por cromatografia de exclusão por dimensões numa coluna de Sephadex G-50 .
I I
Em seguida, faz-se reagir o oligonucleótido activado purificado com um excesso molar de 100 vezes de cistamina em borato de sódio 0,15 M. pH 8,3, durante 1 hora à temperatura ambiente. A cistamina que não reagiu é removida por cromatografia de exclusão por dimensões numa coluna de Sephadex G-50. Fazem-se então reagir os ODNs derivatizados com diversas aminas.· A preparação derivatizada de ODNs é dividida em 12 porções e cada porção é posta em reacção (em excesso molar de 25 vezes) com os ésteres de pentafluorofenilo de: (1) ácido 4-metoxibenzóico, (2) ácido 4-fluorobenzóico, (3) ácido toluico, (4) ácido benzóico, (5) ácido indol-3-acético, (6) ácido 2,6-difluorobenzóico, (7) N-óxido de ácido nicotínico, (8) ácido 2-nitrobenzóico, (9) ácido 5-acetilsalicílico, (10) ácido 4-etoxibenzóico, (11) ácido cinâmico, (12) ácido 3-aminonicotínico. A reacção é efectuada durante 2 horas a 37°C em borato de Na 0,2 M, pH 8,3. Os ODNs derivatizados são purificados por cromatografia de exclusão em gel numa coluna de Sephadex G-50.
Para cortar o marcador a partir do oligonucleótido, os ODNs são ajustados a uma concentração de 1 x 10'5 molar e são então feitas diluições (diluições de 12,3 vezes) em TE (TE corresponde a Tris 0,01 M, pH 7,0, EDTA 5 mM) com 50% de EtOH (VA/). A volumes de 100 μΙ de ODNs são adicionados 25 μΙ de ditiotreitol (DTT) 0.01 Μ. A um conjunto idêntico de controlos não é adicionado-DTT. A mistura é incubada durante 30 minutos à temperatura ambiente. É adicionado NaCI a 0,1 M e são adicionados 2 volumes de EtOH para precipitar os ODNs. Os ODNs são removidos da solução por centrifugação a 14.000 x G a 4°C durante 15 minutos. Os sobrenadantes são reservados e secos por completo. O pellet é então dissolvido em 25 μι. de MeOH. O pellet é então testado por espectrometria de massa quanto à presença de marcadores. O espectrómetro de massa usado neste trabalho é um espectrómetro de massa de transformação de Fourier com fonte externa de iões (FTMS). As amostras preparadas para análise MALDI são depositadas na ponta de uma sonda directa e inseridas na fonte de iões. Quando a amostra é irradiada com um impulso de laser, são extraídos iões da fonte que passam para um longo canal quadrupolar de guia de 118 iões, que focaliza e transporta os iões para uma célula de analisador FTMS localizada no interior do orifício de um magneto supercondutor.
Os espectros fornecem a informação que se segue. São encontrados picos de intensidade que varia entre 25 a 100 unidades de intensidade relativa para os seguintes pesos moleculares: (1) 212,1 amu indicando um derivado do ácido 4-metoxibenzóico, (2) 200,1 amu indicando um derivado do ácido 4-fluorobenzóico, (3) 196.1 amu indicando um derivado do ácido toluico, (4) 182,1 amu indicando um derivado do ácido benzóico, (5) 235,2 amu indicando um derivado do ácido indol-3-acético. (6) 218,1 amu indicando um derivado do ácido 2,6-difluorobenzóico, (7) 199.1 amu indicando um derivado N-óxido do ácido nicotínico, (8) 227,1 amu indicando 2-nitrobenzamida, (9) 179,18 amu indicando um derivado do ácido 5-acetilsalicílico, (10) 226,1 amu indicando um derivado do ácido 4-etoxibenzóico, (11) 209.1 amu indicando um derivado do ácido cinâmico, (12) 198,1 amu indicando um derivado do ácido 3-aminonicotínico.
Os resultados indicam que os marcadores são cortados a partir dos primers e são detectáveis por espectrometria de massa. EXEMPLO 5
PREPARAÇÃO DE UM CONJUNTO DE COMPOSTOS COM A FÓRMULA
Ri-36-LYS(í:-INIP)-ANP-TFP A Figura 3 ilustra a síntese em paralelo de um conjunto de 36 compostos T-L-X (X = Lh), em que Lh é um éster activado (especificamente, o éster de tetrafluorofenilo), L2 é um grupo orto-nitrobenzilamina e L3 é um grupo metileno que liga Lh e L2, T possui uma estrutura modular em que o grupo de ácido carboxílico da lisina foi ligado ao átomo de azoto do grupo benzilamina de L2 para formar uma ligação amida, e um componente de peso variável Ri.36 (em que estes grupos R correspondem a T2 tal como aqui definido, e podem ser introduzidos por meio de qualquer um dos ácidos carboxílicos aqui listados) se encontra ligado através do grupo α-amino da lisina, existindo também um grupo melhorador da sensibilidade da 119 espectrometria de massa (introduzido através do ácido N-metilisonipecótico) que se encontra ligado através do grupo ε-amino da lisina.
Por referência à Figura 3:
Passo A. A Resina NovaSyn HMP (comercializada pela NovaBiochem; 1 eq.) é suspensa em DMF no vaso de recolha do ACT357. São adicionados o composto I (ANP, comercializado pela ACT; 3 eq.), HATU (3 eq.) e NMM (7,5 eq.) em DMF, e o vaso de recolha é agitado durante 1 h. O solvente é removido e a resina é lavada com NMP (2X), MeOFI (2X) e DMF (2X). O acoplamento de I à resina e os passos de lavagem são repetidos para originar o composto II.
Passo B. A resina (composto II) é misturada com piperidina a 25% em DMF e agitada durante 5 min. A resina é filtrada, sendo então misturada com piperidina a 25% em DMF e agitada durante 10 min. O solvente é removido e a resina é lavada com NMP (2X), MeOH (2X) e DMF (2X), sendo então directamente usada no passo C.
Passo C. A resina desprotegida obtida no passo B é suspensa em DMF e é adicionada à suspensão um aminoácido protegido por FMOC, contendo uma funcionalidade amina na sua cadeia lateral (Fmoc-Lys-(Aloc)-OH, comercializado pela PerSeptive Biosystems; 3 eq.), HATU (3 eq.) e NMM (7,5 eq.) em DMF. O vaso é agitado durante 1 hora. O solvente é removido e a resina é lavada com NMP (2X), MeOH (2X) e DMF (2X). O acoplamento de Fmoc-Lys-(Aloc)-OH á resina e os passos de lavagem são repetidos para originar o composto IV.
Passo D. A resina (composto IV) é lavada com CH2CI2 (2X), sendo então suspensa numa solução de (PPh3)4Pd (0) (0,3 eq.) e PhSiH3 (10 eq.) em CH2CI2. A mistura é agitada durante 1 hora. O solvente é removido e a resina é lavada com CH2CI2 (2X). O passo de paládio é repetido. O solvente é removido e a resina é lavada com CH2CI2 (2X), dietilditiocarbamato de Ν,Ν-diisopropiletilamónio em DMF (2X) e DMF (2X) para originar o composto V. 120
Passo E. A resina desprotegida do passo D é acoplada ao ácido N-metilisonipecótico tal como descrito no passo C para originar o composto VI.
Passo F. A resina VI protegida por Fmoc é dividida em 36 partes iguais pelo ACT357 a partir do vaso de recolha para 36 vasos de reacção, originando os compostos Vli. 36-
Passo G. A resina (compostos Vh.36) é tratada com piperidina como descrito no passo B, para remover o grupo FMOC.
Passo H. As 36 alíquotas de resina desprotegida obtida no passo G são suspensas em DMF. A cada vaso de reacção é adicionado o ácido carboxílico apropriado (R1-36 C02H; 3 eq.), HATU (3 eq.) e NMM (7,5 eq.) em DMF. Os vasos de reacção são agitados durante 1 hora. O solvente é removido e as alíquotas de resina são lavadas com NMP (2X), MeOH (2X) e DMF (2X). O acoplamento de R-m6 C02H às alíquotas de resina e os passos de lavagem são repetidos para originar os compostos Vllli_36.
Passo I. As alíquotas de resina (compostos νΐΙΙι_36) são lavadas com CH2CI2 (3X). É adicionado a cada vaso de reacção TFA:H20:CH2CI2 a 90:5:5 e os vasos de reacção são agitados durante 120 min. O solvente é filtrado a partir dos vasos de reacção para tubos individuais. As alíquotas de resina são lavadas com CH2CI2 (2X) e MeOH (2X) e os filtrados são combinados nos tubos individuais. Os tubos individuais são evaporados em vácuo, fornecendo os compostos IX1.36.
Passo J. Cada um dos ácidos carboxílicos livres IX1-36 é dissolvido em DMF. A cada solução é adicionada piridina (1,05 eq.), seguindo-se a adição de trifluoroacetato de tetrafluorofenilo (1,1 eq.): As misturas são agitadas durante 45 min. à temperatura ambiente. As soluções são diluídas com EtOAc, lavadas com NaHC03 em solução aquosa a 5% (3X), secadas em Na2S04, filtradas e evaporadas em vácuo, fornecendo os compostos Xi-36- 121 EXEMPLO 6
PREPARAÇÃO DE UM CONJUNTO DE COMPOSTOS COM A FÓRMULA
Ri.36-LYS(b-INIP)-NBA-TFP A Figura 4 ilustra a síntese em paralelo de um conjunto de 36 compostos T-L-X (X = Lh), em que Lh é um éster activado (especificamente, o éster de tetrafluorofenilo), L2 é um grupo orto-nitrobenzilamina e L3 é uma ligação directa entre Lh e L2, em que Lh se encontra directamente ligado ao anel aromático do grupo L2, T possui uma estrutura modular em que o grupo de ácido carboxílico da lisina foi ligado ao átomo de azoto do grupo benzilamina de L2 para formar uma ligação amida. e um componente de peso variável Ri_36 (em que estes grupos R correspondem a T2 tal como aqui definido, e podem ser introduzidos por meio de qualquer um dos ácidos carboxílicos aqui listados) se encontra ligado através do grupo α-amino da lisina, existindo também um grupo melhorador da sensibilidade da espectrometria de massa (introduzido através do ácido N-metilisonipecótico) que se encontra ligado através do grupo ε-amino da lisina.
Por referência à Figura 4:
Passo A. A Resina NovaSyn HMP é acoplada ao composto I (NBA preparado de acordo com o procedimento de Brown et al., Molecular Diversity, 1, 4 (1995)), de acordo com o procedimento descrito no passo A do Exemplo 5, para originar o composto II.
Passos B-J. A resina (composto II) é tratada tal como descrito nos passos B-J do Exemplo 5 para originar os compostos X1-36· "asr: "asr: ST-
j
. I
V EXEMPLO 7
PREPARAÇÃO DE UM CONJUNTO DE COMPOSTOS COM A FÓRMULA
INIP-LYSfc-R^-ANP-TFP A Figura 5 ilustra a síntese em paralelo de um conjunto de 36 compostos T-L-X (X = Lh), em que Lh é um éster activado (especificamente, o éster de tetrafluorofenilo), L2 é um grupo orto-nitrobenzilamina e L3 é um grupo metileno que liga Lh a L2, T possui uma estrutura modular em que o grupo de ácido carboxílico da lisina foi ligado ao átomo de azoto do grupo benzilamina de L2 para formar uma ligação amida, e um componente de peso variável Ri.36 (em que estes grupos R correspondem a T2 tal como aqui definido, e podem ser introduzidos por meio de qualquer um dos ácidos carboxílicos aqui listados) se encontra ligado através do grupo c-amino da lisina, existindo também um grupo melhorador da sensibilidade da espectrometria de massa (introduzido através do ácido N-metilisonipecótico) que se encontra ligado através do grupo α-amino da lisina.
Por referência à Figura 5:
Passos A-C. Tal como no Exemplo 5.
Passo D. A resina (composto IV) é tratada com piperidina, como descrito no passo B do Exemplo 5, para remover o grupo FMOC.
Passo E. A α-amina desprotegida na resina do passo D é acoplada com o ácido N-metilisonipecótico, tal como descrito no passo C do Exemplo 5, para originar o composto V.
Passo F. Tal como no Exemplo 5.
Passo G. A resina (compostos Vh-36) é tratada com paládio, tal como descrito no passo D do Exemplo 5, para remover o grupo Aloc. 123
Passos H-J. Os compostos X1.36 são preparados do mesmo modo que no Exemplo 5. EXEMPLO 8
PREPARAÇÃO DE UM CONJUNTO DE COMPOSTOS COM A FÓRMULA
Ri-36-GLU(y-DIAEA)-ANP-TFP A Figura 6 ilustra a síntese em paralelo de um conjunto de 36 compostos T-L-X (X = Lh), em que Lh é um éster activado (especificamente, o éster de tetrafluorofenilo), L2 é um grupo orto-nitrobenzilamina e L3 é um grupo metileno que liga Lh a L2, T possui uma estrutura modular em que o grupo de ácido a-carboxílico do ácido glutâmico foi ligado ao átomo de azoto do grupo benzilamina de L2 para formar uma ligação amida, e um componente de peso variável R^e (em que estes grupos R correspondem a T2 tal como aqui definido, e podem ser introduzidos por meio de qualquer um dos ácidos carboxílicos aqui listados) se encontra ligado através do grupo α-amino do ácido glutâmico, existindo também um grupo melhorador da sensibilidade da espectrometria de massa (introduzido através da 2-(diisopropilamino)etilamina) que se encontra ligado através do grupo de ácido y-carboxílico do ácido glutâmico.
Por referência à Figura 6: Passos A-B. Tal como no Exemplo 5.
Passo C. A resina desprotegida (composto III) é acoplada a Fmoc-Glu-(OAI)-OH , usando o método de acoplamento descrito no passo C do Exemplo 5, para originar o composto IV.
Passo D. O éster de alilo da resina (composto IV) é lavado com CH2CI2 (2X), sendo então misturado a uma solução de (PPh3)4Pd (0) (0,3 eq.) e N-metilanilina (3 eq.) em CH2CI2. A mistura é agitada durante 1 hora. O solvente é removido e a resina é lavada com CH2CI2 (2X). O passo de paládio é repetido. O solvente é removido e a 124 resina é lavada com CH2CI2 (2X), dietilditiocarbamato de N,N-diisopropiletilamónio em DMF (2X) e DMF (2X) para originar o composto V.
Passo E. A resina desprotegida do passo D é suspensa em DMF e activada através da mistura com FIATU (3 eq.) e NMM (7,5 eq.). Os vasos são agitados durante 15 minutos. O solvente é removido e a resina é lavada com NMP (1X). A resina é misturada com 2-(diisopropilamino)etilamina (3 eq.) e NMM (7,5 eq.). Os vasos são agitados durante 1 hora. O acoplamento entre a 2-(diisopropilamino)etilamina e a resina e os passos de lavagem são repetidos, para originar o composto VI.
Passos F-J. Tal como no Exemplo 5. EXEMPLO 9 PREPARAÇÃO DE UM CONJUNTO DE COMPOSTOS COM A FÓRMULA Ri.36-LYS(c-INIP)-ANP-LYS(c-NH2)-NH2 A Figura 7 ilustra a síntese em paralelo de um conjunto de 36 compostos T-L-X (X = Lh), em que Lh é uma amina (especificamente, o grupo s-amino de uma porção molecular derivada da lisina), L2 é um grupo orto-nitrobenzilamina e L3 é um grupo alquilenoaminoacilalquileno carboxamido-substituído que liga Lh a L2, T possui uma estrutura modular em que o grupo de ácido carboxílico da lisina foi ligado ao átomo de azoto do grupo benzilamina de L2 para formar uma ligação amida, e um componente de peso variável R1.36 (em que estes grupos R correspondem a T2 tal como aqui definido, e podem ser introduzidos por meio de qualquer um dos ácidos carboxílicos aqui listados) se encontra ligado através do grupo rc-amino da lisina, existindo também um grupo melhorador da sensibilidade da espectrometria de massa (introduzido através do ácido N-metilisonipecótico) que se encontra ligado através do grupo c-amino da lisina. 125
Por referência à Figura 7:
Passo A. A Resina Fmoc-Lys(Boc)-SRAM (comercializada pela ACT; composto I) é misturada com piperidina a 25% em DMF, agitando-se durante 5 minutos. A resina é filtrada e em seguida misturada com piperidina a 25% em DMF, agitando-se durante 10 min. O solvente é removido, a resina é lavada com NMP (2X), MeOH (2X) e DMF (2X), e é usada directamente no passo B.
Passo B. São adicionados a resina (composto II), ANP (comercializado pela ACT; 3 eq.), HATU (3 eq.) e NMM (7,5 eq.) em DMF, e o vaso de recolha é agitado durante 1 h. O solvente é removido e a resina é lavada com NMP (2X), MeOH (2X) e DMF (2X). O acoplamento de I à resina e os passos de lavagem são repetidos para originar o composto III.
Passos C-J. A resina (composto III) é tratada tal como nos passos B-l no Exemplo 5 para formar os compostos X-i-36· EXEMPLO 10
PREPARAÇÃO DE UM CONJUNTO DE COMPOSTOS COM A FÓRMULA Ri.36-LYS(8-TFA)-LYS(e-INIP)-ANP-TFP A Figura 8 ilustra a síntese em paralelo de um conjunto de 36 compostos T-L-X (X = Lh), em que Lh é um éster activado (especificamente. o éster de tetrafluorofenilo), L2 é um grupo orto-nitrobenzilamina e L3 é um grupo metileno que liga Lh a L2, T possui uma estrutura modular em que o grupo de ácido carboxílico de um primeiro resíduo de lisina foi ligado ao átomo de azoto do grupo benzilamina de L2 para formar uma ligação amida, um grupo melhorador da sensibilidade da espectrometria de- massa (introduzido através do ácido N-metilisonipecótico) está ligado através do grupo ε-amino da primeira lisina, uma segunda molécula de lisina está ligada à primeira lisina através do grupo α-amino da primeira lisina, um grupo ajustador do peso molecular (contendo uma estrutura de trifluoroacétilo) está ligado ao grupo ε-amino da segunda lisina, e um componente de peso variável R^ (em 126 que estes grupos R correspondem a T2 tal como aqui definido, e podem ser introduzidos por meio de qualquer um dos ácidos carboxílicos aqui listados) se encontra ligado através do grupo α-amino da segunda lisina.
Por referência à Figura 8:
Passos A-E. Estes passos são idênticos aos passos A-E do Exemplo 5.
Passo F. A resina (composto VI) é tratada com piperidina, tal como descrito no passo B do Exemplo 5, para remover o grupo FMOC.
Passo G. A resina desprotegida (composto VII) é acoplada a Fmoc-Lys-(Tfa)-OH , usando o método de acoplamento descrito no passo C do Exemplo 5, para originar o composto VIII.
Passos H-K. A resina (composto VIII) é tratada tal como nos passos F-J do Exemplo 5 para originar os compostos XI1-36. EXEMPLO 11
PREPARAÇÃO DE UM CONJUNTO DE COMPOSTOS COM A FÓRMULA Ri_36-LYS(8-INIP)-ANP-5-AH-ODN A Figura 9 ilustra a síntese em paralelo de um conjunto de 36 compostos T-L-X (X = MOI, em que MOI é um fragmento de ácido nucleico, ODN) derivados dos ésteres do exemplo 5 (poderá recorrer-se ao mesmo procedimento utilizado com outros compostos T-L-X em que X é um éster activado). A MOI é conjugada com T-L através da extremidade 5’ da MOI por meio de um grupo fosfodiéster-alquilenoamina.
Por referência à figura 9:
Passo A. São preparados compostos XII1-36 de acordo com um procedimento de biotinilação modificado descrito em Van Ness et al., Nucleic Acids Res., 19, 3345 127
(1991). A solução de um dos oligonucleótidos de 5’-aminohexilo (compostos XI-1-36, 1 mg) em borato de sódio 200 mM (pH 8,3 , 250 mL) é adicionado um dos ésteres de tetrafluorofenilo (compostos X-i^do exemplo 5, excesso molar de 100 vezes em 250 mL de NMP). A reacção é incubada durante doze horas à temperatura ambiente. Os ésteres de tetrafluorofenilo hidrolisados e os que não reagiram são removidos dos compostos XIh.36 por cromatografia com coluna de Sephadex G-50.
I EXEMPLO 12 PREPARAÇÃO DE UM CONJUNTO DE COMPOSTOS COM A FÓRMULA Ri.36-LYS(í:-INIP)-ANP-LYS(s-(MCT-5’-AH-ODN))-NH2 A Figura 10 ilustra a síntese em paralelo de um conjunto de 36 compostos T-L-X (X = MOI, em que MOI é um fragmento de ácido nucleico, ODN) derivados das aminas do Exemplo 11 (poderá recorrer-se ao mesmo procedimento utilizado com outros compostos T-L-X em que X é uma amina). A MOI é conjugada com T-L através da extremidade 5' da MOI por meio de um grupo fosfodiéster-alquilenoamina.
Por referência à figura 10:
Passo A. Os oligonucleótidos 5’-[6-(4,6-dicloro-1,3,5-triazin-2-ilamino)hexil] Xll^g são preparados como descrito em Van Ness et al., Nucleic Acids Res., 19, 3345 (1991).
Passo B. À solução de um dos oligonucleótidos 5’-[6-(4,6-dicloro-1,3,5-triazin-2-ilamino)hexil] (compostos Xlh-36) a uma concentração de 1 mg/mL em borato de sódio 100 mM (pH 8,3) foi adicionado um excesso molar de 100 vezes de uma amina primária seleccionada a partir dos compostos Ri.36-Lys(Í:-iNIP)-ANP-Lys(};-NH2)-NH2 (compostos X^ do Exemplo 11). A solução é misturada durante doze horas à temperatura ambiente. A amina que não reagiu é removida por ultrafiltração através de uma membrana com cutoff de PM 3000 (Amicon, Beverly. MA) usando 128 H20 como solução de lavagem (3X). Os compostos XIII1.36 são isolados por redução do volume até 100 mL. EXEMPLO 13
DEMONSTRAÇÃO DA DETECÇÃO SIMULTÂNEA DE MARCADORES MÚLTIPLOS
POR ESPECTROMETRIA DE MASSA
Este Exemplo proporciona uma descrição da capacidade de detectar em simultâneo múltiplos compostos (marcadores) por espectrometria de massa. Neste Exemplo em particular, 31 compostos são misturados com uma matriz, depositados e secos sobre um suporte sólido e então desadsorvidos com um laser. Os iões resultantes são então introduzidos num espectrómetro de massa.
Os compostos que se seguem (comercializados pela Aldrich, Milwaukee, Wl) são misturados numa base equimolar a uma concentração final de 0,002 M (por composto): benzamida (121,14), nicotinamida (122,13), pirazinamida (123,12), ácido 3- amino-4-pirazolcarboxílico (127,10), 2-tiofenocarboxamida (127,17), 4- aminobenzamida (135,15), toluimida (135,17), 6-metilnicotinamida (136,15), 3-aminonicotinamida (137,14), N-óxido de nicotinamida (138,12), 3-hidropicolinamida (138,13), 4-fluorobenzamida (139,13), cinamamida (147,18), 4-metoxibenzamida (151,17). 2,6-difluorobenzamida (157,12), 4-amino-5-imidazol-carboxiamida (162,58), 3,4-piridina-dicarboxiamida (165,16), 4-etoxibenzamida (165,19), 2,3-pirazinadicarboxamida (166,14), 2-nitrobenzamida (166,14), ácido 3-fluoro-4-metoxibenzóico (170,4), indol-3-acetamida (174,2), 5-acetilsalicilamida (179,18), 3,5-dimetoxibenzamida (181,19), 1-naftalenoacetamida (185,23), 8-cloro-3,5-diamino-2-pirazinacarboxiamida (187,59), 4-trifluorometilo-benzamida (189,00). 5-amino-5-fenil- 4- pirazol-carboxamida (202,22), 1-metil-2-benzilmalonamato (207,33), 4-amino-2,3,5,6-tetrafluorobenzamida (208,11), ácido 2,3-naftalenodicarboxílico (212,22). Os compostos são colocados em DMSO à concentração acima descrita. Um pL do material é então misturado com uma matriz alfa-ciano de ácido 4-hidroxicinâmico (após uma diluição de 1:10.000) e depositados sobre um suporte sólido de aço inoxidável. 129 O material é então desdsorvido com um laser utilizando um Espectrómetro de Massa TOF para Proteínas (Brucker, Manning Park, MA) e os iões resultantes são medidos tanto no modo de funcionamento linear como no modo de reflectrão. São observados os seguintes valores para a razão m/z (Figura 11): 121,1 —> 122,1 —-> 123.1 —> 124.1 125.2 127.3 —> 127,2 —> 135.1 > 135.1 > 136.2 —> 137.1 —-> 138.2 —> 138.2 —> 139.2 —> 140.2 147.3 —> 148.2 149.2 152.2 158.3 163.3 165.2 —> 165.2 —> 166.2 —-> benzamida (121,14) nicotinamida (122,13) pirazinamida (123,12) ácido 3-amino-4-pirazolcarboxílico (127,10) 2- tiofenocarboxamida (127,17) 4-aminobenzamida (135,15) toluimida (135,17) 6-metilnicotinamida (136,15) 3- aminonicotinamida (137,14) N-óxido de nicotinamida (138,12) 3- hidropicolinamida (138,13) 4- fluorobenzamida (139,13) cinamamida (147,18) 4-metoxibenzamida (151,17) 2,6-difluorobenzamida (157,12) 4-amino-5-imidazol-carboxiamida (162,58) 3,4-piridina-dicarboxiamida (165,16) 4-etoxibenzamida (165,19) 2,3-pirazinodicarboxamida (166,14) 130 166,2 — -> 2-nitrobenzamida (166,14) ácido 3-fluoro-4-metoxibenzóico (170,4) 171.1 172.2 173,4 178,3 indol-3-acetamida (174,2) 179,3— -> 181,2 —-> 182,2 —> 5-acetilsalicilamida (179,18) 3,5-dimetoxibenzamida (181,19) 186.2 1-naftalenoacetamida (185,23) 188,2 8-cloro-3,5-diamino-2-pirazinocarboxiamída (187,59) 189.2 —> 190.2 191.2 192.3 4-trifluorometil-benzamida (189,00) 203,2 203,4 5-amino-5-fenil-4-pirazol-carboxamida (202,22) 212,2 —> 219.3 221,2 228,2 234,2 237.4 241.4 1 -metil-2-benzil-malonamato (207,33) 4-amino-2,3,5,6-tetrafluorobenzamida (208,11) ácido 2,3-naftalenodicarboxílico (212,22) 131
Os dados indicam que 22 dos 31 compostos apareceram no espectro com a massa prevista, enquanto 9 dos 31 compostos apareceram no espectro com uma massa de η + H (1 unidade de massa atómica, amu) acima do valor de massa previsto. Este fenómeno é provavelmente devido à protonação de uma amina existente nos compostos. Assim sendo, 31 de 31 compostos são detectados por espectroscopia de massa MALDI. Mais importante que isto, o exemplo demonstra que múltiplos marcadores podem ser detectados em simultâneo por um método espectroscópico. A matriz alfa-ciano por si só (Figura 11) exibe picos a 146,2, 164,1, 172,1, 173,1, 189,1, 190,1, 191,1, 192,1. 212,1, 224,1, 228,0 e 234,3. Outras massas identificadas no espectro são devidas a contaminantes dos compostos comercializados, já que nenhum esforço foi feito para purificar mais completamente os compostos. EXEMPLO 14
MARCADORES DE MICROSATÉLITE: AMPLIFICAÇÕES POR PCR
Os marcadores de microsatélite são amplificados utilizando as condições padronizadas de PCR que se seguem. Abreviadamente, são realizadas reacções de PCR num volume total de 50 μΙ, contendo 40 ng de DNA genómico, 50 pmol de cada primer, 0,125 mM de dNTPs e 1 unidade de polimerase Taq. O tampão de amplificação 1X contém base de Tris a 10 mM, pH 9, KCI a 50 mM, MgCI2 a 1,5 mM, Triton X-100 a 0,1% e gelatina a 0,01%. As reacções são executadas seguindo um procedimento de “arranque a quente”: a polimerase Taq é adicionada apenas após um primeiro passo de desnaturação a 96°C com a duração de 5 minutos. A amplificação é realizada em 35 ciclos: desnaturação (94°C durante 40 seg) e annealing (55°C durante 30 seg). Um passo de elongação (72°C durante 2 minutos) finaliza o processo após o último annealing. Uma vez que os produtos de amplificação a ser obtidos são de curta extensão (com um comprimento de 90 a 350 pares de bases) e o que o intervalo de tempo necessário para aumentar a temperatura de 55°C até 94°C (obtido com uma taxa de incremento de 1°C/segundo) 132 é suficientemente longo, a conclusão do elongamento do DNA pode ser atingida sem a realização de um passo a 72°C.
Lisboa, - 9 Mt 2000
^ íX|' CISCO DE NOVAES
r,Ci.Nt,.. c. it.í. l:a PSOPC-LDADL íNDUSIRIAL ---- 1 -' 03 / 3533033 133

Claims (50)

  1. REIVINDICAÇÕES 1. Um método para a determinação da presença de uma molécula de ácido nucleico, caracterizado pelo facto de compreender: (a) a produção de moléculas de ácido nucleico marcadas a partir de uma ou mais moléculas-alvo de ácido nucleico seleccionadas, sendo que um marcador é correlacionável com um fragmento de ácido nucleico em particular e é detectável poe espectrometria ou potenciometria; (b) separar as ditas moléculas marcadas segundo as suas dimensões; (c) cortar e separar o dito marcador da dita molécula marcada; e (d) detectar o dito marcador por espectrometria ou potenciometria, e deste modo determinar a presença da dita molécula de ácido nucleico.
  2. 2. Um método para a detecção de uma molécula de ácido nucleico seleccionada, caracterizado pelo facto de compreender: (a) a combinação de uma sonda marcada de ácido nucleico com moléculas-alvo de ácido nucleico, sob condições e durante o tempo suficiente para permitir a hibridização da dita sonda marcada de ácido nucleico com uma sequência-alvo complementar seleccionada de ácido nucleico, sendo que a dita sonda marcada de ácido nucleico compreende um marcador que é correlacionável com um fragmento em particular e é detectável por espectrometria ou potenciometria, (b) a alteração das dimensões das ditas sondas marcadas hibridizadas, da dimensão das sondas ou moléculas-alvo não hibridizadas ou da dimensão dos híbridos de sonda:molécula-alvo, (c) a separação das sondas marcadas por dimensões, (d) o corte e a remoção do dito marcador da dita sonda marcada, e (e) a detecção do dito marcador através de espectrometria ou potenciometria, detectando deste modo a presença da molécula de ácido nucleico seleccionada.
  3. 3. Um método, conforme reivindicado em qualquer das reivindicações 1-2, caracterizado pelo facto de a detecção do marcador ser feita por espectrometria de massa, espectrometria em infravermelho, espectrometria em ultravioleta ou potenciometria amperostática..
  4. 4. Um método, conforme reivindicado nas reivindicações 1-3, caracterizado pelo facto de ser gerado um número superior a 4 fragmentos de ácido nucleico marcados, e sendo cada marcador específico para um fragmento de ácido nucleico seleccionado.
  5. 5. Um método, conforme reivindicado nas reivindicações 2-3, caracterizado pelo facto de ser gerado um número superior a 4 fragmentos de sonda de ácido nucleico, e sendo cada marcador específico para uma sonda de ácido nucleico seleccionado.
  6. 6. Um método, conforme reivindicado nas reivindicações 1-5, caracterizado pelo facto de a dita molécula-alvo de ácido nucleico ser gerada pela extensão de um primer.
  7. 7. Um método, conforme reivindicado nas reivindicações 2-5, caracterizado pelo facto de as dimensões das ditas sondas marcadas hibridizadas, das sondas não hibridizadas ou das moléculas-alvo, ou dos híbridos sonda.alvo, serem alteradas por um método seleccionado a partir do grupo que compreende a extensão por polimerase, ligação, digestão por exonuclease e digestão por endonuclease.
  8. 8. Um método, conforme reivindicado nas reivindicações 1-7, caracterizado pelo facto de as ditas moléculas marcadas serem separadas por um método seleccionado a partir do grupo que compreende a electroforese em gel, a electroforese capilar, a electroforese em micro-canais, a HPLC, a cromatografia de exclusão por dimensões e a filtração.
  9. 9. Um método, conforme reivindicado nas reivindicações 1-8, caracterizado pelo facto de as ditas moléculas marcadas serem cortadas através de um método seleccionado a partir do grupo que compreende os métodos de oxidação, redução, labilidade a ácidos, labilidade a bases, enzimático, electroquímico, térmico e de fotolabilidade.
  10. 10. Um método, conforme reivindicado nas reivindicações 1-9, caracterizado pelo facto de o dito marcador ser detectado por espectrometria de massa de tempo-de-voo, espectrometria de massa quadrupolar, espectrometria de massa de sector magnético e espectrometria de massa de sector eléctrico.
  11. 11. Um método, conforme reivindicado nas reivindicações 1-9, caracterizado pelo facto de o dito marcador ser detectado por amperometria potenciostática utilizando detectores seleccionados a partir do grupo formado por detectores coulométricos e detectores amperométricos.
  12. 12. Um método, conforme reivindicado nas reivindicações 1-11, caracterizado pelo facto de os passos de separação, corte e detecção serem efectuados em modo contínuo.
  13. 13. Um método, conforme reivindicado nas reivindicações 1-12, caracterizado pelo facto de os passos de separação, corte e detecção serem efectuados em modo contínuo num só dispositivo.
  14. 14. Um método, conforme reivindicado nas Reivindicações 1-13, caracterizado pelo facto de os passos de separação, corte e detecção serem automatizados.
  15. 15. Um método, conforme reivindicado nas reivindicações 1-14, caracterizado pelo facto de as ditas moléculas ou sondas marcadas serem geradas a partir de primers oligonucleotídicos não marcados em 3’.
  16. 16. Um método, conforme reivindicado nas reivindicações 1-14, caracterizado pelo facto de as ditas moléculas ou sondas marcadas serem geradas a partir de terminadores didesoxinucleotídicos marcados.
  17. 17. Um método, conforme reivindicado nas reivindicações 1-2, 4-9 e 12-16, caracterizado pelo facto de as ditas moléculas ou sondas marcadas serem detectadas por espectrometria não-fluorescente ou potenciometria.
  18. 18. Um método para a genotipagem de um organismo seleccionado, caracterizado pelo facto de compreender: (a) A produção de moléculas de ácido nucleico marcadas a partir de uma molécula-alvo seleccionada, sendo que um marcador é correlacionável com um fragmento em particular e é detectável por meio de espectrometria não-fluorescente ou potenciometria; (b) a separação das ditas moléculas marcadas pelo comprimento sequencial, (c) o corte e a remoção do dito marcador da dita molécula marcada, e
    (d) a detecção do dito marcador através de espectrometria ou potenciometria, determinando deste modo o genotipo do organismo.
  19. 19. Um método para a genotipagem de um organismo seleccionado, caracterizado pelo facto compreender: (a) a combinação de uma molécula marcada de ácido nucleico com uma molécula-alvo seleccionada, sob condições e durante o tempo suficiente para permitir a hibridização da dita molécula marcada à dita molécula-alvo, sendo que um marcador é correlacionável com um fragmento em particular e é detectável por espectrometria ou potenciometria, (b) a separação das ditas moléculas marcadas pelo comprimento sequencial, (c) o corte e a remoção do dito marcador da dita molécula marcada, e (d) a detecção do dito marcador através de espectrometria ou potenciometria, determinando deste modo o genotipo do organismo.
  20. 20. Um método, conforme reivindicado nas reivindicações 18 ou 19, caracterizado pelo facto de as ditas moléculas marcadas são geradas a partir de um pool de clones seleccionados a partir do grupo que consiste em colnes genómicos, clones de cDNA e clones de RNA.
  21. 21. Um método, conforme reivindicado nas reivindicações 18 ou 19, caracterizado pelo facto de as ditas moléculas marcadas serem geradas através de reacção em cadeia por polimerase.
  22. 22. Um método, conforme reivindicado nas reivindicações 18 ou 19, caracterizado pelo facto de a dita molécula-alvo de ácido nucleico ser gerada através da extensão de um primer.
  23. 23. Um método, conforme reivindicado nas reivindicações 18-22, caracterizado pelo facto de a detecção do marcador ser feita por espectrometria de massa, espectrometria em infravermelho, espectrometria em ultravioleta ou amperometria potenciostática.
  24. 24. Um método, conforme reivindicado nas reivindicações 18-23, caracterizado pelo facto de ser gerado um número superior a 4 moléculas de ácido nucleico marcadas e sendo cada marcador específico para um fragmento de ácido nucleico seleccionado. 4
  25. 25. Um método, conforme reivindicado nas reivindicações 18-24, caracterizado pelo facto de as ditas moléculas marcadas serem separadas através de um método seleccionado a partir do grupo que consiste em electroforese em gel, electroforese capilar, electroforese em micro-canais, HPLC, cromatografia de exclusão por dimensões e filtração.
  26. 26. Um método, conforme reivindicado nas reivindicações 18-25, caracterizado pelo facto de as ditas moléculas marcadas serem cortadas por um método seleccionado a partir do grupo que compreende os métodos de oxidação, redução, labilidade a ácidos, labilidade a bases, enzimático, electroquímico, térmico e de fotolabilidade.
  27. 27. Um método, conforme reivindicado nas reivindicações 18-26, caracterizado pelo facto de o dito marcador ser detectado por espectrometria de massa de tempo-de-voo, espectrometria de massa quadrupolar, espectrometria de massa de sector magnético e espectrometria de massa de sector eléctrico.
  28. 28. Um método, conforme reivindicado nas reivindicações 18-26, caracterizado pelo facto de o dito marcador ser detectado por amperometria potenciostática utilizando detectores seleccionados a partir do grupo formado por detectores coulométricos e detectores amperométricos.
  29. 29. Um método, conforme reivindicado nas reivindicações 18-28, caracterizado pelo facto de os passos de separação, corte e detecção serem efectuados em modo contínuo.
  30. 30. Um método, conforme reivindicado nas reivindicações 18-29, caracterizado pelo facto de os passos de separação, corte e detecção serem efectuados em modo contínuo num só dispositivo.
  31. 31. Um método, conforme reivindicado nas reivindicações 18-30, caracterizado pelo facto de os passos de separação, corte e detecção serem automatizados.
  32. 32. Um método, conforme reivindicado nas reivindicações 18-31, caracterizado pelo facto de as ditas moléculas marcadas serem geradas a partir de primers oligonucleotídicos não marcados em 3’.
  33. 33. Um método, conforme reivindicado nas reivindicações 18-31, caracterizado pelo facto de as ditas moléculas marcadas serem geradas a partir de terminadores didesoxinucleotídicos marcados.
  34. 34. Um método, conforme reivindicado nas reivindicações 1-33, caracterizado pelo facto de a dita molécula-alvo ser obtida a partir de uma amostra biológica.
  35. 35. Um método, conforme reivindicado nas reivindicações 18-34, caracterizado pelo facto de o dito marcador ser detectado por espectrometria não fluorescente ou por potenciometria.
  36. 36. Uma composição, caracterizada pelo facto de compreender uma pluralidade de compostos com a fórmula: Tms-L-MOI em que TMS é um grupo orgânico detectável por espectrometria de massa, formado por carbono, pelo menos um átomo de hidrogénio e de flúor, e átomos opcionais seleccionados a partir do grupo formado por oxigénio, azoto, enxofre, fósforo e iodo; L é um grupo orgânico que permite que se dê o corte da ligação entre uma porção molecular específica contendo TMS e a porção remanescente do composto, sendo que a porção molecular contendo TMS compreende um grupo funcional que suporta um estado ionizado de carga única quando o composto é submetido a espectrometria de massa e é seleccionado a partir do grupo de amina terciária, amina quaternária e ácido orgânico; MOI (molécula de interesse) constitui um fragmento de ácido nucleico; e em que pelo menos dois compostos possuem o mesmo TMS , mas os grupos MOI destas moléculas possuem extensões nucleotídicas não idênticas, sendo que os fragmentos de MOI não terminam com o mesmo didesoxinucleótido, seleccionado a partir do grupo constituído por ddAMP, ddCMP, ddGMP e ddTMP.
  37. 37. Uma composição, caracterizada pelo facto de compreender uma pluralidade de compostos com a fórmula: 6
    Tms-L-MOI em que TMS é um grupo orgânico detectável por espectrometria de massa, formado por carbono, pelo menos um átomo de hidrogénio e de flúor, e átomos opcionais seleccionados a partir do grupo formado por oxigénio, azoto, enxofre, fósforo e iodo; L é um grupo orgânico que permite que se dê o corte da ligação entre uma porção molecular específica contendo e a porção remanescente do composto, sendo que a porção molecular contendo TMS compreende um grupo funcional que suporta um estado ionizado de carga única quando o composto é submetido a espectrometria de massa e é seleccionado a partir do grupo de amina terciária, amina quaternária e ácido orgânico; MOI constitui um fragmento de ácido nucleico; e em que pelo menos dois compostos possuem o mesmo TMS , mas estes compostos possuem tempos de eluição não idênticos, tal como medido por HPLC, usando uma coluna de partículas não porosas de poli(estireno-divinilbenzeno)-Ci8 com 2,3 prn e um tampão aquoso compreendendo acetato de trietilamónio a 100 mM.
  38. 38. Uma composição, caracterizada pelo facto de compreender uma pluralidade de compostos com a fórmula: Tms-L-MOI em que TMS é um grupo orgânico detectável por espectrometria de massa, formado por carbono, pelo menos um átomo de hidrogénio e de flúor, e átomos opcionais seleccionados a partir do grupo formado por oxigénio, azoto, enxofre, fósforo e iodo; L é um grupo orgânico que permite que se dê o corte da ligação entre uma porção molecular específica contendo TMS e a porção remanescente do composto, sendo que a porção molecular contendo T^18 compreende um grupo funcional que suporta um estado ionizado de carga única quando o composto é submetido a 7 c espectrometria de massa e é seleccionado a partir do grupo de amina terciária, amina quaternária e ácido orgânico; MOI constitui um fragmento de ácido nucleico; e em que nenhum par de compostos que possua a mesma extensão nucleotídica da MOI possui igualmente o mesmo TMS
  39. 39. Um método, conforme reivindicado nas reivindicações 36-38, caracterízado pelo facto de a pluralidade ser superior a 2.
  40. 40. Uma composição, conforme reivindicado nas reivindicações 36-38, caracterizada pelo facto de a pluralidade ser superior a 4.
  41. 41. Uma composição, conforme reivindicado nas reivindicações 36-40, caracterizada pelo facto de o fragmento de ácido nucleico possuir uma sequência complementar a uma porção de um vector, possuindo o fragmento a capacidade de servir como primer para a síntese de polinucleótidos.
  42. 42. Uma composição, conforme reivindicado nas reivindicações 36-41, caracterizada pelo facto de os grupos Tms dos membros da pluralidade diferirem em pelo menos 2 amu.
  43. 43. Uma composição, conforme reivindicado nas reivindicações 36-41, caracterizada pelo facto de os grupos Tms dos membros da pluralidade diferirem em, pelo menos, 4 amu.
  44. 44. Uma composição, caracterizada pelo facto de compreender uma pluralidade de conjuntos de compostos, possuindo, cada conjunto de compostos, a fórmula: Tms-L-MOI em que TMS é um grupo orgânico detectável por espectrometria de massa, formado por carbono, pelo menos um átomo de hidrogénio e de flúor, e átomos opcionais seleccionados a partir do grupo formado por oxigénio, azoto, enxofre, fósforo e iodo; L é um grupo orgânico que permite que se dê o corte da ligação entre uma porção molecular específica contendo TMS e a porção remanescente do composto, sendo que a porção molecular contendo TMS compreende um grupo funcional que 8
    suporta um estado ionizado de carga única quando o composto é submetido a espectrometria de massa e é seleccionado a partir do grupo de amina terciária, amina quaternária e ácido orgânico; MOI (molécula de interesse) constitui um fragmento de ácido nucleico; e os membros de um primeiro conjunto de compostos possuem o mesmo TMS mas os seus grupos MOI não são idênticos, existindo diferenças nos números de nucleótidos entre as MOI, sendo que o primeiro conjunto é formado por pelo menos dez membros e que, entre conjuntos, os grupos Tms diferem em pelo menos 2 amu.
  45. 45. Uma composição, conforme reivindicado na reivindicação 44, caracterizado pelo facto de a pluralidade corresponder a, pelo menos, 3.
  46. 46. Uma composição, conforme reivindicado na reivindicação 44, caracterizado pelo facto de a pluralidade corresponder a, pelo menos, 5.
  47. 47. Uma composição, caracterizada pelo facto de compreender uma pluralidade de conjuntos de compostos, possuindo cada conjunto de compostos a fórmula: Tms-L-MOI em que TMS é um grupo orgânico detectável por espectrometria de massa, formado por carbono, pelo menos um átomo de hidrogénio e de flúor, e átomos opcionais seleccionados a partir do grupo formado por oxigénio, azoto, enxofre, fósforo e iodo; L é um grupo orgânico que permite que se dê o corte da ligação entre uma porção molecular específica contendo TMS e a porção remanescente do composto, sendo que a porção molecular contendo compreende um grupo funcional que suporta um estado ionizado de carga única quando o composto é submetido a espectrometria de massa e é seleccionado a partir do grupo de amina terciária, amina quaternária e ácido orgânico; MOI constitui um fragmento de ácido nucleico; e em que os compostos dentro do mesmo conjunto possuem grupos T*'18 não idênticos, mas têm tempos de eluição iguais, tal como medido por HPLC, usando 9 uma coluna de partículas não porosas de poli(estireno-divinilbenzeno)-Ci8 com 2,3 μιτι e um tampão aquoso compreendendo acetato de trietilamónio a 100 mM.
  48. 48. Um kit para genotipagem, caracterizado pelo facto de compreender uma pluralidade de pares de primers de amplificação, em que pelo menos um dos primers possui a fórmula: Tms-L-MOI em que TMS é um grupo orgânico detectável por espectrometria de massa, formado por carbono, pelo menos um átomo de hidrogénio e de flúor, e átomos opcionais seleccionados a partir do grupo formado por oxigénio, azoto, enxofre, fósforo e iodo; L é um grupo orgânico que permite que se dê o corte da ligação entre uma porção molecular específica contendo TMS e a porção remanescente do composto, sendo que a porção molecular contendo TMS compreende um grupo funcional que suporta um estado ionizado de carga única quando o composto é submetido a espectrometria de massa e é seleccionado a partir do grupo de amina terciária, amina quaternária e ácido orgânico; MOI constitui um fragmento de ácido nucleico; e cada par de primers se associa a um locus diferente.
  49. 49. Um kit, conforme reivindicado na reivindicação 48, caracterizado pelo facto de a pluralidade corresponder a, pelo menos, 3.
  50. 50. Um kit, conforme reivindicado na reivindicação 48, caracterizado pelo facto de a pluralidade corresponder a, pelo menos, 5. Lisboa, 9 de Junho de 2000 O AGENTE OFtClAL ÕA PROPRtEDADE SNTJUSTRIA|
    10
PT97905603T 1996-01-23 1997-01-23 Metodos e composicoes para a analise de moleculas de acidos nocleicos usando tecnicas de separacao por dimensoes PT840804E (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US1453696P 1996-01-23 1996-01-23
US2048796P 1996-06-04 1996-06-04

Publications (1)

Publication Number Publication Date
PT840804E true PT840804E (pt) 2000-10-31

Family

ID=26686209

Family Applications (1)

Application Number Title Priority Date Filing Date
PT97905603T PT840804E (pt) 1996-01-23 1997-01-23 Metodos e composicoes para a analise de moleculas de acidos nocleicos usando tecnicas de separacao por dimensoes

Country Status (18)

Country Link
EP (2) EP0962537B1 (pt)
JP (2) JP2000503845A (pt)
KR (1) KR100482915B1 (pt)
CN (1) CN1202260C (pt)
AT (2) ATE434054T1 (pt)
AU (1) AU717945B2 (pt)
BR (1) BR9707016A (pt)
CA (1) CA2243546C (pt)
CZ (1) CZ228598A3 (pt)
DE (2) DE69701612T2 (pt)
DK (1) DK0840804T3 (pt)
ES (1) ES2145580T3 (pt)
GR (1) GR3033887T3 (pt)
HU (1) HUP9901856A3 (pt)
NZ (1) NZ331043A (pt)
PL (1) PL328239A1 (pt)
PT (1) PT840804E (pt)
WO (1) WO1997027325A2 (pt)

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6401267B1 (en) 1993-09-27 2002-06-11 Radoje Drmanac Methods and compositions for efficient nucleic acid sequencing
CA2243989A1 (en) * 1996-01-23 1997-07-31 Rapigene, Inc. Methods and compositions for detecting binding of ligand pair using non-fluorescent label
CN100434531C (zh) * 1997-01-15 2008-11-19 X齐里昂有限两合公司 与质量标记连接的杂交探针
US6699668B1 (en) 1997-01-15 2004-03-02 Xzillion Gmbh & Co. Mass label linked hybridisation probes
EP0975795A1 (en) * 1997-02-24 2000-02-02 TM Technologies Inc. Process for selecting anti-sense oligonucleotides
ATE240408T1 (de) * 1997-07-22 2003-05-15 Qiagen Genomics Inc Verfahren und verbindungen zur analysierung von nukleinsaeuren durch massenspektrometrie
US6090558A (en) * 1997-09-19 2000-07-18 Genetrace Systems, Inc. DNA typing by mass spectrometry with polymorphic DNA repeat markers
US6289229B1 (en) 1998-01-20 2001-09-11 Scimed Life Systems, Inc. Readable probe array for in vivo use
CN1371356A (zh) * 1999-08-31 2002-09-25 佳根基因组学公司 具有光可裂解的键的富含对映体的化合物以及与其有关的方法
US6379889B1 (en) 1999-11-04 2002-04-30 Agilent Technologies, Inc. Multiplexing methods for identifying nucleic acids using denaturing liquid chromatography
DE10021204A1 (de) * 2000-04-25 2001-11-08 Epigenomics Ag Verfahren zur hochparallelen Analyse von Polymorphismen
US7771929B2 (en) 2000-04-28 2010-08-10 Monogram Biosciences, Inc. Tag library compounds, compositions, kits and methods of use
US7160735B2 (en) 2000-04-28 2007-01-09 Monogram Biosciences, Inc. Tagged microparticle compositions and methods
US6716634B1 (en) 2000-05-31 2004-04-06 Agilent Technologies, Inc. Increasing ionization efficiency in mass spectrometry
DE10027040A1 (de) * 2000-06-02 2001-12-06 Basf Lynx Bioscience Ag Verfahren zur Herstellung von DNA-Arrays
EP1170379A1 (en) * 2000-06-30 2002-01-09 Centre National de Genotypage Sample generation for genotyping by mass spectrometry
FI115139B (fi) * 2001-01-10 2005-03-15 Valtion Teknillinen Menetelmä ja testipakkaus solu- tai kudosnäytteissä olevien polynukleotidien määrässä tapahtuvien vaihteluiden kvantitatiiviseen ja/tai vertailevaan arvioimiseen
DE10108453B4 (de) * 2001-02-22 2005-10-20 Bruker Daltonik Gmbh Massenspektrometrische Mutationsanalyse mit photolytisch spaltbaren Primern
DE10112387B4 (de) * 2001-03-15 2004-03-25 Bruker Daltonik Gmbh Massenspektrometrische Genotypisierung
CN1559006A (zh) 2001-05-21 2004-12-29 埃克来拉生物科学公司 用于分析蛋白的方法和组合物
AU2002305658A1 (en) 2001-05-21 2002-12-03 Aclara Biosciences, Inc. Analyzing phosphorylated proteins
WO2002097112A2 (en) 2001-05-26 2002-12-05 Aclara Biosciences, Inc. Catalytic amplification of multiplexed assay signals
US20050118589A1 (en) * 2001-11-21 2005-06-02 Vann Charles S. Digital array
US7347976B2 (en) 2001-12-20 2008-03-25 3M Innovative Properties Company Methods and devices for removal of organic molecules from biological mixtures using a hydrophilic solid support in a hydrophobic matrix
US7192560B2 (en) 2001-12-20 2007-03-20 3M Innovative Properties Company Methods and devices for removal of organic molecules from biological mixtures using anion exchange
AU2003201159A1 (en) 2002-01-08 2003-07-24 Bayer Healthcare Ag Single nucleotide polymorphisms predicting cardiovascular disease and medication efficacy
EP1333101B1 (en) * 2002-02-01 2007-03-28 Bruker Daltonik GmbH Mutation analysis by PCR and Mass spectrometry
GB0205455D0 (en) 2002-03-07 2002-04-24 Molecular Sensing Plc Nucleic acid probes, their synthesis and use
US7402397B2 (en) 2002-05-21 2008-07-22 Monogram Biosciences, Inc. Detecting and profiling molecular complexes
US20040229294A1 (en) 2002-05-21 2004-11-18 Po-Ying Chan-Hui ErbB surface receptor complexes as biomarkers
FI20021325A0 (fi) * 2002-07-05 2002-07-05 Valtion Teknillinen Menetelmä ja reagenssipakkaus yksittäisten polynukleotidien määrän määrittämiseksi
US7981600B2 (en) 2003-04-17 2011-07-19 3M Innovative Properties Company Methods and devices for removal of organic molecules from biological mixtures using an anion exchange material that includes a polyoxyalkylene
US7939249B2 (en) 2003-12-24 2011-05-10 3M Innovative Properties Company Methods for nucleic acid isolation and kits using a microfluidic device and concentration step
GB0515323D0 (en) 2005-07-26 2005-08-31 Electrophoretics Ltd Mass labels
GB0518585D0 (en) 2005-09-12 2005-10-19 Electrophoretics Ltd Mass labels
EP1936369A1 (en) * 2006-12-20 2008-06-25 Agilent Technologies, Inc. Selective excitation of OH-containing solvents
GB0704764D0 (en) 2007-03-12 2007-04-18 Electrophoretics Ltd Isobarically labelled reagents and methods of their use
US7888127B2 (en) * 2008-01-15 2011-02-15 Sequenom, Inc. Methods for reducing adduct formation for mass spectrometry analysis
GB0809488D0 (en) 2008-05-23 2008-07-02 Electrophoretics Ltd Mass spectrometric analysis
GB0811574D0 (en) * 2008-06-24 2008-07-30 Trillion Genomics Ltd Characterising planar samples by mass spectrometry
EP2180065A1 (en) * 2008-10-24 2010-04-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method of reducing the molecular weight of at least one PCR product for its detection while maintaining its identity
JP5283178B2 (ja) * 2009-03-05 2013-09-04 株式会社島津製作所 マトリックス支援レーザ脱離イオン化質量分析用マトリックス
GB0921665D0 (en) 2009-12-10 2010-01-27 Trillion Genomics Ltd Phobes
DK2588144T3 (en) 2010-07-02 2018-07-23 Ventana Med Syst Inc Detection of targets using mass markers and mass spectrometry
US9305756B2 (en) 2013-03-13 2016-04-05 Agena Bioscience, Inc. Preparation enhancements and methods of use for MALDI mass spectrometry
GB201322567D0 (en) 2013-12-19 2014-02-05 Electrophoretics Ltd Mass labels
CN110687191A (zh) * 2019-10-22 2020-01-14 宁波大学 基于基质辅助激光解吸电离飞行时间质谱与ftir光谱联用的微生物鉴定和分型方法
CN113607829B (zh) * 2021-06-11 2023-05-30 南京品生医学检验实验室有限公司 一种检测血清中5-羟色胺和褪黑素浓度的方法
CN115337665B (zh) * 2022-09-14 2023-05-30 洛阳理工学院 微通道萃取装置辅助从黄岑根中高效分离黄芩苷的方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4709016A (en) * 1982-02-01 1987-11-24 Northeastern University Molecular analytical release tags and their use in chemical analysis
US5516931A (en) * 1982-02-01 1996-05-14 Northeastern University Release tag compounds producing ketone signal groups
US5118605A (en) * 1984-10-16 1992-06-02 Chiron Corporation Polynucleotide determination with selectable cleavage sites
US5346670A (en) * 1986-12-24 1994-09-13 British Technology Group U.S.A. Inc. Phthalocyanine and tetrabenztriazaporphyrin reagents
FI80476C (fi) * 1987-10-09 1990-06-11 Orion Yhtymae Oy Foerbaettrat hybridisationsfoerfarande, vid foerfarandet anvaent redskap och reagensfoerpackning.
EP0317239A3 (en) * 1987-11-13 1990-01-17 Native Plants Incorporated Method and device for improved restriction fragment length polymorphism analysis
US5003059A (en) * 1988-06-20 1991-03-26 Genomyx, Inc. Determining DNA sequences by mass spectrometry
DK220890D0 (da) * 1990-09-14 1990-09-14 Ole Buchardt Fremgangsmaade til fremstilling af c-terminalt amiderede peptider
WO1993005183A1 (en) * 1991-09-09 1993-03-18 Baylor College Of Medicine Method and device for rapid dna or rna sequencing determination by a base addition sequencing scheme
AU3919293A (en) * 1992-03-27 1993-11-08 University Of Maryland At Baltimore Detection of gene mutations with mismatch repair enzymes
US5565324A (en) * 1992-10-01 1996-10-15 The Trustees Of Columbia University In The City Of New York Complex combinatorial chemical libraries encoded with tags
DE69333087T2 (de) * 1992-10-01 2004-05-06 The Trustees Of Columbia University In The City Of New York Komplexe kombinatorische chemische banken, die mit markierungen versehen sind
EP1262564A3 (en) * 1993-01-07 2004-03-31 Sequenom, Inc. Dna sequencing by mass spectrometry
GB9315847D0 (en) * 1993-07-30 1993-09-15 Isis Innovation Tag reagent and assay method
CZ218498A3 (cs) * 1996-01-23 1998-12-16 Rapigene, Inc. Způsoby a kompozice pro stanovení sekvence molekul nukleových kyselin
CA2243989A1 (en) * 1996-01-23 1997-07-31 Rapigene, Inc. Methods and compositions for detecting binding of ligand pair using non-fluorescent label

Also Published As

Publication number Publication date
AU2244897A (en) 1997-08-20
ATE434054T1 (de) 2009-07-15
DE69701612T2 (de) 2000-08-31
PL328239A1 (en) 1999-01-18
JP2000503845A (ja) 2000-04-04
CN1212020A (zh) 1999-03-24
WO1997027325A3 (en) 1998-04-02
CA2243546A1 (en) 1997-07-31
CN1202260C (zh) 2005-05-18
HUP9901856A3 (en) 2001-10-29
BR9707016A (pt) 2000-01-04
CA2243546C (en) 2008-04-15
DK0840804T3 (da) 2000-07-17
EP0962537A2 (en) 1999-12-08
AU717945B2 (en) 2000-04-06
DE69701612D1 (de) 2000-05-11
EP0962537A3 (en) 2004-02-11
KR19990081924A (ko) 1999-11-15
EP0962537B1 (en) 2009-06-17
EP0840804A1 (en) 1998-05-13
HUP9901856A2 (hu) 1999-09-28
GR3033887T3 (en) 2000-11-30
ATE191515T1 (de) 2000-04-15
EP0840804B1 (en) 2000-04-05
DE69739465D1 (de) 2009-07-30
CZ228598A3 (cs) 1998-12-16
WO1997027325A2 (en) 1997-07-31
KR100482915B1 (ko) 2005-09-12
JP2008200040A (ja) 2008-09-04
ES2145580T3 (es) 2000-07-01
NZ331043A (en) 1999-01-28

Similar Documents

Publication Publication Date Title
PT840804E (pt) Metodos e composicoes para a analise de moleculas de acidos nocleicos usando tecnicas de separacao por dimensoes
AU717435B2 (en) Methods and compositions for determining the sequence of nucleic acid molecules
JP4414086B2 (ja) 質量分析によって核酸を分析するための方法および化合物
US7052846B2 (en) Methods and compositions for analyzing nucleic acid molecules utilizing sizing techniques
EP0850320B1 (en) Methods for detecting binding of ligand pair with enhanced sensitivity
US6623928B2 (en) Methods and compositions for determining the sequence of nucleic acid molecules
US6027890A (en) Methods and compositions for enhancing sensitivity in the analysis of biological-based assays
WO1997027331A9 (en) Methods and compositions for determining the sequence of nucleic acid molecules
EP0992511B1 (en) Methods and compositions for determining the sequence of nucleic acid molecules
EP0962464A2 (en) Methods and compositions for detecting binding of ligand pair using non-fluorescent label
MXPA98005955A (en) Methods and compositions to analyze nucleic acid molecules by using classification techniques