ES2287104T3 - Marcadores de masa. - Google Patents

Marcadores de masa. Download PDF

Info

Publication number
ES2287104T3
ES2287104T3 ES01911912T ES01911912T ES2287104T3 ES 2287104 T3 ES2287104 T3 ES 2287104T3 ES 01911912 T ES01911912 T ES 01911912T ES 01911912 T ES01911912 T ES 01911912T ES 2287104 T3 ES2287104 T3 ES 2287104T3
Authority
ES
Spain
Prior art keywords
mass
markers
marker
radical
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES01911912T
Other languages
English (en)
Inventor
Gunter Schmidt
Andrew Hugin Thompson
Robert Alexander Walker Johnstone
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Proteome Sciences PLC
Original Assignee
Electrophoretics Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=9887608&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2287104(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Electrophoretics Ltd filed Critical Electrophoretics Ltd
Application granted granted Critical
Publication of ES2287104T3 publication Critical patent/ES2287104T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K1/00General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
    • C07K1/107General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length by chemical modification of precursor peptides
    • C07K1/1072General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length by chemical modification of precursor peptides by covalent attachment of residues or functional groups
    • C07K1/1077General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length by chemical modification of precursor peptides by covalent attachment of residues or functional groups by covalent attachment of residues other than amino acids or peptide residues, e.g. sugars, polyols, fatty acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6872Methods for sequencing involving mass spectrometry
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2458/00Labels used in chemical analysis of biological material
    • G01N2458/15Non-radioactive isotope labels, e.g. for detection by mass spectrometry
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10TTECHNICAL SUBJECTS COVERED BY FORMER US CLASSIFICATION
    • Y10T436/00Chemistry: analytical and immunological testing
    • Y10T436/13Tracers or tags

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Hematology (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Urology & Nephrology (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Cell Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Inorganic Insulating Materials (AREA)
  • Liquid Crystal Substances (AREA)
  • Glass Compositions (AREA)
  • Transition And Organic Metals Composition Catalysts For Addition Polymerization (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Pyridine Compounds (AREA)

Abstract

Un conjunto de dos o más marcadores de masa, comprendiendo cada marcador en el conjunto un radical marcador de masa anclado a través de un conector escindible a un radical de normalización de masas, donde cada radical de normalización de masas asegura que un marcador de masa tiene una masa agregada deseada, y donde cada radical marcador de masa tiene una masa diferente de la de todos los otros radicales marcadores de masa, y cada marcador en el conjunto tiene una masa agregada común; y donde todos los marcadores de masa en el conjunto son distinguibles entre sí mediante espectrometría de masas.

Description

Marcadores de masa.
Esta invención se refiere a compuestos útiles para marcar analitos, particularmente biomoléculas tales como ácidos nucleicos y proteínas. Específicamente esta invención se refiere a métodos de análisis mediante espectrometría de masas, utilizando marcadores de masa específicos.
En la técnica se conocen diferentes métodos para marcar moléculas de interés, incluyendo átomos radiactivos, colorantes fluorescentes, reactivos luminiscentes, reactivos de captura de electrones y colorantes absorbentes de luz. Cada uno de estos sistemas de marcaje tiene características que lo hacen adecuado para ciertas aplicaciones y no otras. Por motivos de seguridad, el interés en sistemas de marcaje no radiactivos ha conducido al extenso desarrollo comercial de esquemas de marcaje fluorescente particularmente para análisis genético. Los esquemas de marcaje fluorescente permiten el marcaje de un número relativamente pequeño de moléculas simultáneamente, típicamente se pueden utilizar simultáneamente cuatro marcadores y posiblemente hasta ocho. No obstante, los costes del aparato de detección y las dificultades para analizar las señales resultantes limitan el número de marcadores que se pueden utilizar simultáneamente en un esquema de detección de fluorescencia.
Más recientemente ha habido un desarrollo en el área de la espectrometría de masas como método para detectar marcadores que se anclan escindiblemente a su molécula asociada de interés. En muchas aplicaciones de biología molecular se necesita ser capaz de separar las moléculas de interés antes del análisis. Generalmente, se realizan separaciones en fase líquida. En la espectrometría de masas en los últimos años se han desarrollado algunas interfases para las separaciones en fase líquida, que hacen la espectrometría particularmente eficaz como sistema de detección para esta clase de aplicaciones. Hasta hace poco se utilizó la Cromatografía Líquida-Espectrometría de Masas para detectar iones de analitos o sus iones fragmento directamente. No obstante, para muchas aplicaciones tales como el análisis de ácidos nucleicos, la estructura del analito se puede determinar a partir del marcaje indirecto. Esto es ventajoso particularmente con respecto al uso de la espectrometría de masas puesto que las biomoléculas complejas tales como el ADN tienen espectros de masas complejos y se detectan con una sensibilidad relativamente escasa. La detección indirecta significa que se puede utilizar una molécula marcadora asociada para identificar el analito original, diseñándose el marcador para la detección sensible y teniendo un espectro de masas sencillo. Los espectros de masas sencillos permiten utilizar marcadores múltiples para analizar una pluralidad de analitos simultáneamente.
En WO98/31830 se describen matrices ("matrices") de sondas de ácidos nucleicos ancladas covalentemente a marcadores escindibles que son detectables mediante espectrometría de masas, que identifican la secuencia de la sonda de ácido nucleico conectada covalentemente. Las sondas marcadas de esta solicitud tienen la estructura Nu-L-M donde Nu es un ácido nucleico conectado covalentemente a L, un conector escindible, conectado covalentemente a M, un marcador de masas. Los conectores escindibles preferidos en esta solicitud se escinden dentro de la fuente iónica del espectrómetro de masas. Los marcadores de masas preferidos son los poliéteres arílicos. Esta solicitud describe una variedad de métodos de ionización, y análisis mediante analizadores de masas cuadrupolares, analizadores de tiempo de vuelo (TOF) e instrumentos de sector magnético como métodos específicos para analizar marcadores de masas mediante espectrometría de masas.
En WO98/15652 se describe un método para secuenciar ácido nucleico, especialmente ADN. El método implica escindir ácidos nucleicos para formar fragmentos con extremos cohesivos ambiguos. Estos fragmentos se capturan utilizando genotecas de adaptadores. Se prefieren los extremos cohesivos ambiguos que tienen cuatro pares de bases y se emplean preferiblemente poblaciones de 256 adaptadores que comprenden cada posible secuencia de cuatro bases. También se describe que los adaptadores se pueden detectar utilizando marcaje de masas de manera que los marcadores de masa escindibles se anclan a los adaptadores.
En WO99/027 se describen métodos para caracterizar ADN en particular para obtener información de la secuencia. El método funciona proporcionando una población de fragmentos de ADN que son anclados escindiblemente a marcadores de masas. Los fragmentos se escinden en un espectrómetro de masas para liberar el marcador de masa que es determinado mediante espectrometría de masas. Se pueden emplear conexiones amina en este método.
En PCT/GB94/01675 se describen ligandos, y específicamente ácidos nucleicos, conectados escindiblemente a moléculas marcadoras de masa. Los conectores escindibles preferidos son fotoescindibles. Esta solicitud describe la espectrometría de masas de Desorción/Ionización mediante Láser Asistida por Matriz (MALDI) TOF como un método específico para analizar los marcadores de masa mediante espectrometría de masas.
En PCT/US97/22639 se describen moléculas marcadoras de masas no volátiles liberables. En realizaciones preferidas estos marcadores comprenden polímeros, típicamente biopolímeros que están anclados escindiblemente a un grupo o ligando reactivo, es decir una sonda. Parece que los conectores escindibles son escindibles químicamente o enzimáticamente. Esta solicitud describe la espectrometría de masas (MALDI) TOF como un método específico para analizar marcadores de masa mediante espectrometría de masas.
En PCT/US97/01070, PCT/US97/01046, y PCT/US97/01304 se describen ligandos, y específicamente ácidos nucleicos, conectados escindiblemente a moléculas marcadoras de masa. Parece que los conectores escindibles preferidos son escindibles químicamente o fotoescindibles. Estas solicitudes describen una variedad de métodos de ionización y análisis mediante analizadores de masas cuadrupolares, analizadores TOF e instrumentos del sector magnético como métodos específicos para analizar marcadores de masas mediante espectrometría de masas.
En WO99/32501 se describe un grupo de 8 etiquetas, para caracterizar ácidos nucleicos. Cada etiqueta tiene diferente masa y están formadas por marcadores de masa de la misma masa, conectados escindiblemente a una variedad de radicales arilo.
En WO99/14362 se describe un método para analizar una población de fragmentos de ácido nucleico. El método se refiere en concreto a la secuenciación de Sanger utilizando una matriz de marcadores de masa conectados escindiblemente a una base de ácido nucleico. Los marcadores de masa son específicos de los nucleótidos individuales a los que están anclados.
Los espectros de masas generados para una sustancia analito son muy sensibles a los contaminantes. Esencialmente, cualquier sustancia introducida en el espectrómetro de masas que se pueda ionizar puede aparecer en el espectro de masas. Esto significa que para muchos análisis es necesario purificar cuidadosamente el analito antes de introducirlo en el espectrómetro de masas. Para los propósitos de los sistemas de alta eficiencia para el análisis indirecto de analitos a través de marcadores de masa sería deseable evitar cualquier etapa de preparación de muestras innecesaria. Es decir, sería deseable poder detectar marcadores en un fondo de sustancia contaminantes y certificar que el pico que se detecta no corresponde de hecho a un marcador. La técnica anterior no describe métodos o composiciones que puedan mejorar la señal frente a la proporción del ruido alcanzable en sistemas de detección basados en la espectrometría de masas o que puedan proporcionar la confirmación de que un pico de masas estaba ocasionado por la presencia de un marcador de masa.
Con el fin de la detección de analitos después de la cromatografía líquida o las separaciones electroforéticas, es deseable que los marcadores utilizados interfieran mínimamente en el procedimiento de separación. Si se utiliza una matriz de tales marcadores, es deseable que el efecto de cada miembro de la matriz sobre su analito asociado sea el mismo que el de cada una de las otras marcas. Esto choca hasta cierto punto con el propósito del marcaje de masas que es para generar matrices de marcadores que pueden ser resueltas en el espectrómetro de masas basándose en su masa. Los marcadores de masa deben ser resueltos preferiblemente por 4 daltons para evitar la interferencia de los picos de los isótopos de un marcador con los de otro marcador. Esto significa que para generar 250 marcadores de masa distintos se requerirían marcadores repartidos a lo largo de un intervalo de aproximadamente 1000 daltons y probablemente más, puesto que no es trivial generar grandes matrices de marcadores separados exactamente por 4 daltons. Este intervalo de masas dará como resultado casi indudablemente marcadores de masa que tendrán un efecto distinto sobre cualquier procedimiento de separación que preceda la detección mediante espectrometría de masas. Esto tiene también implicaciones para el diseño del aparato, puesto que a medida que aumenta el intervalo de masas sobre el que el espectrómetro de masas puede detectar iones, el coste del aparato
aumenta.
Así, un objeto de esta invención es resolver los problemas asociados con la técnica anterior precedente, y proporcionar marcadores de masa que se puedan detectar en un fondo de contaminación y cuya identidad como marcadores de masa se pueda confirmar. Además un objeto de esta invención es proporcionar matrices de marcadores que se puedan resolver en un intervalo de masas comprimido de manera que los marcadores no interfieran tanto con los procedimientos de separación y que se puedan detectar fácilmente en un espectrómetro de masas que detecta iones a lo largo de un intervalo limitado de masas con relación a las proporciones de carga.
También es un objeto de esta invención proporcionar métodos para analizar biomoléculas que explota los marcadores de esta invención para maximizar el rendimiento, las proporciones de señal a ruido y la sensibilidad de tales análisis, concretamente en análisis genéticos y más concretamente en la electroforesis en gel bidimensional que se utiliza para analizar proteínas.
Además el diseño de los marcadores de masa descritos más abajo permite diseñar un espectrómetro de masas en tándem simplificado para el propósito de detectar marcadores de masa. El cebador analizador de masas necesita únicamente seleccionar un número limitado de iones cuya masa es relativamente baja. El segundo analizador de masas necesita únicamente detectar un pequeño número de productos de fragmentación.
Por consiguiente, la presente invención proporciona un conjunto de dos o más marcadores de masa, como se define en la reivindicación 1. Cada marcador del conjunto comprende un radical marcador de masas anclado a través de un conector escindible a un radical de normalización de masas, siendo el radical marcador de masas resistente a la fragmentación, donde la masa agregada de cada marcador en el conjunto es la misma y la masa del radical marcador de masas de cada marcador en el conjunto es diferente, y donde cada marcador tiene un radical marcador de masas que tiene una masa diferentes de la de las otros radicales marcadores de masas de este grupo, de manera que todos los marcadores de masas en el conjunto son distinguibles entre sí mediante espectrometría de masas.
Se pretende que el término radical marcador de masas utilizado en el presente contexto haga referencia a un radical que se va a detectar mediante espectrometría de masas, mientras que se pretende que el término radical de normalización de masas utilizado en el presente contexto haga referencia a un radical que no es detectado necesariamente mediante espectrometría de masas, pero está presente para asegurarse de que un marcador de masa tiene una masa agregada deseada. El número de marcadores en el conjunto no está especialmente limitado, siempre que el conjunto comprenda una pluralidad de marcadores. No obstante, se prefiere que el conjunto comprenda dos o más, tres o más, cuatro o más, o cinco o más marcadores.
\global\parskip0.930000\baselineskip
La presente invención también proporciona una matriz de marcadores de masa, que comprende dos o más conjuntos de marcadores de masa como se ha definido antes, donde la masa agregada de cada uno de los marcadores de masa en uno cualquiera de los conjuntos es diferente de la masa agregada de cada uno de los marcadores de masa en todos los demás conjuntos de la matriz.
La invención proporciona adicionalmente un método de análisis, cuyo método comprende detectar un analito identificando mediante espectrometría de masas un marcador de masa o una combinación de marcadores de masa única para el analito, donde el marcador de masa es un marcador de masa de un conjunto de marcadores de masa como se ha definido antes.
La invención está definida por el alcance de las reivindicaciones adjuntas. Cualquier conjunto de marcadores que no caiga dentro del alcance de la reivindicación 1 es descrito en la presente memoria únicamente con fines informativos.
La invención se describirá ahora con más detalle por medio de ejemplos únicamente, con referencia a los dibujos adjuntos, donde:
La Figura 1 muestra una disposición esquemática de un espectrómetro de masas de cuadrupolo triple;
La Figura 2 muestra diez fragmentos que comprenden cinco radicales de normalización de masas (M_{0}-M_{4}), y cinco radicales marcadores de masa (X_{0}-X_{4}), para formar un conjunto de marcadores según la presente invención, donde se emplean átomos de flúor sustituyentes como radicales ajustadores de masa;
La Figura 3 muestra un conjunto de cinco marcadores según la presente invención, formado a partir de los radicales de normalización de masas y los radicales marcadores de masas de la Figura 2;
La Figura 4 muestra un conjunto de cinco marcadores de masa según la presente invención donde todos los marcadores tienen una masa diferente, pero donde todos los marcadores de masa del conjunto tienen la misma masa;
La Figura 5 muestra un ejemplo de marcaje de un analito tal como un oligonucleótido con una combinación de marcadores de masa; de manera que la combinación de marcadores de masa tiene un espectro de masas único que identifica el analito;
La Figura 6 muestra una matriz de conjuntos de marcadores de masa, teniendo cada conjunto el mismo grupo modificador de la serie de masas (S) y siendo distinto de todos los otros conjuntos en virtud del número de sustituyentes flúor del grupo fenilo base;
La Figura 7 muestra una matriz de conjuntos de marcadores de masa, teniendo cada conjunto el mismo grupo modificador de la serie de masas (S) y siendo distinto de todos los otros conjuntos en virtud del número de unidades feniléter en el grupo modificador de la serie de masas;
La Figura 8 ilustra la realización del "modo de mezclado" de la presente invención, mostrando 4 de los 8 espectros de masas únicos posibles para todas las combinaciones de tres marcadores de masa P, Q y R cuando están presentes en cantidades relativas de 0 o 1;
La Figura 9 ilustra la realización del "modo de mezclado" de la presente invención, mostrando 8 de los 243 espectros de masas únicos posibles para todas las combinaciones de tres marcadores de masa P, Q, R, S y T cuando están presentes en cantidades relativas de 0, 1 o 2 (existen 81 espectros posibles si T permanece constante como patrón interno);
La Figura 10 muestra cuántos conjuntos más grandes de marcadores se pueden formar ampliando los radicales de normalización de masas y marcadores de masas para permitir más alcance para la sustitución -este conjunto de marcadores tiene nueve miembros, y utiliza átomos de flúor sustituyentes como radicales ajustadores de masas- de un conjunto de marcadores que tienen al menos 8 miembros de manera que esto es conveniente para marcar todos los 256 4-meros en una matriz de oligonucleótidos utilizando el modo de mezclado de la presente invención;
La Figura 11 muestra espectro de masas 1, que es un espectro completo que comprende picos de todos los iones A^{+}, B^{+}, C^{+}, y D^{+};
La Figura 12 muestra espectro de masas 2, que es un espectro de A^{+} únicamente, producido seleccionando iones A^{+} en un cebador cuadrupolo del espectrómetro (Q1);
La Figura 13 muestra espectro de masas 3, que es un espectro de un cebador ión A_{1}^{+} (con la misma razón masa/carga que A^{+}) y productos de fragmentación de A_{1}^{+}, P^{+} y Q^{+};
La Figura 14 muestra el espectro de masas 4, que es un espectro de un segundo ión A_{2}^{+} (con la misma razón masa/carga que A^{+}) y productos de fragmentación de A_{2}^{+}, X^{+} y Y^{+};
\global\parskip1.000000\baselineskip
La Figura 15 muestra el espectro de masas 5, que es un espectro formado seleccionando iones A^{+} cuando están presentes dos tipos de tales iones, A_{1}^{+} y A_{2}^{+};
La Figura 16 muestra el espectro de masas 6, que es un espectro formado en un espectrómetro de cuadrupolo triple seleccionando en Q1 iones A^{+} cuando están presentes dos tipos de tales iones (A_{1}^{+} y A_{2}^{+}) induciendo la disociación de los iones seleccionados mediante colisión en Q2, y seleccionando un producto de colisión conocido de A_{1}^{+} (P^{+}) en Q3 - tal procedimiento permite la resolución de A_{1}^{+} y A2^{+};
La Figura 17 muestra espectro de masas 7, que es un espectro bidimensional de un conjunto de cinco marcadores de masa según la presente invención, donde una masa MX se selecciona en Q1 (primera dimensión) y cinco masas distintas X_{0}, X_{1}, X_{2}, X_{3}, y X_{4} se seleccionan en Q3 (segunda dimensión);
La Figura 18 muestra el espectro de masas 8, que es un espectro bidimensional de un conjunto de cuatro marcadores de masa según la presente invención, donde cuatro masas distintas, M_{0}X_{0}, M_{1}X_{0}, M_{2}X_{0}, y M_{3}X_{0}, se seleccionan en Q1 (primera dimensión) y una única masa M_{0} se selecciona en Q3 (segunda dimensión);
La Figura 19 muestra el espectro de masas 9, que es un espectro bidimensional de un conjunto de marcadores de masa que comprende marcadores formados a partir de todas las combinaciones de M_{0}-M_{3} con X_{0}-X_{3}, donde siete masas distintas se seleccionan en Q1 (primera dimensión) y cuatro masas distintas X_{0}-X_{3} se seleccionan en Q3 (segunda dimensión);
La Figura 20 muestra un esquema de un procedimiento de escisión típico utilizando los marcadores de masa de la presente invención y escindiéndolos de sus analitos térmicamente, o utilizando ionización de electropulverización;
La Figura 21 muestra un esquema de los procedimientos de selección en espectrometría de masas bidimensional utilizando un conjunto de cinco marcadores de masa según la presente invención.
La Figura 22 muestra marcadores de masa deuterados según la presente invención;
La Figura 23 muestra marcadores de masa deuterados adicionales según la presente invención; y
La Figura 24 muestra un espectro teórico para dos para dos muestras de un péptido con la secuencia H_{2}N-gly-leu-ala-ser-glu-COOH, donde cada muestra está anclada a uno de los marcadores con las fórmulas mostradas en la Figura 23.
En una realización preferida, la presente invención proporciona un conjunto de marcadores de masa como se ha definido antes, donde cada marcador en el conjunto tiene un radical marcador de masa que tiene una masa común y cada marcador en el conjunto tiene una masa agregada única. Un ejemplo de un conjunto de marcadores de este cebador tipo se proporciona en la Figura 4.
En una realización más preferida alternativa, cada marcador en el conjunto tiene una masa agregada común y cada marcador en el conjunto tiene un radical marcador de masa de una masa única. Un ejemplo de un conjunto de marcadores de este segundo tipo se proporciona en la Figura 3.
No se necesita que el conjunto de marcadores esté limitado a las dos realizaciones preferidas descritas antes, y puede comprender por ejemplo marcadores de ambos tipos, siempre que todos los marcadores sean distinguibles mediante espectrometría de masas, como se ha indicado antes.
Se prefiere que, en un conjunto de marcadores del segundo tipo, cada radical marcador de masa en el conjunto tenga una estructura básica común y cada radical de normalización de masas en el conjunto tenga una estructura básica común, y cada marcador de masa en el conjunto comprenda uno o más radicales ajustadores de masas, estando los radicales ajustadores de masas anclados a o situados en la estructura básica del radical marcador de masa y/o la estructura básica del radical de normalización de masas. En esta realización, cada radical marcador de masa en el conjunto comprende un número diferente de radicales ajustadores de masas y cada marcador de masa en el conjunto tiene el mismo número de radicales ajustadores de masas.
A lo largo de esta descripción, mediante estructura básica común, se significa que dos o más radicales comparten una estructura que tiene sustancialmente el mismo esqueleto, cadena principal o núcleo estructural. Este esqueleto o cadena principal puede ser por ejemplo un radical feniléter. El esqueleto o la cadena principal pueden comprender sustituyentes pendientes de él, o reposiciones atómicas o isotópicas dentro de él, sin cambiar la estructura básica común.
Típicamente, un conjunto de marcadores de masa del segundo tipo referido antes comprende marcadores de masa con la fórmula:
M(A)_{y}-L-X(A)_{z}
donde M es el radical de normalización de masas, X es el radical marcador de masa, A es un radical ajustador de masas, L es un conector escindible, y y z son enteros de 0 o superiores, e y+z es un entero de 1 o superior. Preferiblemente M es un grupo resistente a la fragmentación, L es un conector que es susceptible a la fragmentación al colisionar con otra molécula o átomo y X es preferiblemente un grupo resistente a la fragmentación, preionizado. La suma de las masas de M y X es la misma para todos los miembros del conjunto. Preferiblemente M y X tienen la misma estructura básica o estructura núcleo, estando modificada esta estructura por los radicales ajustadores de masas.
El radical ajustador de masas asegura que la suma de las masas de M y X sean las mismas para todos los marcadores de masa en un conjunto, pero asegura que cada X tenga una masa distinta (única).
Un conjunto de marcadores de masa preferido que tiene la estructura anterior es uno en el que cada uno de los marcadores en el conjunto tiene la siguiente estructura:
1
donde R es hidrógeno o es un grupo alifático, aromático, cíclico o heterocíclico sustituido o no sustituido, L es el conector escindible y A es el radical ajustador de masas, cada p es igual y es un entero de 0 o superior, cada y' puede ser igual o diferente y es un entero de 0-4, siendo la suma de todos los y' igual a y, cada z' puede ser igual o diferente y es un entero de 0-4, siendo la suma de todos los z' igual a z. Preferiblemente R es H, L es un enlace amida, p=0, y A es un átomo de F.
En el presente contexto, el patrón de sustitución del grupo R no está limitado en absoluto. El sustituyente o los sustituyentes pueden comprender cualquier grupo orgánico y/o uno o más átomos de cualquiera de los grupos IIIA, IVA, VA, VIA o VIIA de la Tabla Periódica, tales como un átomo de B, Si, N, P, O, o S o un átomo de halógeno (p. ej. F, Cl, Br o I).
Cuando el sustituyente comprende un grupo orgánico, el grupo orgánico puede comprender un grupo hidrocarbonado. El grupo hidrocarbonado puede comprender un grupo de cadena lineal, de cadena ramificada o cíclico. Independientemente, el grupo hidrocarbonado puede comprender un grupo alifático o aromático. También independientemente, el grupo hidrocarbonado puede comprender un grupo saturado o insaturado.
Cuando el hidrocarburo comprende un grupo insaturado, éste puede comprender uno o más funcionalidades alqueno y/o una o más funcionalidades alquino. Cuando el hidrocarburo comprende un grupo de cadena lineal o ramificada, éste puede comprender uno o más grupos alquilo primarios, secundarios y/o terciarios. Cuando el hidrocarburo comprende un grupo cíclico éste puede comprender un anillo aromático, un anillo alifático, un grupo heterocíclico, y/o derivados de anillo fusionado de estos grupos. El grupo cíclico puede comprender en ese caso un grupo benceno, naftaleno, antraceno, indeno, fluoreno, piridina, quinolina, tiofeno, benzotiofeno, furano, benzofurano, pirrol, indol, imidazol, tiazol, y/u oxazol, así como regioisómeros de los grupos anteriores.
El número de átomos de carbono en el grupo hidrocarbonado no está limitado especialmente, pero generalmente el grupo hidrocarbonado comprende 1-40 átomos de C. El grupo hidrocarbonado puede ser en ese caso un hidrocarburo inferior (1-6 átomos de C) o un hidrocarburo superior (7 átomos de C o más, p. ej. 7-40 átomos de C). El número de átomos en el anillo del grupo cíclico no está limitado especialmente, pero el anillo del grupo cíclico puede comprender 3-10 átomos, por ejemplo 3, 4, 5, 6 o 7 átomos.
Los grupos que comprenden los heteroátomos definidos antes, así como cualquiera de los otros grupos definidos antes, pueden comprender uno o más heteroátomos de cualquiera de los grupos IIIA, IVA, VA, VIA o VIIA de la Tabla Periódica, tales como un átomo de B, Si, N, P, O, o S o un átomo de halógeno (p. ej. F, Cl, Br o I). Así, el sustituyente puede comprender uno o más de cualquiera de los grupos funcionales comunes en química orgánica, tales como grupos hidroxi, grupos ácido carboxílico, grupos éster, grupos éter, grupos aldehído, grupos cetona, grupos amina, grupos amida, grupos imina, grupos tiol, grupos tioéter, grupos sulfato, grupos ácido sulfónico, y grupos fosfato. El sustituyente puede comprender también derivados de estos grupos, tales como anhídridos de ácido carboxílico y haluros de ácido carboxílico.
Además, cualquier sustituyente puede comprender una combinación de dos o más de los sustituyentes y/o grupos funcionales definidos antes.
Las matrices de marcadores de masa de la presente invención no están particularmente limitadas, siempre que contengan a pluralidad de conjuntos de marcadores de masa según la presente invención. Se prefiere que las matrices comprendan dos o más, tres o más, cuatro o más, o cinco o más conjuntos de marcadores de masa. Preferiblemente cada uno de los marcadores de masa en la matriz tiene cualquiera de las siguientes estructuras:
2
donde S es el grupo modificador de la serie de masas, M es el radical de normalización de masas, X es el radical marcador de masa, A es el radical ajustador de masas, L es el conector escindible, x es un entero de 0 o superior, y y z son enteros de 0 o superiores, e y+z es un entero de 1 o superior.
Una matriz de marcadores de masa preferida del tipo anterior es una en la que los marcadores de masa tienen cualquiera de las siguientes estructuras:
3
4
donde R es hidrógeno o es un grupo alifático, aromático, cíclico o heterocíclico sustituido o no sustituido, cada p es igual y es un entero de 0 o superior, x es un entero de 0 o superior siendo cada x para un conjunto cualquiera diferente de la x de cada otro conjunto en la matriz, cada y' puede ser igual o diferente y es un entero de 0-4, siendo la suma de todos los y' igual a y, y cada z' puede ser igual o diferente y es un entero de 0-4, siendo la suma de todos los z' igual a z. Una matriz de este tipo se representa en la Figura 7.
En un aspecto alternativo preferido, la matriz de marcadores de masa puede comprender marcadores de masa que tienen cualquiera de las siguientes estructuras:
5
donde S es un grupo modificador de la serie de masas, M es el radical de normalización de masas, X es el radical marcador de masa, A es un radical ajustador de masas de los radicales marcadores de masas y de normalización de masas, A* puede ser igual o diferente de A y es un radical ajustador de masas del grupo modificador de la serie de masas, L es el conector escindible, r es un entero de 0 o superior y es al menos 1 para uno o más conjuntos de marcadores de masa en la matriz, y y z son enteros de 0 o superiores, y x+y es un entero de 1 o superior. Preferiblemente, M es un grupo resistente a la fragmentación, L es un conector que es susceptible a la fragmentación al colisionar con otra molécula o átomo y X es preferiblemente un grupo resistente a la fragmentación, preionizado. S es típicamente a grupo tal que cada miembro de la matriz de conjuntos de marcadores comprende un S cuya masa está separada preferiblemente por 4 daltons de cada otro S de cada otro miembro de la matriz. Así cada diferente conjunto de marcadores de masa tiene una masa única distinta.
Una matriz de marcadores de masa preferida del último tipo anterior es una en la que los marcadores de masa en la matriz tienen cualquiera de las siguientes estructuras:
6
\vskip1.000000\baselineskip
7
donde R es hidrógeno o es un grupo alifático, aromático, cíclico o heterocíclico sustituido o no sustituido, cada p es igual y es un entero de 0 o superior, x es un entero de 0 o superior siendo x el mismo para todos los marcadores de masa en la matriz, cada y' puede ser igual o diferente y es un entero de 0-4, siendo la suma de todos los y' igual a y, cada z' puede ser igual o diferente y es un entero de 0-4, siendo la suma de todos los z' igual a z, y cada r' puede ser igual o diferente, siendo la suma de todos los r' igual a r. Una matriz de este tipo se representa en la Figura 6.
En los anteriores conjuntos y matrices de esta invención, la estructura básica común de los grupos M, X y S no está particularmente limitada y puede comprender un grupo cíclico y/o no cíclico. La naturaleza de M, X y S no está particularmente limitada. No obstante, se prefiere que M y/o X, y/o S comprenda como estructura básica (núcleo), un grupo cíclico, tal como un grupo arilo, cicloalquilo o heterocíclico. Estos grupos pueden estar no sustituidos, pero están preferiblemente sustituidos. M, X y/o S pueden comprender respectivamente un oligómero o polímero formado a partir de los monómeros cíclicos anteriores, donde los monómeros cíclicos están conectados por un enlace o grupo resistente a la fragmentación.
Los éteres arílicos, tales como un feniléter y sus oligómeros y polímeros, especialmente los éteres arílicos sustituidos, son estructura básica comunes preferidas para M, X y S.
El grupo conector escindible L no está particularmente limitado. No obstante, se prefiere que L comprenda un grupo que sea escindible mediante colisión, y/o sea escindible en un espectrómetro de masas. Preferiblemente el grupo L comprende un enlace amida.
En un aspecto preferido adicional, esta invención proporciona conjuntos y matrices de marcadores de masa que se pueden hacer reaccionar con moléculas de analito, los marcadores de masa tiene la forma:
Re-L'-marcador
\hskip1cm
o
\hskip1cm
Re-L'-S-marcador
donde Re es una funcionalidad o grupo reactivos que permiten que los marcadores de masa reaccionen covalentemente con un grupo funcional apropiado en una molécula de analito, tales como, pero no limitadas a, un nucleótido, oligonucleótido, polinucleótido, aminoácido, péptido o polipéptido. L' es un conector que puede ser escindible o no, y marcador es un marcador de masa de cualquiera de los conjuntos o matrices definidos antes. S tiene el mismo significado que se ha definido antes. L' puede ser un conector escindible si se desea, tal como un conector escindible L, como se ha definido antes.
En las realizaciones preferidas de los aspectos anteriores de la invención, L y/o L' son escindibles en el espectrómetro de masas y preferiblemente en la fuente de iones del espectrómetro de masas.
Grupos Conectores
En el estudio anterior y siguiente se hace referencia a grupos conectores que se pueden utilizar para conectar moléculas de interés a los compuestos marcadores de masa de esta invención. Se conocen en la técnica una variedad de conectores que se pueden introducir entre los marcadores de masa de esta invención y su analito anclado covalentemente. Algunos de estos conectores pueden ser escindibles. Los oligo- o poli-etilenglicoles o sus derivados se pueden utilizar como conectores, tales como los descritos por Maskos, U. & Southern, en E.M. Nucleic Acids Research 20: 1679-1684, 1992. Los conectores basados en ácido succínico se utilizan también ampliamente, aunque estos son menos preferidos para las aplicaciones que implican el marcaje de oligonucleótidos puesto que son generalmente lábiles frente a las bases y en ese caso son incompatibles con las etapas de desprotección mediadas por bases utilizadas en numerosos sintetizadores de oligonucleótidos.
El alcohol propargílico es un conector bifuncional que proporciona una conexión que es estable en las condiciones de síntesis de oligonucleótidos y es un conector preferido para su uso con esta invención en relación con las aplicaciones de oligonucleótidos. De un modo similar el 6-aminohexanol es un reactivo bifuncional útil para conectar moléculas apropiadamente funcionalidadas y es también un conector preferido.
Se pueden utilizar una variedad de grupos conectores escindibles junto con los compuestos de esta invención, por ejemplo como fotoconectores escindibles. Los grupos orto-nitrobencilo son conocidos como fotoconectores escindibles, concretamente los ésteres 2-nitrobencílicos y las 2-nitrobencilaminas, que se escinden en el enlace bencilamina. Para una revisión de los conectores escindibles véase Lloyd-Williams et al., Tetrahedron 49, 11065-11133, 1993, que cubre una variedad de conectores fotoescindibles y escindibles químicamente.
En WO 00/02895 se describen los compuestos de vinilsulfona como conectores escindibles, que son también aplicables para su uso en esta invención, concretamente en aplicaciones que implican el marcaje de polipéptidos, péptidos y aminoácidos. El contenido de esta solicitud es incorporado como referencia.
En WO 00/02895 se describe el uso de compuestos de silicio como conectores que son escindibles por bases en la fase gaseosa. Estos conectores son también aplicables para su uso en esta invención, concretamente en aplicaciones que implican el marcaje de oligonucleótidos. El contenido de esta solicitud es incorporado como referencia.
En la discusión anterior, se hace referencia a las funcionalidades reactivas, Re, que permiten a los compuestos de la invención unirse a otros compuestos, ya sean grupos informadores o moléculas de analito. Se pueden introducir una variedad funcionalidades reactivas en los marcadores de masa de esta invención.
En la Tabla 1 de más abajo se registran algunas funcionalidades reactivas que puede se pueden hacer reaccionar con funcionalidades nucleofílicas que se encuentran en las biomoléculas para generar un enlace covalente entre las dos entidades. Para las aplicaciones que implican oligonucleótidos sintéticos, a menudo se introducen aminas primarias o tioles en los extremos de las moléculas para permitir el marcaje. Cualquiera de las funcionalidades enumeradas más abajo podría ser introducida en los compuestos de esta invención para permitir que los marcadores de masa se anclen a una molécula de interés. Se puede utilizar una funcionalidad reactiva para introducir grupos conectores adicionales con una funcionalidad reactiva adicional si se desea esto. No se pretende que la Tabla 1 sea exhaustiva y la presente invención no está limitadas al uso de las funcionalidades enumeradas únicamente.
TABLA 1
8
Se debe observar que en aplicaciones que implican el marcaje de oligonucleótidos con los marcadores de masa de esta invención, algunas de las funcionalidades reactivas anteriores o sus grupos conectores resultantes tendrían que ser protegidos antes de la introducción en un sintetizador de oligonucleótidos. Preferiblemente se deben evitar los enlaces éster, tioéter, amina y amida no protegidos, puesto que usualmente no son estables en un sintetizador de oligonucleótidos. Se conocen en la técnica una amplia variedad de grupos protectores que se pueden utilizar para proteger las uniones de reacciones secundarias no deseadas.
En el estudio de más abajo se hace referencia a "funcionalidades portadoras de carga" y grupos solubilizantes. Estos grupos se pueden introducir en marcadores de masa tales como los marcadores de masa de la invención para promover la ionización y la solubilidad. La elección de los marcadores depende de si se va a utilizar la detección de iones positivos o negativos. En la Tabla 2 de más abajo se enumeran algunas funcionalidades que se pueden introducir en los marcadores de masa para promover la ionización positiva o negativa. No se pretende que la tabla sea una lista exhaustiva, y la presente invención no está limitada al uso de las funcionalidades enumeradas únicamente.
TABLA 2
9
En WO 00/02893 se describe el uso de radicales de unión de iones metálicos tales como éteres corona o porfirinas con el fin de mejorar la ionización de los marcadores de masa. Estos radicales también son aplicables para su uso con los marcadores de masa de esta invención.
Los componentes de los marcadores de masa de esta invención son preferiblemente resistentes a la fragmentación de manera que el sitio de fragmentación de los marcadores se puede controlar mediante la introducción de una conexión que es rota fácilmente mediante Disociación Inducida por Colisión. Los éteres arílicos son un ejemplo de una clase de compuestos resistentes a la fragmentación que se pueden utilizar en esta invención. Estos compuestos son también químicamente inertes y térmicamente estables. En WO 99/32501 se habla del uso de poliéteres en espectrometría de masas con mayor detalle y el contenido de esta solicitud es incorporado como referencia.
En el pasado, el método general para la síntesis de éteres arílicos estaba basado en el acoplamiento de Ullmann de bromuros de arilo con fenoles en presencia de polvo de cobre a aproximadamente 200ºC (referencia representativa: H. Stetter, G. Duve, Chemische Berichte 87 (1954) 1699). Se han desarrollado métodos más suaves para la síntesis de éteres arílicos utilizando un catalizador metálico diferente pero la temperatura de reacción todavía está entre 100 y 120ºC. (M. Iyoda, M. Sakaitani, H. Otsuka, M. Oda, Tetrahedron Letters 26 (1985) 477). Esta es una ruta preferida para la producción de poliéteres marcadores de masa. Véase la síntesis de FT77 proporcionada en los ejemplos más abajo. Un método publicado recientemente proporciona una ruta más preferida para la generación de poliéteres marcadores de masa puesto que se lleva a cabo en condiciones mucho más suaves que las de los primeros métodos (D. E. Evans, J. L. Katz, T. R. West, Tetrahedron Lett. 39 (1998) 2937).
La presente invención también proporciona un conjunto de dos o más sondas, siendo cada sonda en el conjunto diferente y estando anclada a un único marcador de masa o a una combinación única de marcadores de masa, de a conjunto o una matriz de marcadores de masa como se ha definido antes.
Se proporciona adicionalmente una matriz de sondas que comprende dos o más conjuntos de sondas, donde cada sonda en un conjunto cualquiera está anclada a un único marcador de masa, o a una combinación única de marcadores de masa, de un conjunto de marcadores de masa como se ha definido antes, y donde las sondas en un conjunto cualquiera están ancladas a los marcadores de masa del mismo conjunto de marcadores de masa, y cada conjunto de sondas está anclado a los marcadores de masa de los conjuntos de marcadores de masa únicos de una matriz de marcadores de masa como se ha definido antes.
En una realización, cada sonda está anclada preferiblemente a una combinación única de marcadores de masa, siendo distinguida cada combinación por la presencia o ausencia de cada marcador de masa en el conjunto de los marcadores de masa y/o la cantidad de cada marcador de masa anclado a la sonda. Esto se denomina "modo de mezclado" de la presente invención, puesto que las sondas pueden estar ancladas a una mezcla de marcadores de masa.
En los aspectos anteriores, la naturaleza de la sonda no está particularmente limitada. No obstante, preferiblemente cada sonda comprende una biomolécula. Se puede emplear cualquier biomolécula, pero la biomolécula se selecciona preferiblemente entre un ADN, un ARN, un oligonucleótido, una base de ácido nucleico, un péptido, un polipéptido, una proteína y un aminoácido.
En una realización preferida, esta invención proporciona conjuntos y matrices de analitos sometidos a marcaje de masa, tales como nucleótidos, oligonucleótidos y polinucleótidos, de la forma:
Analito-L'-marcador
\hskip1cm
o
\hskip1cm
Analito-L'-S-marcador
Donde L' y S se definen como antes, y el marcador es un marcador de masa de cualquiera de los conjuntos y matrices definidos antes.
En el aspecto anterior, la naturaleza del analito no está particularmente limitada. No obstante, preferiblemente cada analito comprende una biomolécula. Se puede emplear cualquier biomolécula, pero la biomolécula se selecciona preferiblemente entre un ADN, un ARN, un oligonucleótido, una base de ácido nucleico, un péptido, un polipéptido, una proteína y un aminoácido.
En una realización, cada analito está anclado preferiblemente a una combinación única de marcadores de masa, siendo distinguida cada combinación por la presencia o ausencia de cada uno de los marcadores de masa en el conjunto de los marcadores de masa y/o la cantidad de cada uno de los marcadores de masa anclados a la sonda. Como se ha mencionado antes, esto se denomina "modo de mezclado" de la presente invención, puesto que las sondas pueden estar ancladas a una mezcla de marcadores de masa.
Como se ha mencionado antes, la presente invención proporciona un método de análisis, cuyo método comprende detectar un analito identificando mediante espectrometría de masas un marcador de masa o una combinación de marcadores de masa únicos para el analito, donde el marcador de masa es un marcador de masa de un conjunto o una matriz de marcadores de masa como se ha definido antes. El tipo de método no está particularmente limitado, siempre que el método se beneficie del uso de los marcadores de masa de la presente invención para identificar un analito. El método puede ser, por ejemplo, un método de secuenciación de ácido nucleico o un método para perfilar la expresión de uno o más genes detectando cantidades de proteína en una muestra. El método es especialmente ventajoso, puesto que se puede utilizar para analizar fácilmente una pluralidad de analitos simultáneamente. No obstante, el método también tiene ventajas para analizar analitos sencillos individualmente, puesto que utilizando los presentes marcadores de masa, se producen espectros de masas que son más limpios que los espectros convencionales, haciendo el método exacto y sensible.
En una realización preferida adicional, la presente invención proporciona un método cuyo método comprende:
(a) poner en contacto uno o más analitos con un conjunto de sondas, o una matriz de sondas, siendo específica cada sonda en el conjunto o matriz para al menos un analito, donde las sondas se definen como antes,
(b) identificar un analito, detectando la sonda específica para el analito.
En esta realización se prefiere que el marcador de masa sea escindido de la sonda antes de detectar el marcador de masa mediante espectrometría de masas.
La naturaleza de los métodos de esta realización concreta no está limitada especialmente. No obstante, se prefiere que el método comprenda poner en contacto uno o más ácido nucleicos con un conjunto de sondas de hibridación. El conjunto de sondas de hibridación típicamente comprende un conjunto de hasta 256 4-meros, teniendo cada sonda en el conjunto una diferente combinación de bases de ácidos nucleicos. Este método puede ser adecuado para identificar la presencia de ácidos nucleicos diana, o alternativamente se puede utilizar en un método por etapas de secuenciación por prolongación del cebador de uno o más moldes de ácido nucleico.
Los marcadores de masa de la presente invención son concretamente adecuados para su uso en métodos de análisis bidimensional, principalmente debido al gran número de marcadores que se pueden distinguir simultáneamente. Los marcadores se pueden utilizar en ese caso en un método de electroforesis en gel bidimensional, o en un método de espectrometría de masas bidimensional.
Así, en un aspecto la presente invención proporciona un método de análisis espectrométrico de masas bidimensional, cuyo método comprende:
\global\parskip0.950000\baselineskip
(a) proporcionar uno o más analitos, estando marcado cada analito con un marcador de masa o una combinación de marcadores de masa únicos para este analito, donde los marcadores de masa son de un conjunto o matriz de marcadores de masa como se ha definido antes;
(b) escindir los marcadores de masa de los analitos;
(c) detectar los marcadores de masa;
(d) disociar los marcadores de masa en el espectrómetro de masas, para liberar los radicales marcadores de masas de los radicales de normalización de masas;
(e) detectar los radicales marcadores de masas; y
(f) identificar los analitos sobre la base del espectro de masas de los marcadores de masa en la primera dimensión y el espectro de masas de los radicales marcadores de masas en la segunda dimensión.
En éste método, preferiblemente en la etapa (c) los marcadores de masa de una masa elegida o de un intervalo de masas elegido se seleccionan para la detección. También se prefiere que en la etapa (e) los radicales marcadores de masas que tienen una masa específica o un intervalo específico de masas se seleccionen para la detección.
En otro aspecto, la presente invención proporciona un método de análisis, cuyo método comprende:
(a) someter una mezcla de analitos marcados a un primer tratamiento de separación basándose en una primera propiedad de los analitos;
(b) someter los analitos separados resultantes a un segundo tratamiento de separación basándose en una segunda propiedad de los analitos; y
(c) detectar un analito detectando su marcador;
donde los analitos se marcan con un marcador de masa de un conjunto o una matriz de marcadores de masa como se ha definido antes.
Las propiedades de los analitos no están particularmente limitadas. No obstante, en esta realización en la etapa (a) y/o la etapa (b) los analitos se separan preferiblemente según su longitud o masa. Se prefiere adicionalmente que en la etapa (a) y/o la etapa (b) los analitos se separen según su punto isoeléctrico. Típicamente, los analitos comprenden una o más proteínas, polipéptidos, péptidos, aminoácidos o ácido nucleicos, o fragmentos de los mismos. Se prefiere concretamente que se emplee la electroforesis en gel en cada una de las etapas de separación. En esta realización, el método es un método de electroforesis en gel bidimensional.
En un aspecto adicional, la presente invención proporciona un método para caracterizar ácido nucleico, que comprende:
(a) proporcionar una población de fragmentos de ácido nucleico, teniendo cada fragmento anclado escindiblemente un marcador de masa de un conjunto o una matriz de marcadores de masa como se ha definido antes para identificar una característica de este fragmento;
(b) separar los fragmentos basándose en su longitud;
(c) escindir cada fragmento para liberar su marcador de masa; y
(d) determinar cada uno de los marcadores de masa mediante espectroscopia de masas para relacionar la característica de cada fragmento con la longitud del fragmento.
Típicamente, el método de este aspecto de la invención se utiliza para caracterizar ADNc. Preferiblemente, éste método comprende:
(a) exponer una muestra que comprende una población de uno o más ADNc o fragmentos de los mismos a un agente de escisión que reconoce una secuencia predeterminada y corta en un sitio de referencia a un desplazamiento conocido de la secuencia predeterminada cerca de un extremo de cada ADNc o fragmento del mismo de manera que se genera una población de fragmentos terminales;
(b) ligar a cada sitio de referencia un oligonucleótido adaptador que comprende un sitio de reconocimiento para un agente de escisión de la muestra;
(c) exponer la población de fragmentos terminales a un agente de escisión de la muestra que se une al sitio de reconocimiento y corta en un sitio de la muestra de desplazamiento conocido desde el sitio de reconocimiento de manera que se genera en cada fragmento terminal una secuencia de extremos cohesivos de una longitud predeterminada de hasta 6 bases, y de secuencia desconocida;
\global\parskip1.000000\baselineskip
(d) separar la población de fragmentos terminales en subpoblaciones según la longitud de la secuencia; y
(e) determinar cada secuencia de extremos cohesivos:
(i)
sondeando con una matriz de sondas de hibridación marcadas, conteniendo la matriz todas las secuencias de bases posibles de la longitud predeterminada;
(ii)
ligar esas sondas que hibridan con las secuencias de extremos cohesivos; y
(iii)
determinar que sondas están ligadas mediante identificación y preferiblemente cuantificación de los marcadores;
donde los marcadores son marcadores de masa de un conjunto o una matriz como se ha definido antes.
En éste método, la población de fragmentos terminales se separa preferiblemente mediante electroforesis capilar, HPLC o electroforesis en gel.
En otro aspecto adicional de la presente invención, se proporciona un método para caracterizar ácido nucleico, cuyo método comprende fragmentos de ácido nucleico en escalera de Sanger de uno o más moldes de ácido nucleico, en la presencia de al menos una base terminadora marcada, e identificar la longitud del fragmento, y la base terminadora del fragmento, donde el marcador es específico para la base terminadora y es un marcador de masa de un conjunto o una matriz como se ha definido antes.
En este aspecto de la invención, se prefiere que las cuatro base terminadoras estén presentes en la misma zona de reacción. El método típicamente comprende generar fragmentos de ácido nucleico en escalera de Sanger a partir de una pluralidad de moldes de ácido nucleico presentes en la misma zona de reacción, y para cada fragmento de ácido nucleico producido identificar la longitud del fragmento, la identidad del molde del que deriva el fragmento y la base terminadora del fragmento, donde antes de generar los fragmentos, se hibrida un cebador nucleótido o oligonucleótido marcado con cada molde, siendo el marcador sobre cada cebador específico para el molde con el que hibrida el cebador para permitir la identificación del molde. El tipo de marcador identificar el molde no está particularmente limitada. No obstante, se prefiere que el marcador que identifica el molde sea un marcador de masa de un conjunto o una matriz como se ha definido en lo anterior.
Un aspecto adicional del método de la presente invención proporciona un método para secuenciar ácido nucleico, cuyo método comprende:
(a) obtener una población de ácido nucleico diana que comprende uno o más ADN de hebra sencilla que se van a secuenciar, cada uno de los cuales está presente en una cantidad única y porta un cebador para proporcionar una porción de hebra sencilla del ácido nucleico para su ligación;
(b) poner en contacto la población de ácido nucleico con una matriz de sondas de hibridación, comprendiendo cada sonda a marcador anclado escindiblemente a una secuencia de bases conocida de longitud predeterminada, conteniendo la matriz todas las secuencias de bases posibles de longitud predeterminada y siendo las secuencias de bases incapaces de ligación entre sí, donde el contacto se lleva a cabo en presencia de ligasa en condiciones para ligar la porción de doble hebra de cada ácido nucleico portando la sonda la secuencia de bases complementaria al ácido nucleico de hebra sencilla adyacente a la porción de doble hebra para formar de ese modo una porción de doble hebra ampliada que es incapaz de ligación a sondas adicionales; y
(c) eliminar todas las sondas no ligadas; seguido de las etapas de:
(d) escindir las sondas ligadas para liberar cada marcador;
(e) registrar la cantidad de cada marcador; y
(f) activar la porción de doble hebra ampliada para posibilitar su ligación; donde
(g) las etapas (b) a (f) se repiten en un ciclo durante un número suficiente de veces para determinar la secuencia del ácido nucleico de hebra sencilla o de cada uno de ellos determinando la secuencia de liberación de cada marcador,
donde los marcadores de las sondas de hibridación son cada una de un conjunto o una matriz como se ha definido antes.
En este aspecto de la invención, se prefiere que las sondas de hibridación sean un conjunto de 256 4-meros, teniendo cada sonda en el conjunto una combinación diferente de bases de ácido nucleicos.
Como ya se ha mencionado, se prefiere en todos los aspectos anteriores de los presentes métodos que dos o más analitos sean detectados identificando simultáneamente sus marcadores de masa o combinaciones de marcadores de masa mediante espectrometría de masas.
El modo de mezclado de la presente invención se puede aplicar a todos los métodos anteriores. En esta realización, cada analito es identificado por una combinación única de marcadores de masa de un conjunto o matriz de marcadores de masa, siendo distinguida cada combinación por la presencia y ausencia de cada uno de los marcadores de masa en el conjunto o matriz y/o la cantidad de cada marcador de masa.
Si el método es aplicado a dos o más analitos simultáneamente, en algunos aspectos se prefiere que los analitos sean separados según su masa, antes de detectar el marcador de masa mediante espectrometría de masas. Preferiblemente, la etapa de separación es una etapa cromatográfica, tal como cromatografía líquida o electroforesis en gel. Los presentes marcadores de tipo 2 son concretamente ventajosos en estas realizaciones, puesto que la masa agregada de todos los marcadores en el conjunto es la misma, así durante una etapa de separación cromatográfica, la movilidad de todos los analitos es afectada igualmente por los marcadores.
Típicamente, en los presentes métodos, el espectrómetro de masas empleado para detectar el marcador de masa comprende uno o más analizadores de masa, cuyos analizadores de masa son capaces de permitir que iones de una masa, o intervalo de masas concreto, pasen a través para la detección y/o son capaces de hacer que los iones se disocien. Preferiblemente los iones de una masa o intervalo de masas concreto específico para uno o más marcadores de masa conocidos se seleccionan utilizando el analizador de masas, los iones seleccionados se disocian, y los productos de disociación son detectados para identificar los patrones iónicos indicativos de los marcadores de masa seleccionado. En métodos particularmente preferidos, el espectrómetro de masas comprende analizadores de masa de tres cuadrupolos. En esta realización, generalmente se utiliza un primer analizador de masas para seleccionar iones de una masa o intervalo de masas concreto, se utiliza un segundo analizador de masas para disociar los iones seleccionados, y se utiliza un tercer analizador de masas para detectar los iones resultantes.
A realización preferida de los métodos anteriores proporciona un método para analizar moléculas de analitos sometidos a marcaje de masa, que comprende las etapas de:
1. Escindir el marcador de masa de su molécula de interés asociada.
2. Ionizar el marcador de masa escindido.
3. Seleccionar iones de una masa predeterminada para la proporción de carga correspondiente a la proporción de masa a carga de los iones preferidos de los marcadores de masa conocidos en una analizador de masas.
4. Inducir la disociación de estos iones seleccionados mediante colisión.
5. Detectar los productos de colisión para identificar iones del producto de colisión que son indicativos de los marcadores de masa seleccionados.
Se prefiere que el procedimiento de escisión del marcador de masa de su ácido nucleico asociado tenga lugar en un espectrómetro de masas, preferiblemente dentro de la fuente de iones. También se prefiere que los marcadores de masa estén pre-ionizados. En esta realización sólo se necesita transferir los marcadores de una fase líquida o sólida a la fase gaseosa (si los marcadores de masa están en una fase líquida o sólida). Típicamente, la etapa de ionización del marcador de masa resulta de la escisión del marcador de masa dentro de la fuente de iones del espectrómetro de masas.
Preferiblemente, la tercera etapa de selección de los iones de una masa predeterminada respecto a la proporción de carga se realiza en el primer analizador de masas de un aparato en serie. Los iones seleccionados son canalizados después a una celda de colisión separada donde se hacen colisionar con un gas o una superficie sólida según la cuarta etapa anterior. Los productos de colisión son canalizados después a un analizador de masas adicional de un aparato en serie para detectar los productos de colisión según la quinta etapa anterior. Los aparatos en serie típicos para su uso en la presente invención incluyen un espectrómetro de masas de cuadrupolo triple, aparatos de sector en tándem y espectrómetros de masas de tiempo de vuelo cuadrupolares.
Se prefiere adicionalmente que la tercera etapa anterior de seleccionar los iones de una masa predeterminada respecto a una proporción de carga, la cuarta etapa de hacer colisionar los iones seleccionados con un gas y la quinta etapa de detectar los productos de colisión sean realizadas en la misma zona del espectrómetro de masas. Esto se puede efectuar, por ejemplo, en analizadores de masa de tipo trampa de iones y espectrómetros de masas de Resonancia de Ión Ciclotrón por Transformada de Fourier.
En una realización preferida adicional, la invención proporciona un método para analizar moléculas de analito sometidas a marcaje de masa, que comprende las etapas de:
1. Escindir el marcador de masa su molécula de analito asociada.
2. Ionizar el marcador de masa escindido.
3. Seleccionar los iones de una proporción de masa a carga predeterminada correspondiente a la proporción de masa a carga de los iones preferidos de marcadores de masa conocidos en un analizador de masas.
4. Inducir la disociación de estos iones seleccionados mediante colisión.
5. Detectar más de uno de los productos de colisión para identificar patrones de iones de los productos de colisión que sean indicativos de los marcadores de masa seleccionados que a su vez identifican el ácido nucleico marcado.
En aspectos preferidos de esta realización de esta invención, el procedimiento de escindir el marcador de masa de su ácido nucleico asociado tiene lugar dentro de un espectrómetro de masas, preferiblemente dentro de la fuente de iones.
En ciertos aspectos preferidos de esta realización, los marcadores de masa son pre-ionizados y sólo se necesita transferirlos de una fase líquida o sólida a la fase gaseosa (si los marcadores de masa están en una fase líquida o sólida).
En otros aspectos preferidos, la etapa de ionización del marcador de masa resulta de la escisión del marcador de masa dentro de la fuente de iones del espectrómetro de masas.
En ciertos aspectos, la tercera etapa de selección de los iones de una proporción de masa a carga predeterminada se realiza en el primer analizador de masas de un aparato en serie. Los iones seleccionados son canalizados después a una celda de colisión separada donde se hacen colisionar con un gas o una superficie sólida según la cuarta etapa anterior. Los productos de la colisión son canalizados después a un analizador de masas adicional de un aparato en serie para detectar los productos de colisión según la quinta etapa anterior. Los aparatos en serie típicos incluyen un espectrómetro de masas de cuadrupolo triple, aparatos de sector en tándem y espectrómetros de masas de tiempo de vuelo cuadrupolares.
En otros aspectos preferidos, la tercera etapa para seleccionar los iones con una proporción de masa a carga predeterminada, la cuarta etapa de colisionar los iones seleccionados con un gas y le quinta etapa para detectar los productos de colisión son realizadas en la misma zona del espectrómetro de masas.
Esto se puede efectuar en analizadores de masa de tipo trampa de iones y espectrómetros de masas de Resonancia de Ión Ciclotrón por Transformada de Fourier, por ejemplo.
Espectrometría de masas en tándem
A expensas de alguna pérdida de sensibilidad, se pueden conseguir grandes aumentos de selectividad a través del uso de espectrometría de masas en tándem (MS/MS) para detectar los marcadores de masa de la presente invención. Con el fin de ilustrar la invención se proporciona algún estudio concerniente a la espectrometría de masas en tándem, ejemplificada en la presente memoria con referencia al espectrómetro de masas de cuadrupolo triple. El triple quad permite la fácil ilustración del principio del MS/MS.
El analizador de masas cuadrupolar es esencialmente un filtro de masas que puede ser en cualquier momento un conjunto para permitir que pasen iones de sólo una proporción de masa a carga concreta. Un cuadrupolo comprende 4 electrodos paralelos con forma de varilla que forman un canal. Se aplica un potencial de corriente directo superpuesto mediante un potencial de frecuencia de radio sinusoidal a los electrodos de varillas. Los iones entran en el canal formado por las varillas paralelas siguiendo trayectorias complejas y para un potencial de CC y un potencial de frecuencia de radio concretos sólo los iones con una proporción de carga a masa predeterminada tendrán una trayectoria estable que los conducirá a través del canal. Cambiando los potenciales se puede hacer que el cuadrupolo barra a través de un intervalo de masa completo para proporciones de carga de hasta aproximadamente 4000.
En la Figura 1 se muestra una disposición en triple quad (Q). Tres analizadores de masa cuadrupolares están conectados en serie. El primer cuadrupolo es referido más adelante como Q1, de un modo similar el segundo será referido como Q2 y el tercero como Q3. Los cuadrupolos Q1 y Q3 se utilizan en los modos de barrido. La velocidad de barrido es muy alta. Alternativamente, Q1 o Q3 se pueden utilizar como "puertas", que permiten atravesar sólo iones seleccionados. El cuadrupolo Q2 se utiliza en un modo de no barrido, donde actúa como dispositivo de enfoque iónico. Todos los iones pasan a través de Q2 cuando hay alto vacío. Cuando se introduce un gas en Q2, los iones entrantes colisionan con el gas y muchos de los iones ganan suficiente energía para fragmentarse. Esta es la "Disociación Inducida por Colisión" (CID).
Considérese un uso concreto del triple quad. Supóngase que los iones son producidos en la fuente de iones (A^{+} B^{+}, C^{+}, D^{+}, etc.). Si todos estos iones se dejan pasar a través de Q1, funcionando Q2 y Q3 en un modo de barrido, se genera un espectro de masas completo (Figura 11 - Espectro de Masas 1). El Espectro de Masas 1 muestra un espectro que comprende los iones moleculares A^{+} a D^{+} e iones fragmento variados.
Supóngase ahora que Q1 se ajusta para que pasen sólo iones A^{+} y Q2 está a baja presión. Los iones A^{+} pasan a través de Q2 y Q3 y son detectados (Figura 12 - Espectro de Masas 2). El nuevo espectro de masas está ahora "limpio", de los otros iones (B^{+} C^{+}, etc.) que han sido rechazados por Q1. Se pueden detectar múltiples analitos de la misma muestra introducida en el espectrómetro de masas ajustando Q1 a barrido sobre una serie limitada de masa correspondiente a la especie de ión concreta de los analitos de interés. Esto se denomina "Monitorización Selectiva de Iones".
Se puede utilizar un cuadrupolo triple para ganar sensibilidad adicional, sin embargo. Es posible que los iones A^{+} puedan provenir de diversas fuentes (p. ej. algunos iones podrían tener la misma proporción de masa a carga de 100 pero tienen diferentes composiciones tales como C_{7}H_{16}, C_{6}H_{12}O, C_{5}H_{8}O etc.). Supóngase que existen dos composiciones de iones A^{+} (A1^{+}, A_{2}^{+}) ambas de la misma masa nominal (Figuras 13 y 14 - Espectros de Masas 3 y 4). Si los iones A^{+} se seleccionan en Q1 y se lleva a cabo la CID en Q2, un barrido de Q3 producirá el espectro mostrado en la Figura 15 - Espectro de Masas 5. Este es un espectro "mixto".
Supóngase que los iones P^{+}, Q^{+} (o incluso sólo P^{+}) pueden revelar inequívocamente que está presente A_{1}^{+}. Es decir, se sabe que se producir la fragmentación (reacción) A_{1}^{+} \rightarrow P^{+} + Q^{+}. En lugar de barrer todos los iones en Q3, se ajusta para detectar únicamente iones P^{+}. En ese caso, después de dejar la fuente de iones, los iones A^{+} B^{+} ......... son reducidos sólo a iones A^{+} (= A_{1}^{+}, A_{2}^{+}) que van a Q2.
Después de la CID, sólo se seleccionan iones fragmento P^{+} y estos son característicos únicamente de A_{1}^{+}. Se dice que esto es "Monitorización de la Reacción Sencilla o Selectiva", que es altamente selectiva. En un sentido más generalizado, el espectro completo de los iones que entran en Q1 (Figura 11 - Espectro de Masas 1) se reduce en Q3 a P^{+} (Figura 16 - Espectro de Masas 6) y estos iones son conocidos por referirse únicamente a A_{1}^{+}.
En algunos de los estudios que siguen, los ejemplos hacen referencia al uso de los marcadores de masa de esta invención para identificar nucleótidos u oligonucleótidos. Es posible igualmente que los marcadores de esta invención se puedan utilizar con proteínas o péptidos u otros analitos y oligonucleótidos son mencionados con el fin de ilustrar. Con el fin de analizar oligonucleótidos se supone que los marcadores de masa están anclados al oligonucleótido covalentemente vía conector escindible. El conector puede ser escindible mediante una variedad de mecanismos, incluyendo escisión térmica, escisión química, escisión por voltaje de cono o foto-escisión. En el siguiente estudio del comportamiento de los marcadores de masa se supone que los marcadores han sido escindidos de sus ácidos nucleicos asociados durante o antes de la ionización. Los conectores escindibles preferidos y sus métodos de uso son descritos en las solicitudes de patente británicas GB 9815163.2 y GB 9815164.0. El procedimiento de escisión preferido está representado esquemáticamente en la Figura 20.
Según el primer aspecto de esta invención el principio de Monitorización Selectiva de Iones (SIM) acoplado a la Monitorización Selectiva de Reacciones (SRM) se puede aplicar a las técnicas con marcadores de masa produciendo un procedimiento de detección bidimensional. Si A_{1}^{+} era un ión de un marcador de masa y por lo tanto de composición y patrón de fragmentación conocidos no importa cuántos iones se producían en la etapa de ionización, el marcador de masa se podría identificar sin que haya ninguna interferencia de otros iones encerrando los iones A^{+} en el primer cuadrupolo de un quad triple y detectando después los productos de fragmentación de A_{1}^{+}, es decir encerrando sólo los iones P^{+} en el tercer cuadrupolo de un cuadrupolo triple. No importaría que el intervalo M/Z fuera examinado y ya no sería necesario encontrar ventanas "limpias" en el espectro de masas.
Como se ha mencionado antes, un aspecto de esta invención proporciona marcadores de masa que pueden ser representados esquemáticamente por la fórmula M-L-X. Como ejemplo A_{1}^{+} podría ser el ión molecular para el marcador mostrado más abajo:
\vskip1.000000\baselineskip
10
\vskip1.000000\baselineskip
M es en ese caso un grupo bencilo, L es un enlace amida y X es un grupo. El enlace amida que conecta el anillo de bencilo con el anillo de piridilo es concretamente susceptible de escisión mediante colisión. Así, al colisionar, A_{1}^{+} produce el ión fragmento de más abajo:
\vskip1.000000\baselineskip
11
\vskip1.000000\baselineskip
y este podría representar P^{+}. De este modo, la detección de P^{+} significa que A_{1}^{+} está presente y que uno de los marcadores está presente. Los marcador han sido identificados selectivamente a partir de otros iones y esto elimina eficazmente la contaminación del "fondo". Esto significa que los analitos marcados no necesitan se4 purificados exhaustivamente y que los marcadores no necesitan ser escindidos y separados del analito fuera del espectrómetro de masas. Este principio se puede generalizar para proporcionar una clase útil de compuestos para su uso como marcadores de masa, todos los cuales una estructura general M-L-X donde M está conectado a X vía un enlace escindible L, tal como un enlace amida y X es el ión que es detectado mediante SRM. Así X es análogo al producto de escisión mostrado antes y referido como P^{+}.
Según un aspecto de esta invención la estructura del marcador de masa ilustrada ante se puede generalizar para proporcionar un conjunto útil de marcadores de masa todos con la misma masa pero que son todavía resueltos fácilmente mediante SRM. Permitamos que M_{0}, M_{1}...M_{4} y X_{0}, X_{1}...X_{4} sean formas isotópicas de las mitades de M-L-X donde L es un enlace amida que conecta M y X. El ejemplo anterior se puede utilizar de nuevo. Si esta estructura está sustituida con flúor, se pueden generar los componentes mostrados en la Figura 2. Estos componentes marcadores se pueden combinar para formar un marcador de masa MX (ignorando el enlace escindible L por el momento) como sigue:
\vskip1.000000\baselineskip
12
\vskip1.000000\baselineskip
Las cinco sustancias tienen exactamente la misma masa (Figura 3). Así, si se selección un marcador de masa en Q1 de un cuadrupolo triple, sólo se podrían seleccionar los iones de masa = M_{m}X_{n} (m=0-4, n=4-0). Q1 podría ser ajustado para "mirar" iones MX iones. Si se efectúa la CID en Q2, Q3 podría ser ajustado para que pasaran sólo iones X_{0}, X_{1}, X_{2}, X_{3} y X_{4} como se muestra en la Figura 21.
Por consiguiente, todos de la misma masa, habría 5 marcadores de masa seleccionados en Q1 y las reacciones de escisión mostradas más abajo se pueden identificar en Q3. Se detectaba la masa 139 en Q3, ésta debía provenir de M_{3}X_{1} etcétera.
\vskip1.000000\baselineskip
13
\vskip1.000000\baselineskip
El procedimiento de selección de éste método se puede visualizar en forma de un espectro de masas bi-dimensional mostrado en la Figura 17 - espectro de masas 7.
En un enfoque alternativo, se puede sintetizar un conjunto diferente de marcadores de masa. En este modo de análisis SRM se combina con "Monitorización Selectiva de Iones" (SIM). En el modo de análisis SIM, el primer cuadrupolo (Q1) barre selectivamente sobre masas predeterminadas encerrando sólo iones con las masas predetermi-
nadas.
Considerando M_{0}, M_{1}, M_{2}, M_{3}, M_{4} y X_{0} de las Figuras 2 y 3 de nuevo, estos componentes marcadores se pueden combinar para dar 5 marcadores con diferentes masas, M_{0}X_{0}, M_{1}X_{0}, M_{2}X_{0}, M_{3}X_{0} y M_{4}X_{0}. Ahora se supone que Q1 de un cuadrupolo triple es ajustado para seleccionar estas 5 masas, Q3 sólo necesita ser ajustado para detectar 1 masa (X_{0}) como en la Figura 4.
Así, el espectrómetro de masas identifica sólo 1 ión fijado (X_{0}). Puesto que X_{0} debe provenir de M_{0}X_{0}, M_{1}X_{0}, M_{2}X_{0}, M_{3}X_{0}, M_{4}X_{0} sólo y se sabe cuando estos han sido seleccionados en Q esto proporciona un modo alternativo de marcaje de masa. Ahora se pueden identificar cinco analitos diferentes mediante una de cinco "reacciones sencillas" específicas
\vskip1.000000\baselineskip
14
\vskip1.000000\baselineskip
Esto genera un espectro de masas bidimensional diferente mostrado en la Figura 18 - espectro de masas 8.
\newpage
Los dos enfoques anteriores se pueden combinar. Supóngase que M_{0}, M_{1}, M_{2}, M_{3} son elegidos para representar la primera base de un dinucleótido. La segunda base está caracterizada por X_{0}, X_{1}, X_{2}, X_{3} para dar 16 marcadores de masa diferentes como se muestra en la Tabla 3 de más abajo:
\vskip1.000000\baselineskip
TABLA 3
15
Cada uno de los marcadores de masa tendrá una de las 7 masas diferentes que se pueden seleccionar en el primer analizador de masas de un aparato en tándem. Los productos de la colisión identificados en el segundo analizador de masas identificarán el dímero. Así con 8 de los componentes de los marcadores de masa, es posible generar 16 marcadores de masa. El espectro de masas bidimensional de todas las masas para todos estos marcadores se muestra en la Figura 19 - espectro de masas 9. De un modo similar, si se requieren 256 marcadores de masa, dos conjuntos de 16 componentes, es decir M_{0} a M_{15} y X_{0} a X_{15}, podrían generar suficientes marcadores, donde cada marcador tendría una de las 31 masas diferentes.
Según otro aspecto de esta invención, también es posible generar matrices de conjuntos de marcadores de masa utilizando grupos modificadores de la serie de masas. Según este aspecto de la invención un conjunto de marcadores, donde cada marcador en el conjunto tiene la misma masa pero se puede resolver mediante SRM, se puede emplear a un conjunto de marcadores adicional conectando cada miembro del conjunto a un grupo modificador de la serie de masas que desplazará la masa de cada miembro del conjunto en una cantidad predeterminada generando así un segundo conjunto de marcadores cuya masa total es diferente del primer conjunto. En ese caso se podrían encerrar dos conjuntos de iones marcadores de masa distintos mediante SIM en el primer cuadrupolo de un analizador de masas y los productos de colisión podrían ser analizados en el tercer quad monitorizando la misma especie de fragmento para ambos conjuntos de marcadores. Claramente se pueden generar claramente tantos conjuntos diferentes de marcadores como se puedan analizar cómodamente en un espectrómetro de masas utilizando diferentes grupos modificadores de la serie de masas.
Los grupos modificadores de la serie de masas (S) son preferiblemente grupos resistentes a la fragmentación tal que cada S grupo, cuando se conecta a cada miembro de un conjunto de marcadores, genera un nuevo conjunto de marcadores que es claramente resolvible de cada uno de los otros en una matriz de tales marcadores. En este contexto resolvible significa que cada conjunto de marcadores en la matriz está separado preferiblemente de cada otro conjunto por aproximadamente 4 daltons al menos. Esto es para asegurar que los picos isotópicos de un marcador no se solapen en el espectro de masas con los de otro marcador. En realizaciones preferidas de este aspecto de la invención, los grupos S son grupos cíclicos sustituidos o no sustituidos, tales como grupos arilo, grupos cicloalquilo y grupos heterocíclicos, preferiblemente conectados a los miembros de un conjunto de grupos marcadores de masa resolvibles mediante SRM por una conexión éter. Cada conjunto en la matriz puede tener el mismo grupo S, pero teniendo un nivel de sustitución diferente, para asegurarse de que cada conjunto es distinto de todos los otros conjuntos. Un ejemplo de una matriz de tales marcadores se muestra en la Figura 6. En esta matriz, se utilizan átomos de F como sustituyentes (radicales ajustadores), pero se podrían emplear otros sustituyentes tales como los grupos metilo. Debe quedar claro que una matriz de tales marcadores tendrá efectos muy similares sobre la movilidad de cualquier molécula de analito asociada.
Se podrían añadir conjuntos adicionales de marcadores a tal matriz utilizando grupos fenilo sustituidos con metilo y también grupos fenilo sustituidos con grupos metilo y fluoro. Los grupos metilo difieren en la masa de los grupos flúor en exactamente menos de 4 daltons y así se podría generar matriz de marcadores significativa cuyo efecto sobre la movilidad de los analitos asociados sería mínima.
En otras realizaciones preferidas de este aspecto de esta invención, los S grupos son oligómeros o polímeros de grupos cíclicos tales como grupos arilo, grupos cicloalquilo y grupos heterocíclicos, que también pueden estar sustituidos. Específicamente, los grupos S preferidos son poliéteres arílico. Un ejemplo de tal matriz se muestra en la Figura 7.
Según un aspecto adicional de esta invención se pueden adoptar adicionalmente los principios descritos antes, marcando analitos con una combinación distinta de los marcadores de masa de la presente invención. Como se ha mencionado antes, esta realización se denomina marcaje en modo de mezclado. Cuando cualquier analito individual de un gran número debe ser identificado, por ejemplo en química combinatoria, se elige una mezcla de marcadores, p. ej. M_{0}X_{3}, M_{1}X_{2}, M_{2}X_{1}, M_{3}X_{0}. La mezcla está anclada a un analito, de manera que está presente una cantidad concreta de cada marcador. Por ejemplo, aM_{0}X_{3} + bM_{1}X_{2} + cM_{2}X_{1} + dM_{3}X_{0} donde a=b=c=d=1 (Figura 5). Si se acoplan partes iguales de cuatro marcadores de masa (a = b = c = d = 0.25) a un analito en la misma reacción, la reacción de acoplamiento químico no discriminaría entre ellos. Cuando un oligonucleótido está marcado, el oligo ha sido sometido a marcaje de masa con más de un marcador por nucleótido u oligonucleótido.
Considérense tres marcadores de masa de la forma mostrada más abajo en la Tabla 4:
\vskip1.000000\baselineskip
TABLA 4
16
donde "*" puede representar los isótopos H^{2} o C^{13} en la posición marcada. Debe quedar claro que se pueden utilizar diferentes sustituyentes tales como grupos flúor o metilo por ejemplo. Un modo de mezclado es el que se muestra en la Figura 8. Se pueden generar ocho patrones distintos mediante una combinación de la presencia o ausencia de marcadores distintos en una mezcla acoplada a una molécula de analito.
Considérense una variedad diferente de patrones donde se varían las proporciones de cada uno de los cinco marcadores cuando son acoplados a su analito asociado como se muestra en la Tabla 5 de más abajo:
TABLA 5
17
Con 4 marcadores de masa, P, Q, R y S, que pueden estar presentes a 3 proporciones diferentes, es decir ninguno, 1 o 2, existen efectivamente 3 entidades diferentes para cada marcador lo que significa que existen 81 posibles patrones de espectros de masas diferentes que se pueden generar. Es preferible que haya también uno de estos marcadores cuya proporción respecto de los otros componentes permanezca constante (T), para actuar como marcador interno frente al que el sistema de datos del espectrómetro de masas pueda comparar las proporciones relativas de P, Q, R y S. Esto significa que con una mezcla de 5 marcadores se podrían identificar las 64 combinaciones de nucleótidos naturales en un oligonucleótido 3-mérico.
En el ejemplo anterior P, Q, R, S y T pueden ser marcadores de la forma mostrada en la Figura 3, así los cinco marcadores tienen la misma masa y se pueden apartar de los contaminantes del fondo en el primer cuadrupolo de un cuadrupolo triple o de un aparato Q-TOF, por ejemplo. Los patrones de fragmentación formados como resultado de la colisión con un baño de gas en el segundo cuadrupolo de un cuadrupolo triple y la detección en el tercer cuadrupolo se muestran en la Figura 9.
Se puede observar que el principio se puede ampliar. En algunos aspectos de la presente invención es deseable marcar los 256 4-meros posibles, utilizando la estrategia anterior. Es necesario generar 7 diferente marcadores que se puedan mezclar en todas las posibles combinaciones de proporciones mostradas antes. Alternativamente, si los marcadores son de la forma mostrada en la Figura 6 o 7, se pueden generar 4 conjuntos de las 81 codificaciones del surtido mostrado en el ejemplo anterior utilizando los 4 diferentes grupos modificadores de la serie de masas para generar diferentes conjuntos de 5 marcadores como se muestra en la Figura 6. Esto genera suficientes marcadores para codificar los 256 4-meros posibles.
El principio de este aspecto de la invención se puede ampliar todavía más. Considérese una genoteca de 4-meros de ADN que comprenden las 256 combinaciones posibles de los nucleótidos naturales. Cada 4-mero en la serie puede estar representado como un número del 1 al 256, es decir AAAA podría ser 1, y AAAC podría ser 2 a TTTT que podría ser 256.
Los números 1 a 256 se pueden representar en forma binaria por ejemplo de manera que los números puedan ser representados en un registro de memoria de un ordenador. En un registro existen una serie de conmutadores que representan los números 2^{8}, 2^{7}, 2^{6}, 2^{5}, 2^{4}, 2^{3}, 2^{2}, 2^{1} y 2^{0}. Para representar cualquiera de los números del 1 al 256, los conmutadores son abiertos o cerrados de manera que la suma de las potencias binarias represente el número decimal original, como se muestra en Tabla 6 de más abajo:
TABLA 6
18
Se puede lograr una representación análoga de estos números con moléculas marcadoras de masa en las que cada conmutador del registro está representado por la presencia o ausencia de una molécula concreta. Así para identificar un 4-mero se podría marcar el 4-mero con la mezcla de marcadores que representa el número que identifica que el 4-mero, p. ej. si AACG está representado por el número 7, se puede identificar marcando el 4-mero con una mezcla de una molécula que representa 2^{2} con moléculas que representan 2^{1} y 2^{0}.
En términos prácticos, estas moléculas pueden estar representadas como una serie de moléculas basadas en una molécula núcleo sustituida con diferentes números de sustituyentes o isótopos concretos, p. ej. diferentes números de un radical ajustador de masas, tales como átomos de flúor o diferentes isótopos de deuterio. Así 2^{0} puede estar representado por la molécula núcleo sin sustituyentes flúor, 2^{1} puede estar representado por la molécula núcleo con 1 sustituyente flúor y de un modo similar 2^{8} puede estar representado por la molécula núcleo con 8 sustituyentes flúor. Cuando estas moléculas son analizadas mediante espectrometría de masas, se pueden combinar con un componente complementario para dar 9 marcas isobáricas que se pueden analizar en un aparato en tándem.
Así, en el caso del 4-mero AACG, este oligo se puede marcar con los marcadores 0, 1 y 2 de los marcadores mostrados antes. Claramente todos los otros 4-meros posibles se pueden representar de esta manera binaria y requieren sólo 8 marcadores básicos para identificarlos tales como los mostrados en la Figura 10.
Secuenciación de ADN utilizando SRM
El análisis de las Escaleras Secuenciadoras de Sanger se puede efectuar eficazmente utilizando marcadores de masa de la forma estudiada antes. La secuenciación de ADN convencional según la metodología de Sanger utiliza una ADN polimerasa para añadir numerosos didesoxi/desoxinucleótidos a un cebador oligonucleotídico, hibridado a un molde de ADN de hebra sencilla, de manera específica para el molde. La terminación al azar de este procedimiento se logra cuando son incorporados los nucleótidos terminadores, es decir los didesoxinucleótidos, son incorporados al complemento del molde. Una "escalera de ADN" es producida cuando las hebras terminadas al azar son separadas en un gel de poliacrilamida desnaturalizante o en un capilar. La información de la secuencia es reunida, generalmente utilizando electroforesis en gel de poliacrilamida para separar los fragmentos por longitud, seguido de la detección de la "escalera de ADN". En secuenciadores de ADN semi-automáticos y automáticos convencionales, tales como ABI 377 de Perkin Elmer o MegaBACE de Molecular Dynamics, se utilizan los marcadores fluorescentes F_{1}, F_{2}, F_{3}, F_{4} para identificar las cuatro bases terminadoras A, C, G, T o bien incorporando el marcador fluorescente en uno de los nucleótidos terminadores o en el cebador utilizado en la reacción. Esta escalera se lee después mirando los cuatro colorantes que pasan un detector que barre el gel o un capilar. Son posibles otros formatos para la detección de la fluorescencia.
Secuenciación de un solo molde
En el método de los espectros de masas, los marcadores fluorescentes son cambiados por marcadores de masa (p. ej. M_{0}X_{4}; M_{1}X_{3}; M_{2}X_{2}; M_{3}X_{1}; M_{4}X_{0} mostrados en la Figura 3). El terminador didesoxi para la Adenina es marcado ahora con M_{1}X_{3}. De un modo similar el terminador didesoxi para la Citosina es marcado ahora con M_{2}X_{2}, el terminador para la Guanosina es marcado con M_{3}X_{1} y el terminador para la Timidina es marcado con M_{4}X_{0}. A medida que las bandas eluyen del capilar, son pulverizadas, en línea, a la fuente de iones de un analizador de masas en tándem adecuado tal como un cuadrupolo triple donde los ácidos nucleicos con la masa marcada son analizados según un aspecto de esta invención. Típicamente, en la fuente de iones los marcadores son escindidos de la base terminadora de cada fragmento en la escalera e introducidos en el primer analizador de masas, Q1 de un cuadrupolo triple. Q1 es ajustado para encerrar sólo iones moleculares de MX, mientras que Q3 es ajustado para mirar los marcadores X_{0} a X_{4}. Puede ser deseable que una de las masas, digamos X_{4}, se utilice como patrón interno, a saber; siempre está presente y X_{0}, X_{1}, X_{2}, y X_{3} son examinados con relación a X_{4}.
En un enfoque alternativo, los cuatro nucleótidos terminadores pueden ser marcados con los cuatro marcadores mostrados en la Figura 4 de manera que el terminador didesoxi para la Adenina está ahora marcado con M_{1}X_{0}. De un modo similar el terminador didesoxi para la Citosina está ahora marcado con M_{2}X_{0}, el terminador para la Guanosina está marcado con M_{3}X_{0} y el terminador para la Timidina está marcado con M_{4}X_{0}. Los marcador M_{0}X_{0} se pueden utilizar como patrón interno si se desea. En esta realización, Q1 de un cuadrupolo triple es ajustado para encerrar iones moleculares de los marcadores M_{4}X_{0} a M_{0}X_{0}, mientras que Q3 es ajustado para mirar los marcadores X_{0}.
Además de la secuenciación marcada con terminadores de nucleótidos, se puede realizar la secuenciación marcada con cebadores. Los detalles de la secuenciación marcada con cebadores, que pueden emplear los marcadores de masa de la presente invención son proporcionados en WO99/02728.
Secuenciación Multiplexada de moldes con marcadores de masa
Los marcadores de masa de esta invención permiten analizar más de un molde simultáneamente, puesto que se pueden desarrollar muchos más de cuatro marcadores. Esto significa que se pueden generar conjuntos múltiples de cuatro marcadores para permitir el análisis de moldes múltiples según la metodología descrita antes que está basada los métodos inventados originalmente por Sanger. Los detalles concernientes con la secuenciación multiplexada de moldes de ácido nucleico que puede emplear los marcadores de masa de la presente invención son proporcionados en WO99/02728.
Los marcadores de masa de la forma mostrada en la Figura 6 o la Figura 7 se pueden utilizar para multiplexar el análisis de múltiples secuencias de ADN. Cada conjunto de cinco marcadores, resolvible en el espectrómetro de masas de cada otro conjunto mediante un modificador de la serie de masas distinto, se puede utilizar para identificar un solo molde, quedando sobrante un marcador para su uso como patrón de tamaño/cantidad si se desea. No obstante, son suficientes conjuntos de 4 marcadores para secuenciar, y los patrones de tamaño no son esenciales. De ese modo es posible, por ejemplo, utilizar la matriz de 20 marcadores mostrada en la Figura 6 para analizar los productos de reacción de Sanger de 5 moldes simultáneamente.
Perfilado de la Expresión Génica
Se han desarrollado diferentes métodos para analizar poblaciones de ADN complementario derivado de ARN mensajero poliadenilado. Varios de estos métodos están basados en la detección de diferentes productos de amplificación o restricción clasificados por tamaño mediante separaciones electroforéticas de genotecas de ADNc. En general estas técnicas están basadas en la generación de fragmentos de restricción o productos de amplificación característicos a partir de los miembros de una genoteca de ADN (ADNc) complementario derivada de ARN mensajero
poliadenilado.
La Presentación Diferencial (Laing y Pardee, Science 257, 967-971, 1992) es el método clásico de electroforesis basado en el perfilado de la expresión génica. Se ha realizado el desarrollo de los conceptos de esta técnica dando como resultado sucesores mejorados para esta técnica. Los métodos de perfilado de la expresión basados en el "indexado molecular" utilizando endonucleasas de restricción de tipo IIS o tipo IP tales como Sibson (PCT/GB93/0145) o Kato (EP 0 735 144 A1) son ejemplos de una clase de sucesores. En particular WO 98/48047 describe un método de indexado molecular basado en electroforesis capilar-espectrometría de masas (CEMS).
En éste método los ADNc son sintetizados utilizando cebadores de poli-timidina anclados y biotinilados, lo que asegura que todos los ADNc son terminados con una cola corta de poli-A de longitud fija. En una preparación de ADNc de "cebador anclado", los ARNm que portan poli-A son capturados y cebados utilizando un oligonucleótido de aproximadamente 18 restos desoxitimidina con una de las tres bases restantes del extremo 3' para anclar el cebador al extremo de la región poli-A. La biotinilación de los cebadores permite inmovilizar los ADNc sobre un soporte en fase sólida con avidina añadida. Estos ADNc capturados pueden ser escindidos con una endonucleasa de restricción de tipo II corriente. Esto deja un fragmento de restricción en el extremo 3' sobre el soporte sólido mientras que los otros fragmentos son eliminados al lavar. Se liga un adaptador al extremo cohesivo conocido resultante. El adaptador es diseñado para incluir el sitio de unión para una endonucleasa de restricción de tipo IIs. Estas enzimas se unen a su secuencia diana pero escinden el ADN subyacente a un número definido de bases alejado del sitio de unión. Algunas de estas enzimas producen un corte escalonado; fokl por ejemplo generará un extremo cohesivo de 4 pb ambiguo. Si una población de ADNc es tratada con tal enzima el extremo cohesivo quedará expuesto en el extremo con adaptador de cada ADNc en la población. Se utiliza una familia de moléculas adaptadoras para sondear esas 4 bases expuestas. Con un extremo cohesivo de 4 pb ambiguo existen 256 posibles candidatos. Para identificar las sondas, se etiquetan con marcadores de masa utilizando un conector escindible, de manera que un único marcador de masa identifica cada uno de los 256 posible adaptadores de 4 pb. Esto da como resultado una población de fragmentos con longitudes variables según por donde los corte la endonucleasa de restricción de tipo II y con uno de los 256 posibles adaptadores sometidos a marcaje de masa en el extremo 5' del ADNc.
Los fragmentos de restricción 3' sometidos a marcaje de masa son separados después basándose en su longitud, utilizando electroforesis capilar, seguido de análisis de los marcadores de masa ligados a los extremos de los fragmentos de ADNc. La columna CE alimenta directamente espectrómetro de masas de electropulverización o un espectrómetro de masas equivalente. En la ionización en el espectrómetro de masas los marcadores se escinden de sus fragmentos de restricción asociados. Se determina la cantidad de cada uno de los marcadores de masa presentes en cada banda, correspondiente a una longitud de fragmentos de restricción diferente, que eluye de la columna de electroforesis capilar. Este procedimiento proporciona una firma para cada ADNc que se puede utilizar para explorar una base de datos.
Esta técnica se utiliza preferiblemente 256 marcadores de masa. Utilizando enfoques convencionales para el marcaje de masas se podría dar como resultado una matriz de etiquetas de masa, separadas por aproximadamente 4 daltons, abarcando un intervalo de masas de más de mil daltons. Es improbable que se pudiera generar una matriz de tales marcadores donde todas las etiquetas tendrían el mismo efecto sobre la movilidad de los fragmentos de restricción de ADNc asociados. Esto significaría que se podrían utilizar algoritmos de corrección complejos para justificar las diferencias de movilidad y permitir de determinación exacta de la longitud del fragmento. Los marcadores de masa y los marcadores de masa asociados de esta invención, no obstante, son eminentemente adecuados en el método anterior, para generar matrices de marcadores de masa cuyo efecto sobre la movilidad de las moléculas de analito asociadas es el mismo, permitiendo la determinación directa de la longitud del fragmento con alta sensibilidad y excelentes proporciones de señal frente a ruido.
Una segunda clase de técnica electroforética está basada en el uso de endonucleasas de restricción de tipo II corrientes, que se utilizan para introducir secuencias cebadoras en fragmentos de restricción de ADNc. La amplificación mediante PCR con cebadores marcados conduce a la generación de fragmentos de restricción distintos, que se pueden utilizar para identificar su ARNm asociado. Tales métodos incluyen los descritos en la Patente de los Estados Unidos Núm. 5.712.126 que describe un método para introducir adaptadores en fragmentos de ADNc digeridos con endonucleasa de restricción lo que permite la amplificación selectiva y el marcaje de los fragmentos de ADNc 3' terminales. De un modo similar, en WO 99/02727, se describe un método para amplificar fragmentos de restricción 3' terminales utilizando soportes en fase sólida y cebadores de PCR que sondean la secuencia desconocida adyacente a un sitio de restricción conocido. En esta tecnología los ADNc se preparan utilizando cebadores ancla biotinilados que aseguran que todos los ADNc estén terminados con una cola corta de poli-A de longitud fija y puedan ser inmovilizados sobre un sustrato en fase sólida. El cebador poli-T puede incluir adicionalmente una secuencia cebadora en su extremo 5'. Los ADNc capturados son escindidos después con una endonucleasa de restricción de tipo II corriente. Se liga un adaptador al extremo cohesivo conocido resultante. El adaptador es diseñado para incluir una secuencia cebadora. Después se desnaturaliza el constructo de doble hebra resultante. La hebra que no está inmovilizada se puede eliminar mediante lavado si se desea. Una familia de cebadores complementarios al cebador adaptador con un solapamiento de 4 bases en la secuencia desconocida adyacente al cebador adaptador se añade a la mezcla desnaturalizada. Con un solapamiento de 4 bases existen 256 cebadores posibles. Para identificar las sondas, se etiquetan con marcadores de masa utilizando un conector escindible, de manera que se identifique cada uno de los 256 posible solapamientos de 4 pb mediante un marcador que es únicamente identificable en un espectrómetro de masas. Esto da como resultado una población de fragmentos con longitudes variables según donde los corte la endonucleasa de restricción de tipo II corriente y con uno de los 256 cebadores posibles sometidos a marcaje de masa en el extremo 5' del ADNc. El ciclo de desnaturalización y prolongación del cebador se puede realizar tantas veces como se desee. Si sólo se utilizan los sitios del cebador adaptador, se puede realizar una amplificación lineal. Esto ocasiona una distorsión más pequeña de la cuantificación del ADNc que la amplificación exponencial. Si se desea la amplificación exponencial los oligos poli-T utilizados para atrapar los ARNm deben incluir también un sitio cebador. La amplificación exponencial puede ser deseable si se deben analizar muestras de tejido pequeñas a pesar del potencial para las distorsiones de las frecuencias de ADNc.
Nuevamente, los fragmentos de restricción 3' sometidos a marcaje de masa son separados basándose en la longitud, utilizando electroforesis capilar, de los fragmentos de restricción seguido de análisis de los marcadores de masa de los extremos de los fragmentos de ADNc. Esta técnica, al igual que la descrita en WO 98/48047 se pone en práctica preferiblemente con 256 marcadores de masa y podría así beneficiarse del mismo modo de las características ventajosas de los marcadores de masa de esta invención.
De ese modo, en un aspecto adicional de esta invención, se proporciona un método de análisis que comprende las etapas de:
1. Proporcionar una población de fragmentos de ácido nucleico de diferentes longitudes sometidos a marcaje de masa, donde los marcadores de masa son indicativos de una característica de los ácido nucleicos marcados.
2. Separar los fragmentos marcados basándose en su tamaño
3. Separar los marcadores de masa de los fragmentos marcados
4. Detectar los marcadores de masa en un espectrómetro de masas.
En ciertas realizaciones de este aspecto de la invención, el análisis determina la secuencia del ácido nucleico o una serie de ácidos nucleicos. En realizaciones de secuenciación basadas en la generación de escaleras de Sanger el marcador de masa identifica el nucleótido terminador de cada fragmento y cada fragmento es identificado por un conjunto de cuatro marcadores. En las realizaciones de secuenciación de Sanger los marcadores son introducidos como cebadores sometidos a marcaje de masa o nucleótidos terminadores marcados.
En otras realizaciones de este aspecto de la invención, el análisis se utiliza para determinar la identidad y la cantidad moléculas de ARN expresadas. En realizaciones preferidas, los ácidos nucleicos sometidos a marcaje de masas son generados según los métodos descritos en WO 98/48047 o WO 99/02727. En realizaciones que utilizan estos métodos los marcadores de masa son introducidos en los fragmentos de ácido nucleico mediante ligación de los adaptadores sometidos a marcaje de masas o mediante prolongación de los cebadores sometidos a marcaje de masas, respectivamente. Para un experto normal en la técnica, debe quedar claro que se pueden adaptar otros métodos de perfilado de la expresión génica basados en el tamaño de los fragmentos de ácido nucleico, tales como los descritos en PCT/GB93/0145, EP-A-0 735 144 o US 5.712.126, para su uso con los marcadores de esta invención.
En realizaciones preferidas de esta invención la etapa de separar los analitos basándose en el tamaño se lleva a cabo utilizando electroforesis capilar o cromatografía líquida de alta resolución, utilizando, por ejemplo, sistemas tales como los proporcionados por Transgenomic, Inc. (San Jose, California, USA.) y descritos en US 5.585.236, US 5.772.889 y otras solicitudes. Preferiblemente la separación se realiza en línea con un espectrómetro de masas.
En realizaciones preferidas, la etapa de separación de los marcadores de masa de sus analitos asociados tiene lugar dentro de la fuente de iones del espectrómetro de masas. Los conectores que permiten que un marcador de masa sea fácilmente escindido de su analito asociado en una fuente de iones de un espectrómetro de masas son descritos en PCT/GB98/00127. Los compuestos que mejoran la sensibilidad de detección de un marcador de masa mediante espectrometría de masas se describen en PCT/GB98/00127.
Para un experto normal en la técnica, debe quedar claro que se podrían adaptar otros análisis de clasificación por tamaños para su uso con los marcadores de masa de esta invención, incluyendo, por ejemplo, el análisis de genotipaje miltiplexado descrito por Grossman P.D. et al. en Nucleic Acids Research 1994 Oct 25;22(21):4527-34. Este análisis se beneficiaría enormemente de la capacidad para multiplexar hasta órdenes superiores y todavía resolver el tamaño de los fragmentos fácilmente.
Perfilado de la Expresión de Proteínas y Electroforesis en Gel Bidimensional
Las técnicas para perfilar proteínas, es decir catalogar las identidades y cantidades de todas las proteína expresadas en un tejido, no están bien desarrolladas en términos de automatización o de rendimiento. El método clásico de perfilado de una población de proteínas es la electroforesis bidimensional (R.A. Van Bogelen., E.R. Olson, "Application of two-dimensional protein gels in biotechnology", Biotechnol. Ann. Rev., 1:69-103, 1995). En éste método una muestra de proteína extraída de una muestra biológica es separada sobre una tira de gel estrecha. Esta primera separación separa usualmente proteínas basándose en su punto iso-eléctrico. La tira de gel entera se coloca después al lado de un borde de un gel rectangular, tal como un gel de poliacrilamida. Las proteínas separadas en la tira son separadas después electroforéticamente en el segundo gel basándose en su tamaño, p. ej. mediante Electroforesis en gel de Poliacrilamida-Dodecilsulfato de sodio (SDS PAGE). Esta metodología es lenta y muy difícil de automatizar. También es relativamente insensible en sus representaciones más sencillas. Una vez que se completa la separación se deben visualizar las proteínas. Esto implica típicamente la tinción del gel con un reactivo que puede ser detectado visualmente o mediante fluorescencia. También se utilizan el radiomarcaje y la autorradiografía. En otros métodos se pueden unir covalentemente colorantes fluorescentes a proteínas en una muestra antes de la separación. La adición covalente de un colorante puede alterar la movilidad de una proteína y por eso esto es a veces menos preferido, concretamente si se van a hacer comparaciones con imágenes de geles bidimensionales de bases de datos públicas. Habiendo visualizado las proteínas en un gel es necesario usualmente identificar las proteínas en manchas concretas sobre el gel. Esto se realiza típicamente retirando mediante corte las manchas del gel y extrayendo las proteínas de la matriz de gel matriz. Las proteínas extraídas se pueden identificar después mediante una variedad de técnicas. Las técnicas preferidas implican la digestión de la proteína, seguido de microsecuenciación. Se han realizado numerosas mejoras para aumentar la resolución de proteínas mediante electroforesis en gel 2-D y para mejorar la sensibilidad del sistema. Un método para mejorar la sensibilidad de la electroforesis en gel 2-D y su resolución es analizar la proteína en aplicaciones específicas sobre el gel mediante espectrometría de masas (Jungblut P., Thiede B. "Protein identification from 2-D gels mediante MALDI mass spectrometry", Mass Spectrom. Rev. 16, 145-162, 1997). Uno de tales métodos es la digestión tríptica en gel seguido de análisis de los fragmentos trípticos mediante espectrometría de masas para generar una huella dactilar de la masa del péptido. Si se requiere la información de la secuencia, se puede realizar el análisis mediante espectrometría de masas en tándem.
En la actualidad el análisis 2-D es un procedimiento "por lotes" relativamente lento. Tampoco es muy reproducible y es costoso analizar un gel. Puesto que la mayor parte de los costes en un análisis basado en gel están en la manipulación de cada gel sería deseable ser capaces de multiplexar un número de muestras en un gel 2-D simultáneamente. Si fuera posible marcar las proteínas en diferentes muestras con una etiqueta diferente, detectable independientemente, las proteínas de la muestra podrían ser analizadas simultáneamente en el mismo gel. Esto podría ser especialmente valioso para estudios en los que es deseable seguir el comportamiento de las mismas proteínas en un organismo concreto en múltiples momentos, por ejemplo al vigilar como responde una bacteria a un fármaco a lo largo de un período de tiempo determinado. De un modo similar podría ser deseable comparar el material de biopsia de múltiples pacientes con la misma enfermedad con los controles correspondientes para asegurarse de que la misma proteína de diferentes muestras podría terminar en la misma mancha en el gel. El desplazamiento de todas las muestras sobre el mismo gel permitiría comparar las diferentes muestras sin preocuparse de la reproducibilidad de la separación del gel. Alcanzar esto requiere una serie de muestras cuyo efecto sobre la movilidad de las proteínas en muestras diferentes será la misma, de manera que una proteína concreta que está marcada con un marcador diferente en cada muestra terminará aún en la misma posición en el gel con independencia de su marcador.
Más recientemente se han realizado intentos que explotan la espectrometría de masas para analizar proteínas completas que han sido fraccionadas mediante cromatografía líquida o electroforesis capilar (Dolnik V. "Capillary zone electrophoresis of proteins", Electrophoresis 18, 2353-2361, 1997). Se han sometido a ensayo los sistemas en línea que explotan la electroforesis capilar-espectrometría de masas. El análisis de proteínas completas mediante espectrometría de masas, no obstante, adolece de un número de dificultades. La primera dificultad es el análisis de los espectros de masas complejos resultantes de los estados de ionización múltiples accesibles por las proteínas individuales. La segunda desventaja principal es que la resolución de masas del espectrómetro de masas es en la actualidad bastante escasa para especies de alto peso molecular, es decir para iones que son mayores de aproximadamente 4 kilodaltons de masa de manera que la resolución de proteínas que tienen una masa contigua es difícil. Una tercera desventaja es que el análisis adicional de proteínas completas mediante espectrometría de masas en tándem es difícil puesto que los patrones de fragmentación para proteínas completas son extremadamente complejos y difíciles de interpretar.
En PCT/GB98/00201 y PCT/GB99/03258, se describen métodos de caracterización de mezclas complejas de proteínas aislando péptidos C-terminales de las proteínas en las mezclas y analizándolas mediante espectrometría de masas. Los métodos descritos se pueden utilizar para determinar si las proteínas están presentes o ausentes en una muestra pero pudieran no proporcionar datos comparativos entre las muestras. Los métodos no describen técnicas para el análisis de muestras múltiples simultáneamente, lo que sería necesario para la comparación cuantitativa de los niveles de expresión de las proteínas en muestras múltiples.
En EP-A-0 594 164 se describe un método para aislar un péptido C-terminal de una proteína en un método para permitir la secuenciación del péptido C-terminal utilizando reactivos de secuenciación N-terminal. En éste método la proteína de interés es digerida con una endopeptidasa que escinde en el lado C-terminal de los restos lisina. Los péptidos resultantes se hacen reaccionar con DITC-poliestireno, que reacciona con todos los grupos amino libres. Los grupos amino N-terminales que han reaccionado con el DITC-poliestireno se pueden escindir con ácido trifluoroacético (TFA) liberando de ese modo el extremo N de todos los péptidos. El grupo épsilon-amino de la lisina no se escinde, no obstante, y todos los péptidos no terminales son retenidos en ese caso sobre el soporte y sólo son liberados los péptidos C-terminales. Según este documento, los péptidos C-terminales son recuperados para la micro-secuenciación.
En Nature Biotechnology 17: 994-999 (1999) se describe el uso de "etiquetas de afinidad codificadas por isótopos" para la captura de péptidos de proteínas para permitir el análisis de expresión de la proteína. En este artículo, los autores describen el uso de un conector de biotina, que es reactivo con tioles para capturar péptidos con cisteína en ellos. Una muestra de proteína de una fuente se hace reaccionar con el conector de biotina y se escinde con una endopeptidasa. Los péptidos que contienen cisteína biotinilada se pueden aislar sobre cuentas de avidina para el posterior análisis mediante espectrometría de masas. Dos muestras se pueden comparar cuantitativamente marcando una muestra con el conector de biotina y marcando la segunda muestra con una forma deuterada del conector de biotina. Cada péptido en las muestras es representado después como un par de picos en el espectro de masas donde las alturas relativas de los picos indican sus niveles relativos de expresión.
El método de esta publicación tiene algunas limitaciones. De las diversas limitaciones a este método de "codificación por isótopos", la primera es la dependencia de la presencia de tioles en una proteína - muchas proteínas no tienen tioles mientras que otras tienen varios. En una variación de éste método, los conectores se pueden diseñar para que reaccionen con otras cadenas laterales tales como aminas, pero puesto que muchas proteínas contienen más de un resto lisina, se aislarán múltiples péptidos por proteína en este enfoque. Es probable que esto no pudiera reducir la complejidad de la muestra suficientemente para el análisis mediante espectrometría de masas. Es probable que una muestra que contiene demasiadas especies adolezca de "supresión de iones" donde ciertas especies se ionizan preferentemente sobre otras especies que podrían aparecer normalmente en el espectro de masas en una muestra menos compleja. En general, la captura de proteínas por sus cadena laterales puede producir o demasiados péptidos por proteína o ciertas proteínas se perderán del todo.
La segunda limitación de este enfoque es en el método utilizado para comparar los niveles de expresión de proteínas de diferentes muestras. El marcaje de cada muestra con una variante isotópica diferente de la etiqueta de afinidad da como resultado un pico adicional en el espectro de masas para cada péptido en cada muestra, lo que significa que si dos muestras son analizadas juntas habrá el doble de picos en el espectro. De un modo similar, si tres muestras son analizadas juntas, el espectro será tres veces más complejo que para una muestra sola. Sería factible intentar la comparación de dos o tres muestras mediante este enfoque pero esto bien sería el límite puesto que el número siempre creciente de picos incrementará la probabilidad de que dos péptidos diferentes tengan picos solapantes en el espectro de masas.
Una limitación adicional referida por los autores de la publicación anterior es el cambio de movilidad ocasionado por las etiquetas. Los autores informan que los péptidos marcados con la etiqueta de biotina deuterada eluyen ligeramente después que el mismo péptido marcado con la etiqueta no deuterada.
En vista de lo anterior, un propósito adicional de la presente invención es proporcionar un método mejorado para determinar la identidad y las cantidades relativas de polipéptidos en varias muestras de mezclas polipeptídicas complejas simultáneamente. Un propósito adicional de este aspecto de la invención es asegurarse de que todas las proteínas están representadas en el análisis. También es un propósito de este aspecto de la invención proporcionar marcadores de masa y técnicas que permitan analizar muestras múltiples simultáneamente y cuantitativamente sin aumentar significativamente la complejidad del espectro de masas cuando se compare con el espectro que se podría obtener de una única muestra sola. El propósito final de este aspecto de la invención es proporcionar marcadores que tengan el mismo efecto sobre la movilidad del péptido marcado, de manera que las muestras del mismo péptido marcado con diferentes etiquetas eluirá simultáneamente después de una separación cromatográfica.
Así, una realización preferida adicional de esta invención proporciona un método para analizar una muestra de proteína que contiene más de una proteína, comprendiendo el método las etapas de:
1. Marcar los péptidos, polipéptidos y/o proteínas en la muestra con al menos un marcador de masa resolvible discretamente de los conjuntos y matrices de esta invención, de manera que cada péptido, polipéptido y/o proteína sea marcado con un marcador o combinación de marcadores única para esta proteína
2. Analizar los péptidos, polipéptidos y/o proteínas marcados mediante espectrometría de masas, preferiblemente según un aspecto de esta invención p. ej. espectrometría de masas en tándem, para detectar los marcadores anclados a las proteínas. Los péptidos marcados en la muestra se pueden identificar después y se pueden determinar sus niveles de expresión relativos.
Se prefiere someter las muestras múltiples al procedimiento anterior. Se prefiere adicionalmente que para cada una de varias muestras, antes de la etapa (1) de marcaje anterior, se aíslen los péptidos de los polipéptidos en la mezcla utilizando un agente de escisión, especialmente un agente de escisión específico de la secuencia. Después de la etapa (1) de marcaje, las muestras se pueden reunir, si se desea. Opcionalmente, después de la etapa (1) de marcaje y/o la reunión de las muestras, los péptidos, polipéptidos y/o proteínas en la muestra o muestras pueden ser separados, mediante electroforesis en gel, isoelectroenfoque, cromatografía líquida u otros medios apropiados, preferiblemente para generar fracciones discretas. Estas fracciones pueden ser bandas o manchas en un gel o fracciones líquidas de una separación cromatográfica. Las fracciones de una separación se pueden separar adicionalmente utilizando una segunda técnica de separación. De un modo similar las fracciones adicionales pueden ser fraccionadas de nuevo hasta que las proteínas estén suficientemente resueltas para las etapas de análisis subsiguientes.
Este aspecto de la invención proporciona en ese caso una aplicación adicional de los marcadores y métodos de esta invención descritos antes. Se puede utilizar un conjunto o matriz de marcadores de la presente invención para incrementar el rendimiento de un análisis mediante electroforesis 2-D en gel de las proteínas en un organismo. Cada uno de los marcadores de masa altera la movilidad de su proteína asociada del mismo modo pero todavía es detectable independientemente. En usos conocidos de la espectrometría de masas para analizar proteínas de un gel 2-D, tales como la huella dactilar de la masa del péptido, se requiere extraer las proteínas del gel y purificarlas para eliminar detergentes tales como SDS y otros contaminantes del gel. Los marcadores de esta invención permiten introducir directamente un extracto de proteínas relativamente no purificado del gel en el espectrómetro de masas y los marcadores asociados se pueden identificar después mediante los métodos de esta invención en un fondo de material contaminante.
En una realización particularmente preferida de este aspecto de la invención las muestras múltiples se someten al siguiente procedimiento:
1. para cada de un número de muestras, aislar los péptidos de los polipéptidos en la mezcla utilizando reactivos de escisión específicos de la secuencia;
2. marcar los péptidos aislados en cada muestra con los marcadores de esta invención de manera que cada muestra sea identificada por un único marcador;
3. reunir las muestras marcadas;
4. separar opcionalmente los péptidos reunidos y marcados cromatográficamente o electroforéticamente;
5. analizar estas muestras marcadas mediante espectrometría de masas en tándem para identificar los péptidos marcados en la muestra y determinar sus niveles de expresión relativos.
Otra realización preferida de este aspecto de la invención proporciona un método para analizar una serie de muestras de proteína conteniendo cada muestra más de una proteína, comprendiendo el método las etapas de:
1. Hacer reaccionar covalentemente las proteínas de cada una de las muestras con al menos un marcador de masa resolvible discretamente de los conjuntos y matrices de esta invención, de manera que las proteínas de cada muestra se marque con uno o más marcadores de masa que son diferentes de los marcadores que han reaccionado con las proteínas de cada una de las otras muestras.
2. Reunir las muestras sometidas a marcaje de masas.
3. Separar las muestras reunidas mediante electroforesis en gel, isoelectroenfoque, cromatografía líquida u otros medios apropiados para generar fracciones discretas. Estas fracciones pueden ser bandas o manchas sobre un gel o fracciones líquidas de una separación cromatográfica. Las fracciones de una separación se pueden separar adicionalmente utilizando una segunda técnica de separación. De un modo similar las fracciones adicionales se pueden fraccionar de nuevo hasta que las proteínas estén suficientemente resueltas para las etapas de análisis subsiguientes.
4. Analizar las fracciones mediante espectrometría de masas, preferiblemente según un aspecto de esta invención, para detectar los marcadores anclados a las proteínas.
Una realización todavía más preferida de este aspecto de la presente invención proporciona un método para identificar una proteína en una muestra que contiene más de una proteína, comprendiendo el método las etapas de:
1. Hacer reaccionar covalentemente las proteínas de la muestra con al menos un marcador de masa resolvible discretamente de los conjuntos y las matrices de esta invención.
2. Separar las proteínas mediante electroforesis en gel, isoelectroenfoque, cromatografía líquida u otros medios apropiados para generar fracciones discretas. Estas fracciones pueden ser bandas o manchas sobre un gel o fracciones líquidas de una separación cromatográfica. Las fracciones de una separación se pueden separar adicionalmente utilizando una segunda técnica de separación. De un modo similar se pueden fraccionar de nuevo las fracciones adicionales hasta que las proteínas son resueltas suficientemente para las etapas de análisis subsiguientes.
3. Digerir las proteínas en la fracción con un reactivo de escisión específico de la secuencia.
4. Hacer reaccionar opcionalmente las proteínas en la muestra con un marcador de masa adicional
5. Analizar las fracciones digeridas mediante cromatografía líquida-espectrometría de masas donde el tiempo de elución de los péptidos sometidos a marcaje de masas de la etapa de la columna de cromatografía líquida se determina detectando los marcadores de masa anclados a los péptidos. Se realiza un análisis mediante espectrometría de masas, preferiblemente según un aspecto de esta invención, para detectar los marcadores anclados a las proteínas.
6. Comparar el perfil de elución de los péptidos marcados del análisis mediante cromatografía líquida espectrometría de masas de la etapa 5 con los perfiles de una base de datos para determinar si la proteína ha sido identificada previamente.
Una realización más preferida adicional de este aspecto de la presente invención proporciona un método para identificar una proteína de una serie de muestras de proteína conteniendo cada muestra más de una proteína, comprendiendo el método las etapas de:
1. Hacer reaccionar covalentemente las proteínas de cada una de las muestras con al menos un marcador de masa resolvible discretamente de los conjuntos y matrices de esta invención, de manera que las proteínas de cada muestra se marcan con uno o más marcadores de masa que son diferente de los marcadores que han reaccionado con las proteínas de cada una de las otras muestras.
2. Reunir las muestras sometidas a marcaje de masas.
3. Separar las proteínas mediante electroforesis en gel, isoelectroenfoque, cromatografía líquida u otros medios apropiados generar fracciones discretas. Estas fracciones pueden ser bandas o manchas sobre un gel o fracciones líquidas de una separación cromatográfica. Las fracciones de una separación se pueden separar adicionalmente utilizando una segunda técnica de separación. De un modo similar se pueden fraccionar de nuevo las fracciones adicionales hasta que las proteínas son resueltas suficientemente para las etapas de análisis subsiguientes.
4. Digerir las proteínas en la fracción con un reactivo de escisión específico de la secuencia para generar péptidos característicos para cada proteína en la muestra.
5. Hacer reaccionar opcionalmente las proteínas en la muestra con un marcador de masa adicional.
6. Analizar las fracciones digeridas mediante cromatografía líquida-espectrometría de masas donde el tiempo de elución de los péptidos sometidos a marcaje de masas de la etapa de la columna de cromatografía líquida se determina detectando los marcadores de masa anclados a los péptidos. Se realiza un análisis mediante espectrometría de masas, preferiblemente según un aspecto de esta invención, para detectar los marcadores anclados a las proteínas.
7. Comparar el perfil de elución de los péptidos marcados del análisis mediante cromatografía líquida espectrometría de masas de la etapa 6 con los perfiles de una base de datos para determinar si la proteína ha sido identificada previamente.
La Etapa 1 de las realizaciones preferidas anteriores de esta invención implica hacer reaccionar covalentemente un marcador de masa de esta invención con las cadenas laterales reactivas de una población de proteínas. Es bien conocido en la técnica que las funcionalidades de las cadenas laterales reactivas se pueden hacer reaccionar selectivamente. Las cadenas laterales reactivas incluyen lisina, serina, treonina, tirosina y cisteína. La cisteína está a menudo entrecruzada con sigo misma para formar puentes disulfuro. Para los fines de esta invención no es esencial que se rompan los puentes pero las cadenas laterales de la cisteína pueden ser altamente reactivas y se pueden hacer reaccionar fácilmente con una variedad de reactivos. Si están presentes puentes disulfuro, estos se pueden romper reduciendo el puente disulfuro a un par de tioles con mercaptoetanol. Los tioles se pueden proteger terminalmente selectivamente mediante yodoacetato (Aldrich) en condiciones suavemente alcalinas lo que promueve la formación de un ión tiolato (Mol. Microbiol. 5: 2293, 1991). Una base suave apropiada es un carbonato. Para los fines de esta invención, un marcador de masa de esta invención cuya funcionalidad reactiva es un grupo yodoacetilo se puede hacer reaccionar con los tioles de una proteína analito. En otras realizaciones la población de proteínas puede ser tratada con un marcador de masa cuya funcionalidad reactiva es un grupo isocianato. Los isocianatos reaccionarán casi exclusivamente con el grupo alfa-amino en el extremo N de las proteínas y con grupos épsilon-amino de lisina cualesquiera, es decir con aminas primarias en condiciones suaves, es decir a temperatura ambiente en un disolvente neutro para producir un derivado urea. También se puede hacer que estos reactivos reaccionen con cualquier cadena lateral que porte hidroxilo, tales como las cadenas laterales de la serina, treonina y tirosina, a temperaturas superiores en presencia de un catalizador apropiado tal como piridina o un compuesto de estaño tal como laurato de dibutilestannilo para producir un derivado de uretano. En una realización alternativa la población de proteínas se puede tratar con un marcador de masa cuya funcionalidad reactiva es un grupo sililo tal como clorosilano. Estos compuestos reaccionan fácilmente con la mayoría de los grupos funcionales reactivos. Los derivados amina no son estables en condiciones acuosas y por tanto pueden ser hidrolizados volviendo a la amina libre si esto se desea. También se pueden utilizar cloruros de sulfonilo como grupo reactivo en un marcador de masa para que reaccione selectivamente con el marcador de masa con aminas libres tale como lisina. También se podrían hacer reaccionar las cadenas laterales de ácidos carboxílicos con los marcadores de esta invención aunque usualmente es necesario activas estas cadenas laterales para asegurarse de reaccionarán. El anhídrido acético se utiliza comúnmente para este fin. Este forma anhídridos mixtos en los ácidos carboxílicos libres que se puedan hacer reaccionar con una funcionalidad nucleofílica tal como la amina.
Se pretende que las realizaciones específicas anteriores sean sólo ejemplos que ilustren los métodos preferidos para hacer reaccionar selectivamente las funcionalidades de las cadenas laterales con marcadores de masa. Una amplia gama de grupos reactivos son conocidos en la técnica y muchos de estos se pueden utilizar para completar las primeras etapas de estos aspectos de esta invención. También puede ser deseable hacer reaccionar más de un tipo de cadena lateral de las proteínas en una muestra con diferente marcadores de masa. Si se van a analizar simultáneamente muestras múltiples se pueden utilizar dos o más marcadores para marcar cada muestra. Esto permite que se deduzca más información de cada proteína para ayudar a su identificación.
En etapa 3 y la etapa 4 de las dos últimas realizaciones de este aspecto de la invención, las proteínas modificadas terminalmente en el C son tratadas después con un agente de escisión específico de la secuencia. En algunas realizaciones se pueden utilizar endoproteinasas específicas de la secuencia tales como la tripsina, la quimotripsina, la trombina u otras enzimas. Los agentes de escisión pueden ser alternativamente reactivos químicos. Estos son preferiblemente volátiles para permitir la eliminación fácil del reactivo que no haya reaccionado. Los reactivos de escisión química apropiados incluyen el bromuro de cianógeno que escinde en los restos metionina y BNPS-scatol que escinde en los restos triptófano (D.L. Crimmins et al., Anal. Biochem. 187: 27-38, 1990).
En las realizaciones preferidas anteriores de este aspecto de la invención, la etapa de fraccionamiento de las proteínas se efectúa preferiblemente llevando a cabo la electroforesis en gel bidimensional, utilizando isoelectroenfoque en la primera dimensión y SDS-PAGE en la segunda dimensión. El gel se visualiza después para identificar dónde han migrado las proteínas sobre el gel. Las manchas se pueden después escindir del gel y las proteínas se extraen después de la mancha escindida del gel. Estas proteínas extraídas se pueden analizar después directamente mediante espectrometría de masas de electropulverización o algún otro procedimiento de ionización adecuado. Alternativamente se puede realizar un fraccionamiento adicional en-línea con el espectrómetro de masas tal como HPLC-espectrometría de masas.
En etapa 3 y la etapa 4 de las dos últimas realizaciones preferidas de este aspecto de la invención, las proteínas diferidas se hacen reaccionar opcionalmente con un marcador de masa adicional de esta invención. Esto tiene una mayor significación para la última realización preferida de esta invención, donde se analizan muestras múltiples simultáneamente. La mayoría de las digestiones enzimáticas y algunos de los métodos de escisión química dejan aminas libres sobre los péptidos resultantes de las proteínas fraccionadas digeridas que pueden reaccionar con un marcador de masa. Esto significa que el mismo marcador aparecerá en todos los péptidos y podrá ser detectado selectivamente para maximizar la sensibilidad de este análisis.
En la etapa 6 y la etapa 7 de las dos últimas realizaciones preferidas de este aspecto de la invención, el perfil de elución de los péptidos generados digiriendo las proteínas fraccionadas se utilizan para buscar una base de datos preformada para determinar si las proteínas han sido identificadas previamente. Los péptidos que eluyen de la columna de cromatografía líquida a un espectrómetro de masas pueden ser analizados adicionalmente mediante espectrometría de masas en tándem para determinar la información de la secuencia que se puede utilizar para identificar las proteínas. Los datos de la secuencia peptídica se pueden utilizar para buscar una base de datos para secuencias de proteínas o se pueden trasladar a los datos de una secuencia de ácido nucleico para buscar bases de datos de secuencias de ácido nucleico.
Aislamiento de péptidos aislados post-traduccionalmente
Los carbohidratos están presentes a menudo como una modificación post-traduccional de las proteínas. Estos carbohidratos tienen con frecuencia grupos carbonilo. Los grupos carbonilo pueden ser etiquetados permitiendo que las proteínas que portan tales modificaciones sean detectadas o aisladas. La hidrazida de biocitina (Pierce & Warriner Ltd, Chester, UK) reaccionará con los grupos carbonilo en varias especies de carbohidratos (E.A. Bayer et al., Anal. Biochem. 170, 271-281, "Biocytin hydrazide - a selective label for sialic acids, galactose, and other sugars in glycoconjugates using avidin biotin technology", 1988). Las proteínas que portan modificaciones con carbohidratos en una mezcla compleja pueden ser biotiniladas en ese caso. La mezcla de proteínas se puede tratar después con una endoproteasa, tal como tripsina, generar péptidos a partir de las proteínas. Los péptidos biotinilados, por tanto modificados con carbohidratos, se pueden aislar después utilizando un soporte sólido con avidina añadida. Se pueden tratar una serie de muestras de este modo y los péptidos obtenidos se pueden hacer reaccionar con los marcadores de masa de esta invención, de manera que los péptidos de cada una de las muestras portan un marcador de masa o combinación de marcadores de masa relacionable con el péptido o péptidos de esa muestra. Preferiblemente los péptidos de cada muestra portan un marcador de masa diferente. Estos péptidos que portan carbohidratos sometidos a etiquetado de masa se pueden analizar después mediante cromatografía líquida-espectrometría de masas en
tándem.
Varios grupos de investigación han informado sobre la producción de anticuerpos, que se unen a los restos fosfotirosina en una amplia variedad de proteínas (véase por ejemplo A.R Frackelton et al., Methods Enzymol. 201, 79-92, "Generation of monoclonal antibodies against phosphotyrosine y their use for affinity purification of phosphotyrosine-containing proteins", 1991 y otros artículos en esta edición de Methods Enzymol.). Esto significa que se puede aislar una proporción significativa de las proteínas que han sido modificadas post-traduccionalmente mediante fosforilación con tirosina mediante cromatografía de afinidad utilizando estos anticuerpos como ligando de la columna de
afinidad.
Estos anticuerpos que se unen a la fosfotirosina se pueden utilizar en el contexto de esta invención para aislar péptidos que contienen restos fosfotirosina. De ese modo las proteínas en una mezcla compleja puede ser tratadas con una endopeptidasa de secuencia específica para generar péptidos libres. Estos se pueden hacer pasar después a través de una columna de anticuerpo anti-fosfotirosina, que retendrá los péptidos que contienen un grupo fosfotirosina. Se pueden tratar de este modo una serie de muestras y los péptidos obtenidos se pueden hacer reaccionar con los marcadores de masa de esta invención, de manera que los péptidos de cada muestra porten un marcador de masa o combinación de marcadores de masa relacionables con el péptido o los péptidos de esa muestra. Preferiblemente los péptidos de cada muestra portan un marcador de masa diferente. Estos péptidos que portan fosfotirosina sometidos a marcaje de masa se pueden analizar después mediante cromatografía líquida-espectrometría de masas en tándem.
Aislamiento de los péptidos terminales de las proteínas
Un método preferido de perfilado de la expresión de las proteínas según la presente invención es aislar sólo un péptido de cada proteína en la muestra. Siempre que el fragmento peptídico aislado sea de la longitud suficiente, el fragmento será específico para su proteína de origen. En la primera etapa de este aspecto de la presente invención, los péptidos son aislados de cada proteína en cada una de varias muestras de una mezcla compleja de proteínas. En algunas realizaciones de este aspecto se prefiere aislar los péptidos terminales. El aislamiento de los péptidos terminales asegura que se aísla al menos uno y sólo un péptido por proteína. Los métodos para el aislamiento de péptidos del extremo de los polipéptidos son discutidos en PCT/GB98/00201 y PCT/GB99/03258.
Así, este aspecto de la presente invención proporciona un método de perfilado de proteínas, cuyo método comprende:
(a) tratar una muestra que comprende una población de una pluralidad de polipéptidos con un agente de escisión que es conocido por reconocer en el polipéptido cadenas o secuencias de un resto aminoácido específico y por escindir en un sitio de escisión, con lo que la población es escindida para generar fragmentos peptídicos;
(b) aislar una población de fragmentos peptídicos que portan como extremo de referencia el extremo N o el extremo C del polipéptido del que fueron fragmentados, portando cada fragmento peptídico en el otro extremo el sitio de escisión próximo al extremo de referencia;
(c) antes de o después de aislar los fragmentos peptídicos, marcar cada extremo de referencia de los polipéptidos con un marcador de masa, o una combinación de marcadores de masa de un conjunto o una matriz de marcadores de masa de la presente invención, donde cada extremo de referencia es relacionable con su marcador o combinación de marcadores; y
(d) determinar mediante espectrometría de masas una secuencia firma de uno o más de los fragmentos aislados, cuya secuencia firma es la secuencia de un número predeterminado de restos aminoácido que se mueven desde el sitio de escisión;
donde una secuencia firma caracteriza cada polipéptido.
Un método alternativo preferido proporcionado por este aspecto de la presente invención hace uso de un segundo agente de escisión para generar fragmentos adicionales, que a su vez pueden ser identificados y utilizados para caracterizar su polipéptido o proteína de origen. Este método comprende:
(a) poner en contacto una muestra que comprende uno o más polipéptidos con un primer agente de escisión para generar fragmentos polipeptídicos;
(b) aislar uno o más fragmentos polipeptídicos, comprendiendo cada fragmento el extremo N o el extremo C del polipéptido del que fue fragmentado;
(c) antes de o después de aislar los fragmentos polipeptídicos, marcar cada extremo de los polipéptidos con un marcador de masa, o una combinación de marcadores de masa de un conjunto o una matriz de marcadores de masa de la presente invención, donde cada extremo es relacionable con su marcador o combinación de marcadores; y
(d) identificar los fragmentos aislados mediante espectrometría de masas;
(e) repetir las etapas (a)-(d) en la muestra utilizando un segundo agente de escisión que escinde en un sitio diferente del primer agente de escisión; y
(f) caracterizar los uno o más polipéptidos en la muestra de los fragmentos identificados en la etapas (d) y (e).
En los dos métodos anteriores, la etapa de marcaje de los extremos de referencia puede tener lugar antes o después de aislar los fragmentos y también puede tener lugar antes de que los fragmentos sean escindidos de sus polipéptidos o proteínas de origen, si se desea.
Con relación al aislamiento de los fragmentos peptídicos, en realizaciones preferidas de este aspecto de la presente invención, los péptidos terminales pueden ser aislados de una mezcla compleja de proteínas utilizando un método, que comprende las etapas de:
1. Digerir la mezcla compleja de proteínas completamente con una enzima de escisión específica en el C de la Lys, es decir un reactivo que corta en el enlace peptídico inmediatamente adyacente a un resto lisina en el lado C-terminal de ese resto.
2. Poner en contacto los péptidos resultantes con un soporte sólido activado que reaccionará con los grupos amino libres.
3. Hacer reaccionar opcionalmente los péptidos capturados con un reactivo bifuncional, que tiene al menos una funcionalidad reactiva amina.
4. Poner en contacto los péptidos capturados con un reactivo que los escinde en los grupos alfa-amino de cada péptido sobre el soporte. Todos los péptidos que no son C-terminales tendrán un resto lisina conectándolos covalentemente al soporte sólido. De ese modo los péptidos C-terminales libre son liberados selectivamente.
5. Opcionalmente poner en contacto los péptidos liberados con un segundo soporte sólido que reaccionará con la segunda funcionalidad reactiva del reactivo bifuncional utilizado en la etapa 3 para capturar cualquier péptidos que no reaccione apropiadamente con el primer soporte.
6. Recuperar los péptidos que permanecen libres en solución.
En realizaciones preferidas de éste método, las proteínas en la mezcla compleja son desnaturalizadas, reducidas y tratadas con un reactivo para proteger terminalmente los tioles en las proteínas. Los protocolos típicos implican desnaturalizar las proteínas en un tampón a pH 8.5 con una alta concentración de hidrocloruro de guanidina (6-8 M), como reactivo de desnaturalización, en presencia de un exceso de mercaptoetanol o ditiotreitol, como agentes reductores, y un exceso de un agente de protección terminal tal como vinilpiridina.
En la etapa 1 de éste método, la mezcla compleja de proteínas es digerida completamente con una enzima de escisión específica en el C de la Lys, que puede ser, por ejemplo, la endopeptidasa Lys-C de Lysobacter enzymogenes (Boehringer Mannheim).
En la etapa 2 de éste método, los péptidos resultantes se ponen en contacto con un soporte sólido que reacciona con aminas. En realizaciones preferidas el soporte de la fase sólida es transformado con un compuesto isotiocianato. En una realización la población de péptidos se hace reaccionar con vidrio de isotiocianato (DITC glass, Sigma-Aldrich Ltd, Dorset, England) en presencia de una base. Esto captura todos los péptidos sobre el soporte a través de cualquier grupo amino libre.
La etapa 3 es opcional pero preferida. Puede ser difícil garantizar que todos los péptidos no C-terminales reaccionarán completamente con el primer soporte sólido tanto en el grupo amino de la cadena lateral de la lisina como con el grupo alfa-amino N-terminal. Los péptidos que reaccionan sólo a través de los grupos amino de la cadena lateral de la lisina permanecerán anclados al soporte en etapas subsiguientes. Los péptidos que reaccionan sólo a través de su grupo alfa-amino serán escindidos del soporte junto con el péptido C-terminal. Esta etapa permite que los péptidos no C-terminales sean distinguidos de los péptidos C-terminales. En esta etapa opcional, el reactivo bifuncional puede ser N-succinimidil[4-vinilsulfonil]benzoato (SVSB de Pierce & Warriner Ltd., Chester, UK). Este compuesto comprende un éster de N-hidroxisuccinimida reactivo con aminas conectado al radical vinilsulfona reactivo con tioles. El compuesto reacciona muy fácilmente con las amines a través de la funcionalidad éster sin reacción de la vinilsulfona y se puede hacer reaccionar separadamente con los tioles en la última fase. Así el SVSB se hace reaccionar con cualquier amina libre sobre el soporte en condiciones ligeramente alcalinas. En presencia de un gran exceso del compuesto de SVSB y dado que los péptidos sobre el soporte están inmovilizados, el SVSB reaccionará con los péptidos sólo a través de la funcionalidad succinimida dejando el radical vinilsulfona libre para reacciones adicionales. En realizaciones alternativas, se puede hacer reaccionar cualquier amina que no haya reaccionado con biotina acoplada a una funcionalidad reactiva amina tal como N-hidroxisuccinimida (NHS) biotina (Sigma-Aldrich Ltd, Dorset, England). Esto permite hacer reaccionar incompletamente péptidos que se van a capturar más tarde sobre cuentas con avidina añadida o sobre una resina con avidina añadida en una columna de captura por afinidad.
En la etapa 4 de éste método los péptidos capturados se ponen en contacto con un reactivo que escinde en los grupos alfa-amino de cada péptido sobre el soporte. En realizaciones donde se utiliza vidrio de DITC como soporte reactivo para la amina, los péptidos son tratados con un ácido volátil apropiado tal como ácido trifluoroacético (TFA) que escinde el aminoácido N-terminal de cada péptido sobre el soporte. Todos los péptidos que no son C-terminales tendrán un resto lisina conectándolos covalentemente al soporte sólido. De ese modo los péptidos C-terminales libres son liberados selectivamente.
La etapa 5 opcional es preferida especialmente si se realiza la etapa 3 opcional. Los péptidos no C-terminales que no reaccionan completamente con el soporte reactivo con amina son eliminados mediante esta etapa. Si se utiliza SVSB para etiquetar péptidos no C-terminales que sólo reaccionan a través de sus grupos alfa-amino estos tendrán una funcionalidad reactiva disponible que les permitirá reaccionar con un soporte sólido transformado con un nucleófilo apropiado, preferiblemente un tiol. Si se utiliza vidrio DITC en la etapa 4, lo que es preferido, los péptidos puede ser liberados del soporte utilizando TFA. Los péptidos liberados pueden ser recuperados en forma de sales trifluoroacetato eliminando mediante evaporación el TFA. Los péptidos se pueden resuspender después en un tampón con un pH de aproximadamente 7 o exactamente en un disolvente neutro apropiado tal como dimetilformamida, dimetilsulfoxido o una mezcla de agua y acetona. Los péptidos son añadidos después al soporte transformado con el tiol. A pH 7 la funcionalidad vinilo restante en los péptidos tratados con SVSB debe reaccionar casi exclusivamente con el soporte de tiol en lugar de con las aminas libres expuestas mediante escisión de los péptidos del soporte de vidrio DITC. Los Tentagels transformados con tiol son adquiribles de Rapp Polymere GmbH (Tübingen, Germany) o se puede preparar un soporte transformado con tiol incubando un gel de sílice con 3-mercaptopropil-trimetoxisilano.
En etapa 6 de éste método se recuperan los péptidos liberados. Si se utilizan las etapas 3 y 5 opcionales los péptidos pueden estar presentes en una variedad de disolventes o tampones. Estos se seleccionarán para que sean volátiles en las realizaciones preferidas. Si los péptidos son recuperados directamente del primer soporte, que es vidrio DITC en las realizaciones preferidas, es probable que los péptidos estén en el TFA, que es volátil. Los péptidos son recuperados preferiblemente de estos disolventes volátiles o tampones evaporando el disolvente o tampón. Los péptidos aislados mediante este método tendrán un grupo alfa-amino libre disponible para reaccionar con los marcadores de esta invención.
Marcaje de Péptidos Aislados
Cualquiera de los marcadores de masa de la presente invención se puede utilizar en las realizaciones de perfilado de la expresión de proteínas descritas en este aspecto de la invención. Los marcadores de masa ilustrados en las Figuras 22 y 23 son concretamente preferidos para su uso con esta invención, especialmente este aspecto de la presente invención. Estos compuestos tienen un grupo reactivo vinilsulfona, que permitirá que estos compuestos experimenten reacciones de adición con aminas y tioles libres. Si sólo se desea un marcador por péptido las proteínas en las mezclas complejas pueden ser tratadas con agentes de protección terminal antes de su escisión con la endopeptidasa específica de la secuencia. Fenil, etil y metilvinilsulfona reaccionarán con aminas y tioles libres protegiéndolos terminalmente mientras aún se permite la escisión mediante tripsina de las proteínas protegidas terminalmente. Los restos épsilon-amino de la lisina reaccionarán con dos radicales vinilsulfona si los radicales vinilsulfona no tienen impedimento estérico, concretamente etil y metil vinilsulfona.
Después del anclaje de los marcadores estos péptidos marcados tendrán una masa que es desplazada por la masa del marcador. La masa del péptido puede ser suficiente para identificar la proteína fuente. En este caso sólo se necesita detectar el marcador lo que se puede lograr mediante monitorización de la reacción seleccionada con un cuadrupolo triple, discutido con más detalle más abajo. Brevemente, el primer cuadrupolo del cuadrupolo triple es ajustado para dejar pasar a su través iones cuya proporción de masa a carga corresponde a del péptido de interés, ajustado para la masa del marcador. Los iones seleccionados son sometidos después a disociación inducida por colisión (CID) en el segundo cuadrupolo. En las condiciones de clasificación utilizadas en el análisis de péptidos los iones se fragmentarán en su mayor parte en los enlaces amida de la molécula. Los marcadores de las Figuras 22 y 23 tienen un enlace amida, que liberan la porción pre-ionizada terminal de la etiqueta durante la escisión. Si bien todas las etiquetas tienen la misma masa, la porción terminal es diferente debido a las diferencias en los sustituyentes a cada lado del enlace amida. De ese modo los marcadores se pueden distinguir entre sí. La presencia del fragmento marcador asociado con un ión de una masa específica debe confirmar que el ión era un péptido y las alturas relativas de los picos de las etiquetas de muestras diferentes proporcionarán información a cerca de las cantidades relativas de los péptidos en sus muestras. Si la masa no es suficiente para identificar un péptido, debido a que un número de péptidos terminales en la muestra tienen la misma masa terminal o debido a que el péptido no es conocido, la información de la secuencia puede ser determinada mediante el análisis del espectro CID completo. La Figura 24 muestra un espectro teórico para dos muestras de un péptido con la secuencia H_{2}N-gly-leu-ala-ser-glu-COOH, donde cada muestra está anclada a uno de los marcadores con las fórmulas mostradas en la Figura 23. El espectro está idealizado, puesto que sólo muestra los fragmentos de la serie-b y no muestra otras fragmentaciones o picos de ruido cualesquiera, no obstante no ilustra que el espectro está claramente dividida en una región de masa más alta correspondiente a los picos de fragmentación del péptido y una región de masa inferior correspondiente a los picos de los marcadores de masa. Si se desea, los picos de fragmentación de los péptidos se pueden utilizar para identificar los péptidos mientras que los picos de las etiquetas de masas proporcionan información a cerca de las cantidades relativas de los péptidos.
Separación de los péptidos marcados mediante cromatografía o electroforesis
Preferiblemente en este aspecto de la invención, en la etapa anterior al análisis espectroscópico de masas los péptidos terminales marcados son sometidos a una separación cromatográfica antes del análisis mediante espectrometría de masas. Esto es preferiblemente Cromatografía Líquida de Alta (HPLC) que se puede acoplar directamente a un espectrómetro de masas para el análisis en línea de los péptidos a medida que eluyen de la columna cromatográfica. Se pueden realizar una variedad de técnicas de separación mediante HPLC pero la cromatografía en fase reversa es un método popular para la separación de péptidos antes de la espectrometría de masas. La electroforesis en zona capilar es otro método de separación que puede ser acoplado directamente a un espectrómetro de masas para el análisis automático de las muestras que eluyen. Estas y otras técnicas de fraccionamiento se pueden aplicar para reducir la complejidad de una mezcla de péptidos antes del análisis mediante espectrometría de masas.
Cuantificación de las Proteínas e Identificación mediante Espectrometría de Masas en Tándem
En el método de este aspecto de la invención, los péptidos aislados marcados son analizados mediante espectrometría de masas en tándem.
Como se ha comentado antes los espectrómetros de masas en tándem permiten seleccionar y fragmentar iones con una proporción de carga a masa predeterminada, p. ej. mediante disociación inducida por colisión (CID). Los fragmentos se pueden detectar después para proporcionar información estructural a cerca del ión seleccionado. Cuando los péptidos son analizados mediante CID en un espectrómetro de masas en tándem, se observan patrones de escisión característicos, que permiten determinar la secuencia del. Los péptidos naturales se fragmentan típicamente al azar en los enlaces amida del esqueleto peptídico para dar series de iones que son característicos del péptido. Las series de fragmentos CID son indicadas usualmente como a_{n}, b_{n}, c_{n}, etc. para la escisión en el enlace peptídico nº, donde la carga del ión es retenida en el fragmento N-terminal del ión. De un modo similar, las series de fragmentos son indicadas como x_{n}, y_{n}, z_{n}, etc. donde la carga es retenida en el fragmento C-terminal del ión. Esta notación se representa en el siguiente Esquema 1:
Esquema 1
19
La tripsina y la trombina son agentes de escisión válidos para la espectrometría de masas en tándem por cuanto producen péptidos con grupos alcalinos en ambos extremos de la molécula, es decir el grupo alfa-amino en el extremo N y cadenas laterales de lisina o arginina en el extremo C. Esto favorece la formación iones doblemente cargados, donde los centros cargados están en extremos opuestos de la molécula. Estos iones doblemente cargados producen series de iones tanto C-terminales como N-terminales después de la CID. Esto ayuda a determinar la secuencia del péptido. En términos generales sólo se observan una o dos de las series de iones posibles en los espectros CID de un péptido dado. En colisiones de baja energía típicas de aparatos basados en cuadrupolos predominan los fragmentos N-terminales de la serie b o los fragmentos C-terminales de la serie y. Si se examinan los iones doblemente cargados a menudo se detectan ambas series. En general, los iones de la serie y predominan sobre los de la serie b.
Si los péptidos aislados utilizados en el método de esta invención son péptidos C-terminales aislados utilizando vidrio DITC como se ha comentado antes, los péptidos tendrán una amina libre tras el aislamiento en sus extremos N facilitando el marcaje con los marcadores de esta invención. Como se ha mencionado antes, estos marcadores pueden tener todos la misma masa de manera que los péptidos equivalentes en cada muestra que es analizada tendrán desplazada la masa en la misma cantidad. La CID de estos péptidos producirá fragmentos de los marcadores. Las intensidades de los fragmentos marcadores permitirán determinar las cantidades relativas de péptidos equivalente en cada muestra. La conexión covalente de los marcadores de masa de esta invención a los extremos N de los péptidos aislados desplazará las masas de los fragmentos iónicos de la serie b mediante la masa del marcador, en tanto que la carga permanece en el marcador. Puesto que la masa del marcador utilizado para cada muestra bajo análisis es la misma, habrá sólo una serie de iones producida para todas las muestras en tanto que la escisión inducida por colisión de los péptidos marcados tiene lugar en el esqueleto peptídico. Esto significa que es posible identificar los péptidos marcados mediante iones fragmento y para cualquier péptido dado sólo habrá una serie de fragmentos para ese péptido, independientemente del número de muestras que esté siendo analizado simultáneamente. La fragmentación en los propios marcadores producirá picos característicos de cada muestra. Estos picos se producirán en un intervalo de masa relativamente bajo (véase la Figura 24). Con un aparato de cuadrupolo triple, es preferible utilizar la monitorización de la reacción seleccionada para lograr la detección más sensible de estos picos. Las intensidades relativas de estos picos serán indicativa de las cantidades relativas de la proteína fuente, de la que derivaba el péptido, en las muestras originales. En los péptidos naturales, los iones fragmento de la serie b tienden a tener menos intensidad que los de la serie y. Con un marcador de masa apropiadamente alcalino o un marcador de masa "pre-ionizado", que comprende por ejemplo un centro de amonio cuaternario, se puede aumentar la intensidad de los fragmentos iónicos de la serie b. Desafortunadamente, si se utilizan péptidos C-terminales no existe la garantía de que el aminoácido C-terminal sea alcalino, de manera que los iones fragmento de la serie y pueden ser débiles. La determinación de la información estructura utilizando la serie y requeriría que el extremo C de estos péptidos porte un grupo alcalino o un grupo "pre-ionizado".
El análisis de proteínas mediante espectrometría de masas en tándem, concretamente las mezclas de proteínas, es complicado por la "ruidosidad" de los espectros obtenidos. Las proteínas aisladas de las muestras biológicas están contaminadas usualmente con reactivos tamponadores, desnaturalizantes y detergentes, todos los cuales introducen picos en el espectro de masas. Como resultado, existen a menudo más picos de contaminación en el espectro que picos de péptidos, e identificar los picos que corresponden a los péptidos puede ser un problema importante, especialmente con pequeñas muestras de proteínas que son difíciles de aislar. Como resultado se han utilizado diferentes métodos para determinar qué picos corresponden a los péptidos antes de realizar el análisis CID detallado. Los aparatos basados en cuadrupolos triples permiten el "barrido del ión precursor" (véase Wilm M. et al., Anal. Chem. 68(3) 527-33, "Parent ion scans of unseparated peptide mixtures" (1996)). El cuadrupolo triple es operado en el modo "monitorización de una sola reacción", donde el primer cuadrupolo barre a lo largo del intervalo de masas completo y cada ión encerrado es sometido a CID en el segundo cuadrupolo. El tercer cuadrupolo es ajustado para detectar sólo un ión fragmento específico, que es usualmente un ión fragmento característico de un péptido tal como los iones amonio. Un método alternativo utilizado con espectrómetros de masas de cuadrupolo/tiempo de vuelo barre para los iones doblemente cargados identificando iones que cuando se someten a CID producen iones hijo con una proporción de masa a cargas más alta que la del ión de origen. Un método adicional para identificar iones doblemente cargados es mirar los conjuntos de picos en el espectro que están sólo 0.5 daltons aparte con proporciones de intensidad apropiadas que podrían indicar que los iones son los mismos difiriendo solamente en la proporción de C^{13} presente en la molécula.
Mediante el marcaje de péptidos con los marcadores de masa de esta invención, se puede considerar una forma novedosa de barrido de iones precursores donde los picos de los péptidos son identificados mediante la presencia de fragmentos correspondientes a los marcadores de masa de esta invención después de someter los péptidos marcados a CID. En particular, los péptidos aislados de cada muestra mediante el método de esta invención pueden ser marcados con más de un marcador de masa. Se puede utilizar una mezcla equimolar de un marcador de "barrido del ión precursor" que se utiliza en todas las muestras y un marcador específico para la muestra para marcar los péptidos en cada muestra. De este modo los cambios en el nivel de péptidos en diferentes muestras no tendrán un efecto adverso sobre la identificación de los picos de los péptidos en un barrido de iones precursores.
Habiendo identificado y seleccionado un ión peptídico, éste es sometido preferiblemente a CID. Los espectros CID son a menudo bastante complejos y determinar qué picos en el CID espectro corresponden a una serie de fragmentos peptídicos significativos es un problema adicional al determinar la secuencia de un péptido mediante espectrometría de masas. Shevchenko et al., Rapid Commun. Mass Spec. 11 1015-1024 (1997) describe un método adicional, que implica el tratamiento de proteínas para análisis con tripsina en agua ^{16}O/^{18}O 1:1. La reacción de hidrólisis da como resultado dos poblaciones de péptidos, la primera cuyo carboxilo terminal contiene ^{16}O y la segunda cuyo carboxilo terminal contiene ^{18}O. Así para cada péptido de la muestra debe haber un pico doble de igual intensidad para cada péptido donde el pico doble está separado 2 daltons. Esto se complica ligeramente complicado por los picos isotópicos de los péptidos intrínsecos pero permite el barrido automático de espectro CID para los dobletes. Las diferencias de masa entre los dobletes se pueden determinar para identificar el aminoácido mediante la diferencia entre los dos fragmentos. Este método puede ser aplicable con los métodos de esta invención si se aíslan los péptidos N-terminales.

Claims (77)

1. Un conjunto de dos o más marcadores de masa, comprendiendo cada marcador en el conjunto un radical marcador de masa anclado a través de un conector escindible a un radical de normalización de masas, donde cada radical de normalización de masas asegura que un marcador de masa tiene una masa agregada deseada, y donde cada radical marcador de masa tiene una masa diferente de la de todos los otros radicales marcadores de masa, y cada marcador en el conjunto tiene una masa agregada común; y donde todos los marcadores de masa en el conjunto son distinguibles entre sí mediante espectrometría de masas.
2. Un conjunto de marcadores de masa según la reivindicación 1, donde cada radical marcador de masa en el conjunto tiene una estructura básica común, y cada radical de normalización de masas en el conjunto tiene una estructura básica común que puede ser igual o diferente de la estructura básica común de los radicales marcadores de masas, y donde cada uno de los marcadores de masa en el conjunto comprende uno o más radicales ajustadores de masas, estando anclados los radicales ajustadores de masas a o situados dentro de la estructura básica del radical marcador de masa y/o la estructura básica del radical de normalización de masas, de manera que cada radical marcador de masa en el conjunto comprende un número diferente de radicales ajustadores de masas y cada uno de los marcadores de masa en el conjunto tiene el mismo número de radicales ajustadores de masas.
3. Un conjunto de marcadores de masa según la reivindicación 2, teniendo cada uno de los marcadores de masa en el conjunto la siguiente estructura:
M(A)_{y}-L-X(A)_{z}
donde M es un radical de normalización de masas, X es un radical marcador de masa, A es un radical ajustador de masas, L es un conector escindible, y y z son enteros de 0 o superiores, y y+z es un entero de 1 o superior.
4. Un conjunto de marcadores de masa según la reivindicación 2 o la reivindicación 3, donde el radical ajustador de masas se selecciona entre:
(a) un sustituyente isotópico situado dentro de la estructura básica del radical marcador de masa y/o dentro de la estructura básica del radical de normalización de masas, y
(b) átomos sustituyentes o grupos anclados a la estructura básica del radical marcador de masa y/o anclados a la estructura básica del radical de normalización de masas.
5. Un conjunto de marcadores de masa según la reivindicación 4, donde el radical ajustador de masas se selecciona de un átomo de halógeno sustituyente, un grupo metilo y sustituyentes isotópicos H^{2} o C^{13}.
6. Un conjunto de marcadores de masa según la reivindicación 5, donde el radical ajustador de masas es un átomo de flúor sustituyente.
7. Un conjunto de marcadores de masa según cualquier reivindicación precedente, donde el conector escindible que ancla el radical marcador de masa al radical de normalización de masas es un conector escindible mediante colisión.
8. Un conjunto de marcadores de masa según la reivindicación 7, donde el conector escindible comprende un enlace amida.
9. Un conjunto de marcadores de masa según cualquier reivindicación precedente, donde el radical marcador de masa y/o el radical de normalización de masas comprende un grupo resistente a la fragmentación.
10. Un conjunto de marcadores de masa según la reivindicación 9, donde el radical de normalización de masas comprende un grupo fenilo.
11. Un conjunto de marcadores de masa según cualquier reivindicación precedente, donde el radical marcador de masa comprende un grupo pre-ionizado.
12. Un conjunto de marcadores de masa según la reivindicación 11, donde el radical marcador de masa comprende un grupo N-metilpiridilo, o un grupo seleccionado entre los siguientes grupos: -NH_{2}, -NR_{2}, -NR_{3}^{+}, -SR_{3}^{+}, -SO_{3}-, -PO_{4}-, -PO_{3}^{-}, -CO_{2}^{-},
20
y
100
donde R es hidrógeno o es un grupo alifático, aromático, cíclico o heterocíclico sustituido o no sustituido.
13. Un conjunto de marcadores de masa según cualquiera de las reivindicaciones 3-12, donde cada uno de los marcadores en el conjunto tiene la siguiente estructura:
21
donde R es hidrógeno o es un grupo alifático, aromático, cíclico o heterocíclico sustituido o no sustituido; L es un conector escindible; A es un radical ajustador de masas; cada p es igual y es un entero de 0 o superior; cada y' puede ser igual o diferente y es un entero de 0-4, siendo la suma de todos los y' para uno cualquiera de los marcadores igual a y; cada z' puede ser igual o diferente y es un entero de 0-4, siendo la suma de todos los z' para una cualquiera de los marcadores igual a z; e y+z es un entero de 1 o superior.
14. Un conjunto de marcadores de masa según la reivindicación 13, donde R es H, L es un enlace amida, p=0, y A es un átomo de F.
15. Una matriz de marcadores de masa, que comprende dos o más conjuntos de marcadores de masa como se ha definido en cualquiera de las reivindicaciones 1-14, donde la masa agregada de cada uno de los marcadores de masa de uno cualquiera de los conjuntos de la matriz es diferente de la masa agregada de cada uno de los marcadores de masa de cada uno de los otros conjuntos de la matriz.
16. Una matriz de marcadores de masa según la reivindicación 15, donde cada uno de los marcadores de masa en al menos un conjunto comprende un grupo modificador de la serie de masas de una masa común, teniendo el grupo modificador de la serie de masas en cada uno de los marcadores de masa de uno cualquiera de los conjuntos una masa diferente del grupo modificador de la serie de masas en cada uno de los marcadores de masa de cada uno de los otros conjuntos de la matriz.
17. Una matriz de marcadores de masa según la reivindicación 16, donde los grupos modificadores de la serie de masas están anclados a los marcadores de masa de manera que, al escindir el conector escindible de los marcadores de masa, los grupos modificadores de la serie de masas se separan de los radicales marcadores de masas.
18. Una matriz de marcadores de masa según la reivindicación 16 o la reivindicación 17, donde los grupos modificadores de la serie de masas de cada conjunto en la matriz tienen una estructura básica común, y cada uno de los marcadores de masa de uno cualquiera de los conjuntos de la matriz tiene el mismo número de grupos modificadores de la serie de masas que los otros marcadores de masa de ese conjunto, y un número diferente de grupos modificadores de la serie de masas de los marcadores de masa de cada uno de los otros conjuntos en la matriz.
19. Una matriz de marcadores de masa según la reivindicación 18, teniendo cada uno de los marcadores de masa en la matriz cualquiera de las siguientes estructuras:
22
donde S es un grupo modificador de la serie de masas; M es un radical de normalización de masas; X es un radical marcador de masa; A es un radical ajustador de masas; L es un conector escindible; x es un entero de 0 o superior; y y z son enteros de 0 o superiores; e y+z es un entero de 1 o superior.
20. Una matriz de marcadores de masa según cualquiera de las reivindicaciones 16-19, donde los grupos modificadores de la serie de masas comprenden un grupo ariléter.
\newpage
21. Una matriz de marcadores de masa según la reivindicación 19 o la reivindicación 20, teniendo cada uno de los marcadores de masa en la matriz cualquiera de las siguientes estructuras:
23
\vskip1.000000\baselineskip
24
donde R es hidrógeno o es un grupo alifático, aromático, cíclico o heterocíclico sustituido o no sustituido; A se define como en la reivindicación 19; cada p es igual y es un entero de 0 o superior; x es un entero de 0 o superior, siendo x igual para cada uno de los marcadores de masa en uno cualquiera de los conjuntos de la matriz, y siendo el x de uno cualquiera de los conjuntos diferente del x de cada uno de los otros conjuntos en la matriz; cada y' puede ser igual o diferente y es un entero de 0-4, siendo la suma de todos los y' para uno cualquiera de los marcadores igual a y, y cada z' puede ser igual o diferente y es un entero de 0-4, siendo la suma de todos los z' para uno cualquiera de los marcadores igual a z; e y+z es un entero de 1 o superior.
22. Una matriz de marcadores de masa según la reivindicación 16 o la reivindicación 17, donde los grupos modificadores de la serie de masas de cada conjunto en la matriz tienen una estructura básica común, el grupo modificador de la serie de masas de los marcadores de masa de al menos un conjunto que comprende uno o más radicales ajustadores de masas, estando anclados los radicales ajustadores de masas a o situados dentro de la estructura básica del grupo modificador de la serie de masas.
23. Una matriz de marcadores de masa según la reivindicación 22, donde cada uno de los marcadores de masa de cada conjunto en la matriz tiene el mismo número de grupos modificadores de la serie de masas, donde el grupo modificador de la serie de masas en cada uno de los marcadores de masa de uno cualquiera de los conjuntos tiene el mismo número de radicales ajustadores de masas que los grupos modificadores de la serie de masas en cada uno de los otros marcador de ese conjunto, y donde los grupos modificadores de la serie de masas en los marcadores de masa de uno cualquiera de los conjuntos tienen un número diferente de radicales ajustadores de masas de los grupos modificadores de la serie de masas en los marcadores de cada uno de los otros conjuntos en la matriz.
24. Una matriz de marcadores de masa según la reivindicación 23, donde cada uno del conjuntos de la matriz comprende marcadores de masa que tiene cualquiera de las siguientes estructuras:
25
donde S es un grupo modificador de la serie de masas; M es un radical de normalización de masas; X es un radical marcador de masa; A es un radical ajustador de masas de los radicales marcadores de masas y masa normalización radicales; A* puede ser igual o diferente de A y es un radical ajustador de masas de los grupos modificadores de la serie de masas; L es un conector escindible; r es un entero de 0 o superior y es al menos 1 para uno o más conjuntos de marcadores de masa en la matriz; y y z son enteros de 0 o superiores; e y+z es un entero de 1 o superior.
25. Una matriz de marcadores de masa según la reivindicación 24, donde cada uno de los conjuntos de la matriz comprende marcadores de masa que tienen cualquiera de las siguientes estructuras:
26
27
donde R es hidrógeno o es un grupo alifático, aromático, cíclico o heterocíclico sustituido o no sustituido; A y A* se definen como en la reivindicación 24; cada p es igual y es un entero de 0 o superior; x es un entero de 0 o superior siendo x igual para todos los marcadores de masa en la matriz; cada y' puede ser igual o diferente y es un entero de 0-4, siendo la suma de todos los y' para uno cualquiera de los marcadores igual a y; cada z' puede ser igual o diferente y es un entero de 0-4, siendo la suma de todos los z' para uno cualquiera de los marcadores igual a z; y+z es un entero de 1 o superior; cada r' puede ser igual o diferente, siendo la suma de todos los r' para uno cualquiera de los marcadores igual a r; y r es un entero de 0 o superior y es al menos 1 para uno o más conjuntos de marcadores de masa en la matriz.
26. Una matriz de marcadores de masa según cualquiera de las reivindicaciones 15-25, donde los marcadores de masa de uno cualquiera de los conjuntos difiere en la masa de los marcadores de masa de cada uno de los otros conjuntos en la matriz en 4 daltons o más.
27. Un conjunto de dos o más sondas, siendo cada sonda en el conjunto diferente y estando anclados a un único marcador de masa o una combinación única de marcadores de masa, de un conjunto de marcadores de masa como se ha definido en cualquiera de las reivindicaciones 1-14.
28. Una matriz de sondas que comprende dos o más conjuntos de sondas como se ha definido en la reivindicación 27, donde cada sonda en uno cualquiera de los conjuntos está anclada a un único marcador de masa, o una combinación única de marcadores de masa, de un conjunto de marcadores de masa como se ha definido en cualquiera de las reivindicaciones 1-14, y donde las sondas en uno cualquiera de los conjuntos están ancladas a los marcadores de masa del mismo conjunto de marcadores de masa, y cada conjunto de sondas está anclado a marcadores de masa de conjuntos únicos de marcadores de masa de una matriz de marcadores de masa como se ha definido en cualquiera de las reivindicaciones 15-26.
29. Un conjunto o matriz de sondas según la reivindicación 27 o la reivindicación 28, donde cada sonda está anclada a una combinación única de marcadores de masa, siendo distinguida cada combinación mediante la presencia y ausencia de cada uno de los marcadores de masa en el conjunto de marcadores de masa y/o la cantidad de cada uno de los marcadores de masa anclados a la sonda.
30. Un conjunto o matriz de sondas según cualquiera de las reivindicaciones 27-29, donde cada sonda comprende una biomolécula.
31. Un conjunto o matriz de sondas según la reivindicación 30, donde la biomolécula se selecciona entre un ADN, un ARN, un oligonucleótido, una base de ácido nucleico, una proteína y/o un aminoácido.
32. Un método de análisis, cuyo método comprende detectar dos o más analitos identificando simultáneamente mediante espectrometría de masas sus marcadores de masa o combinaciones de marcadores de masa, donde los marcadores de masa son marcadores de masa de un conjunto de marcadores de masa como se ha definido en cualquiera de las reivindicaciones 1-14.
33. Un método según la reivindicación 32, donde cada analito es identificado mediante una combinación única de marcadores de masa de un conjunto de marcadores de masa, siendo distinguida cada combinación mediante la presencia y ausencia de cada uno de los marcadores de masa en el conjunto y/o la cantidad de cada marcador de masa.
34. Un método según la reivindicación 32 o la reivindicación 33 para identificar dos o más analitos, donde los analitos son separados según su masa, antes de detectar el marcador de masa mediante espectrometría de masas.
35. Un método según la reivindicación 34, donde separación se lleva a cabo mediante un método cromatográfico o electroforético.
36. Un método según cualquiera de las reivindicaciones 32-35, donde el espectrómetro de masas empleado para detectar el marcador de masa comprende uno o más analizadores de masa, cuyos analizadores de masa son capaces de permitir que iones de una masa concreta, o de un intervalo de masas, pasen a través para la detección y/o son capaces de hacer que los iones se disocien.
37. Un método según la reivindicación 36, donde los iones de una masa concreta o intervalo de masas específico para uno o más marcadores de masa conocidos se seleccionan utilizando el analizador de masas, los iones seleccionados son disociados, y los productos de disociación son detectados para identificar patrones de iones indicativos de los marcadores de masa seleccionados.
\newpage
38. Un método según la reivindicación 36 o la reivindicación 37, donde el espectrómetro de masas comprende analizadores de masa de tres cuadrupolos.
39. Un método según la reivindicación 37 o la reivindicación 38, donde un primer analizador de masas se utiliza para seleccionar iones de una masa o intervalo de masas concretos, un segundo analizador de masas se utiliza para disociar los iones seleccionados, y un tercer analizador de masas se utiliza para detectar los iones resultantes.
40. Un método según cualquiera de las reivindicaciones 32-39, cuyo método comprende:
(a) poner en contacto dos o más analitos con un conjunto de sondas, o una matriz de sondas, donde las sondas se definen como en cualquiera de las reivindicaciones 27-31,
(b) identificar un analito, detectando una sonda relacionable con este analito.
41. Un método según la reivindicación 40, donde el marcador de masa es escindido de la sonda antes de detectar el marcador de masa mediante espectrometría de masas.
42. Un método según la reivindicación 40 o la reivindicación 41, cuyo método comprende poner en contacto uno o más ácidos nucleicos con un conjunto de sondas de hibridación.
43. Un método según la reivindicación 42, donde el conjunto de sondas de hibridación comprende un conjunto de hasta 256 4-meros, teniendo cada sonda en el conjunto una combinación diferente de bases de ácido nucleicos.
44. Un método de análisis espectrométrico de masas bi-dimensional, cuyo método comprende:
(a) proporcionar dos o más analitos, estando marcado cada analito con un marcador de masa o una combinación de marcadores de masa, donde los marcadores de masa son de un conjunto de marcadores de masa como se ha definido en cualquiera de las reivindicaciones 1-14;
(b) escindir los marcadores de masa de los analitos;
(c) detectar los marcadores de masa;
(d) disociar los marcadores de masa en el espectrómetro de masas, para liberar los radicales marcadores de masas de los radicales de normalización de masas;
(e) detectar los radicales marcadores de masas; y
(f) identificar los analitos basándose en el espectro de masas de los marcadores de masa y el espectro de masas de los radicales marcadores de masas.
45. Un método según la reivindicación 44, donde en la etapa (c) los marcadores de masa de una masa elegida o un intervalo de masas elegido se seleccionan para la detección, y/o en la etapa (e) los radicales marcadores de masas que tiene una masa específica o un intervalo específico de masas se seleccionan para la detección.
46. Un método de análisis según la reivindicación 32, cuyo método comprende:
(a) someter una mezcla de analitos marcados a un primer tratamiento de separación basándose en una primera propiedad de los analitos;
(b) someter los analitos separados resultantes a un segundo tratamiento de separación basándose en una segunda propiedad de los analitos; y
(c) detectar un analito para detectar su marcador mediante espectrometría de masas;
donde los analitos se marcan con un marcador de masa de un conjunto de marcadores de masa como se ha definido en cualquiera de las reivindicaciones 1-14.
47. Un método según la reivindicación 46 donde en la etapa (a) y/o la etapa (b) los analitos son separados según su longitud o masa.
48. Un método según la reivindicación 46 o 47, donde en la etapa (a) y/o etapa (b) los analitos son separados según su punto isoeléctrico.
49. Un método según cualquiera de las reivindicaciones 46-48, donde los analitos comprenden una proteína, un polipéptido, un péptido un aminoácido o un ácido nucleico, o fragmentos de los mismos.
50. Un método de electroforesis en gel bidimensional según cualquiera de las reivindicaciones 46-49.
51. Un método para caracterizar ácido nucleico, según la reivindicación 32, que comprende:
(a) proporcionar una población de fragmentos de ácido nucleico, teniendo cada fragmento anclado escindiblemente un marcador de masa de un conjunto de marcadores de masa como se ha definido en cualquiera de las reivindicaciones 1-14 para identificar una característica de este fragmento;
(b) separar los fragmentos basándose en su longitud;
(c) escindir cada fragmento para liberar su marcador de masa; y
(d) determinar cada uno de los marcadores de masa mediante espectroscopia de masas para relacionar la característica de cada fragmento con la longitud del fragmento.
52. Un método según la reivindicación 51 para caracterizar ADNc, cuyo método comprende:
(a) exponer una muestra que comprende una población de uno o más ADNc o fragmentos de los mismos a un agente de escisión que reconoce una secuencia predeterminada y corta en un sitio de referencia a un desplazamiento conocido de la secuencia predeterminada cerca de un extremo de cada ADNc o fragmento del mismo de manera que se genera una población de fragmentos terminales;
(b) ligar a cada sitio de referencia un oligonucleótido adaptador que comprende un sitio de reconocimiento para un agente de escisión de la muestra;
(c) exponer la población de fragmentos terminales a un agente de escisión de la muestra que se une al sitio de reconocimiento y corta en un sitio de la muestra de desplazamiento conocido desde el sitio de reconocimiento de manera que se genera en cada fragmento terminal una secuencia de extremos cohesivos de una longitud predeterminada de hasta 6 bases, y de secuencia desconocida;
(d) separar la población de fragmentos terminales en subpoblaciones según la longitud de la secuencia; y
(e) determinar cada secuencia de extremos cohesivos:
(i)
sondeando con una matriz de sondas de hibridación marcadas, conteniendo la matriz todas las secuencias de bases posibles de la longitud predeterminada;
(ii)
ligar esas sondas que hibridan con las secuencias de extremos cohesivos; y
(iii)
determinar que sondas están ligadas mediante identificación y preferiblemente cuantificación de los marcadores;
donde los marcadores son marcadores de masa de un conjunto como se ha definido en cualquiera de las reivindicaciones 1-14.
53. Un método según la reivindicación 52, donde la población de fragmentos terminales es separada mediante electroforesis capilar, HPLC o electroforesis en gel.
54. Un método para caracterizar ácido nucleico, según la reivindicación 32, cuyo método comprende generar fragmentos de ácido nucleico en escalera de Sanger de uno o más moldes de ácido nucleico, en la presencia de al menos una base terminadora marcada, e identificar la longitud del fragmento, y la base terminadora del fragmento, donde el marcador es relacionable con la base terminadora y es un marcador de masa de un conjunto como se ha definido en cualquiera de las reivindicaciones 1-14.
55. Un método según la reivindicación 54, donde las cuatro base terminadoras están presentes en la misma zona de reacción.
56. Un método según la reivindicación 54 o la reivindicación 55, cuyo método comprende generar fragmentos de ácido nucleico en escalera de Sanger a partir de una pluralidad de moldes de ácido nucleico presentes en la misma zona de reacción, y para cada fragmento de ácido nucleico producido identificar la longitud del fragmento, la identidad del molde del que está derivado el fragmento y la base terminadora del fragmento, donde antes de generar los fragmentos, se hibrida con cada molde un nucleótido o oligonucleótido cebador marcado, siendo el marcador de cada cebador específico para el molde con el que hibrida el cebador para permitir la identificación del
molde.
57. Un método según la reivindicación 56, donde el marcador que identifica el molde es un marcador de masa de un conjunto como se ha definido en cualquiera de las reivindicaciones 1-14.
\newpage
58. Un método para secuenciar ácido nucleico, según la reivindicación 32, cuyo método comprende:
(a) obtener una población de ácido nucleico diana que comprende uno o más ADN de hebra sencilla que se van a secuenciar, cada uno de los cuales está presente en una cantidad única y porta un cebador para proporcionar una porción de doble hebra del ácido nucleico para su ligación;
(b) poner en contacto la población de ácido nucleico con una matriz de sondas de hibridación, comprendiendo cada sonda un marcador anclado escindiblemente a una secuencia de bases conocida de longitud predeterminada, conteniendo la matriz todas las secuencias de bases posibles de esa longitud predeterminada y siendo las secuencias de bases incapaces de ligación entre sí, donde el contacto se lleva a cabo en presencia de ligasa en condiciones para ligar a la porción de doble hebra de cada ácido nucleico la sonda que porta la secuencia de bases complementaria al ácido nucleico de doble hebra adyacente a la porción de doble hebra para formar de ese modo una porción de doble hebra prolongada que es incapaz de ligación a sondas adicionales; y
(c) eliminar todas las sondas no ligadas; seguido de las etapas de:
(d) escindir las sondas ligadas para liberar cada marcador;
(e) registrar la cantidad de cada marcador mediante espectrometría de masas; y
(f) activar la porción de doble hebra prolongada para posibilitar su ligación;
donde
(g) las etapas (b) a (f) se repiten en un ciclo durante un número suficiente de veces para determinar la secuencia del o de cada ácido nucleico de hebra sencilla determinando la secuencia de liberación de cada marcador,
donde los marcadores de las sondas de hibridación son cada de un conjunto como se ha definido en cualquiera de las reivindicaciones 1-14.
59. Un método según la reivindicación 58, donde las sondas de hibridación son un conjunto de 256 4-meros, teniendo cada sonda en el conjunto una combinación diferente de bases de ácido nucleicos.
60. Un método para caracterizar una muestra que comprende péptidos, polipéptidos y/o proteínas, según la reivindicación 32, cuyo método comprende:
(a) proporcionar una muestra que comprende péptidos, polipéptidos y/o proteínas, teniendo cada péptido, polipéptido y/o proteína anclado escindiblemente un marcador de masa, o una combinación de marcadores de masa de un conjunto de marcadores de masa como se ha definido en cualquiera de las reivindicaciones 1-14, donde cada péptido, polipéptido y/o proteína es relacionable con su marcador o combinación de marcadores;
(b) analizar los péptidos, polipéptidos y/o proteínas marcados, mediante espectrometría de masas para detectar los marcadores.
61. Un método según la reivindicación 60, donde la muestra es proporcionada formando péptidos a partir de la acción de un agente de escisión sobre una muestra que comprende polipéptidos y/o proteínas.
62. Un método según la reivindicación 60 o la reivindicación 61, donde los péptidos, polipéptidos y/o proteínas marcados son separados mediante un método cromatográfico o electroforético, antes de su análisis.
63. Un método según cualquiera de las reivindicaciones 60-62, donde se proporciona una pluralidad de muestra.
64. Un método según la reivindicación 63, donde la pluralidad de muestras es reunida, antes de su análisis.
65. Un método según cualquiera de las reivindicaciones 60-64, donde uno o más de los péptidos, polipéptidos y/o proteínas en la muestra es modificado post-traduccionalmente y comprende un carbohidrato, y donde el método comprende biotinilar el péptido, polipéptido o proteína modificados anclando biotina a través de un grupo carbonilo del carbohidrato.
66. Un método según cualquiera de las reivindicaciones 60-64, donde uno o más de los péptidos, polipéptidos y/o proteínas en la muestra es modificado post-traduccionalmente mediante fosforilación con tirosina, y donde el método comprende separar tales péptidos, polipéptidos y/o proteínas modificados mediante cromatografía de afinidad utilizando un anticuerpo anti-fosfotirosina.
67. Un método según cualquiera de las reivindicaciones 60-64, cuyo método comprende aislar un fragmento peptídico sencillo de cada péptido, polipéptido y/o proteína.
68. Un método según la reivindicación 67, donde cada fragmento aislado es un fragmento terminal.
69. Un método según la reivindicación 68, cuyo método comprende:
(a) tratar una muestra que comprende una población de una pluralidad de polipéptidos con un agente de escisión que es conocido por reconocer en cadenas polipeptídicas un resto específico o secuencias de aminoácidos y escindir en un sitio de escisión, con lo que la población es escindida para generar fragmentos peptídicos;
(b) aislar una población de fragmentos peptídicos que portan como extremo de referencia el extremo N o el extremo C del polipéptido del que fueron fragmentados, portando cada fragmento peptídico en el otro extremo el sitio de escisión próximo al extremo de referencia;
(c) antes de o después de aislar los fragmentos peptídicos, marcar cada extremo de referencia de los polipéptidos con un marcador de masa, o una combinación de marcadores de masa de un conjunto de marcadores de masa como se ha definido en cualquiera de las reivindicaciones 1-14, donde cada extremo de referencia es relacionable con su marcador o combinación de marcadores; y
(d) determinar mediante espectrometría de masas una secuencia firma de uno o más de los fragmentos aislados, cuya secuencia firma es la secuencia de un número predeterminado de restos aminoácido que se mueven desde el sitio de escisión;
donde una secuencia firma caracteriza cada polipéptido.
70. Un método según la reivindicación 68, cuyo método comprende:
(a) poner en contacto una muestra que comprende uno o más polipéptidos con un primer agente de escisión para generar fragmentos polipeptídicos;
(b) aislar uno o más fragmentos polipeptídicos, comprendiendo cada fragmento el extremo N o el extremo C del polipéptido del que fueron fragmentados;
(c) antes de o después de aislar los fragmentos polipeptídicos, marcar cada extremo de los polipéptidos con un marcador de masa, o una combinación de marcadores de masa de un conjunto de marcadores de masa como se ha definido en cualquiera de las reivindicaciones 1-14, donde cada extremo es relacionable con su marcador o combinación de marcadores; y
(d) identificar los fragmentos aislados mediante espectrometría de masas;
(e) repetir las etapas (a)-(d) en la muestra utilizando un segundo agente de escisión que escinde en un sitio diferente del primer agente de escisión; y
(f) caracterizar los uno o más polipéptidos en la muestra de los fragmentos identificados en la etapas (d) y (e).
71. El uso de un conjunto o una matriz de marcadores como se define en cualquiera de las reivindicaciones 1-26, en un método de análisis mediante espectrometría de masas.
72. El uso según la reivindicación 71 en un método de análisis electroforético bidimensional.
73. El uso según la reivindicación 71 en un método de análisis espectrométrico de masas bidimensional.
74. El uso según cualquiera de las reivindicaciones 71-73 en un método de secuenciación de uno o más ácido nucleicos.
75. El uso según cualquiera de las reivindicaciones 71-73 en un método de perfilado de la expresión génica.
76. El uso según cualquiera de las reivindicaciones 71-73 en un método de perfilado de la expresión de proteínas.
77. El uso según cualquiera de las reivindicaciones 71-73 en un método de clasificación de ácidos nucleicos.
ES01911912T 2000-03-14 2001-03-14 Marcadores de masa. Expired - Lifetime ES2287104T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GBGB0006141.6A GB0006141D0 (en) 2000-03-14 2000-03-14 Mass labels
GB0006141 2000-03-14

Publications (1)

Publication Number Publication Date
ES2287104T3 true ES2287104T3 (es) 2007-12-16

Family

ID=9887608

Family Applications (2)

Application Number Title Priority Date Filing Date
ES07075074T Expired - Lifetime ES2389510T3 (es) 2000-03-14 2001-03-14 Marcadores de masa
ES01911912T Expired - Lifetime ES2287104T3 (es) 2000-03-14 2001-03-14 Marcadores de masa.

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES07075074T Expired - Lifetime ES2389510T3 (es) 2000-03-14 2001-03-14 Marcadores de masa

Country Status (15)

Country Link
US (3) US7294456B2 (es)
EP (2) EP1275004B1 (es)
JP (1) JP4608171B2 (es)
CN (2) CN102839213A (es)
AT (1) ATE364841T1 (es)
AU (2) AU4083401A (es)
CA (1) CA2403114C (es)
DE (1) DE60128900T2 (es)
DK (1) DK1275004T3 (es)
ES (2) ES2389510T3 (es)
GB (1) GB0006141D0 (es)
IL (2) IL151732A0 (es)
NO (1) NO330733B1 (es)
PT (1) PT1275004E (es)
WO (1) WO2001068664A2 (es)

Families Citing this family (65)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1002128A1 (en) * 1997-07-11 2000-05-24 Brax Genomics Limited Characterising nucleic acids
US6824981B2 (en) 2000-08-11 2004-11-30 Agilix Corporation Ultra-sensitive detection systems using alterable peptide tags
DE60237810D1 (de) * 2001-04-03 2010-11-11 Thermo Finnigan Llc Zur vereinfachung komplexer peptidgemische geeignete verfahren und kits
PT1425586E (pt) * 2001-09-14 2007-12-31 Electrophoretics Ltd Marcadores de massa
EP1451588A4 (en) * 2001-11-06 2005-03-09 Agilix Corp SENSITIVE CODED DEFINITION SYSTEMS
CA2469492C (en) * 2001-12-11 2012-10-16 University Of Medicine And Dentistry Of New Jersey Diagnostic methods for protein profiling
US7700306B2 (en) 2002-04-04 2010-04-20 Electrophoretics Limited Method for charcterising analytes
US20040219685A1 (en) * 2003-01-30 2004-11-04 Applera Corporation Methods and mixtures pertaining to analyte determination using electrophilic labeling reagents
GB0306756D0 (en) * 2003-03-24 2003-04-30 Xzillion Gmbh & Co Kg Mass labels
US20060263886A1 (en) * 2003-11-14 2006-11-23 Eric Peters Fluorous labeling for selective processing of biologically-derived samples
US20050148087A1 (en) 2004-01-05 2005-07-07 Applera Corporation Isobarically labeled analytes and fragment ions derived therefrom
US7307169B2 (en) 2004-01-05 2007-12-11 Applera Corporation Isotopically enriched N-substituted piperazines and methods for the preparation thereof
US7355045B2 (en) 2004-01-05 2008-04-08 Applera Corporation Isotopically enriched N-substituted piperazine acetic acids and methods for the preparation thereof
US7868547B2 (en) * 2004-03-01 2011-01-11 Dh Technologies Development Pte. Ltd. Determination of analyte characteristics based upon binding properties
JP4861308B2 (ja) * 2004-04-07 2012-01-25 ジェネンテック, インコーポレイテッド 抗体結合体の質量分析
US20080206737A1 (en) * 2004-05-19 2008-08-28 Hunter Christie L Expression quantification using mass spectrometry
US20060078960A1 (en) * 2004-05-19 2006-04-13 Hunter Christie L Expression quantification using mass spectrometry
US20070054345A1 (en) * 2004-05-19 2007-03-08 Hunter Christie L Expression quantification using mass spectrometry
EP1756307A1 (en) 2004-05-20 2007-02-28 Trillion Genomics Limited Use of mass labelled probes to detect target nucleic acids using mass spectrometry
WO2006017208A1 (en) * 2004-07-12 2006-02-16 Applera Corporation Mass tags for quantitative analyses
US20070048752A1 (en) 2004-07-12 2007-03-01 Applera Corporation Mass tags for quantitative analyses
ATE534750T1 (de) 2004-07-30 2011-12-15 Adeza Biomedical Corp Onkofetales fibronektin als zervixkarzinom-marker
CA2596117A1 (en) * 2005-02-03 2006-08-10 Perkinelmer Las, Inc. Ultra-sensitive detection systems using multidimension signals
US20060183238A1 (en) * 2005-02-09 2006-08-17 Applera Corporation Amine-containing compound analysis methods
US20070037286A1 (en) * 2005-02-09 2007-02-15 Subhasish Purkayastha Thyroxine-containing compound analysis methods
GB0515323D0 (en) * 2005-07-26 2005-08-31 Electrophoretics Ltd Mass labels
JP4651094B2 (ja) * 2005-08-09 2011-03-16 キヤノン株式会社 標識されたプローブ結合物体、その製造方法、及びその利用方法
GB0518585D0 (en) * 2005-09-12 2005-10-19 Electrophoretics Ltd Mass labels
US20080318327A1 (en) * 2006-01-05 2008-12-25 Ge Healthcare Bio-Sciences Ab Kit and Method for Mass Labelling
US7902345B2 (en) 2006-12-05 2011-03-08 Sequenom, Inc. Detection and quantification of biomolecules using mass spectrometry
US8133701B2 (en) * 2006-12-05 2012-03-13 Sequenom, Inc. Detection and quantification of biomolecules using mass spectrometry
US7728287B2 (en) * 2007-03-01 2010-06-01 Lawrence Livermore National Security, Llc Imaging mass spectrometer with mass tags
GB0704764D0 (en) 2007-03-12 2007-04-18 Electrophoretics Ltd Isobarically labelled reagents and methods of their use
EP2195452B1 (en) 2007-08-29 2012-03-14 Sequenom, Inc. Methods and compositions for universal size-specific polymerase chain reaction
GB0809488D0 (en) * 2008-05-23 2008-07-02 Electrophoretics Ltd Mass spectrometric analysis
GB0811574D0 (en) * 2008-06-24 2008-07-30 Trillion Genomics Ltd Characterising planar samples by mass spectrometry
US20120046178A1 (en) * 2008-10-30 2012-02-23 Sequenom, Inc. Products and processes for multiplex nucleic acid identification
EP2406634A4 (en) 2009-03-10 2013-06-19 Univ Maryland ISOBARE DEUTERIUM REACTIVE MARKERS USED FOR QUANTITATIVE ANALYZES
GB0916881D0 (en) 2009-09-25 2009-11-11 Electrophoretics Ltd Mass labels
GB0921665D0 (en) 2009-12-10 2010-01-27 Trillion Genomics Ltd Phobes
WO2011088423A2 (en) 2010-01-15 2011-07-21 California Institute Of Technology Isobaric tags for analyte detection and quantification
JP5855581B2 (ja) * 2010-01-22 2016-02-09 ディーエイチ テクノロジーズ デベロップメント プライベート リミテッド 小分子の同時的な定量および同定のための質量タグ試薬
EP2588144B1 (en) 2010-07-02 2018-05-09 Ventana Medical Systems, Inc. Detecting targets using mass tags and mass spectrometry
US8461987B2 (en) * 2010-11-17 2013-06-11 Theodosios Kountotsis System and method for performing chemical analysis of fingerprints for providing at least one response
CN110564819A (zh) * 2011-05-19 2019-12-13 基纳生物技术有限公司 用于多重核酸鉴定的产品和方法
US9388132B2 (en) 2011-09-15 2016-07-12 Wisconsin Alumni Research Foundation Isobaric tandem mass tags for quantitative proteomics and peptidomics
EP2847594B1 (en) * 2012-05-10 2016-06-22 Thermo Finnigan LLC Method for highly multiplexed quantitation of peptides by mass spectrometry and labeling reagent sets therefor
US9366678B2 (en) 2012-10-25 2016-06-14 Wisconsin Alumni Research Foundation Neutron encoded mass tags for analyte quantification
CN105102977A (zh) * 2012-12-26 2015-11-25 奎斯特诊断投资公司 通过质谱法的c肽检测
JP5569761B1 (ja) * 2013-03-29 2014-08-13 シャープ株式会社 分析方法
GB201308765D0 (en) * 2013-05-15 2013-06-26 Electrophoretics Ltd Mass Tag Reagents
GB201322567D0 (en) 2013-12-19 2014-02-05 Electrophoretics Ltd Mass labels
GB201410523D0 (en) 2014-06-12 2014-07-30 Electrophoretics Ltd Mass labels
CN114350766A (zh) 2015-04-24 2022-04-15 基纳生物技术有限公司 检测和定量次要变体的并行式方法
CN114540470A (zh) 2015-04-24 2022-05-27 基纳生物技术有限公司 用于次要等位基因和多态性的鉴定和定量的多重化方法
GB201511508D0 (en) * 2015-07-01 2015-08-12 Ge Healthcare Bio Sciences Ab Method for determining a size of biomolecules
GB201521903D0 (en) 2015-12-11 2016-01-27 Electrophoretics Ltd Isorbaric mass labels
GB201521919D0 (en) 2015-12-11 2016-01-27 Electrophoretics Ltd Isobaric mass labels
JP6508409B2 (ja) * 2016-02-22 2019-05-08 株式会社島津製作所 シアリル糖鎖解析方法
WO2018115243A1 (en) * 2016-12-23 2018-06-28 Roche Diagnostics Gmbh Method for tracking a sample identity during a process in an analysis system
JP7046070B2 (ja) * 2016-12-23 2022-04-01 エフ.ホフマン-ラ ロシュ アーゲー 分析系におけるプロセス中に試薬を同定するための方法
JP7051871B2 (ja) * 2016-12-23 2022-04-11 エフ.ホフマン-ラ ロシュ アーゲー 分析系におけるプロセス中に試薬を同定するための方法
EP3942291A4 (en) * 2019-03-21 2022-12-14 C2Sense, Inc. VOLATILE ION DETECTION SYSTEMS AND RELATED METHODS
GB201907792D0 (en) 2019-05-31 2019-07-17 Thermo Fisher Scient Bremen Gmbh Deconvolution of mass spectromerty data
EP4047371A1 (en) 2021-02-18 2022-08-24 Thermo Fisher Scientific (Bremen) GmbH Method and apparatus for analysing samples of biomolecules using mass spectrometry with data-independent acquisition

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5800992A (en) * 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US5252296A (en) 1990-05-15 1993-10-12 Chiron Corporation Method and apparatus for biopolymer synthesis
GB9315847D0 (en) 1993-07-30 1993-09-15 Isis Innovation Tag reagent and assay method
JPH08145948A (ja) * 1994-11-16 1996-06-07 Sumitomo Chem Co Ltd 還元性オリゴ糖の質量分析法
NZ331044A (en) 1996-01-23 1999-02-25 Rapigene Inc Methods and compositions for determining the sequence of nucleic acid molecules
US6027890A (en) * 1996-01-23 2000-02-22 Rapigene, Inc. Methods and compositions for enhancing sensitivity in the analysis of biological-based assays
AU2217597A (en) 1996-03-18 1997-10-22 Sequenom, Inc. Dna sequencing by mass spectrometry
US6475807B1 (en) 1996-04-08 2002-11-05 Smithkline Beecham Corporation Mass-based encoding and qualitative analysis of combinatorial libraries
GB9620769D0 (en) 1996-10-04 1996-11-20 Brax Genomics Ltd Nucleic acid sequencing
JPH10123096A (ja) * 1996-10-22 1998-05-15 Sumitomo Chem Co Ltd シアロオリゴ糖の質量分析法
EP0963443B1 (en) 1996-12-10 2006-03-08 Sequenom, Inc. Releasable nonvolatile mass-label molecules
CN100434531C (zh) * 1997-01-15 2008-11-19 X齐里昂有限两合公司 与质量标记连接的杂交探针
EP1002128A1 (en) * 1997-07-11 2000-05-24 Brax Genomics Limited Characterising nucleic acids
GB9718921D0 (en) * 1997-09-05 1997-11-12 Brax Genomics Ltd Catalytically generated mass labels
NZ503289A (en) 1997-09-15 2002-11-26 Xzillion Gmbh & Co Kg Characterising nucleic acid fragments by mass spectrometry
FI106679B (fi) * 1997-12-16 2001-03-15 Nokia Networks Oy Optinen vastaanotin
GB9823646D0 (en) 1997-12-19 1998-12-23 Brax Genomics Ltd Compounds for mass spectrometry
GB9815163D0 (en) * 1998-07-13 1998-09-09 Brax Genomics Ltd Compounds
US6824981B2 (en) 2000-08-11 2004-11-30 Agilix Corporation Ultra-sensitive detection systems using alterable peptide tags
US9722639B2 (en) 2013-05-01 2017-08-01 Qorvo Us, Inc. Carrier aggregation arrangements for mobile devices
US9701046B2 (en) 2013-06-21 2017-07-11 Pavestone, LLC Method and apparatus for dry cast facing concrete deposition
US9187086B1 (en) 2014-05-22 2015-11-17 Ford Global Technologies, Llc Clutch control to enter powersplit hybrid powertrain parallel mode
US9701070B2 (en) 2014-11-06 2017-07-11 Lockheed Martin Corporation Mandrel forming for discrete wing skin stiffeners

Also Published As

Publication number Publication date
US7816304B2 (en) 2010-10-19
JP2003529059A (ja) 2003-09-30
EP1806586A1 (en) 2007-07-11
GB0006141D0 (en) 2000-05-03
NO20024344D0 (no) 2002-09-12
EP1275004A2 (en) 2003-01-15
CN1427953B (zh) 2012-08-29
NO330733B1 (no) 2011-06-27
US7294456B2 (en) 2007-11-13
US20080167197A1 (en) 2008-07-10
JP4608171B2 (ja) 2011-01-05
ES2389510T3 (es) 2012-10-26
NO20024344L (no) 2002-11-14
CA2403114A1 (en) 2001-09-20
PT1275004E (pt) 2007-08-14
US7825069B2 (en) 2010-11-02
ATE364841T1 (de) 2007-07-15
CN102839213A (zh) 2012-12-26
DE60128900T2 (de) 2008-02-07
US20030194717A1 (en) 2003-10-16
AU2001240834B2 (en) 2005-11-17
EP1806586B1 (en) 2012-08-15
IL151732A (en) 2008-11-03
IL151732A0 (en) 2003-04-10
DK1275004T3 (da) 2007-10-15
WO2001068664A2 (en) 2001-09-20
WO2001068664A3 (en) 2002-03-21
US20080145850A1 (en) 2008-06-19
DE60128900D1 (de) 2007-07-26
AU4083401A (en) 2001-09-24
CA2403114C (en) 2007-07-31
EP1275004B1 (en) 2007-06-13
CN1427953A (zh) 2003-07-02

Similar Documents

Publication Publication Date Title
ES2287104T3 (es) Marcadores de masa.
JP4467589B2 (ja) オリゴマー配列の決定のための質量欠損標識
AU2001240834A1 (en) Mass labels
US6436640B1 (en) Use of LNA in mass spectrometry
ES2296996T3 (es) Marcaje de moleculas.
JP5054694B2 (ja) 質量標識体
US6846679B1 (en) Characterizing polypeptides through cleavage and mass spectrometry
JP4163103B2 (ja) ポリペプチドの特徴分析方法
AU2002253825A1 (en) Mass defect labeling for the determination of oligomer sequences
AU2007200980A1 (en) Mass defect labeling for the determination of oligomer sequences