ES2840456T3 - Secuenciación de ADN - Google Patents

Secuenciación de ADN Download PDF

Info

Publication number
ES2840456T3
ES2840456T3 ES18182487T ES18182487T ES2840456T3 ES 2840456 T3 ES2840456 T3 ES 2840456T3 ES 18182487 T ES18182487 T ES 18182487T ES 18182487 T ES18182487 T ES 18182487T ES 2840456 T3 ES2840456 T3 ES 2840456T3
Authority
ES
Spain
Prior art keywords
nucleotide base
nucleic acid
ratio
marker
intensity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18182487T
Other languages
English (en)
Inventor
Mark W Eshoo
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ibis Biosciences Inc
Original Assignee
Ibis Biosciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ibis Biosciences Inc filed Critical Ibis Biosciences Inc
Application granted granted Critical
Publication of ES2840456T3 publication Critical patent/ES2840456T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids

Abstract

Un método para secuenciar un ácido nucleico objetivo usando un enfoque de secuenciación por síntesis (SBS), el método comprendiendo: a) proporcionar una primera pluralidad de una primera base de nucleótidos, una segunda pluralidad de una segunda base de nucleótidos, una tercera pluralidad de una tercera base de nucleótidos, y una cuarta pluralidad de una cuarta base de nucleótidos, en donde: (1) una primera proporción de una primera porción de la primera pluralidad marcada con un primer marcador en relación a una segunda porción de la primera pluralidad marcada con un segundo marcador; y (2) una segunda proporción de una tercera porción de la segunda pluralidad marcada con el primer marcador en relación con una cuarta porción de la segunda pluralidad marcada con el segundo marcador, son detectablemente diferentes entre sí; b) incorporar mediante polimerización la primera pluralidad de la primera base de nucleótidos, la segunda pluralidad de la segunda base de nucleótidos, la tercera pluralidad de la tercera base de nucleótidos, o la cuarta pluralidad de la cuarta base de nucleótidos en una pluralidad de copias de un ácido nucleico que es complementario al ácido nucleico objetivo; c) determinar una proporción de señales producida a partir de la primera pluralidad de la primera base de nucleótidos o una proporción de señales producida a partir de la segunda pluralidad de la segunda base de nucleótidos en la pluralidad de copias de un ácido nucleico que es complementario al ácido nucleico objetivo, en donde una primera proporción de señales producida por la primera pluralidad de la primera base de nucleótidos es detectablemente diferente de una segunda proporción de señales producida por la segunda pluralidad de la segunda base de nucleótidos y en donde la proporción de señales producida a partir de la primer pluralidad se produce por al menos dos marcadores que emiten dos longitudes de onda distinguibles y la proporción de señales producida a partir de la segunda pluralidad se produce por al menos dos marcadores que emiten dos longitudes de onda distinguibles; d) asociar la proporción de señales o señal con la primera base de nucleótidos o la segunda base de nucleótidos para identificar la base de nucleótidos en la pluralidad de copias de un ácido nucleico que es complementaria al ácido nucleico objetivo; y e) analizar un conjunto de datos de proporciones de señales ordenadas para producir una secuencia de nucleótidos del ácido nucleico objetivo, en donde el método de SBS es un enfoque de secuenciación basado en conjuntos la secuencia del ácido nucleico objetivo se determina detectando la señal producida después de cada incorporación de bases, y en donde: (i) cada uno de los nucleótidos comprende un grupo 3' hidroxilo que está bloqueado químicamente y los cuatro nucleótidos se añaden simultáneamente a una reacción que comprende ADN polimerasa y agrupaciones de complejos plantilla-cebador; o (ii) cada nucleótido se añade uno a la vez a una mezcla de la reacción que contiene un complejo de objetivo de ácido nucleico-cebador y una polimerasa.

Description

DESCRIPCION
Secuenciación de ADN
CAMPO DE LA INVENCIÓN
En la presente se proporciona tecnología relacionada con la secuenciación de ácidos nucleicos y particularmente, pero no exclusivamente, con métodos, composiciones y sistemas para secuenciar un ácido nucleico usando por lo menos dos marcadores en donde la proporción de los marcadores identifica y diferencia las bases. ANTECEDENTES
La secuenciación del ADN está impulsando la investigación y el descubrimiento genómicos. La finalización del Proyecto del Genoma Humano fue un logro monumental que involucró una cantidad increíble de esfuerzos combinados entre centros de genoma y científicos de todo el mundo. Este proyecto de una década se completó usando el método de secuenciación de Sanger, que sigue siendo la metodología de secuenciación del genoma básico en los centros de secuenciación del genoma de alto rendimiento. La razón principal detrás del éxito prolongado de este método fue su método básico y eficiente, a la vez que elegante, de terminación de cadena dideoxy. Con mejoras crecientes en la secuenciación de Sanger, incluyendo el uso de excitación fluorescente inducida por láser de colorantes de transferencia de energía, ADN polimerasas diseñadas, electroforesis capilar, preparación de muestras, informática, y software de análisis de secuencias, la plataforma de secuenciación de Sanger ha sido capaz de mantener su estado. Los secuenciadores de ADN basados en Sanger del estado de la técnica actual pueden producir más de 700 bases de secuencia claramente legible en una única ejecución a partir de plantillas de hasta 30 kb de longitud. Sin embargo, como ocurre con la mayoría de las invenciones tecnológicas, las mejoras continuas en esta plataforma de secuenciación han llegado a un punto muerto, con el costo estimado actual para producir una secuencia de borrador de genoma microbiano de alta calidad a alrededor de 10.000 $ por par de megabases. Los secuenciadores de ADN actuales basados en el método de Sanger permiten analizar hasta 384 muestras en paralelo.
Es evidente que la explotación de la secuencia del genoma humano completa para la medicina clínica y el cuidado de la salud requiere métodos precisos de secuenciación de ADN de bajo coste y alto rendimiento. De hecho, los sectores de ciencias genómicas tanto públicos (National Human Genome Research Institute, NHGRI) como privados (The J. Craig Venter Science Foundation y el premio para genómica Archon X) han lanzado un llamamiento para el desarrollo de tecnología de secuenciación de próxima generación que reducirá el costo de secuenciar hasta una diezmilésima parte de su costo actual en los próximos diez años. Por consiguiente, para superar las limitaciones de las tecnologías de secuenciación convencionales actuales, se han investigado una variedad de nuevos métodos de secuenciación de ADN, que incluyen enfoques de secuenciación por síntesis (SBS) tales como pirosecuenciación (Ronaghi et al. (1998) Science 281: 363-365), secuenciación de moléculas de ADN individuales (Braslaysky et al. (2003) Proc. Natl. Acad. Sci. USA 100: 3960-3964), y colonias de polimerasa (secuenciación de "polonias") (Mitra et al. (2003) Anal. Biochem. 320: 55-65).
El concepto de secuenciación por síntesis de ADN (SBS) se reveló en 1988 con un intento de secuenciar el ADN mediante la detección del grupo pirofosfato que se genera cuando se incorpora un nucleótido en una reacción de ADN polimerasa (Hyman (1999) Anal. Biochem. 174: 423-436). Las tecnologías de SBS posteriores se basaron en formas adicionales para detectar la incorporación de un nucleótido a una cadena de ADN en crecimiento. En general, la SBS convencional usa un cebador de oligonucleótidos diseñado para alinearse a una posición predeterminada de la molécula plantilla de muestra a secuenciar. El complejo cebador-plantilla se presenta con un nucleótido en presencia de una enzima polimerasa. Si el nucleótido es complementario a la posición en la molécula plantilla de muestra que está directamente en 3' del extremo del cebador de oligonucleótidos, entonces la ADN polimerasa extenderá el cebador con el nucleótido. La incorporación del nucleótido y la identidad del nucleótido insertado puede detectarse, por ejemplo, mediante la emisión de luz, un cambio en la fluorescencia, un cambio en el pH (ver, por ejemplo, Patente de Estados Unidos N° 7.932.034), un cambio en la conformación de enzimas, o algún otro cambio físico o químico en la reacción (ver, por ejemplo, la WO 1993/023564 y la WO 1989/009283; Seo et al., (2005) "Four-color DNA sequencing by synthesis on a chip using photocleavable fluorescent nucleotides," PNAS 102: 5926-59). Tras cada incorporación con éxito de un nucleótido, se detecta una señal que refleja la aparición, identidad y número de incorporaciones de nucleótidos. Los nucleótidos no incorporados pueden luego eliminarse (por ejemplo, mediante degradación química o mediante lavado) y puede consultarse la posición siguiente en el cebador-plantilla con otra especie de nucleótido.
SUMARIO
En la secuenciación por síntesis de ADN convencional que usa monómeros de nucleótidos marcados, cuatro fracciones diferentes (por ejemplo, un colorante o un marcador fluorescente) se unen a las cuatro bases de nucleótidos para permitir que el detector distinga las bases entre sí por el color. Por ejemplo, algunos métodos marcan cada uno de los A, C, G y T con una fracción fluorescente que emite luz a una longitud de onda que se distingue de la luz emitida por las otras tres fracciones fluorescentes, por ejemplo, para producir luz de cuatro colores diferentes asociada con cada una de las cuatro bases.
Por el contrario, la tecnología actual se basa en las diferencias en las proporciones de marcado en lugar de solo en las diferencias de color para identificar las bases incorporadas durante una reacción de secuenciación. En este esquema, cada base de nucleótidos individual se marca en una proporción conocida específica de por lo menos dos fracciones diferentes (por ejemplo, un colorante, un marcador fluorescente, etc.). Como una realización ejemplar, el ATP se marca con dos fracciones X e Y en una proporción de 1:0 (todas las moléculas de ATP se marcan con fracción X), el TTP se marca con las dos fracciones X e Y en una proporción de 2:1 (dos tercios de la población de moléculas de TTP se marca con la fracción X y un tercio de la población de moléculas de TTP se marca con la fracción Y), GTP se marca con las dos fracciones X e Y en una proporción de 1:2 (un tercio de la población de moléculas de GTP se marca con la fracción X y dos tercios de la población de moléculas de GTP se etiqueta con la fracción Y), y La CTP está marcada con las dos fracciones X e Y en una proporción de 0:1 (todas las moléculas de CTP se marcan con la fracción Y). Entonces, de acuerdo con algunas realizaciones, se realiza una estrategia de secuenciación basada en polonias (por ejemplo, una colonia clonal) con la secuencia determinada detectando la proporción de señales producidas por los dos colorantes después de cada incorporación de base.
En algunas realizaciones, un elemento de la tecnología que permite separar y asignar las intensidades de señal en "compartimentos" específicos de base apropiados es el uso de una secuencia de calibración de 4 bases al comienzo de una ejecución de secuenciación. Esta secuencia de calibración contiene cada una de las 4 bases en un orden conocido para proporcionar una referencia de calibración, pero ejemplo, para calibrar un instrumento de secuenciación para reconocer las proporciones de señal apropiadas (y por tanto, las proporciones de marcadores) para cada una de las bases.
Como consecuencia, las realizaciones de la tecnología reducen el número de colorantes fluorescentes necesarios para identificar las cuatro bases (por ejemplo, permitiendo a uno usar solo los colorantes más óptimos para adquirir una secuencia), reducen la cantidad de láseres usados para excitar marcadores (por ejemplo, fracciones fluorescentes), reducen o eliminan la óptica usada para dividir la señal óptica por longitud de onda, y reducen la cantidad de detectores para registrar eventos de incorporación.
Por consiguiente, en la presente se proporcionan métodos para secuenciar un ácido nucleico objetivo, el método comprendiendo: determinar una proporción de señales producida a partir de una pluralidad de una base de nucleótidos en la que una primera fracción de la pluralidad se marca con un primer marcador y una segunda fracción de la pluralidad se marca con un segundo marcador; y asociar la proporción de señales con la base de nucleótidos para identificar la base de nucleótidos. En algunas realizaciones, la proporción de señales producida por la pluralidad de la base de nucleótidos es detectablemente diferente de una segunda proporción de señales producida por una segunda pluralidad de una segunda base de nucleótidos. Por ejemplo, algunas realizaciones proporcionan que la primera fracción de la pluralidad produce una primera señal que tiene una primera intensidad y la segunda fracción de la pluralidad produce una segunda señal que tiene una segunda intensidad y la proporción de señales es una proporción de la primera intensidad con respecto a la segunda intensidad. En algunas realizaciones, la primera intensidad es una primera amplitud de emisión de fluorescencia y la segunda intensidad es una segunda amplitud de emisión de fluorescencia; algunas realizaciones proporcionan que la primera intensidad es una primera altura del pico y la segunda intensidad es una segunda altura del pico.
En algunos aspectos, la tecnología se refiere a secuenciar ácidos nucleicos usando nucleótidos marcados. Por consiguiente, en algunas realizaciones, los métodos comprenden proporcionar una primera pluralidad de una primera base de nucleótidos y una segunda pluralidad de una segunda base de nucleótidos, en donde una primera proporción de una primera porción de la primera pluralidad marcada con el primer marcador con respecto a una segunda porción de la primera pluralidad marcada con el segundo marcador es detectablemente diferente de una segunda proporción de una tercera porción de la segunda pluralidad marcada con el primer marcador con respecto a una cuarta porción de la segunda pluralidad marcada con el segundo marcador. Además, algunas realizaciones comprenden además proporcionar una primera pluralidad de una primera base de nucleótidos, una segunda pluralidad de una segunda base de nucleótidos, una tercera pluralidad de una tercera base de nucleótidos, y una cuarta pluralidad de una cuarta base de nucleótidos, en donde una primera proporción de una primera porción de la primera pluralidad marcada con el primera marcador con respecto a una segunda porción de la primera pluralidad marcada con el segundo marcador, una segunda proporción de una tercera porción de la segunda pluralidad marcada con el primer marcador con respecto a una cuarta porción de la segunda pluralidad marcada con el segundo marcador, una tercera proporción de una quinta porción de la tercera pluralidad marcada con el primer marcador con respecto a una sexta porción de la tercera pluralidad marcada con el segundo marcador, y una cuarta proporción de una séptima porción de la cuarta pluralidad marcada con el primer marcador con respecto a una octava porción de la cuarta pluralidad marcada con el segundo marcador son todas detectablemente diferentes entre sí. Por ejemplo, en algunas realizaciones, la primera base de nucleótidos es A, la segunda base de nucleótidos es C, la tercera base de nucleótidos es G, y la cuarta base de nucleótidos es T.
La tecnología se refiere a usar diferentes proporciones de dos marcadores para diferenciar nucleótidos en una reacción de secuenciación. Por tanto, algunas realizaciones proporcionan que el primer marcador es una primera fracción fluorescente con un pico de emisión a una primera longitud de onda y el segundo marcador es una segundo fracción fluorescente con un pico de emisión a una segunda longitud de onda. Además, algunas realizaciones comprenden monitorizar un primer canal y un segundo canal, en donde el primera marcador produce una señal en el primer canal y el segundo marcador produce una señal en el segundo canal.
En algunos aspectos, los métodos están relacionados con la secuenciación por síntesis; por tanto, se proporcionan métodos que comprenden incorporar por polimerización la pluralidad de la base de nucleótidos en una pluralidad de un ácido nucleico que es complementario al ácido nucleico objetivo. Se contemplan varios métodos de detección por la presente tecnología. Por ejemplo, en algunas realizaciones, los métodos comprenden señales de monitorización con un dispositivo óptico.
En algunas realizaciones, los métodos comprenden proporcionar un oligonucleótido de calibración que comprende una secuencia conocida. Y, algunas realizaciones comprenden analizar un conjunto de datos de proporciones de señal ordenadas para producir una secuencia de nucleótidos del ácido nucleico objetivo.
Adicionalmente, algunos aspectos de la tecnología se refieren a composiciones que comprenden una pluralidad de una base de nucleótidos en donde una primera porción de la pluralidad está marcada con un primer marcador y una segunda porción de la pluralidad está marcada con un segundo marcador. En algunas realizaciones, las composiciones comprenden además una segunda pluralidad de una segunda base de nucleótidos en donde una tercera porción de la segunda pluralidad está marcada con el primer marcador y una cuarta porción de la segunda pluralidad está marcada con el segundo marcador y una primera proporción de la primera porción con respecto a la segunda porción es diferente de una segunda proporción de la tercera porción con respecto a la cuarta porción. En algunas realizaciones, las composiciones comprenden además una tercera pluralidad de una tercera base de nucleótidos y una cuarta pluralidad de una cuarta base de nucleótidos, en donde una quinta porción de la tercera pluralidad está marcada con el primer marcador y una sexta porción de la tercera pluralidad está marcada con el segundo marcador, y una séptima porción de la cuarta pluralidad está marcada con el primer marcador y una octava porción de la cuarta la pluralidad está marcada con el segundo marcador y una tercera proporción de la quinta porción con respecto a la sexta porción es diferente de una proporción de la séptima porción con respecto a la octava porción y la tercera y la cuarta proporciones son ambas diferentes que la primera y la segunda proporciones. Por ejemplo, en algunas realizaciones, la primera base de nucleótidos es A, la segunda base de nucleótidos es C, la tercera base de nucleótidos es G, y la cuarta base de nucleótidos es T y, en algunas realizaciones, el marcador es una fracción fluorescente. En algunas realizaciones, la primera, la segunda, la tercera, y/o la cuarta base es una base modificada o análogo de base como una inosina, isoguanina, isocitosina, una diaminopirimidina, una xantina, un nitroazol, una base de tamaño expandido, etc.
Aunque la tecnología se refiere en algunos aspectos a composiciones de nucleótidos, la tecnología también se refiere a composiciones que comprenden además un ácido nucleico objetivo, un cebador de secuenciación, y una polimerasa. Algunas realizaciones de las composiciones comprenden un ácido nucleico que comprende la base de nucleótidos.
Los métodos y composiciones están relacionados, por ejemplo, con realizaciones de sistemas para secuenciar un ácido nucleico, en donde los sistemas comprenden; una composición que comprende una pluralidad de una base de nucleótidos en donde una primera porción de la pluralidad está marcada con un primer marcador y una segunda porción de la pluralidad está marcada con un segundo marcador; y un oligonucleótido de calibración. Algunas realizaciones del sistema comprenden además un aparato de secuenciación, algunas realizaciones del sistema comprenden además un procesador configurado para asociar una proporción de señal con una base de nucleótidos, y algunas realizaciones del sistema comprenden además una funcionalidad de salida para proporcionar una secuencia de nucleótidos del ácido nucleico.
Los sistemas para secuenciar un ácido nucleico objetivo (plantilla) comprenden en algunas realizaciones una segunda pluralidad de una segunda base de nucleótidos, una tercera pluralidad de una tercera base de nucleótidos, y una cuarta pluralidad de una cuarta base de nucleótidos, en donde una tercera porción de la segunda pluralidad está marcada con el primer marcador y una cuarta porción de la segunda pluralidad está marcada con el segundo marcador, una quinta porción de la tercera pluralidad está marcada con el primer marcador y una sexta porción de la tercera pluralidad está marcada con el segundo marcador, y una séptima porción de la cuarta pluralidad está marcada con el primer marcador y una octava porción de la cuarta pluralidad está marcada con el segundo marcador y una primera proporción de la primera porción con respecto a la segunda porción, una segunda proporción de la tercera porción con la cuarta porción, una tercera proporción de la quinta porción con la sexta porción, y una cuarta proporción de la séptima porción con la octava porción son diferentes entre sí. Por tanto, algunas realizaciones también comprenden una funcionalidad para detectar el primer marcador y el segundo marcador y, además, algunas realizaciones comprenden una funcionalidad para diferenciar la base de nucleótidos, la segunda base de nucleótidos, la tercera base de nucleótidos y la cuarta base de nucleótidos entre sí.
La tecnología encuentra uso en kits que comprenden realizaciones de las composiciones provistas para, por ejemplo, poner en práctica realizaciones de los métodos proporcionados. Por ejemplo, algunas realizaciones proporcionan un kit para secuenciar un ácido nucleico, en donde el kit comprende una composición que comprende una pluralidad de una base de nucleótidos en donde una primera porción de la pluralidad está marcada con un primer marcador y una segunda porción de la pluralidad está marcada con un segundo marcador; y un oligonucleótido de calibración.
En algunas realizaciones, se proporcionan kits que comprenden una segunda pluralidad de una segunda base de nucleótidos, una tercera pluralidad de una tercera base de nucleótidos, y una cuarta pluralidad de una cuarta base de nucleótidos, en donde una tercera porción de la segunda pluralidad está marcada con el primer marcador y una cuarta porción de la segunda pluralidad está marcada con el segundo marcador, una quinta porción de la tercera pluralidad está marcada con el primer marcador y una sexta porción de la tercera pluralidad está marcada con el segundo marcador, y una séptima porción de la cuarta pluralidad está marcada con el primer marcador y una octava porción de la cuarta pluralidad está marcada con el segundo marcador y una primera proporción con respecto a la segunda porción, una segunda proporción de la tercera porción a la cuarta porción, una tercera proporción de la quinta porción a la sexta porción, y una cuarta proporción de la séptima porción a la octava porción son diferentes entre sí.
Realizaciones adicionales serán evidentes para los expertos en la técnica relevante en base a las enseñanzas contenidas en la presente.
DESCRIPCIÓN DETALLADA
En la presente se proporciona tecnología relacionada con la secuenciación de ácidos nucleicos y particularmente, pero no exclusivamente, con métodos, composiciones, sistemas, y kits para secuenciar un ácido nucleico usando la proporción entre múltiples señales de marcador para diferenciar bases.
Los encabezados de las secciones usados en la presente son solo con propósitos de organización y no debe interpretarse que limitan de ninguna manera la materia descrita.
En esta descripción detallada de las varias realizaciones, con propósitos de explicación, se exponen numerosos detalles específicos para proporcionar una comprensión exhaustiva de las realizaciones divulgadas. Un experto en la técnica apreciará, sin embargo, que estas varias realizaciones se pueden poner en práctica con o sin estos detalles específicos. En otros casos, las estructuras y los dispositivos se muestran en forma de diagramas de bloques. Además, un experto en la técnica puede apreciar fácilmente que las secuencias específicas en las que se presentan y realizan los métodos son ilustrativas y se contempla que las secuencias puedan variarse y permanecer todavía dentro del espíritu y el alcance de las diversas realizaciones divulgadas en la presente.
A menos que se defina lo contrario, todos los términos técnicos y científicos usados en la presente tienen el mismo significado que el entendido comúnmente un experto en la técnica a la que pertenecen las varias realizaciones descritas en la presente. Cuando las definiciones de los términos en las referencias incorporadas parecen diferir de las definiciones proporcionadas en las presentes enseñanzas, debe prevalecer la definición proporcionada en las presentes enseñanzas.
Se apreciará que hay un "aproximadamente" implícito antes de las temperaturas, concentraciones, tiempos, etc. tratados en las presentes enseñanzas, de tal manera que las desviaciones insustanciales están dentro del alcance de las presentes enseñanzas. En esta solicitud, el uso del singular incluye el plural a menos que se indique específicamente lo contrario. Además, el uso de "comprender", "comprende", "comprendiendo", "contener", "contiene", "conteniendo", "incluir", "incluye" e "incluyendo" no se pretende que sea limitativo. Debe entenderse que tanto la descripción general anterior como la siguiente descripción detallada son ejemplares y explicativas solamente y no son restrictivas de las presentes enseñanzas.
Además, a menos que el contexto requiera lo contrario, los términos singulares incluirán el plural y los términos plurales incluirán el singular. Generalmente, las nomenclaturas utilizadas en conexión con, y las técnicas de, cultivo celular y tisular, biología molecular y química e hibridación de proteínas y oligonucleótidos o polinucleótidos descritas en la presente son las bien conocidas y usadas comúnmente en la técnica. A menos que se indique lo contrario, se usan técnicas estándar, por ejemplo, para la purificación y preparación de ácidos nucleicos, análisis químico, ácido nucleico recombinante, y síntesis de oligonucleótidos. Las reacciones enzimáticas y las técnicas de purificación se realizan de acuerdo con las especificaciones del fabricante o como se realiza comúnmente en la técnica o como se describe en la presente. Las técnicas y procedimientos descritos en la presente se realizan generalmente de acuerdo con métodos convencionales bien conocidos en la técnica y como se describe en varias referencias generales y más específicas que se citan y tratan a lo largo de la presente especificación. Ver, por ejemplo, Sambrook et al., Molecular Cloning: A Laboratory Manual (Tercera edición, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (2000)). Las nomenclaturas utilizadas en conexión con, y los procedimientos y técnicas de laboratorio descritos en la presente son los bien conocidos y usados comúnmente en la técnica.
Definiciones
Para facilitar una comprensión de la presente tecnología, se definen a continuación una serie de términos y frases. Definiciones adicionales se exponen a lo largo de la descripción detallada.
A lo largo de la especificación y las reivindicaciones, los siguientes términos toman los significados explícitamente asociados en la presente, a menos que el contexto indique claramente lo contrario. La frase "en una realización" como se usa en la presente no se refiere necesariamente a la misma realización, aunque puede. Además, la frase "en otra realización" como se usa en la presente no se refiere necesariamente a una realización diferente, aunque puede. Por tanto, como se describe a continuación, pueden combinarse fácilmente varias realizaciones de la invención, sin apartarse del alcance o el espíritu de la invención.
Adicionalmente, como se usa en la presente, el término "o" es un operador "o" inclusivo y es equivalente al término "y/o" a menos que el contexto indique claramente lo contrario. El término "basado en" no es exclusivo y permite basarse en factores adicionales no descritos, a menos que el contexto indique claramente lo contrario. Adicionalmente, a lo largo de la especificación, el significado de "un" y "el" incluye referencias en plural. El significado de "en" incluye "en" y "sobre".
Un "sistema" denota un conjunto de componentes, reales o abstractos, que comprenden un todo donde cada componente interactúa o está relacionado con por lo menos otro componente dentro del todo.
Como se usa en la presente, la frase "dNTP" significa desoxinucleotidotrifosfato, donde el nucleótido comprende una base de nucleótidos, como A, T, C, G o U.
El término "monómero" como se usa en la presente significa cualquier compuesto que pueda incorporarse a una cadena molecular en crecimiento por una polimerasa dada. Tales monómeros incluyen, sin limitaciones, nucleótidos de origen natural (por ejemplo, ATP, GTP, TTP, UTP, CTP, dATP, dGTP, dTTP, dUTP, dCTP, análogos sintéticos), precursores para cada nucleótido, nucleótidos de origen no natural y sus precursores, o cualquier otra molécula que pueda incorporarse en una cadena polimérica en crecimiento por una polimerasa dada.
Como se usa en la presente, un "ácido nucleico" significará cualquier molécula de ácido nucleico, incluyendo, sin limitación, ADN, ARN e híbridos de los mismos. Las bases de ácido nucleico que forman las moléculas de ácido nucleico pueden ser las bases A, C, G, T y U, así como derivados de las mismas. Los derivados de estas bases son bien conocidos en la técnica. Debe entenderse que el término incluye, como equivalentes, análogos de o ADN o ARN elaborados a partir de análogos de nucleótidos. El término como se usa en la presente también abarca ADNc, que es ADN complementario, o copia, producido a partir de una plantilla de ARN, por ejemplo mediante la acción de la transcriptasa inversa. Es bien sabido que el ADN (ácido desoxirribonucleico) es una cadena de nucleótidos que consta de 4 tipos de nucleótidos- A (adenina), T (timina), C (citosina), y (G) guanina) y que el ARN (ácido ribonucleico) es una cadena de nucleótidos que consiste de 4 tipos de nucleótidos- A, U (uracilo), G y C. También se sabe que todos estos 5 tipos de nucleótidos se unen específicamente entre sí en combinaciones denominadas emparejamiento de bases complementarias. Es decir, la adenina (A) se empareja con la timina (T) (en el caso del ARN, sin embargo, la adenina (A) se empareja con uracilo (U)), y la citosina (C) se empareja con guanina (G), de tal manera que cada uno de estos pares de bases forma una cadena doble. Como se usa en la presente, "datos de secuenciación de ácido nucleico", "información de secuenciación de ácido nucleico", "secuencia de ácido nucleico", "secuencia genómica", "secuencia genética", "secuencia de fragmento", o "lectura de secuenciación de ácido nucleico" denota cualquier información o dato que sean indicativos del orden de las bases de nucleótidos (por ejemplo, adenina, guanina, citosina, y timina/uracilo) en una molécula (por ejemplo, un genoma completo, un transcriptoma completo, un exoma, oligonucleótido, polinucleótido, fragmento, etc.) de ADN o ARN.
La referencia a una base, un nucleótido o a otra molécula puede ser en singular o en plural. Es decir, una base puede referirse a una única molécula de esa base o a una pluralidad de esa base, por ejemplo, en una solución.
Como se usa en la presente, la frase "una pluralidad clonal de ácidos nucleicos" o "una población clonal de ácidos nucleicos" o "una agrupación" o "una polonia" se refiere a un conjunto de productos de ácido nucleico que son sustancialmente o completamente o esencialmente idénticos a entre sí, y son copias complementarias de la cadena de ácido nucleico plantilla a partir de la cual se sintetizan.
Como se usa en la presente, un "polinucleótido", también denominado un ácido nucleico, es una serie covalentemente enlazada de nucleótidos en donde la posición 3' de la pentosa de un nucleótido está unida por un grupo fosfodiéster a la posición 5' de la siguiente. El ADN (ácido desoxirribonucleico) y el ARN (ácido ribonucleico) son polinucleótidos que se producen biológicamente en los que los residuos de nucleótidos están enlazados en una secuencia específica mediante enlaces de fosfodiéster. Como se usa en la presente, los términos "polinucleótido" u "oligonucleótido" abarcan cualquier compuesto polimérico que tiene una cadena principal lineal de nucleótidos. Un "oligodesoxirribonucleótido" u "oligonucleótidos", también denominado un "oligómero", es generalmente un polinucleótido de una longitud más corta.
Como se usa en la presente, "complementario" se refiere generalmente a formar dúplex de nucleótidos específicos para formar pares de bases de Watson-Crick canónicas, como es entendido por los expertos en la técnica. Sin embargo, complementario también incluye emparejamiento de bases de análogos de nucleótidos que son capaces de formar un emparejamiento de bases universal con nucleótidos A, T, G o C y/o con ácidos nucleicos bloqueados que mejoran la estabilidad térmica de los dúplex. Un experto en la técnica reconocerá que la rigurosidad de la hibridación es un determinante en el grado de coincidencia o falta de coincidencia en el dúplex formado mediante hibridación.
Como se usa en la presente, "fracción" se refiere a una de dos o más partes en las que algo se puede dividir algo como, por ejemplo, las varias partes de una cadena, una molécula o una sonda.
Una "polimerasa" es una enzima generalmente para unir nucleótidos de 3'-OH 5 '-trifosfato, oligómeros y análogos de los mismos. Las polimerasas incluyen, pero no están limitadas a, , ADN-polimerasas dependientes de ADN, ARN polimerasas dependientes de a Dn , ADN polimerasas dependientes de ARN, ARN polimerasas dependientes de ARN, ADN polimerasa T7, ADN polimerasa T3, ADN polimerasa T4, ARN polimerasa T7, ARN polimerasa T3, ARN polimerasa SP6, ADN polimerasa 1, fragmento de Klenow, ADN polimerasa de Thermophilus aquaticus, ADN polimerasa Tth, ADN polimerasa Vent ((New England Biolabs) ADN polimerasa , Deep Vent (New England Biolabs), Fragmento grande de ADN polimerasa Bst, , fragmento de Stoeffel, ADN polimerasa 9° N, ADN polimerasa Pfu, ADN polimerasa Tfl, polimerasa RepliPHI Phi29, ADN polimerasa Tli, ADN polimerasa beta eucariota, telomerasa, polimerasa Therminator (New England Biolabs), ADN polimerasa KOD HiFi. (Novagen), ADN polimerasa KOD1, Q-beta replicasa, transferasa terminal, transcriptasa inversa AMV, transcriptasa inversa M-MLV, transcriptasa inversa Phi6, transcriptasa inversa VIH-1, nuevas polimerasas descubiertas por bioprospección y polimerasas enumeradas en la Publicación de Solicitud de Patente de Estados Unidos N° 2007/0048748 y en las Patentes de Estados Unidos N° 6.329.178; 6.602.695; y 6.395.524. Estas polimerasas incluyen isoformas mutantes de tipo salvaje y variantes genéticamente diseñadas como exo-polimerasas y otros mutantes, por ejemplo, aquellos que toleran nucleótidos marcador y los incorporan en una cadena de ácido nucleico.
El término "cebador" se refiere a un oligonucleótido, ya sea de origen natural como en un digesto de restricción purificado o producido sintéticamente, que es capaz de actuar como un punto de inicio de la síntesis cuando se coloca en condiciones en las que se induce la síntesis de un producto de extensión del cebador que es complementario a una cadena de ácido nucleico, (por ejemplo, en presencia de nucleótidos y un agente inductor como ADN polimerasa y a una temperatura y pH adecuados). El cebador es preferiblemente de cadena sencilla para una máxima eficiencia en la amplificación, pero alternativamente puede ser de cadena doble. Si es de cadena doble, primero se trata el cebador para separar sus cadenas antes de ser usado para preparar productos de extensión. Preferiblemente, el cebador es un oligodesoxirribonucleótido. El cebador debe ser lo suficientemente largo para cebar la síntesis de los productos de extensión en presencia del agente inductor. Las longitudes exactas de los cebadores dependerán de muchos factores, incluyendo la temperatura, la fuente del cebador y el uso del método.
Realizaciones de la tecnología
La tecnología se refiere de manera general a métodos, composiciones, sistemas, y kits para la secuenciación de ADN usando un enfoque de secuenciación por síntesis. Aunque la divulgación en la presente se refiere a ciertas realizaciones ilustradas, debe entenderse que estas realizaciones se presentan a modo de ejemplo y no a modo de limitación.
Métodos
Algunas realizaciones de la tecnología proporcionan métodos de secuenciación por síntesis de ADN en los que diferentes proporciones de intensidades de señales, en lugar de diferentes longitudes de onda de señales, identifican bases incorporadas durante, por ejemplo, una reacción de secuenciación por síntesis. En algunas realizaciones, se usa un enfoque de secuenciación basado en conjuntos (por ejemplo, una colonia de polimerasa ("polonia") o una colonia clonal). Estos enfoques secuencian múltiples copias idénticas o sustancialmente idénticas de una molécula de ADN que forman una agrupación de moléculas plantilla. Se proporcionan métodos para formar agrupaciones, por ejemplo, en la patente de Estados Unidos N° 7.115.400. En algunas realizaciones, las agrupaciones se inmovilizan en un soporte sólido como una perla. Estas agrupaciones generalmente resultan de la amplificación de una molécula de ADN originaria individual; por tanto, cada agrupación representa la molécula individual que inició la amplificación. Por ejemplo, en el proceso de "amplificación por puente" usado en la secuenciación de Solexa, hay aproximadamente 1 millón de copias del fragmento de la molécula de ADN original en la agrupación. Entonces, dependiendo de la química y la metodología de secuenciación de las realizaciones particulares, se añaden bases a la colección de agrupaciones (o, de forma equivalente, colonias, polonias, etc.). En un método de conjuntos de acuerdo con la tecnología actual, la proporción de marcado está directamente asociada con las calidades de la señal producida. Por ejemplo, una base (por ejemplo, una pluralidad de una base en solución) marcada a una proporción de 1:1 con dos fracciones que emiten señales fluorescentes en dos longitudes de onda distintas producirá un espectro de emisión que tiene dos picos en las dos longitudes de onda; la misma cantidad de la base marcada a una proporción de 1:0 con las dos fracciones emitirá generalmente una señal fluorescente que tiene un único pico que es dos veces más intenso que cualquiera de los picos de la base cuando se marca a una proporción de 1:1. La proporción de las alturas de los picos relativas (por ejemplo, las intensidades de señal en dos longitudes de onda) en el espectro es generalmente similar a la proporción de la relación de una base que está marcada. Por ejemplo, una población de bases marcadas en una proporción de 1:3 con dos fracciones X e Y producirá generalmente un espectro que tiene dos picos (correspondientes a las longitudes de onda de emisión de X e Y) cuyas alturas relativas también son 1:3. La altura del pico y la intensidad de la señal están relacionadas de tal manera que los dos términos pueden usarse indistintamente. Consecuentemente, la proporción de las señales puede medirse, por ejemplo, mediante la proporción de alturas de los picos en un espectro, otras características de pico (como área de pico, anchura de pico a media altura, etc.) y/o como una proporción de dos intensidades medidas usando, por ejemplo, filtros o división óptica. En algunas realizaciones, las proporciones se corrigen usando un factor de corrección relacionado con una diferencia en la eficiencia de emisión molar para dos fracciones.
En general, se usan dos enfoques para la adición de bases en la síntesis por secuenciación basada en conjuntos: en el primero, las bases se proporcionan una a la vez; en el segundo, las bases se modifican con fracciones identificadoras de manera que el tipo de base del nucleótido incorporada se identifica a medida que avanza la síntesis. En algunas realizaciones, la síntesis se controla de sincrónicamente añadiendo una base a la vez (ver, por ejemplo, Margulies, M. et al. "Genome sequencing in microfabricated high-density picolitre reactors", Nature 437: 376-380 (2005); Harris, T.D. et al. "Single-molecule DNA sequencing of a viral genome", Science 320: 106-109 (2008)) o usando nucleótidos que se bloquean de manera reversible. En realizaciones particulares, la extensión se bloquea momentáneamente después de cada adición de bases usando nucleótidos modificados (por ejemplo, terminadores reversibles de nucleótidos como se describe en, por ejemplo, la WO2004/018497, la Publicación de Solicitud de Patente de Estados Unidos N° 2007/0166705; Bentley, D.R. et al. "Accurate whole human genome sequencing using reversible terminator chemistry", Nature 456: 53-59 (2008); Turcatti, G. et al. "A new class of cleavable fluorescent nucleotides: synthesis and optimization as reversible terminators for DNA sequencing by synthesis", Nucleic Acids Res. 36: e25 (2008); Guo, J. et al. "Four-color DNA sequencing with 3’-O-modified nucleotide reversible terminators and chemically cleavable fluorescent dideoxynucleotides", Proc. Natl. Acad. Sci. USA 105: 9145-9150 (2008); Ju, J. et al. "Four-color DNA sequencing by synthesis using cleavable fluorescent nucleotide reversible terminators", Proc. Natl. Acad. Sci. USA 103: 19635-19640 (2006); Seo, T.S. et al. "Four-color DNA sequencing by synthesis on a chip using photocleavable fluorescent nucleotides", Proc. Natl. Acad. Sci. USA 102: 5926-5931 (2005); Wu, W. et al. "Termination of DNA synthesis by N6-alkylated, not 3’-O-alkylated, photocleavable 2’-deoxyadenosine triphosphates", Nucleic Acids Res. 35: 6339-6349 (2007)) u omitiendo componentes de la reacción como iones metálicos divalentes (ver, por ejemplo, la WO 2005/123957, Publicación de Solicitud de Patente de Estados Unidos N° 20060051807).
Típicamente, cada adición de base es seguida por un paso de lavado para eliminar el exceso de reactivos. Luego, mientras se detiene la síntesis, se obtienen imágenes de las agrupaciones para determinar qué base se ha añadido. En realizaciones en las que se añade una base por ciclo de reacción, la incorporación con éxito de una base indica la base (y por tanto la secuencia) en esa posición. Estas adiciones de bases se detectan típicamente mediante fluorescencia (ver, por ejemplo, Harris, supra) o por cascadas enzimáticas que identifican la liberación de pirofosfato mediante la producción de luz (ver, por ejemplo, Margulies, supra, Bentley, supra). De acuerdo con la tecnología proporcionada en la presente, la identidad de base se asocia con la proporción de las señales (por ejemplo, intensidades o picos del espectro) generadas y detectadas durante esta fase de detección, que a su vez, está asociada con la proporción del marcado de bases.
Cuando todas las bases se añaden simultáneamente, las bases se discriminan convencionalmente por diferentes etiquetas (por ejemplo, fracciones fluorescentes) unidas a cada base (ver, por ejemplo, Korlach, J. et al. "Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nanostructures", Proc. Natl. Acad. Sci. USA 105: 1176-1181 (2008); Publicación de Solicitud de Patente de Estados Unidos N° 20030194740; Publicación de Solicitud de Patente de Estados Unidos N° 20030064366; Turcatti, G., et al. "A new class of cleavable fluorescent nucleotides: synthesis and optimization as reversible terminators for DNA sequencing by synthesis", Nucleic Acids Res. 36: e25 (2008); Guo, J. et al. "Four-color DNA sequencing with 3’-O-modified nucleotide reversible terminators and chemically cleavable fluorescent dideoxynucleotides", Proc. Natl. Acad. Sci. USA 105: 9145-9150 (2008); Ju, J. et al. "Four-color DNA sequencing by synthesis using cleavable fluorescent nucleotide reversible terminators", Proc. Natl. Acad. Sci. USA 103: 19635­ 19640 (2006); Seo, T.S. et al. "Four-color DNA sequencing by synthesis on a chip using photocleavable fluorescent nucleotides", Proc. Natl. Acad. Sci. USA 102: 5926-5931 (2005); Wu, W. et al. "Termination of DNA synthesis by N6-alkylated, not 3’-O-alkylated, photocleavable 2’-deoxyadenosine triphosphates", Nucleic Acids Res. 35: 6339-6349 (2007); WO 2006/084132. De acuerdo con realizaciones de la tecnología proporcionada en la presente, la identidad de base se asocia con una proporción de señales generadas (por ejemplo, altura de pico y/o intensidad de señal en múltiples longitudes de onda distinguibles), que, a su vez, está asociada con la proporción del marcado de bases.
Por ejemplo, en algunas realizaciones, los cuatro nucleótidos se añaden simultáneamente a la reacción que comprende ADN polimerasa y las agrupaciones de complejos plantilla-cebador. En algunas realizaciones, los nucleótidos llevan un marcador fluorescente y el grupo 3' hidroxilo está químicamente bloqueado (por ejemplo, con un terminador reversible marcado) de tal manera que la síntesis se detiene después de que se incorpora una base en la cadena de ADN en crecimiento (sintetizada). Un paso de obtención de imágenes sigue cada paso de incorporación de bases, durante el que se obtienen imágenes de las agrupaciones. Para obtener imágenes de las agrupaciones, en algunas realizaciones los marcadores fluorescentes se excitan mediante un láser y luego se registra la fluorescencia emitida desde las agrupaciones. En algunas realizaciones, la obtención de imágenes registra las longitudes de onda y las intensidades a esas longitudes de onda de la fluorescencia emitida. De acuerdo con la presente tecnología, por lo menos se marcan dos bases usando proporciones diferentes de las dos bases y por tanto las diferencias en la proporción emitida de las señales en las dos longitudes de onda asociadas con los dos marcadores diferencia las bases entre sí. Luego, antes de iniciar el siguiente ciclo sintético, se eliminan los grupos bloqueadores 3' terminales para proporcionar un sustrato para la incorporación de la base siguiente. Los ciclos se repiten de esta manera para determinar la secuencia de las plantillas una base cada vez.
En algunas realizaciones, cada nucleótido se agrega de uno en uno a una mezcla de la reacción que contiene el complejo de ácido nucleico objetivo-cebador y la polimerasa, monitorizando la reacción para una señal, y eliminando la base de la reacción. Por ejemplo, una realización ilustrativa del método comprende:
1. proporcionar un cebador de secuenciación, una plantilla, una polimerasa, y soluciones de las cuatro bases A, C, G y T
2. hibridar el cebador con la plantilla en condiciones químicas y físicas apropiadas
3. añadir una alícuota de una solución que comprende la base A a la reacción
4. monitorizar la reacción para la producción de una señal
5. eliminar la base A de la solución
6. añadir una alícuota de una solución que comprende la base C a la reacción
7. monitorizar la reacción para la producción de una señal
8. eliminar la base C de la solución
9. añadir una alícuota de una solución que comprende la base G a la reacción
10. monitorizar la reacción para la producción de una señal
11. eliminar la base G de la solución
12. añadir una alícuota de una solución que comprende la base T a la reacción
13. monitorizar la reacción para la producción de una señal
14. eliminar la base T de la solución
15. Repita los pasos 3-14 hasta que la plantilla esté secuenciada.
Durante cada ciclo, la detección de una señal de salida apropiada para la base añadida en el paso anterior indica una incorporación con éxito de esa base y por tanto identifica la base incorporada en ese paso. La detección puede ser por tecnología convencional. Por ejemplo, si la marcador es una fracción fluorescente, entonces la detección de una base incorporada puede llevarse a cabo utilizando un microscopio de barrido confocal para analizar la colección de agrupaciones (por ejemplo, unidas a una superficie) con un láser para obtener imágenes de las fracciones fluorescentes unidas directamente a las bases incorporadas. Alternativamente, puede usarse un detector 2D sensible, como un detector de carga acoplada (CCD), para visualizar las señales generadas. Sin embargo, hay disponibles y pueden usarse otras técnicas como la microscopía óptica de barrido en campo cercano (SNOM) cuando se obtienen imágenes de matrices densas. Por ejemplo, usando SNOM, pueden distinguirse polinucleótidos individuales cuando están separados por una distancia de menos de 100 nm, por ejemplo de 10 nm a 10 fm. Para una descripción de la microscopía óptica de barrido de campo cercano, ver Moyer et al., Laser Focus World (1993) 29:10. Se conocen aparatos adecuados usados para obtener imágenes de matrices de polinucleótidos y la configuración técnica será evidente para el experto en la técnica. La detección se usa preferiblemente en combinación con un sistema de análisis para determinar el número y la naturaleza de los nucleótidos incorporados para cada paso de la síntesis. Este análisis, que puede llevarse a cabo inmediatamente después de cada paso de síntesis, o más tarde usando datos guardados, permite determinar la secuencia de la plantilla de ácido nucleico dentro de una colonia dada.
Aunque esta realización ejemplar indica añadir las bases en el orden A, C, G y T, la tecnología no está limitada a este orden. De hecho, en algunas realizaciones, las bases se añaden en cualquier orden permutado del conjunto {A C G T} o {A C G U}, por ejemplo, A, G, C, T; A, T, C, G; T, C, G, A, etc. Adicionalmente, algunas realizaciones proporcionan que se añadan análogos de bases, bases modificadas y otras moléculas en lugar de A, C, G y T. Debe entenderse que los nucleótidos que comprenden uridina ("U") pueden usarse en lugar de T y viceversa. Si la secuencia que se está determinando es desconocida, los nucleótidos añadidos se aplican generalmente en un orden elegido que luego se repite a lo largo del análisis, por ejemplo como se ha tratado anteriormente. Si, sin embargo, la secuencia que se está determinando es conocida y se está re-secuenciando, por ejemplo, para determinar si hay pequeñas diferencias presentes en la secuencia en relación a la secuencia conocida, el proceso de determinación de secuenciación puede hacerse más rápido añadiendo los nucleótidos en cada paso en el orden apropiado, elegidos de acuerdo a la secuencia conocida. Las diferencias de la secuencia dada se detectan por tanto por la falta de incorporación de ciertos nucleótidos en etapas particulares de la extensión del cebador.
Como un método mejorado para detectar la adición de bases en SBS, la tecnología es generalmente aplicable a los métodos de SBS en los que las bases están marcadas diferencialmente para identificarlas. Sin embargo, aunque las tecnologías convencionales diferencian bases únicamente por color (por ejemplo, posición del pico en el dominio de longitud de onda), la tecnología proporcionada en la presente diferencia bases por diferencias en la proporción de marcadores de bases, por ejemplo, la proporción de intensidades de señal producidas por al menos dos marcadores que emiten en dos longitudes de onda distinguibles. Por ejemplo, en algunas realizaciones, las cuatro bases están marcadas en una proporción diferente con dos marcadores (por ejemplo, fracciones fluorescentes).
Con respecto a los métodos y esquemas de secuenciación por síntesis que encuentran uso, por ejemplo, como adaptados apropiadamente a los métodos proporcionados en la presente, Morozova y Marra proporcionan una revisión de algunas de tales tecnologías en Genomics 92: 255 (2008); exposiciones adicionales se encuentran en Mardis, Annu. Rev. Genomics Hum. Genet. (2008) 9:387-402 y en Fuller, et al. (2009) Nat. Biotechnol. 27: 1013.
Más específicamente, algunas realizaciones proporcionan el uso de bases marcadas a diferentes proporciones en una técnica de secuenciación por síntesis de conjuntos como la siguiente: secuenciación paralela de amplicones divididos (Publicación de PCT N° WO2006084132); extensión de oligonucleótidos paralelos (ver, por ejemplo, Patente de Estados Unidos N° 5.750.341; Patente de Estados Unidos N° 6.306.597); secuenciación de polonias Mitra et al. (2003) Analytical Biochemistry 320: 55-65; Shendure et al. (2005) Science 309: 1728-1732; Patente de Estados Unidos N° 6.432.360, Patente de Estados Unidos N° 6.485.944, Patente de Estados Unidos N° 6.511.803); la tecnología de adición de bases individuales Solexa (ver, por ejemplo, Bennett et al. (2005), Pharmacogenomics 6:373-382; Patente de Estados Unidos N° 6.787.308; Patente de Estados Unidos N° 6.833.246; la tecnología de secuenciación de firmas masivamente paralela de Lynx (Brenner et al. (2000) Nat. Biotechnol., 18: 630-634, Patente de Estados Unidos N° 5.695.934, Patente de Estados Unidos N° 5.714.330). y la tecnología de colonias de PCR Adessi (Adessi et al. (2000). Nucleic Acid Res. 28: E87; WO 00018957).
En una realización ejemplar, se usa la secuenciación Solexa. En la plataforma Solexa/Illumina (Voelkerding et al., Clinical Chem., 55: 641-658, 2009; MacLean et al., Nature Rev. Microbiol. 7: 287-296; Patente de Estados Unidos N° 6.833.246; Patente de Estados Unidos N° 7.115.400; Patente de Estados Unidos N° 6.969.488; y Patente de Estados Unidos N° 6.787.308), los datos de secuenciación se producen en forma de lecturas de longitud más corta. En este método, el ADN fragmentado de cadena sencilla se repara en el extremo para generar extremos romos 5'-fosforilados, seguido de la adición mediada de Klenow de una única base A al extremo 3' de los fragmentos. La adición de A facilita la adición de oligonucleótidos adaptadores de saliente T, que se usan posteriormente para capturar las moléculas adaptadoras plantilla en la superficie de una célula de flujo que está tachonada con anclajes de oligonucleótidos. El anclaje se usa como un cebador de PCR, pero debido a la longitud de la plantilla y su proximidad a otros oligonucleótidos de anclaje cercanos, la extensión mediante PCR da como resultado el "arqueamiento" de la molécula para hibridar con un oligonucleótido de anclaje adyacente para formar una estructura puente (y, después de varias rondas de amplificación, una agrupación) en la superficie de la célula de flujo. Estos giros de ADN están desnaturalizados y escindidos. Las cadenas directas se secuencian luego con terminadores de colorante reversibles. La secuencia de nucleótidos incorporados se determina mediante detección de fluorescencia posterior a la incorporación (por ejemplo, mediante proporciones de señales de diferencias), con cada flúor y bloque eliminado antes del siguiente ciclo de adición de dNTP. La longitud de lectura de secuencia varía de 36 nucleótidos a más de 50 nucleótidos, con una producción total que excede 1 billón de pares de nucleótidos por ejecución de análisis.
En algunas realizaciones, se usa una secuencia de calibración para diferenciar las proporciones de intensidades de señal asociadas con las bases. Por ejemplo, dicha secuencia de calibración comprende, en algunas realizaciones, cada una de las cuatro bases en un orden conocido, de tal manera que se calibra un instrumento de secuenciación para reconocer las intensidades de señal (debido a las proporciones de marcadores) esperadas para cada una de las bases complementarias al secuencia de calibración. En algunas realizaciones, la secuencia de calibración está unida al comienzo de cada ácido nucleico objetivo a secuenciar. En algunas realizaciones, la secuencia de calibración no está unida a la secuencia objetivo sino que se usa para calibrar el instrumento de secuenciación antes de adquirir la secuencia del ácido nucleico objetivo. En algunas realizaciones, la calibración se usa para más de una ejecución de secuenciación. La secuencia de calibración es de cualquier longitud que proporcione la calibración adecuada. En algunas realizaciones, la secuencia de calibración es de cuatro bases de longitud; en algunas realizaciones, la secuencia de calibración es de 5, 6, 7, 8, 9, 10, 16, 20, 24, 28, 32, 64, o más bases de longitud.
Algunas realizaciones proporcionan métodos para la detección de moléculas o el marcado de muestras usando reactivos de detección marcados con diferentes proporciones de por lo menos dos marcadores. Las diferencias en las proporciones de señal identifican las moléculas y diferencian las moléculas entre sí. Por ejemplo, algunos métodos comprenden poner en contacto una muestra (por ejemplo, una célula, tejido, fluido, etc.) con dos o más anticuerpos en donde cada anticuerpo está marcado en una proporción diferente con por lo menos dos fracciones; algunos métodos comprenden poner en contacto una muestra (por ejemplo, una célula, tejido, fluido, etc.) con dos o más sondas de oligonucleótidos marcadas en donde cada sonda está marcada en una proporción diferente con por lo menos dos fracciones. Los métodos comprenden diferenciar dos o más moléculas, muestras, tejidos, células, etc. entre asociando una diferencia en la proporción de señales con un reactivo de detección y por tanto con el objetivo del reactivo de detección.
Composiciones
La tecnología proporciona composiciones, por ejemplo, composiciones de bases de nucleótidos solos o en combinación (por ejemplo, una mezcla) en donde la proporción de marcado difiere en por lo menos dos de las bases. Como se ha indicado anteriormente, la proporción de señales producidas y detectadas durante la reacción de SBS varía proporcionalmente con la proporción de marcador para cada base. Por ejemplo, una proporción de marcador de 2:1 produce una señal en dos longitudes de onda con una proporción de intensidades de señal de 2:1 (por ejemplo, alturas de picos).
En algunas realizaciones, la proporción de marcador difiere entre las cuatro bases, permitiendo diferenciar cada base de las otras tres, por ejemplo, a medida que cada base se incorpora en una reacción de SBS de conjuntos y se produce una señal. Como se usa en la presente, la "proporción de marcador" se refiere a las fracciones relativas de moléculas base de un tipo que están marcadas. La proporción de marcador puede ser cualquier proporción que permita que una base se distinga de otra base marcada a una segunda proporción de marcador. Por ejemplo, si el número de moléculas de base A individuales (por ejemplo, en una solución) es 100 y el número de moléculas de base A individuales que están marcadas con la marcador X es 50 y el número de moléculas de base A individuales que están marcadas con la marcador Y es 50, entonces la proporción de marcador para A es 1 ;1. En esta realización ejemplar, las proporciones de marcador para las otras tres bases C, G y T son 1:2, 2:1 y 1:0, respectivamente. Varias realizaciones proporcionan proporciones de marcador distintas de estos valores ejemplares. De hecho, se contempla cualquier combinación de proporción de marcador por la tecnología siempre que las cuatro bases se puedan distinguir entre sí en base a las diferencias en las proporciones de marcador y las proporciones posteriores de las señales producidas en una reacción de SBS. En varias realizaciones, cualquiera de las cuatro bases se marca a una proporción que es 1:0, 1:3, 1:2, 1:1, 2:1, 3:1, y 0:1 con dos marcadores, siempre que las proporciones sean suficientes para diferenciar las bases entre sí.
Las composiciones proporcionadas por la presente tecnología incluyen soluciones de cuatro bases en donde por lo menos dos bases están marcadas con diferentes proporciones de por lo menos dos marcadores. Las realizaciones de las composiciones comprenden generalmente un tampón conocido en la técnica y opcionalmente comprenden otras sales y conservantes conocidos por los expertos en la técnica, por ejemplo, para mantener la estabilidad de la composición. Varias realizaciones incluyen composiciones que comprenden una base o mezclas de 2, 3, 4, o más bases. Las bases en estas composiciones se marcan en diferentes proporciones con marcadores diferentes usando esquemas de identificación como se ha tratado anteriormente.
Algunas realizaciones proporcionan una composición que comprende un oligonucleótido de calibración que comprende o que consiste de una secuencia conocida de bases. En algunas realizaciones, el oligonucleótido de calibración comprende o consiste de 4, 5, 6, 7, 8 o más bases cuya secuencia es conocida. El oligonucleótido está, en algunas realizaciones, sintetizado químicamente.
Análisis de los datos
Algunas realizaciones comprenden un sistema informático sobre el que pueden implementarse las realizaciones de las presentes enseñanzas. En varias realizaciones, un sistema informático incluye un bus u otro mecanismo de comunicación para comunicar información y un procesador acoplado con el bus para procesar información. En varias realizaciones, el sistema informático incluye una memoria, que puede ser una memoria de acceso aleatorio (RAM), u otro dispositivo de almacenamiento dinámico, acoplado al bus para identificar bases (por ejemplo, haciendo "llamadas de bases"), e instrucciones para ser ejecutadas por el procesador. La memoria también puede usarse para almacenar variables temporales u otra información intermedia durante la ejecución de las instrucciones a ser ejecutadas por el procesador. En varias realizaciones, el sistema informático puede incluir además una memoria de solo lectura (ROM) u otro dispositivo de almacenamiento estático acoplado al bus para almacenar información estática e instrucciones para el procesador. Puede proporcionarse un dispositivo de almacenamiento, como un disco magnético o disco óptico, y acoplarlo al bus para almacenar información e instrucciones.
En varias realizaciones, el sistema informático se acopla a través del bus a una pantalla, como un tubo de rayos catódicos (CRT) o una pantalla de cristal líquido (LCD), para mostrar información a un usuario del ordenador. Un dispositivo de entrada, incluyendo teclas alfanuméricas y otras, pueden acoplarse al bus para comunicar información y selecciones de comandos al procesador. Otro tipo de dispositivo de entrada del usuario es un control de cursor, como un ratón, una rueda de desplazamiento, o teclas de dirección del cursor para comunicar información de dirección y selecciones de comandos al procesador y para controlar el movimiento del cursor en la pantalla. Este dispositivo de entrada tiene típicamente dos grados de libertad en dos ejes, un primer eje (por ejemplo, x) y un segundo eje (por ejemplo, y), que le permite al dispositivo especificar posiciones en un plano.
Un sistema informático puede realizar realizaciones de la presente tecnología. De acuerdo con ciertas implementaciones de las presentes enseñanzas, pueden proporcionarse resultados por el sistema informático en respuesta a que el procesador ejecute una o más secuencias de una o más instrucciones contenidas en la memoria. Tales instrucciones se pueden leer en la memoria desde otro medio legible por ordenador, como un dispositivo de almacenamiento. La ejecución de las secuencias de instrucciones contenidas en la memoria puede hacer que el procesador realice los métodos descritos en la presente. Alternativamente, puede usarse una circuitería de cable físico en lugar de o en combinación con instrucciones de software para implementar las presentes enseñanzas. Por tanto, las implementaciones de las presentes enseñanzas no están limitadas a ninguna combinación específica de circuitos de hardware y software.
El término "medio legible por ordenador" como se usa en la presente se refiere a cualquier medio que participe en la provisión de instrucciones al procesador para su ejecución. Tal medio puede tomar muchas formas, incluyendo pero no limitado a, medios no volátiles, medios volátiles y medios de transmisión. Los ejemplos de medios no volátiles pueden incluir, pero no están limitados a, discos ópticos o magnéticos. Los ejemplos de medios volátiles pueden incluir, pero no están limitados a, memoria dinámica y flash. Los ejemplos de medios de transmisión pueden incluir, pero no están limitados a, cables coaxiales, cable de cobre, y fibras ópticas, incluyendo los cables que componen el bus.
Las formas comunes de medios legibles por ordenador incluyen, por ejemplo, un disquete, un disco flexible, disco duro, cinta magnética o cualquier otro medio magnético, un CD-ROM, cualquier otro medio óptico, tarjetas perforadas, cinta de papel, cualquier otro medio físico con patrones de orificios, una RAM, PROM, y EPROM, un FLASH-EPROM, cualquier otro chip o cartucho de memoria, o cualquier otro medio tangible del que pueda leer un ordenador.
Varias formas de medios legibles por ordenador pueden estar implicadas en llevar una o más secuencias de una o más instrucciones al procesador para su ejecución. Por ejemplo, las instrucciones pueden llevarse inicialmente en el disco magnético de un ordenador remoto. El ordenador remoto puede cargar las instrucciones en su memoria dinámica y enviar las instrucciones a través de una conexión de red (por ejemplo, una LAN, una WAN, Internet, una línea telefónica). Un sistema informático local puede recibir los datos y transmitirlos al bus. El bus puede llevar los datos a la memoria, de la que el procesador recupera y ejecuta las instrucciones. Las instrucciones recibidas por la memoria pueden almacenarse opcionalmente en un dispositivo de almacenamiento ya sea antes o después de la ejecución por parte del procesador.
De acuerdo con varias realizaciones, las instrucciones configuradas para ser ejecutadas por un procesador para realizar un método se almacenan en un medio legible por ordenador. El medio legible por ordenador puede ser un dispositivo que almacena información digital. Por ejemplo, un medio legible por ordenador incluye una memoria de solo lectura de disco compacto (CD-ROM) como se conoce en la técnica para almacenar software. Al medio legible por ordenador se accede mediante un procesador adecuado para ejecutar instrucciones configuradas para ejecutarse.
De acuerdo con dicho sistema informático, algunas realizaciones de la tecnología proporcionada en la presente comprenden además funcionalidades para recoger, almacenar y/o analizar datos (por ejemplo, datos de secuencias de nucleótidos). Por ejemplo, algunas realizaciones contemplan un sistema que comprende un procesador, una memoria y/o una base de datos para, por ejemplo, almacenar y ejecutar instrucciones, analizar datos de imágenes de una reacción de SBS, realizar cálculos usando los datos, transformar los datos y almacenarlos los datos. En algunas realizaciones, un algoritmo de llamada base asigna una secuencia de bases a los datos y asocia puntuaciones de calidad a llamadas base en base a un modelo estadístico. En algunas realizaciones, el sistema está configurado para ensamblar una secuencia a partir de múltiples sub-secuencias, en algunos casos teniendo en cuenta la superposición y calculando una secuencia de consenso. En algunas realizaciones, una secuencia determinada a partir de una reacción de SBS se alinea con una secuencia de referencia o con un supercóntigo.
Muchos diagnósticos implican determinar la presencia de, o una secuencia de nucleótidos de, uno o más ácidos nucleicos. Por tanto, en algunas realizaciones, una ecuación que comprende variables que representan la presencia o las propiedades de secuencia de múltiples ácidos nucleicos produce un valor que encuentra uso en la elaboración de un diagnóstico o en la evaluación de la presencia o las cualidades de un ácido nucleico. Como tal, en algunas realizaciones este valor se presenta mediante un dispositivo, por ejemplo, mediante un indicador relacionado con el resultado (por ejemplo, un LED, un icono en una LCD, un sonido o similar). En algunas realizaciones, un dispositivo almacena el valor, transmite el valor o usa el valor para cálculos adicionales.
Además, en algunas realizaciones, un procesador está configurado para controlar las reacciones de secuenciación y recoger los datos (por ejemplo, imágenes). En algunas realizaciones, el procesador se usa para iniciar y/o finalizar cada ronda de secuenciación y recogida de datos referentes a una reacción de secuenciación. Algunas realizaciones comprenden un procesador configurado para analizar el conjunto de datos de las proporciones de señales adquiridas durante la reacción de SBS y discernir la secuencia del ácido nucleico objetivo y/o de su complemento.
En algunas realizaciones, el procesador usa un dispositivo que comprende una interfaz de usuario (por ejemplo, un teclado, botones, diales, conmutadores y similares) para recibir la entrada del usuario para dirigir una medición. En algunas realizaciones, el dispositivo comprende además una salida de datos para transmitir (por ejemplo, mediante una conexión por cable o inalámbrica) datos a un destino externo, por ejemplo, un ordenador, una pantalla, una red y/o un medio de almacenamiento externo.
En algunas realizaciones, la tecnología encuentra uso en el ensayo de la presencia de uno o más ácidos nucleicos y/o proporcionar la secuencia de uno o más ácidos nucleicos. Por consiguiente, la tecnología proporcionada en la presente encuentra uso en los campos médico, clínico y de medicina de emergencia. En algunas realizaciones, se usa un dispositivo para analizar muestras biológicas. En tal ensayo, la muestra biológica comprende un ácido nucleico y la secuenciación del ácido nucleico es indicativa de un estado o una propiedad de la muestra y, en algunas realizaciones, del sujeto del que se tomó la muestra. Algunas muestras relevantes incluyen, pero no están limitadas a, sangre total, linfa, plasma, suero, saliva, orina, heces, sudoración, moco, lágrimas, líquido cefalorraquídeo, secreción nasal, secreción cervical o vaginal, semen, líquido pleural, líquido amniótico, líquido peritoneal, líquido del oído medio, líquido articular, aspirado gástrico, homogeneizado tisular, homogeneizado celular o similares.
La secuencia de señales de salida proporciona la secuencia del ADN sintetizado y, por las reglas de complementariedad de bases, también proporciona por tanto la secuencia de la cadena plantilla.
Aparatos
Un aspecto adicional de la invención proporciona un aparato para llevar a cabo los métodos o para preparar las composiciones de la tecnología. Tal aparato podría comprender, por ejemplo, una pluralidad de plantillas y cebadores de ácidos nucleicos unidos, preferiblemente covalentemente, a un soporte sólido, junto con una polimerasa de ácido nucleico, una pluralidad de nucleótidos o análogos de nucleótidos como los descritos anteriormente, y una funcionalidad para controlar la temperatura y/o las adiciones de nucleótidos. Preferiblemente, el aparato también comprende una funcionalidad de detección para detectar y distinguir señales de agrupaciones de ácidos nucleicos individuales. Dicha funcionalidad de detección podría comprender un dispositivo acoplado a carga conectado operativamente a un dispositivo de amplificación como un microscopio. Preferiblemente, cualquier aparato de la invención se proporciona en una forma automatizada, por ejemplo, bajo el control de un programa de pasos y decisiones, por ejemplo, como se implementa en un software informático.
Algunas realizaciones de dicho aparato incluyen una unidad de administración y control de fluidos; una unidad de procesamiento de muestra; una unidad de detección de señales; y una unidad de adquisición, análisis y control de datos. Varias realizaciones del aparato pueden proporcionar una secuenciación automatizada que puede usarse para recopilar información de secuencia de una pluralidad de secuencias en paralelo, por ejemplo, sustancialmente de forma simultánea.
En varias realizaciones, la unidad de administración y control de fluidos incluye un sistema de administración de reactivos. El sistema de administración de reactivos puede incluir un depósito de reactivos para el almacenamiento de varios reactivos (por ejemplo, composiciones de nucleótidos o análogos de nucleótidos de acuerdo con la tecnología). Los reactivos pueden incluir cebadores basados en ARN, cebadores de ADN directos/inversos, mezclas de oligonucleótidos para la secuenciación por ligamiento, mezclas de nucleótidos para secuenciación por síntesis, tampones, reactivos de lavado, reactivo de bloqueo, reactivos de agotamiento y similares. Adicionalmente, el sistema de administración de reactivos puede incluir un sistema de pipeteo o un sistema de flujo continuo que conecta la unidad de procesamiento de muestra con el depósito de reactivos.
En varias realizaciones, la unidad de procesamiento de muestras puede incluir una cámara de muestra, como una celda de flujo, un sustrato, una micromatriz, una bandeja de múltiples pocillos o similar. La unidad de procesamiento de muestras puede incluir múltiples carriles, múltiples canales, múltiples pocillos, u otros modos de procesamiento de conjuntos de muestras múltiples de manera sustancialmente simultánea. Adicionalmente, la unidad de procesamiento de muestras puede incluir múltiples cámaras de muestras para permitir el procesamiento de múltiples ejecuciones simultáneamente. En realizaciones particulares, el sistema puede realizar la detección de señales en una cámara de muestras a la vez que procesa sustancialmente de manera simultánea otra cámara de muestras. Adicionalmente, la unidad de procesamiento de muestras puede incluir un sistema de automatización para mover o manipular la cámara de muestras.
En varias realizaciones, la unidad de detección de señales puede incluir un sensor de obtención de imágenes o detección. La unidad de detección de señales puede incluir un sistema de excitación para provocar que una sonda, como un colorante fluorescente, emita una señal. El sistema de excitación puede incluir una fuente de iluminación, como una lámpara de arco, un láser, un diodo emisor de luz (LED) o similar. En realizaciones particulares, la unidad de detección de señales puede incluir óptica para la transmisión de luz desde una fuente de iluminación a la muestra o desde la muestra al sensor de obtención de imágenes o detección. Alternativamente, la unidad de detección de señales puede no incluir una fuente de iluminación, como, por ejemplo, cuando se produce una señal espontáneamente como resultado de una reacción de secuenciación. Por ejemplo, una señal puede producirse por la interacción de una fracción liberada, como un ion liberado que interactúa con una capa sensible a iones, o un pirofosfato que reacciona con una enzima u otro catalizador para producir una señal quimioluminiscente.
En varias realizaciones, una unidad de análisis y control de adquisición de datos puede monitorizar varios parámetros del sistema. Los parámetros del sistema pueden incluir la temperatura de varias partes del instrumento, como una unidad de procesamiento de muestras o depósitos de reactivos, volúmenes de varios reactivos, el estado de varios subcomponentes del sistema, como un manipulador, un motor a pasos, una bomba o similares, o cualquier combinación de los mismos.
Un experto en la técnica apreciará que pueden usarse varias realizaciones de dicho instrumento para poner en práctica una variedad de métodos de secuenciación que incluyen métodos basados en ligamiento, secuenciación por síntesis, métodos de moléculas individuales y otras técnicas de secuenciación. La secuenciación por ligamiento puede incluir técnicas de ligamiento único, o técnicas de ligamiento de cambio donde se realizan múltiples ligamientos en secuencia en un único primario. La secuenciación por síntesis puede incluir la incorporación de nucleótidos marcados con colorante, terminación de cadena o similares. Las técnicas de moléculas individuales pueden incluir secuenciación escalonada, donde las reacciones de secuenciación se pausan para determinar la identidad del nucleótido incorporado.
En varias realizaciones, el instrumento de secuenciación puede determinar la secuencia de un ácido nucleico, como un polinucleótido o un oligonucleótido. El ácido nucleico puede incluir ADN o ARN, y puede ser de cadena sencilla, como ADNmc y ARN, o de cadena doble, como ADNcd o un par de ARN/ADNc. En varias realizaciones, el ácido nucleico puede incluir o derivarse de una biblioteca de fragmentos, una biblioteca de parejas acopladas, un fragmento ChIP, o similar. En realizaciones particulares, el instrumento de secuenciación puede obtener la información de secuencia de un grupo de moléculas de ácido nucleico sustancialmente idénticas.
En varias realizaciones, el instrumento de secuenciación puede producir datos de lectura de la secuenciación de ácidos nucleicos en una variedad de diferentes tipos/formatos de archivos de datos de salida, incluyendo, pero no limitados a: *.fasta, *.csfasta, *seq.txt, *qseq.txt, *.fastq, *.sff, *prb.txt, *.sms, *srs y/o *.qv.
Algunas realizaciones comprenden un sistema para reconstruir una secuencia de ácido nucleico de acuerdo con las varias realizaciones proporcionadas en la presente. El sistema puede incluir un secuenciador de ácidos nucleicos, un almacenamiento de datos de secuencias de la muestra, un almacenamiento de datos de secuencias de referencia y un dispositivo/servidor/nodo de computación analítica. En varias realizaciones, el dispositivo/servidor/nodo de computación analítica puede ser una estación de trabajo, un ordenador central, un ordenador personal, un dispositivo móvil, etc.
El secuenciador de ácidos nucleicos puede configurarse para analizar (por ejemplo, interrogar) un fragmento de ácido nucleico (por ejemplo, fragmento individual, fragmento de pareja acoplada, fragmento de extremo emparejado, etc.) utilizando todas las variedades apropiadas de técnicas, plataformas o tecnologías para obtener información de la secuencia de ácido nucleico, por ejemplo, usando una secuenciación de conjuntos por síntesis. En varias realizaciones, el secuenciador de ácidos nucleicos puede estar en comunicación con el almacenamiento de datos de secuencia de muestra directamente a través de un cable de datos (por ejemplo, un cable en serie, una conexión de cable directa, etc.) o enlace de bus o, alternativamente, a través de una conexión de red (por ejemplo, Internet, LAN, WAN, VPN, etc.). En varias realizaciones, la conexión de red puede ser una conexión física "cableada". Por ejemplo, el secuenciador de ácidos nucleicos puede estar conectado de forma comunicativa (a través de Categoría 5 (CAT5), fibra óptica, o cableado equivalente) a un servidor de datos que puede conectarse de forma comunicativa (a través de CAT5, fibra óptica o cableado equivalente) a través de Internet y al almacenamiento de datos de secuencias de muestra. En varias realizaciones, la conexión de red puede ser una conexión de red inalámbrica (por ejemplo, Wi-Fi, WLAN, etc.), por ejemplo, utilizando un formato de transmisión 802.11 b/g o equivalente. En la práctica, la conexión de red utilizada depende de los requisitos particulares del sistema. En varias realizaciones, el almacenamiento de datos de secuencias de muestra puede ser una parte integrada del secuenciador de ácidos nucleicos.
En varias realizaciones, el almacenamiento de datos de secuencias de muestra puede ser cualquier dispositivo, sistema o implementación de almacenamiento de bases de datos (por ejemplo, partición de almacenamiento de datos, etc.) que esté configurado para organizar y almacenar datos de lecturas de secuencias de ácidos nucleicos generados por el secuenciador de ácidos nucleicos de tal manera que los datos pueden buscarse y recuperarse manualmente (por ejemplo, por un administrador de bases de datos/operador de cliente) o automáticamente a través de un programa informático/aplicación/script de software. En varias realizaciones, el almacenamiento de datos de referencia puede ser cualquier dispositivo de base de datos, sistema de almacenamiento, o implementación (por ejemplo, partición de almacenamiento de datos, etc.) que esté configurado para organizar y almacenar secuencias de referencia (por ejemplo, genoma completo/parcial, exoma completo/parcial, etc.) de tal manera que los datos puedan buscarse y recuperarse manualmente (por ejemplo, por un administrador de bases de datos/operador de cliente) o automáticamente a través de un programa informático/aplicación/script de software. En varias realizaciones, los datos de lecturas de secuencias de ácidos nucleicos de muestra pueden almacenarse en el almacenamiento de datos de secuencias de muestra y/o el almacenamiento de datos de referencia en una variedad de tipos/formatos de archivos de datos diferentes, incluyendo, pero no limitados a: *.fasta, *.csfasta, *seq.txt, *qseq.txt, *.fastq, *.sff, *prb.txt, *.sms, *srs y/o *.qv.
En varias realizaciones, el almacenamiento de datos de secuencias de muestra y el almacenamiento de datos de referencia son dispositivos/sistemas autónomos independientes o implementados en diferentes dispositivos. En varias realizaciones, el almacenamiento de datos de secuencias de muestra y el almacenamiento de datos de referencia se implementan en el mismo dispositivo/sistema. En varias realizaciones, el almacenamiento de datos de secuencias de muestra y/o el almacenamiento de datos de referencia pueden implementarse en el dispositivo/servidor/nodo de computación analítica.
El dispositivo/servidor/nodo de computación analítica puede estar en comunicación con el almacenamiento de datos de secuencias de muestra y el almacenamiento de datos de referencia directamente a través de un cable de datos (por ejemplo, cable serial, conexión de cable directo, etc.) o enlace de bus o, alternativamente, a través de una conexión de red (por ejemplo, Internet, LAN, WAN, VPN, etc.). En varias realizaciones, el dispositivo/servidor/nodo de computación analítica puede alojar un motor de mapeo de referencia, un módulo de mapeo de novo y/o un motor de análisis terciario. En varias realizaciones, el motor de mapeo de referencia puede configurarse para obtener lecturas de secuencias de ácidos nucleicos de muestra del almacenamiento de datos de muestra y mapearlas contra una o más secuencias de referencia obtenidas del almacenamiento de datos de referencia para ensamblar las lecturas en una secuencia que es similar pero no necesariamente idéntica a la secuencia de referencia usando todas las variedades de técnicas y métodos de mapeo/alineación de referencia. La secuencia reensamblada puede luego analizarse adicionalmente mediante uno o más motores de análisis terciarios opcionales para identificar diferencias en la composición genética (genotipo), expresión génica o estado epigenético de los individuos que pueden dar como resultado grandes diferencias en las características físicas (fenotipo). Por ejemplo, en varias realizaciones, el motor de análisis terciario puede configurarse para identificar varias variantes genómicas (en la secuencia ensamblada) debidas a mutaciones, recombinación/cruce, o deriva genética. Los ejemplos de tipos de variantes genómicas incluyen, pero no están limitados a: polimorfismos de nucleótido único (SNP), variaciones en el número de copias (CNV), inserciones/deleciones (Indels), inversiones, etc.
El módulo de mapeo de novo opcional puede configurarse para ensamblar lecturas de secuencias de ácidos nucleicos de muestra a partir del almacenamiento de datos de muestras en secuencias nuevas y previamente desconocidas.
Debe entenderse, sin embargo, que los varios motores y módulos alojados en el dispositivo/servidor/nodo de computación analítica pueden combinarse o contraerse en un único motor o módulo, dependiendo de los requisitos de la aplicación particular o de la arquitectura del sistema. Además, en varias realizaciones, el dispositivo/servidor/nodo de computación analítica puede alojar motores o módulos adicionales según lo necesite la aplicación particular o la arquitectura del sistema.
En varias realizaciones, los motores de mapeo y/o de análisis terciario están configurados para procesar las lecturas de secuencias de ácidos nucleicos y/o de referencia en el espacio de proporción de señal. En varias realizaciones, los datos de lecturas de secuenciación de ácidos nucleicos de muestra y secuencias referenciadas pueden suministrarse al dispositivo/servidor/nodo de computación analítica en una variedad de tipos/formatos de archivos de datos de entrada diferentes, incluyendo, pero no limitados a: *.fasta, *.csfasta, *seq.txt, *qseq.txt, *.fastq, *.sff, *prb.txt, *.sms, *srs y/o *.qv.
Usos
La tecnología proporciona el uso de los métodos de la tecnología, o las composiciones de la tecnología, para secuenciar y/o re-secuenciar moléculas de ácido nucleico para la monitorización la expresión génica, elaborar perfiles de diversidad genética, diagnóstico, selección, secuenciación del genoma completo, descubrimiento y puntuación de polimorfismos del genoma completo, o cualquier otra aplicación que implique el análisis de ácidos nucleicos donde cuando la información de secuencia o de secuencia parcial sea relevante.
Kits
Un aspecto adicional de la invención proporciona un kit para su uso en la secuenciación, re-secuenciación, monitorización de la expresión génica, elaboración de perfiles de diversidad genética, diagnóstico, selección, secuenciación del genoma completo, descubrimiento y puntuación de polimorfismos del genoma completo o cualquier otra aplicación que implique la secuenciación de ácidos nucleicos. En algunas realizaciones, los kits comprenden por lo menos una pluralidad de un nucleótido marcado con por lo menos dos marcadores y, opcionalmente, un oligonucleótido de calibración que comprende una secuencia conocida. En algunas realizaciones, se proporciona un kit para la detección de moléculas usando reactivos de detección marcados con diferentes proporciones de marcadores. Las diferencias en la identificación de las proporciones de señales identifican las moléculas y diferencian las moléculas entre sí. Por ejemplo, algunos kits comprenden un anticuerpo marcado con por lo menos dos marcadores a una proporción definida; algunos kits comprenden una sonda de oligonucleótido marcada con por lo menos dos marcadores a una proporción definida.
Además, los procesos y sistemas para secuenciación que pueden adaptarse para su uso con la tecnología se describen en, por ejemplo, la Patentes de Estados Unidos N° 7.405.281, titulada "Fluorescent nucleotide analogs and uses therefor", expedida el 29 de julio de 2008 a Xu et al.; 7.315.019, titulada "Arrays of optical confinements and uses thereof", expedida el 1 de enero de 2008 a Turner et al.; 7.313.308, titulada "Optical analysis of molecules", expedida el 25 de diciembre de 2007 a Turner et al.; 7.302.146, titulada "Apparatus and method for analysis of molecules", expedida el 27 de noviembre de 2007 a Turner et al.; y 7.170.050, titulada "Apparatus and methods for optical analysis of molecules", expedida el 30 de enero de 2007 a Turner et al.; y las Publicaciones de Patente de Estados Unidos N°. 20080212960, titulada Methods and systems for simultaneous real-time monitoring of optical signals from multiple sources", presentada el 26 de octubre de 2007 por Lundquist et al.; 20080206764, titulada "Flowcell system for single molecule detection", presentada el 26 de octubre de 2007 por Williams et al.; 20080199932, titulada "Active surface coupled polymerases", presentada el 26 de octubre de 2007 por Hanzel et al.; 20080199874, titulada "CONTROLLABLE STRAND SCISSION OF MINI CIRCLE DNA", presentada el 11 de febrero de 2008 por Otto et al.; 20080176769, titulada ""Articles having localized molecules disposed thereon and methods of producing same", presentada el 26 de octubre de 2007 por Rank et al.; 20080176316, titulada "Mitigation of photodamage in analytical reactions", presentada el 31 de octubre de 2007 por Eid et al.; 20080176241, titulada "Mitigation of photodamage in analytical reactions", presentada el 31 de octubre de 2007 por Eid et al.; 20080165346, titulada "Methods and systems for simultaneous real-time monitoring of optical signals from multiple sources", presentada el 26 de octubre de 2007 por Lundquist et al.; 20080160531, titulada "Uniform surfaces for hybrid material substrates and methods for making and using same", presentada el 31 de octubre de 2007 por Korlach; 20080157005, titulada "Methods and systems for simultaneous realtime monitoring of optical signals from multiple sources" presentada el 26 de octubre de 2007 por Lundquist et al.; 20080153100, titulada "Articles having localized molecules disposed thereon and methods of producing same", presentada el 31 de octubre del 2007 por Rank et al.; 20080153095, titulado "CHARGE SWITCH NUCLEOTIDES", presentada el 26 de octubre de 2007 por Williams et al.; 20080152281, titulada "Substrates, systems and methods for analyzing materials", presentada el 31 de octubre de 2007 por Lundquist et al.; 20080152280, titulada "Substrates, systems and methods for analyzing materials", presentada el 31 de octubre de 2007 por Lundquist et al.; 20080145278, titulada "Uniform surfaces for hybrid material substrates and methods for making and using same", presentada el 31 de octubre de 2007 por Korlach; 20080128627, titulada "SUBSTRATES, SYSTEMS AND METHODS FOR ANALYZING MATERIALS", presentada el 31 de agosto de 2007 por Lundquist et al.; 20080108082, titulada "Polymerase enzymes and reagents for enhanced nucleic acid sequencing", presentada el 22 de octubre de 2007 por Rank et al.; 20080095488, titulada "SUBSTRATES FOR PERFORMING ANALYTICAL REACTIONS", presentada el 11 de junio de 2007 por Foquet et al.; 20080080059, titulada "MODULAR OPTICAL COMPONENTS AND SYSTEMS INCORPORATING SAME", presentada el 27 de septiembre de 2007 por Dixon et al.; 20080050747, titulada "Articles having localized molecules disposed thereon and methods of producing and using same", presentada el 14 de agosto de 2007 por Korlach et al.; 20080032301, titulada "Articles having localized molecules disposed thereon and methods of producing same", presentada el 29 de marzo de 2007 por Rank et al.; 20080030628, titulada "Methods and systems for simultaneous real-time monitoring of optical signals from multiple sources", presentada el 9 de febrero de 2007 por Lundquist et al.; 20080009007, titulada "CONTROLLED INITIATION OF PRIMER EXTENSION", presentada el 15 de junio de 2007 por Lyle et al.; 20070238679, titulada "Articles having localized molecules disposed thereon and methods of producing same", presentada el 30 de marzo de 2006 por Rank et al.; 20070231804, titulada "Methods, systems and compositions for monitoring enzyme activity and applications thereof", presentada el 31 de marzo de 2006 por Korlach et al., 20070206187, titulada "Methods and systems for simultaneous real-time monitoring of optical signals from multiple sources", presentada el 9 de febrero de 2007 por Lundquist et al., 20070196846, titulada "Polymerases for nucleotide analogue incorporation", presentada el 21 de diciembre de 2006 por Hanzel et al.; 20070188750, titulada "Methods and systems for simultaneous real-time monitoring of optical signals from multiple sources", presentada el 7 de julio, 2006 por Lundquist et al.; 20070161017, titulada "MITIGATION OF PHOTODAMAGE IN ANALYTICAL REACTIONS", presentada el 1 de diciembre de 2006 por Eid et al.; 20070141598, titulada "Nucleotide Compositions and Uses Thereof", presentada el 3 de noviembre de 2006 por Turner et al.; 20070134128, titulada "Uniform surfaces for hybrid material substrate and methods for making and using same", presentada el 27 de noviembre de 2006 por Korlach; 20070128133, titulada "Mitigation of photodamage in analytical reactions", presentada el 2 de diciembre de 2005 por Eid et al.; 20070077564, titulada "Reactive surfaces, substrates and methods of producing same", presentada el 30 de septiembre de 2005 por Roitman et al.; 20070072196, titulada "Fluorescent nucleotide analogs and uses therefore", presentada el 29 de septiembre de 2005 por Xu et al; y 20070036511, titulada "Methods and systems for monitoring multiple optical signals from a single source", presentada el 11 de agosto de 2005 por Lundquist et al.; y Korlach et al. (2008) "Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nanostructures" PNAS 105(4): 1176-81.
Varias modificaciones y variaciones de las composiciones, métodos y usos de la tecnología descritos serán evidentes para los expertos en la técnica sin apartarse del alcance y el espíritu de la tecnología tal como se describe. Aunque la tecnología se ha descrito en relación con realizaciones ejemplares específicas, debe entenderse que la invención tal como se reivindica no debería limitarse indebidamente a tales realizaciones específicas. De hecho, varias modificaciones de los modos descritos para llevar a cabo la invención que son obvias para los expertos en los campos relacionados se pretende que estén dentro del alcance de las reivindicaciones siguientes.

Claims (14)

REIVINDICACIONES
1. Un método para secuenciar un ácido nucleico objetivo usando un enfoque de secuenciación por síntesis (SBS), el método comprendiendo:
a) proporcionar una primera pluralidad de una primera base de nucleótidos, una segunda pluralidad de una segunda base de nucleótidos, una tercera pluralidad de una tercera base de nucleótidos, y una cuarta pluralidad de una cuarta base de nucleótidos, en donde:
(1) una primera proporción de una primera porción de la primera pluralidad marcada con un primer marcador en relación a una segunda porción de la primera pluralidad marcada con un segundo marcador; y
(2) una segunda proporción de una tercera porción de la segunda pluralidad marcada con el primer marcador en relación con una cuarta porción de la segunda pluralidad marcada con el segundo marcador, son detectablemente diferentes entre sí;
b) incorporar mediante polimerización la primera pluralidad de la primera base de nucleótidos, la segunda pluralidad de la segunda base de nucleótidos, la tercera pluralidad de la tercera base de nucleótidos, o la cuarta pluralidad de la cuarta base de nucleótidos en una pluralidad de copias de un ácido nucleico que es complementario al ácido nucleico objetivo;
c) determinar una proporción de señales producida a partir de la primera pluralidad de la primera base de nucleótidos o una proporción de señales producida a partir de la segunda pluralidad de la segunda base de nucleótidos en la pluralidad de copias de un ácido nucleico que es complementario al ácido nucleico objetivo, en donde una primera proporción de señales producida por la primera pluralidad de la primera base de nucleótidos es detectablemente diferente de una segunda proporción de señales producida por la segunda pluralidad de la segunda base de nucleótidos y en donde la proporción de señales producida a partir de la primer pluralidad se produce por al menos dos marcadores que emiten dos longitudes de onda distinguibles y la proporción de señales producida a partir de la segunda pluralidad se produce por al menos dos marcadores que emiten dos longitudes de onda distinguibles;
d) asociar la proporción de señales o señal con la primera base de nucleótidos o la segunda base de nucleótidos para identificar la base de nucleótidos en la pluralidad de copias de un ácido nucleico que es complementaria al ácido nucleico objetivo; y
e) analizar un conjunto de datos de proporciones de señales ordenadas para producir una secuencia de nucleótidos del ácido nucleico objetivo,
en donde el método de SBS es un enfoque de secuenciación basado en conjuntos la secuencia del ácido nucleico objetivo se determina detectando la señal producida después de cada incorporación de bases,
y en donde:
(i) cada uno de los nucleótidos comprende un grupo 3' hidroxilo que está bloqueado químicamente y los cuatro nucleótidos se añaden simultáneamente a una reacción que comprende ADN polimerasa y agrupaciones de complejos plantilla-cebador; o
(ii) cada nucleótido se añade uno a la vez a una mezcla de la reacción que contiene un complejo de objetivo de ácido nucleico-cebador y una polimerasa.
2. El método de la reivindicación 1 en donde:
(i) la primera porción de la primera pluralidad produce una primera señal que tiene una primera intensidad y la segunda porción de la primera pluralidad produce una segunda señal que tiene una segunda intensidad, y la primera proporción de señales producida por la primera pluralidad de la primera base de nucleótidos es una proporción de la primera intensidad con respecto a la segunda intensidad; y
(ii) la tercera porción de la segunda pluralidad produce una tercera señal que tiene una tercera intensidad y la cuarta porción de la segunda pluralidad produce una cuarta señal que tiene una cuarta intensidad y la segunda proporción de señales producida por la segunda pluralidad de la segunda base de nucleótidos es una proporción de la tercera intensidad con respecto a la cuarta intensidad.
3. El método de la reivindicación 2 en el que la primera intensidad es una primera amplitud de emisión de fluorescencia, la segunda intensidad es una segunda amplitud de emisión de fluorescencia, la tercera intensidad es una tercera amplitud de emisión de fluorescencia, y la cuarta intensidad es una cuarta amplitud de emisión de fluorescencia.
4. El método de la reivindicación 2 en el que:
(i) la primera intensidad es una primera altura de pico, la segunda intensidad es una segunda altura de pico, la tercera intensidad es una tercera altura de pico, y la cuarta intensidad es una cuarta altura de pico; (ii) la primera intensidad es una primera área de pico, la segunda intensidad es una segunda área de pico, la tercera intensidad es una tercera área de pico, y la cuarta intensidad es una cuarta área de pico; o
(iii) la primera intensidad es una primera anchura de pico a altura media, la segunda intensidad es una segunda anchura de pico a altura media, la tercera intensidad es una tercera anchura de pico a altura media, y la cuarta intensidad es una cuarta anchura de pico a altura media,
y en donde opcionalmente las proporciones de señales se corrigen usando un factor de corrección relacionado con una diferencia en la eficiencia de emisión molar para dos fracciones.
5. El método de la reivindicación 1 en el que:
(1) una primera proporción de una primera porción de la primera pluralidad marcada con un primer marcador con respecto a una segunda porción de la primera pluralidad marcada con un segundo marcador;
(2) una segunda proporción de una tercera porción de la segunda pluralidad marcada con el primer marcador con respecto a una cuarta porción de la segunda pluralidad marcada con el segundo marcador;
(3) una tercera proporción de una quinta porción de la tercera pluralidad marcada con el primer marcador con respecto a una sexta porción de la tercera pluralidad marcada con el segundo marcador;
(4) una cuarta proporción de una séptima porción de la cuarta pluralidad marcada con el primer marcador con respecto a una octava porción de la cuarta pluralidad marcada con el segundo marcador;
son todas detectablemente diferentes entre sí.
6. El método de la reivindicación 5 en el que la primera base de nucleótidos es A, la segunda base de nucleótidos es C, la tercera base de nucleótidos es G, y la cuarta base de nucleótidos es T.
7. El método de cualquier reivindicación anterior en el que el primer marcador es una primera fracción fluorescente con un pico de emisión a una primera longitud de onda y el segundo marcador es una segunda fracción fluorescente con un pico de emisión a una segunda longitud de onda.
8. El método de cualquier reivindicación anterior en el que cualquiera de las cuatro bases de nucleótidos está marcada a una proporción que es 1:0, 1:3, 1:2, 1:1,2:1,3:1, o 0:1 con dos marcadores, y en donde opcionalmente la proporción de los marcadores para A es 1:1, la proporción de los marcadores para C es 1:2, la proporción de los marcadores para G es 2:1 y la proporción de los marcadores para T es 1:0.
9. El método de cualquier reivindicación anterior que comprende además monitorizar un primer canal y un segundo canal, en donde el primer marcador produce una señal en el primer canal y el segundo marcador produce una señal en el segundo canal.
10. El método de la reivindicación 9 que comprende monitorizar con un dispositivo óptico.
11. El método de cualquier reivindicación anterior que comprende además proporcionar un oligonucleótido de calibración que comprende una secuencia conocida.
12. El método de la reivindicación 11 en el que la secuencia de calibración contiene cada una de las cuatro bases en un orden conocido, y en donde el método comprende además opcionalmente usar la secuencia de calibración para calibrar un instrumento de secuenciación para reconocer las proporciones de señales apropiadas para cada una de las bases.
13. El método de la reivindicación 11 o la reivindicación 12 en el que:
(i) la secuencia de calibración está unida al comienzo de cada ácido nucleico objetivo a secuenciar; o (ii) la secuencia de calibración no está unidad a la secuencia objetivo pero se usa para calibrar el instrumento de secuenciación antes de adquirir la secuencia del ácido nucleico objetivo.
14. El método de cualquier reivindicación anterior en donde la secuencia del ácido nucleico objetivo se determina detectando la proporción de las señales producidas por dos colorantes después de cada incorporación de bases.
ES18182487T 2012-05-02 2013-05-02 Secuenciación de ADN Active ES2840456T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201261641720P 2012-05-02 2012-05-02

Publications (1)

Publication Number Publication Date
ES2840456T3 true ES2840456T3 (es) 2021-07-06

Family

ID=49514892

Family Applications (2)

Application Number Title Priority Date Filing Date
ES13785056.6T Active ES2683978T3 (es) 2012-05-02 2013-05-02 Secuenciación de ADN
ES18182487T Active ES2840456T3 (es) 2012-05-02 2013-05-02 Secuenciación de ADN

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES13785056.6T Active ES2683978T3 (es) 2012-05-02 2013-05-02 Secuenciación de ADN

Country Status (4)

Country Link
US (2) US10544454B2 (es)
EP (3) EP3789502A1 (es)
ES (2) ES2683978T3 (es)
WO (1) WO2013166305A1 (es)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SI3623481T1 (sl) 2011-09-23 2022-01-31 Illumina, Inc. Sestavki za sekvenciranje nukleinske kisline

Family Cites Families (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4971903A (en) 1988-03-25 1990-11-20 Edward Hyman Pyrophosphate-based method and apparatus for sequencing nucleic acids
AU3816993A (en) * 1992-03-19 1993-10-21 Regents Of The University Of California, The Multiple tag labeling method for DNA sequencing
GB9210168D0 (en) 1992-05-12 1992-06-24 Cemu Bioteknik Ab Method of sequencing dna
US5714330A (en) 1994-04-04 1998-02-03 Lynx Therapeutics, Inc. DNA sequencing by stepwise ligation and cleavage
US5695934A (en) 1994-10-13 1997-12-09 Lynx Therapeutics, Inc. Massively parallel sequencing of sorted polynucleotides
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
US6395524B2 (en) 1996-11-27 2002-05-28 University Of Washington Thermostable polymerases having altered fidelity and method of identifying and using same
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
US6511803B1 (en) 1997-10-10 2003-01-28 President And Fellows Of Harvard College Replica amplification of nucleic acid arrays
US6485944B1 (en) 1997-10-10 2002-11-26 President And Fellows Of Harvard College Replica amplification of nucleic acid arrays
AU737174B2 (en) 1997-10-10 2001-08-09 President & Fellows Of Harvard College Replica amplification of nucleic acid arrays
US6787308B2 (en) 1998-07-30 2004-09-07 Solexa Ltd. Arrayed biomolecules and their use in sequencing
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6232075B1 (en) 1998-12-14 2001-05-15 Li-Cor, Inc. Heterogeneous assay for pyrophosphate detection
EP1218543A2 (en) 1999-09-29 2002-07-03 Solexa Ltd. Polynucleotide sequencing
US6329178B1 (en) 2000-01-14 2001-12-11 University Of Washington DNA polymerase mutant having one or more mutations in the active site
WO2001068913A2 (en) * 2000-03-13 2001-09-20 Genset Nucleic acid detection method and system
US6436641B1 (en) * 2000-04-17 2002-08-20 Visible Genetics Inc. Method and apparatus for DNA sequencing
US6936702B2 (en) 2000-06-07 2005-08-30 Li-Cor, Inc. Charge-switch nucleotides
EP1975251A3 (en) 2000-07-07 2009-03-25 Visigen Biotechnologies, Inc. Real-time sequence determination
AU2003224836A1 (en) 2002-04-12 2003-10-27 Stratagene Dual-labeled nucleotides
ES2407681T3 (es) 2002-08-23 2013-06-13 Illumina Cambridge Limited Nucleótidos modificados para la secuenciación de polinucleótidos.
GB0324456D0 (en) * 2003-10-20 2003-11-19 Isis Innovation Parallel DNA sequencing methods
US8119336B2 (en) 2004-03-03 2012-02-21 Ibis Biosciences, Inc. Compositions for use in identification of alphaviruses
US7264934B2 (en) 2004-06-10 2007-09-04 Ge Healthcare Bio-Sciences Corp. Rapid parallel nucleic acid analysis
AU2005254984B2 (en) 2004-06-10 2008-10-16 Ge Healthcare Bio-Sciences Corp. Method for nucleic acid analysis
CA2579150C (en) 2004-09-17 2014-11-25 Pacific Biosciences Of California, Inc. Apparatus and method for analysis of molecules
US7170050B2 (en) 2004-09-17 2007-01-30 Pacific Biosciences Of California, Inc. Apparatus and methods for optical analysis of molecules
US20070048748A1 (en) 2004-09-24 2007-03-01 Li-Cor, Inc. Mutant polymerases for sequencing and genotyping
AU2006210553A1 (en) 2005-02-01 2006-08-10 Ab Advanced Genetic Analysis Corporation Reagents, methods and libraries for bead-based sequencing
US20070141598A1 (en) 2005-02-09 2007-06-21 Pacific Biosciences Of California, Inc. Nucleotide Compositions and Uses Thereof
US7805081B2 (en) 2005-08-11 2010-09-28 Pacific Biosciences Of California, Inc. Methods and systems for monitoring multiple optical signals from a single source
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
US7763423B2 (en) 2005-09-30 2010-07-27 Pacific Biosciences Of California, Inc. Substrates having low density reactive groups for monitoring enzyme activity
AU2006320739B2 (en) 2005-11-28 2012-03-29 Pacific Biosciences Of California, Inc. Uniform surfaces for hybrid material substrates and methods for making and using same
US7998717B2 (en) 2005-12-02 2011-08-16 Pacific Biosciences Of California, Inc. Mitigation of photodamage in analytical reactions
CA2633476C (en) 2005-12-22 2015-04-21 Pacific Biosciences Of California, Inc. Active surface coupled polymerases
AU2006330947B2 (en) 2005-12-22 2012-04-12 Pacific Biosciences Of California, Inc. Polymerases for nucleotide analogue incorporation
US7692783B2 (en) 2006-02-13 2010-04-06 Pacific Biosciences Of California Methods and systems for simultaneous real-time monitoring of optical signals from multiple sources
US7715001B2 (en) 2006-02-13 2010-05-11 Pacific Biosciences Of California, Inc. Methods and systems for simultaneous real-time monitoring of optical signals from multiple sources
US7995202B2 (en) 2006-02-13 2011-08-09 Pacific Biosciences Of California, Inc. Methods and systems for simultaneous real-time monitoring of optical signals from multiple sources
US20080050747A1 (en) 2006-03-30 2008-02-28 Pacific Biosciences Of California, Inc. Articles having localized molecules disposed thereon and methods of producing and using same
US8975216B2 (en) 2006-03-30 2015-03-10 Pacific Biosciences Of California Articles having localized molecules disposed thereon and methods of producing same
US7563574B2 (en) 2006-03-31 2009-07-21 Pacific Biosciences Of California, Inc. Methods, systems and compositions for monitoring enzyme activity and applications thereof
CA2654470C (en) 2006-06-12 2015-02-03 Pacific Biosciences Of California, Inc. Substrates for performing analytical reactions
WO2007147110A2 (en) 2006-06-16 2007-12-21 Pacific Biosciences Of California, Inc. Controlled initiation of primer extension
AU2007289057C1 (en) 2006-09-01 2014-01-16 Pacific Biosciences Of California, Inc. Substrates, systems and methods for analyzing materials
US20080080059A1 (en) 2006-09-28 2008-04-03 Pacific Biosciences Of California, Inc. Modular optical components and systems incorporating same
WO2008051530A2 (en) 2006-10-23 2008-05-02 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
US7932034B2 (en) 2006-12-20 2011-04-26 The Board Of Trustees Of The Leland Stanford Junior University Heat and pH measurement for sequencing of DNA
US8551704B2 (en) 2007-02-16 2013-10-08 Pacific Biosciences Of California, Inc. Controllable strand scission of mini circle DNA
EP2379748A4 (en) * 2008-12-23 2012-08-29 Illumina Inc MULTIBASE RELEASE FOR LONG READINGS IN SEQUENCING BY SYNTHESIS PROTOCOLS
WO2010117804A2 (en) * 2009-03-30 2010-10-14 The Regents Of The University Of California Mostly natural dna sequencing by synthesis
US20100279882A1 (en) * 2009-05-01 2010-11-04 Mostafa Ronaghi Sequencing methods
WO2011038241A1 (en) * 2009-09-25 2011-03-31 President And Fellows Of Harvard College Nucleic acid amplification and sequencing by synthesis with fluorogenic nucleotides
US8753816B2 (en) * 2010-10-26 2014-06-17 Illumina, Inc. Sequencing methods

Also Published As

Publication number Publication date
US20200123604A1 (en) 2020-04-23
EP2844774A4 (en) 2016-01-13
US20150111763A1 (en) 2015-04-23
EP2844774A1 (en) 2015-03-11
US10544454B2 (en) 2020-01-28
EP3438286B1 (en) 2020-10-28
WO2013166305A1 (en) 2013-11-07
ES2683978T3 (es) 2018-10-01
EP3438286A1 (en) 2019-02-06
EP2844774B1 (en) 2018-07-18
EP3789502A1 (en) 2021-03-10

Similar Documents

Publication Publication Date Title
US20210062186A1 (en) Next-generation sequencing libraries
US20190106744A1 (en) Dna sequencing
US11359236B2 (en) DNA sequencing
ES2840456T3 (es) Secuenciación de ADN
US20220145287A1 (en) Methods and compositions for next generation sequencing (ngs) library preparation
Castiblanco A primer on current and common sequencing technologies