ES2893528T3 - Composiciones y métodos para mejorar la identificación de muestras en colecciones de ácidos nucleicos indexadas - Google Patents

Composiciones y métodos para mejorar la identificación de muestras en colecciones de ácidos nucleicos indexadas Download PDF

Info

Publication number
ES2893528T3
ES2893528T3 ES18723273T ES18723273T ES2893528T3 ES 2893528 T3 ES2893528 T3 ES 2893528T3 ES 18723273 T ES18723273 T ES 18723273T ES 18723273 T ES18723273 T ES 18723273T ES 2893528 T3 ES2893528 T3 ES 2893528T3
Authority
ES
Spain
Prior art keywords
strand
adapter
stranded
target
double
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18723273T
Other languages
English (en)
Inventor
Eric Vermaas
Mahdieh Khosroheidari
Angela Kalbande
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Illumina Cambridge Ltd
Illumina Inc
Original Assignee
Illumina Cambridge Ltd
Illumina Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina Cambridge Ltd, Illumina Inc filed Critical Illumina Cambridge Ltd
Application granted granted Critical
Publication of ES2893528T3 publication Critical patent/ES2893528T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B20/00Methods specially adapted for identifying library members
    • C40B20/04Identifying library members by means of a tag, label, or other readable or detectable entity associated with the library members, e.g. decoding processes
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/06Biochemical methods, e.g. using enzymes or whole viable microorganisms
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B70/00Tags or labels specially adapted for combinatorial chemistry or libraries, e.g. fluorescent tags or bar codes
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B80/00Linkers or spacers specially adapted for combinatorial chemistry or libraries, e.g. traceless linkers or safety-catch linkers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Un método que comprende: proporcionar una primera pluralidad de fragmentos de polinucleótidos diana bicatenarios, teniendo cada fragmento un primer extremo y un segundo extremo; proporcionar un primer oligonucleótido adaptador que comprende una primera hebra que tiene un extremo 5' y un extremo 3' y una segunda hebra que tiene un extremo 5' y un extremo 3', en donde el primer oligonucleótido adaptador comprende (i) una región bicatenaria que comprende el extremo 5' de la primera hebra y el extremo 3' de la segunda hebra, y (ii) una región monocatenaria en la que la primera y la segunda hebras son monocatenarias, en donde la región monocatenaria comprende el extremo 3' de la primera hebra y el extremo 5' de la segunda hebra, en donde el primer oligonucleótido adaptador comprende una primera secuencia específica de la colección, en donde el extremo 3' de la primera hebra se modifica para evitar la digestión con una enzima que tiene actividad exonucleasa 3' y en donde el extremo 5' de la segunda hebra se modifica para evitar la digestión con una enzima que tiene actividad exonucleasa 5'; incubar el primer oligonucleótido adaptador y la primera pluralidad de fragmentos de polinucleótidos diana bicatenarios en condiciones adecuadas para ligar el extremo 5' de la primera hebra del primer adaptador y el extremo 3' de la segunda hebra del primer adaptador con el primer y el segundo extremos de los fragmentos de polinucleótidos diana bicatenarios para producir una primera colección de polinucleótidos que comprende secuencias de primer adaptador- diana-primer adaptador; y poner en contacto la primera colección de polinucleótidos con una exonucleasa, en donde la exonucleasa comprende una actividad exonucleasa monocatenaria 3' y 5', para degradar selectivamente los oligonucleótidos del primer adaptador que no están ligados a los fragmentos de polinucleótidos diana bicatenarios.

Description

DESCRIPCIÓN
Composiciones y métodos para mejorar la identificación de muestras en colecciones de ácidos nucleicos indexadas
Solicitud relacionada
Campo
La presente descripción se refiere, entre otras cosas, a la secuenciación de polinucleótidos a partir de colecciones múltiples indexadas; y más particularmente a aumentar la probabilidad de que la secuenciación identifique adecuadamente la colección a partir de la cual se originaron los polinucleótidos.
Antecedentes
Las mejoras en las metodologías de secuenciación han permitido la secuenciación de polinucleótidos agrupados o multiplexados procedentes de diferentes colecciones en un único protocolo de secuenciación. Se puede añadir una secuencia específica de una colección (un "marcador de indicador") a los poliácidos nucleicos de cada colección, de modo que el origen de cada poliácido nucleico secuenciado se pueda identificar adecuadamente. La secuencia del marcador de indicador puede añadirse a polinucleótidos de una colección, por ejemplo, ligando adaptadores que comprenden la secuencia del marcador de indicador a los extremos de los poliácidos nucleicos.
Los adaptadores pueden contener secuencias además de la secuencia del marcador de indicador, tal como una secuencia de cebador de extensión universal y una secuencia de cebador de secuenciación universal. La secuencia del cebador de extensión universal se puede, entre otras cosas, hibridar con un primer oligonucleótido acoplado a una superficie sólida. El primer oligonucleótido puede tener un extremo 3’ libre desde el cual una polimerasa puede añadir nucleótidos para extender la secuencia usando como molde el polinucleótido de la colección hibridado, dando como resultado una hebra inversa del polinucleótido de la colección, acoplada a la superficie sólida. Se pueden acoplar copias adicionales de hebras directas e inversas a la superficie sólida a través de la amplificación de agrupaciones. Un ejemplo de amplificación de agrupaciones es la amplificación en puente, en la que el extremo 3’ de polinucleótidos previamente amplificados que están unidos a la superficie sólida, se hibridan con segundos oligonucleótidos unidos a la superficie sólida. El segundo oligonucleótido puede tener un extremo 3’ libre desde el cual una polimerasa puede añadir nucleótidos para extender la secuencia usando como molde el polinucleótido de la hebra inversa acoplado, dando como resultado una hebra directa del polinucleótido de la colección que se acopla a la superficie sólida a través del segundo oligonucleótido. El procedimiento puede repetirse para producir agrupaciones de hebras directas e inversas, acopladas a la superficie sólida. Las hebras directas o las hebras inversas se pueden eliminar, por ejemplo, mediante escisión, antes de la secuenciación.
Un cebador de secuenciación se puede hibridar con una porción de una hebra de polinucleótidos acoplada al soporte sólido. Por ejemplo, el cebador de secuenciación se puede hibridar con una secuencia de cebador de secuenciación universal, si está presente. La secuenciación puede ocurrir mediante múltiples rondas de adición de nucleótidos al cebador de secuenciación, utilizando el polinucleótido acoplado como molde y detectando la identidad de los nucleótidos añadidos. La hibridación del cebador de secuenciación puede ocurrir en una ubicación sobre la hebra de polinucleótidos acoplada para permitir la identificación de la secuencia del marcador de indicador, así como una secuencia diana del polinucleótido acoplado a la superficie sólida o se pueden emplear cebadores de secuenciación distintos para secuenciar por separado la secuencia del marcador de indicador y la secuencia diana. Por consiguiente, la secuencia diana puede indexarse en una colección de origen particular, en base a la secuencia del marcador de indicador asociada con la secuencia diana.
A pesar de la inclusión de una secuencia de marcador de indicador específica de la colección para cada poliácido nucleico que se va a secuenciar, pueden producirse errores en la identificación del origen de la colección de un poliácido nucleico secuenciado, debido a un fenómeno conocido como salto de indicador. El salto de indicador se produce cuando las secuencias del marcador de indicador de una colección se añaden inadvertidamente a un poliácido nucleico de una colección diferente. El salto de indicador puede ocurrir durante la preparación de la colección o la amplificación de agrupaciones de los polinucleótidos en una celda de flujo u otro soporte sólido adecuado para la secuenciación. El salto de indicador puede confundir los resultados de la secuenciación, por ejemplo, dando como resultado una asignación incorrecta del origen de la colección de un polinucleótido secuenciado. El documento WO2013/177220A1 describe métodos, una composición y kits para el análisis de ácidos nucleicos y la secuenciación de alto rendimiento. El documento WO2015/069374A1 describe usos de adaptadores de transposasa para la secuenciación de ácidos nucleicos. Rahula Sinha et al., bioRxiv, 9 de abril de 2017, DOl: 10.1101/125724 y Kircher M et al., Nucleic Acids Research, vol.40, número 1, páginas 3 - 8, se refieren al uso de la indexación doble durante la secuenciación de ácidos nucleicos.
Breve compendio
Uno o varios aspectos de la presente descripción se dirigen a al menos un mecanismo potencial asociado con el salto de indicador mediante la degradación de polinucleótidos, incluyendo polinucleótidos diana y adaptadores no incorporados que no forman secuencias de polinucleótidos de adaptador-diana-adaptador, durante la preparación de una muestra de una colección. Sin pretender limitarse a una teoría, se cree que el salto de indicador puede ocurrir cuando un adaptador no incorporado que comprende una secuencia de marcador de indicador para una colección, se híbrida con una porción de un adaptador de otra colección, y el adaptador no incorporado sirve como cebador durante la amplificación de la agrupación. Por tanto, una secuencia diana procedente de una colección se puede marcar con un marcador de indicador de un adaptador procedente de otra colección. Durante las rondas posteriores de amplificación de agrupaciones, se pueden amplificar copias adicionales de la diana marcada de forma errónea, antes de la secuenciación. Ese salto de indicador puede confundir los resultados de una secuenciación posterior. Al degradar los adaptadores no incorporados durante la preparación de una muestra de una colección, los adaptadores no incorporados procedentes de otras colecciones no estarán disponibles para servir como cebadores durante la amplificación de las agrupaciones y, por lo tanto, se puede mitigar el salto de indicador.
En un aspecto, la presente invención proporciona un método que comprende proporcionar una primera pluralidad de fragmentos de polinucleótidos diana bicatenarios. Cada uno de los fragmentos de polinucleótidos diana bicatenarios tiene un primer extremo y un segundo extremo. El método incluye además proporcionar un primer oligonucleótido adaptador que comprende una primera hebra que tiene un extremo 5’ y un extremo 3' y una segunda hebra que tiene un extremo 5’ y un extremo 3'. El primer oligonucleótido adaptador comprende (i) una región bicatenaria que comprende el extremo 5’ de la primera hebra y el extremo 3' de la segunda hebra, y (ii) una región monocatenaria en la que la primera y la segunda hebras son monocatenarias. La región monocatenaria comprende el extremo 3’ de la primera hebra y el extremo 5' de la segunda hebra. El primer oligonucleótido adaptador comprende una primera secuencia específica de la colección. El extremo 3’ de la primera hebra se modifica para evitar la digestión con una enzima que tiene actividad exonucleasa 3', y el extremo 5’ de la segunda hebra se modifica para evitar la digestión con una enzima que tiene actividad exonucleasa 5'. El método comprende además incubar el primer oligonucleótido adaptador y la primera pluralidad de fragmentos de polinucleótidos diana bicatenarios en condiciones adecuadas para ligar el extremo 5’ de la primera hebra del primer adaptador y el extremo 3' de la segunda hebra del primer adaptador con el primer y el segundo extremos de los fragmentos de polinucleótidos diana bicatenarios para producir una primera colección de polinucleótidos que comprende secuencias de primer adaptador-diana-primer adaptador. El método comprende además poner en contacto la primera colección de polinucleótidos con una exonucleasa, lo que debe entenderse como una o varias exonucleasas. La exonucleasa comprende una actividad exonucleasa monocatenaria 3’ y 5', para degradar selectivamente los oligonucleótidos del primer adaptador que no están ligados a los fragmentos de polinucleótidos diana bicatenarios.
Otro aspecto de la invención es un adaptador de oligonucleótidos para ligarlo con un polinucleótido diana antes de la secuenciación que incluye una primera hebra de oligonucleótidos que tiene un extremo 5’ y un extremo 3'; y una segunda hebra de oligonucleótidos que tiene un extremo 5’ y un extremo 3'. Una región del extremo 5’ de la primera hebra comprende nucleótidos complementarios a los nucleótidos en una región del extremo 3' de la segunda hebra, de modo que las regiones complementarias son bicatenarias. Una región del extremo 3’ de la primera hebra y una región del extremo 5' de la segunda hebra son suficientemente no complementarias para ser monocatenarias. Al menos una entre la primera hebra y la segunda hebra comprende una secuencia de marcador de indicador específica de la colección. El extremo 3’ de la primera hebra se modifica para evitar la digestión con una enzima que tiene actividad exonucleasa 3', y el extremo 5’ de la segunda hebra se modifica para evitar la digestión con una enzima que tiene actividad exonucleasa 5'.
También se describe en el presente documento un kit que comprende un adaptador tal y como se describe en el párrafo anterior y una exonucleasa. En algunos aspectos descritos en el presente documento, una composición comprende un adaptador tal y como se describe en el párrafo anterior y una exonucleasa.
Un aspecto adicional de la invención es una composición que incluye una pluralidad de polinucleótidos que comprenden una secuencia de primer adaptador-diana-segundo adaptador. La secuencia diana es bicatenaria. Una región del primer adaptador en las proximidades de la diana es bicatenaria. Una región del segundo adaptador en las proximidades de la diana es bicatenaria. Una región del primer adaptador alejada de la diana comprende dos hebras sencillas, cada una de las cuales tiene un extremo. Una región del segundo adaptador alejada de la diana comprende dos hebras sencillas, cada una de las cuales tiene un extremo. Al menos una hebra de las dos hebras sencillas del primer o el segundo adaptador, comprende una secuencia de marcador de indicador específica de la colección. Cada extremo de las dos hebras sencillas del primer y el segundo adaptador, se modifican para evitar la digestión con una exonucleasa.
La composición del párrafo anterior puede comprender opcionalmente un adaptador que incluye una primera hebra de oligonucleótidos que tiene un extremo 5’ y un extremo 3'; y una segunda hebra de oligonucleótidos que tiene un extremo 5’ y un extremo 3'. Una región del extremo 5’ de la primera hebra comprende nucleótidos complementarios a los nucleótidos en una región del extremo 3' de la segunda hebra, de modo que las regiones complementarias son bicatenarias. Una región del extremo 3’ de la primera hebra y una región del extremo 5' de la segunda hebra son suficientemente no complementarias para ser monocatenarias. Al menos una entre la primera hebra y la segunda hebra comprende una secuencia de marcador de indicador específica de la colección. El extremo 3’ de la primera hebra se modifica para evitar la digestión con una enzima que tiene actividad exonucleasa 3', y el extremo 5’ de la segunda hebra se modifica para evitar la digestión con una enzima que tiene actividad exonucleasa 5'.
Las composiciones de cualquiera de los dos párrafos anteriores pueden comprender además una exonucleasa.
Los métodos de la invención, las composiciones de la invención y los kits descritos en el presente documento pueden ser útiles para mitigar el salto de indicador, por ejemplo, degradando los adaptadores no incorporados durante la preparación de la muestra de una colección. Al degradar los adaptadores no incorporados, los adaptadores no incorporados no estarán disponibles para servir potencialmente como cebadores de extensión inadvertidos para la amplificación de agrupaciones. Además, se entenderá que la degradación de productos incompletos, como los polinucleótidos diana a los que no está ligado ningún adaptador o a los que solo está ligado un adaptador, sería generalmente beneficiosa para reducir la unión de poliácidos nucleicos al soporte sólido que pueden no servir como moldes eficaces para la secuenciación.
Las características y ventajas adicionales del objeto de la presente descripción, se establecerán en la descripción detallada que sigue a continuación, y en parte serán fácilmente evidentes para los expertos en la técnica a partir de esta descripción o se reconocerán poniendo en práctica el objeto de la presente descripción, tal y como se describe en el presente documento, incluyendo la descripción detallada que sigue a continuación, las reivindicaciones, así como los dibujos adjuntos.
Debe entenderse que tanto la descripción general anterior como la siguiente descripción detallada presentan realizaciones del objeto de la presente descripción, y se entiende que proporcionan un resumen general o un marco para comprender la naturaleza y el carácter del objeto de la presente descripción, tal y como se reivindica. Los dibujos adjuntos se incluyen para proporcionar una mayor comprensión del objeto de la presente descripción, y se incorporan y constituyen una parte de esta memoria descriptiva. Los dibujos ilustran varias realizaciones del objeto de la presente descripción y, junto con la descripción, sirven para explicar los principios y funcionamiento del objeto de la presente descripción. Además, los dibujos y las descripciones se entiende que son meramente ilustrativos y no están destinados a limitar de ninguna manera el alcance de las reivindicaciones.
Breve descripción de los dibujos
La siguiente descripción detallada de realizaciones específicas de la presente descripción, puede entenderse mejor cuando se lee junto con los siguientes dibujos.
La Fig. 1 es un dibujo esquemático de una realización de un adaptador de acuerdo con varios aspectos de la descripción presentada en este documento.
La Fig. 2 es un dibujo esquemático de una realización de un polinucleótido molde que tiene una secuencia de adaptador-diana-adaptador (que puede incluir un adaptador generalmente tal y como se muestra en la Fig. 1) de acuerdo con varios aspectos de la descripción presentada en este documento.
La Fig. 3 es un dibujo esquemático que ilustra los resultados de la incubación de productos de reacción y reactivos de una ligación de un adaptador-diana con una exonucleasa.
La Fig. 4 es un dibujo esquemático que ilustra una realización de un procedimiento para la amplificación de agrupaciones que emplea una realización de un polinucleótido molde (que puede ser el polinucleótido molde representado en la Fig. 2) de acuerdo con varios aspectos de la descripción presentada en este documento.
La Fig. 5 es un dibujo esquemático que ilustra una realización de cómo un tratamiento con exonucleasa puede mitigar el salto de indicador de acuerdo con varias realizaciones descritas en el presente documento.
Las Figs. 6A y 6B ilustran la naturaleza del fenómeno de salto de indicador. La Fig. 6A muestra cómo las lecturas de una muestra determinada se desmultiplexan incorrectamente y se mezclan con una muestra diferente después de la desmultiplexación. La Fig. 6B demuestra el salto de indicador en un sistema de indicador doble, que conduce a combinaciones inesperadas de secuencias de marcador de indicador.
Las Figs. 7A y 7B ilustran el enfoque general para medir la tasa de salto de indicador en un sistema dado. La Fig. 7A muestra un diseño ejemplar de una placa de adaptador doble, en la que cada pocillo individual de una placa de 96 pocillos contiene una sola pareja de secuencias de marcador de indicador. La Fig. 7B muestra una configuración experimental destinada a medir la tasa de salto de indicador, en la que solo se utilizan combinaciones únicas de marcador de indicador doble.
Las Figs. 8A y 8B ilustran el efecto de adaptadores no ligados sobre la tasa de salto de indicador. La Fig. 8A muestra un aumento de 6 veces en el índice de salto asociado con un aumento del 50% de adaptadores libres. La Fig. 8B muestra un efecto aproximadamente lineal del adaptador bifurcado libre sobre la tasa de salto de indicador dentro del intervalo sometido a ensayo.
La Fig. 9 muestra el efecto combinado de la exonucleasa y el tratamiento de bloqueo de 3’ con adaptadores protegidos de acuerdo con la presente invención, sobre las tasas de salto de indicador en el flujo de trabajo de la preparación de una colección Illumina TruSeq PCR-Free, con y sin un aumento de adaptador libre.
Los dibujos esquemáticos no están necesariamente a escala. Los números similares utilizados en las figuras se refieren a componentes, etapas y análogos similares. Sin embargo, se entenderá que el uso de un número para referirse a un componente en una figura dada, no pretende limitar el componente en otra figura etiquetada con el mismo número. Además, el uso de diferentes números para referirse a los componentes, no pretende indicar que los diferentes componentes numerados no pueden ser iguales o similares a otros componentes numerados.
Descripción detallada
Ahora se hará referencia con mayor detalle a diversas realizaciones del objeto de la presente descripción, algunas de las cuales se ilustran en los dibujos adjuntos.
Definiciones
Todos los términos científicos y técnicos usados en este documento tienen los significados comúnmente usados en la técnica, a menos que se especifique lo contrario. Las definiciones proporcionadas en el presente documento son para facilitar la comprensión de ciertos términos utilizados con frecuencia en el presente documento y no pretenden limitar el alcance de la presente descripción.
Tal y como se usa en el presente documento, las formas singulares "un", "una" y "el, la" incluyen referentes en plural a menos que el contexto indique claramente lo contrario. Así, por ejemplo, la referencia a una "exonucleasa" incluye ejemplos que tienen dos o más "exonucleasas" a menos que el contexto indique claramente lo contrario.
Tal y como se usa en esta memoria descriptiva y las reivindicaciones adjuntas, el término "o" se emplea generalmente en su sentido que incluye "y/o" a menos que el contenido indique claramente lo contrario. El término "y/o" significa uno o todos los elementos enumerados o una combinación de dos o más de los elementos enumerados. El uso de "y/o" en algunos casos no implica que el uso de "o" en otros casos no signifique "y/o".
Tal y como se usa en el presente documento, "tener", "tiene", "que tiene", "incluir", "incluye", "que incluye", "comprender", "comprende", "que comprende" o similares, se usan en su sentido inclusivo abierto, y generalmente significa "incluir, pero no limitar a", "incluye, pero no se limita a", o "que incluye, pero no se limita a".
"Opcional" u "opcionalmente" significa que el evento, circunstancia o componente descrito posteriormente puede tener lugar o no, y que la descripción incluye casos en los que el evento, circunstancia o componente tiene lugar y casos en los que no.
Las palabras "preferido" y "preferiblemente" se refieren a realizaciones de la descripción que pueden proporcionar ciertos beneficios, bajo ciertas circunstancias. Sin embargo, también se pueden preferir otras realizaciones, en las mismas circunstancias o en otras. Además, la enumeración de una o varias realizaciones preferidas no implica que otras realizaciones no sean útiles y no pretende excluir otras realizaciones del alcance de la tecnología inventiva.
También en el presente documento, las descripciones de intervalos numéricos por los extremos incluyen todos los números incluidos dentro de ese intervalo (por ejemplo, 1 a 5 incluye 1, 1,5, 2, 2,75, 3, 3,80, 4, 5, etc.). Cuando un intervalo de valores es "mayor que", "menor que", etc., un valor particular, ese valor se incluye dentro del intervalo.
A menos que se indique expresamente lo contrario, no se pretende de ninguna manera que ningún método establecido en este documento se interprete como que requiere que sus etapas se realicen en un orden específico. En consecuencia, cuando una reivindicación de método no indica realmente un orden a seguir en sus etapas o no se establece específicamente de otra manera en las reivindicaciones o descripciones que las etapas deben limitarse a un orden específico, no se pretende de ninguna manera que se asuma algún orden particular.
Aunque se pueden describir diversas características, elementos o etapas de realizaciones particulares usando la expresión de transición "que comprende", se debe entender que realizaciones alternativas, incluidas aquellas que pueden describirse usando las expresiones de transición "que consiste" o "que consiste esencialmente en", están implícitas. Así, por ejemplo, las realizaciones alternativas implícitas a un polinucleótido que comprende una secuencia de adaptador-diana-adaptador, incluyen realizaciones en las que el polinucleótido consiste en la secuencia de adaptador-diana-adaptador y realizaciones en las que el polinucleótido consiste esencialmente en la secuencia de adaptador-diana-adaptador.
Tal y como se usa en el presente documento, "proporcionar" en el contexto de un compuesto, composición o artículo significa preparar el compuesto, composición o artículo, comprar el compuesto, composición o artículo, u obtener de otro modo el compuesto, composición o artículo.
Tal y como se usa en este documento, "amplificar", "amplificando" o "reacción de amplificación" y sus derivados, se refieren generalmente a cualquier acción o procedimiento mediante el cual al menos una porción de un polinucleótido (p. ej., un polinucleótido molde) se replica o copia en al menos un polinucleótido adicional. El polinucleótido adicional incluye opcionalmente una secuencia que es sustancialmente idéntica o sustancialmente complementaria a al menos alguna porción del polinucleótido molde. El polinucleótido molde puede ser monocatenario o bicatenario y el polinucleótido adicional puede ser independientemente monocatenario o bicatenario. La amplificación incluye opcionalmente una replicación lineal o exponencial de un polinucleótido. En algunas realizaciones, esa amplificación se puede realizar usando condiciones isotérmicas; en otras realizaciones, tal amplificación puede incluir un termociclado. En algunas realizaciones, la amplificación es una amplificación múltiple que incluye la amplificación simultánea de una pluralidad de secuencias diana en una única reacción de amplificación. En algunas realizaciones, "amplificación" incluye la amplificación de al menos alguna porción de los ácidos nucleicos basados en ADN y ARN, solos o en combinación. La reacción de amplificación puede incluir cualquiera de los procedimientos de amplificación conocidos por un experto en la técnica. En algunas realizaciones, la reacción de amplificación incluye la reacción en cadena de la polimerasa (PCR).
Tal y como se usa en este documento, "condiciones de amplificación" y sus derivados, generalmente se refiere a condiciones adecuadas para amplificar una o varias secuencias de polinucleótidos. Tal amplificación puede ser lineal o exponencial. En algunas realizaciones, las condiciones de amplificación pueden incluir condiciones isotérmicas o, alternativamente, pueden incluir condiciones de termociclado, o una combinación de condiciones isotérmicas y de termociclado. En algunas realizaciones, las condiciones adecuadas para amplificar una o varias secuencias de polinucleótidos incluyen condiciones de la reacción en cadena de la polimerasa (PCR). Normalmente, las condiciones de la amplificación se refieren a una mezcla de reacción que es suficiente para amplificar polinucleótidos tales como una o varias secuencias diana, o para amplificar una secuencia diana amplificada ligada a uno o varios adaptadores, por ejemplo, una secuencia diana amplificada ligada a un adaptador. Generalmente, las condiciones de amplificación incluyen un catalizador para la amplificación o para la síntesis de polinucleótidos, por ejemplo, una polimerasa; un cebador que posee algún grado de complementariedad con el ácido nucleico que se va a amplificar; y nucleótidos, tales como desoxirribonucleótidos trifosfatos (dNTPs) para promover la extensión del cebador una vez que se hibrida con el ácido nucleico. Las condiciones de amplificación pueden requerir una hibridación o apareamiento de un cebador con un ácido nucleico, una extensión del cebador y una etapa de desnaturalización en la que el cebador extendido se separa de la secuencia polinucleotídica que experimenta la amplificación. Normalmente, pero no necesariamente, las condiciones de amplificación pueden incluir el termociclado; en algunas realizaciones, las condiciones de amplificación incluyen una pluralidad de ciclos en los que se repiten las etapas de apareamiento, extensión y separación. Normalmente, las condiciones de amplificación incluyen cationes tales como Mg++ o Mn++ y también pueden incluir varios modificadores dela fuerza iónica.
Tal y como se usa en este documento, la expresión "reacción en cadena de la polimerasa" ("PCR") se refiere al método de K. B. Mullis, documentos de patente de EE.UU. n° 4.683.195 y 4.683.202, que describen un método para aumentar la concentración de un segmento de un polinucleótido de interés en una mezcla de ADN genómico sin clonación ni purificación. Este procedimiento de amplificación del polinucleótido de interés consiste en introducir un gran exceso de dos cebadores oligonucleotídicos en la mezcla de ADN que contiene el polinucleótido de interés deseado, seguido de una serie de ciclos térmicos en presencia de una ADN polimerasa. Los dos cebadores son complementarios a sus respectivas hebras del polinucleótido bicatenario de interés. La mezcla se desnaturaliza primero a una temperatura más alta y luego los cebadores se aparean con secuencias complementarias dentro de la molécula de polinucleótido de interés. Después del apareamiento, los cebadores se extienden con una polimerasa para formar una nueva pareja de hebras complementarias. Las etapas de desnaturalización, hibridación del cebador y extensión de la polimerasa pueden repetirse muchas veces (denominadas termociclado) para obtener una concentración elevada de un segmento amplificado del polinucleótido de interés deseado. La longitud del segmento amplificado del polinucleótido de interés deseado (amplicón) está determinada por las posiciones relativas de los cebadores entre sí y, por lo tanto, esa longitud es un parámetro controlable. En virtud de la repetición del procedimiento, el método se denomina "reacción en cadena de la polimerasa" (en adelante, "PCR"). Debido a que los segmentos amplificados deseados del polinucleótido de interés se convierten en las secuencias de ácido nucleico predominantes (en términos de concentración) en la mezcla, se dice que están "amplificados por PCR". En una modificación del método descrito anteriormente, los polinucleótidos pueden amplificarse por PCR usando una pluralidad de parejas de cebadores diferentes, en algunos casos, una o más parejas de cebadores por cada polinucleótido de interés, formando así una reacción PCR múltiple.
Tal y como se define en el presente documento, una "amplificación múltiple" se refiere a una amplificación selectiva y no aleatoria de dos o más secuencias diana dentro de una muestra, usando al menos un cebador específico de una diana. En algunas realizaciones, la amplificación múltiple se realiza de manera que algunas o todas las secuencias diana se amplifican dentro de un único recipiente de reacción. El "factor ple" o "n° de veces" de una amplificación múltiple dada, se refiere generalmente al número de diferentes secuencias específicas de una diana que se amplifican durante esa amplificación múltiple única. En algunas realizaciones, el n° de veces puede ser de aproximadamente 12 veces, 24 veces, 48 veces, 96 veces, 192 veces, 384 veces, 768 veces, 1536 veces, 3072 veces, 6144 veces o superior. También es posible detectar las secuencias diana amplificadas mediante varias metodologías diferentes (p. ej., electroforesis en gel seguida de densitometría, cuantificación con un bioanalizador o PCR cuantitativa, hibridación con una sonda marcada; incorporación de cebadores biotinilados seguida de detección con un conjugado de avidinaenzima; incorporación de trifosfatos de desoxinucleótido marcados con 32P en la secuencia diana amplificada).
Tal y como se usa en este documento, el término "cebador" y sus derivados se refieren generalmente a cualquier polinucleótido que se puede hibridar con una secuencia diana de interés. Normalmente, el cebador funciona como un sustrato sobre el que se pueden polimerizar nucleótidos mediante una polimerasa; en algunas realizaciones, sin embargo, el cebador puede incorporarse en la hebra de ácido nucleico sintetizada y proporcionar un sitio en el que otro cebador se puede hibridar para cebar la síntesis de una nueva hebra que es complementaria a la molécula de ácido nucleico sintetizada. El cebador puede estar compuesto por cualquier combinación de nucleótidos o análogos de los mismos. En algunas realizaciones, el cebador es un oligonucleótido o polinucleótido monocatenario. Tal y como se usa en este documento, "secuencias diana amplificadas" y sus derivados, se refiere generalmente a una secuencia de polinucleótidos producida amplificando las secuencias diana usando cebadores específicos de una diana y los métodos proporcionados en este documento. Las secuencias diana amplificadas pueden tener el mismo sentido (es decir, la hebra positiva) o el sentido contrario (es decir, la hebra negativa) con respecto a las secuencias diana.
Tal y como se usa en este documento, el término "polimerasa" se entiende que es compatible con su uso en la técnica e incluye, por ejemplo, una enzima que produce una réplica complementaria de un polinucleótido usando el polinucleótido como una hebra molde. Normalmente, las ADN polimerasas se unen a la hebra molde y luego se mueven hacia abajo por la hebra molde añadiendo secuencialmente nucleótidos al grupo hidroxilo libre en el extremo 3’ de una hebra de ácido nucleico que está creciendo. Las ADN polimerasas normalmente sintetizan moléculas de ADN complementarias a partir de moldes de ADN y las ARN polimerasas normalmente sintetizan moléculas de ARN a partir de moldes de ADN (transcripción). Las polimerasas pueden usar una hebra corta de ARN o ADN, llamada cebador, para comenzar el crecimiento de la hebra. Algunas polimerasas pueden desplazar la hebra aguas arriba del sitio en donde están añadiendo las bases a una cadena. Se dice que tales polimerasas desplazan la hebra, lo que significa que tienen una actividad que retira una hebra complementaria de una hebra molde que está siendo leída por la polimerasa. Las polimerasas ejemplares que tienen actividad de desplazamiento de cadena incluyen, sin limitación, el fragmento grande de la polimerasa de Bst (Bacillus stearothermophilus), la polimerasa exo-Klenow o la exopolimerasa de T7 de grado de secuenciación. Algunas polimerasas degradan la hebra situada frente a ellas, reemplazándola eficazmente con la cadena en crecimiento de detrás (actividad exonucleasa 5’). Algunas polimerasas tienen una actividad que degrada la hebra detrás de ellas (actividad exonucleasa 3’). Algunas polimerasas útiles se han modificado, ya sea por mutación o de otro modo, para reducir o eliminar la actividad exonucleasa 3’ y/o 5'.
Tal y como se usa en este documento, la expresión "secuencia universal" se refiere a una región de la secuencia que es común a dos o más moléculas de ácido nucleico, en donde las moléculas también tienen regiones de la secuencia que difieren entre sí. Una secuencia universal que está presente en diferentes miembros de una colección de moléculas puede permitir la captura de múltiples ácidos nucleicos diferentes, utilizando una población de ácidos nucleicos de captura universal que son complementarios a la secuencia universal. De manera similar, una secuencia universal presente en diferentes miembros de una colección de moléculas, puede permitir la replicación o amplificación de múltiples ácidos nucleicos diferentes usando una población de cebadores universales que son complementarios a la secuencia universal. Por tanto, un polinucleótido de captura universal o un cebador universal incluye una secuencia que se puede hibridar específicamente con una secuencia universal. Los polinucleótidos pueden modificarse para fijarse a adaptadores universales, por ejemplo, en uno o ambos extremos de las diferentes secuencias.
Salto de indicador
Esta descripción se refiere, entre otras cosas, a la secuenciación de polinucleótidos procedentes de colecciones indexadas múltiples; y más particularmente a aumentar la probabilidad de que la secuenciación identifique adecuadamente la colección a partir de la cual se originaron los polinucleótidos.
Cuando se agrupan o multiplican polinucleótidos procedentes de diferentes colecciones para una secuenciación, los polinucleótidos de cada colección pueden modificarse para incluir una secuencia de marcador de indicador específica de la colección. Durante la secuenciación, el marcador de indicador se secuencia junto con las secuencias de polinucleótidos diana de las colecciones. Por consiguiente, la secuencia del marcador de indicador puede asociarse con una secuencia de polinucleótidos diana de modo que se puede identificar la colección a partir de la cual se originó la secuencia diana.
Sin embargo, un fenómeno conocido como salto de indicador puede ocurrir en un pequeño porcentaje de resultados en una secuencia (típicamente 0,5% a 2%). El salto de indicador se refiere a una secuencia de marcador de indicador de una colección que está asociada con un polinucleótido diana de otra colección (véanse las Figs. 6A y 6B). Si bien los mecanismos por los cuales pueden ocurrir los saltos de índice no se comprenden completamente, la tasa de salto de indicador se puede reducir eficazmente bloqueando el extremo 3’ de los adaptadores no incorporados, después de que los adaptadores se fijan a los polinucleótidos diana de una colección para, entre otras cosas, fijar la secuencia del marcador de indicador al polinucleótido.
Preparación de la muestra de la colección
Las colecciones que comprenden polinucleótidos se pueden preparar de cualquier manera adecuada para fijar adaptadores de oligonucleótidos a polinucleótidos diana. Tal y como se usa en el presente documento, una "colección" es una población de polinucleótidos procedentes de una fuente o muestra determinada. Una colección comprende una pluralidad de polinucleótidos diana. Tal y como se usa en el presente documento, un "polinucleótido diana" es un polinucleótido que se desea secuenciar. El polinucleótido diana puede ser esencialmente cualquier polinucleótido de secuencia conocida o desconocida. Puede ser, por ejemplo, un fragmento de ADN genómico o ADNc. La secuenciación puede dar como resultado la determinación de la secuencia de la totalidad o de una parte de los polinucleótidos diana. Los polinucleótidos diana pueden obtenerse a partir de una muestra de polinucleótidos primaria que se ha fragmentado aleatoriamente. Los polinucleótidos diana se pueden procesar en moldes adecuados para la amplificación, mediante la colocación de secuencias de cebadores universales en los extremos de cada fragmento diana. Los polinucleótidos diana también pueden obtenerse a partir de una muestra de ARN primario mediante transcripción inversa en ADNc.
Los términos "polinucleótido" y "oligonucleótido" se usan indistintamente en el presente documento para referirse a una forma polimérica de nucleótidos de cualquier longitud y pueden comprender ribonucleótidos, desoxirribonucleótidos, análogos de los mismos o mezclas de los mismos. Este término se refiere solo a la estructura primaria de la molécula. Por tanto, el término incluye ácido desoxirribonucleico ("ADN") de cadena triple, doble y sencilla, así como ácido ribonucleico ("ARN") de cadena triple, doble y sencilla. Los términos polinucleótido y oligonucleótido usados en este documento también incluyen ADNc, que es ADN complementario o un ADN copia producido a partir de un molde de ARN, por ejemplo, mediante la acción de una transcriptasa inversa.
Las moléculas de polinucleótidos primarios pueden originarse en forma de ADN bicatenario (ADNbc) (por ejemplo, fragmentos de ADN genómico, productos de una amplificación y PCR y similares) o pueden haberse originado en forma monocatenaria, como ADN o ARN, y convertirse en forma de ADNbc. A modo de ejemplo, las moléculas de ARNm se pueden copiar en ADNc de doble hebra usando métodos estándar bien conocidos en la técnica. La secuencia precisa de polinucleótidos primarios generalmente no es importante para la descripción presentada en este documento y puede ser conocida o desconocida.
En algunas realizaciones, los polinucleótidos diana primarios son moléculas de ARN. En un aspecto de tales realizaciones, el ARN aislado a partir de muestras específicas se convierte primero en ADN de doble hebra usando métodos conocidos en la técnica. A continuación, el ADN de doble hebra se puede marcar con un indicador con un marcador específico de la colección. Se pueden generar diferentes preparaciones de ese ADN de doble hebra que comprenden marcadores de indicadores específicos de la colección, en paralelo, a partir de ARN aislado a partir de diferentes fuentes o muestras. Posteriormente, se pueden mezclar diferentes preparaciones de ADN de doble hebra que comprenden diferentes marcadores de indicadores específicos de la colección, secuenciar en masa y determinar la identidad de cada fragmento secuenciado con respecto a la colección a partir de la cual se aisló/obtuvo, en virtud de la presencia de una secuencia de marcador de indicador específica de la colección.
En algunas realizaciones, los polinucleótidos diana primarios son moléculas de ADN. Por ejemplo, los polinucleótidos primarios pueden representar el complemento genético completo de un organismo y son moléculas de ADN genómico, tales como moléculas de ADN humano, que incluyen secuencias de intrones y exones (secuencia codificante), así como secuencias reguladoras no codificantes, tales como secuencias de promotores y potenciadores. Aunque se podría contemplar que también se podrían usar subconjuntos particulares de secuencias de polinucleótidos o ADN genómico, como por ejemplo, cromosomas particulares o una porción de los mismos. En muchas realizaciones, no se conoce la secuencia de los polinucleótidos primarios. Los polinucleótidos diana de ADN pueden tratarse química o enzimáticamente antes o después de un proceso de fragmentación, tal como un proceso de fragmentación aleatoria, y antes, durante o después de la ligación de los oligonucleótidos de adaptadores.
Preferiblemente, los polinucleótidos diana primarios se fragmentan en longitudes apropiadas adecuadas para la secuenciación. Los polinucleótidos diana se pueden fragmentar de cualquier manera adecuada. Preferiblemente, los polinucleótidos diana se fragmentan aleatoriamente. La fragmentación aleatoria se refiere a la fragmentación de un polinucleótido de forma no ordenada, por ejemplo, por medios enzimáticos, químicos o mecánicos. Esos métodos de fragmentación son conocidos en la técnica y utilizan métodos estándar (Sambrook y Russell, Molecular Cloning, A Laboratory Manual, tercera edición). Para una mayor claridad, generar fragmentos más pequeños de un fragmento más grande de polinucleótido a través de la amplificación mediante una PCR específica de tales fragmentos más pequeños, no es equivalente a fragmentar el fragmento más grande de polinucleótido, ya que el fragmento más grande de polinucleótido permanece intacto (es decir, no se fragmenta en la amplificación con PCR). Además, la fragmentación aleatoria está diseñada para producir fragmentos, independientemente de la identidad de la secuencia o la posición de los nucleótidos que comprenden y/o rodean la ruptura.
En algunas realizaciones, la fragmentación aleatoria es por medios mecánicos tales como la nebulización o someter a ultrasonidos para producir fragmentos desde aproximadamente 50 pares de bases de longitud a aproximadamente 1500 pares de bases de longitud, tales como 50-700 pares de bases de longitud o 50-500 pares de bases de longitud.
La fragmentación de moléculas polinucleotídicas por medios mecánicos (nebulización, ultrasonidos e Hydroshear, por ejemplo) puede dar como resultado fragmentos con una mezcla heterogénea de extremos romos y protuberantes 3’ y 5'. Los extremos de los fragmentos se pueden reparar usando métodos o kits (tales como el kit de reparación de extremos de terminación de ADN de Lucigen) conocidos en la técnica por generar extremos que son óptimos para la inserción, por ejemplo, en sitios romos de vectores de clonación. En algunas realizaciones, los extremos de los fragmentos de la población de polinucleótidos tienen extremos romos. Los extremos de los fragmentos pueden tener extremos romos y estar fosforilados. El resto fosfato puede introducirse mediante tratamiento enzimático, por ejemplo, usando una polinucleótido cinasa.
En algunas realizaciones, las secuencias de polinucleótidos diana se preparan con nucleótidos protuberantes únicos mediante, por ejemplo, la actividad de ciertos tipos de ADN polimerasa como la polimerasa Taq o la polimerasa exo minus de Klenow que tiene una actividad transferasa terminal no dependiente del molde que añade un solo desoxinucleótido, por ejemplo, desoxiadenosina (A) a los extremos 3’, por ejemplo, de productos de una PCR. Tales enzimas se pueden utilizar para añadir un solo nucleótido 'A' al extremo 3’ terminal de cada hebra de los dúplex de polinucleótidos diana. Por lo tanto, se podría añadir una 'A' al extremo 3’ de cada hebra dúplex reparada en el extremo del dúplex de polinucleótidos diana, mediante una reacción con una polimerasa Taq o exo minus de Klenow, mientras que la estructura artificial del polinucleótido adaptador podría ser una estructura artificial T con una 'T' en el extremo protuberante presente en el extremo 3' de cada región dúplex de la estructura artificial del adaptador. Esa modificación del extremo también evita la autoligación de los polinucleótidos diana, de manera que existe una tendencia hacia la formación de polinucleótidos de adaptador-diana combinados ligados.
En algunas realizaciones, la fragmentación se logra mediante “tagmentación” (escisión y marcado), tal y como se describe, por ejemplo, en el documento de publicación de patente internacional WO 2016/130704. En esos métodos, se emplean transposasas para fragmentar un polinucleótido bicatenario. Los fragmentos bicatenarios resultantes pueden rellenar los huecos tal y como se describe en el documento WO 2016/130704 y prepararlos para la ligación con un adaptador.
El polinucleótido diana puede contener un resto 5'-fosfato, ya sea residual del proceso de fragmentación o añadido usando una etapa de tratamiento enzimático, el cual ha sido reparado en el extremo y opcionalmente extendido mediante una base o bases protuberantes, para proporcionar un 3'-OH apto para la ligación. En este contexto, fijar significa unir covalentemente las hebras de polinucleótidos que previamente no estaban unidas covalentemente. En un aspecto particular de la invención, esa fijación tiene lugar mediante la formación de un enlace fosfodiéster entre las dos hebras de polinucleótidos, pero pueden usarse otros medios de enlace covalente (por ejemplo, enlaces de la cadena principal que no son fosfodiéster). La ligación de los adaptadores a los polinucleótidos diana se describe con más detalle, por ejemplo, en el documento de patente de EE.UU. n° 8.053.192.
Los polinucleótidos fragmentados que se han modificado antes de la ligación, por ejemplo, para prepararlos mejor para la ligación, pueden denominarse en el presente documento "fragmentos" de polinucleótidos.
Tal y como se usa en el presente documento, los términos "ligando", "ligación" y sus derivados se refieren generalmente al proceso de unir covalentemente dos o más moléculas entre sí, por ejemplo, unir covalentemente dos o más polinucleótidos entre sí. En algunas realizaciones, la ligación incluye unir los cortes de hebras sencillas entre nucleótidos adyacentes de los polinucleótidos. En algunas realizaciones, la ligación incluye formar un enlace covalente entre un extremo de un primer polinucleótido y un extremo de un segundo polinucleótido. En algunas realizaciones, la ligación puede incluir la formación de un enlace covalente entre un grupo fosfato 5’ de un ácido nucleico y un grupo hidroxilo 3' de un segundo ácido nucleico, formando así un polinucleótido ligado. Generalmente, para los fines de esta descripción, una secuencia diana se puede ligar con un adaptador para generar una secuencia diana ligada a un adaptador.
Tal y como se usa en este documento, "ligasa" y sus derivados, se refiere generalmente a cualquier agente capaz de catalizar la ligación de dos moléculas de sustrato. En algunas realizaciones, la ligasa incluye una enzima capaz de catalizar la unión de cortes de hebras sencillas entre nucleótidos adyacentes de un ácido nucleico. En algunas realizaciones, la ligasa incluye una enzima capaz de catalizar la formación de un enlace covalente entre un fosfato 5’ de una molécula de ácido nucleico y un hidroxilo 3' de otra molécula de ácido nucleico, formando así una molécula de ácido nucleico ligada. Las ligasas adecuadas pueden incluir, pero no se limitan a, la ligasa de ADN de T4, la ligasa de ARN de T4 y la ligasa de ADN de E. coli.
Tal y como se usa en este documento, "condiciones de la ligación" y sus derivados, generalmente se refiere a condiciones adecuadas para ligar dos moléculas entre sí. En algunas realizaciones, las condiciones de ligación son adecuadas para sellar los cortes de hebra sencilla o los huecos entre ácidos nucleicos. Tal y como se usa en este documento, el término corte de hebra sencilla o hueco es compatible con el uso del término en la técnica. Normalmente, se puede ligar un corte de hebra sencilla o un hueco en presencia de una enzima, tal como una ligasa, a una temperatura y un pH apropiados. En algunas realizaciones, la ligasa de ADN de T4 puede unirse a un corte de hebra sencilla entre ácidos nucleicos a una temperatura de aproximadamente 70-72°C.
Cualquier adaptador adecuado puede ligarse a un polinucleótido diana. Preferiblemente, el adaptador comprende una primera hebra de oligonucleótido que tiene un extremo 5’ y un extremo 3'; y una segunda hebra de oligonucleótido que tiene un extremo 5’ y un extremo 3'. Una región del extremo 5’ de la primera hebra comprende nucleótidos complementarios a los nucleótidos en una región del extremo 3' de la segunda hebra, de modo que las regiones complementarias son de doble hebra. Una región del extremo 3’ de la primera hebra y una región del extremo 5' de la segunda hebra son suficientemente no complementarias para ser monocatenarias.
Preferiblemente, la región bicatenaria del adaptador es lo más corta posible sin una pérdida de función. En este contexto, "función" se refiere a la capacidad de la región bicatenaria para formar un dúplex estable en condiciones de reacción estándar. En algunas realizaciones, las condiciones de reacción estándar se refieren a las condiciones de reacción para una reacción de ligación de polinucleótidos catalizada por una enzima, que serán bien conocidas para el lector experto (por ejemplo, incubación a una temperatura en el intervalo de 4°C a 25°C en un tampón de ligación apropiado para la enzima), de modo que las dos hebras que forman el adaptador permanezcan parcialmente apareadas durante la ligación del adaptador a una molécula diana. Los métodos de ligación son conocidos en la técnica y pueden utilizar métodos estándar (Sambrook y Russell, Molecular Cloning, A Laboratory Manual, tercera edición). Esos métodos utilizan enzimas ligasas tales como la ligasa de ADN para efectuar o catalizar la unión de los extremos de las dos hebras polinucleotídicas, en este caso, del oligonucleótido dúplex adaptador y los dúplex de polinucleótidos diana, de modo que se forman enlaces covalentes. El oligonucleótido dúplex adaptador puede contener un resto 5'-fosfato para facilitar la unión a un polinucleótido diana 3'-OH.
La región bicatenaria del adaptador puede tener cualquier número adecuado de pares de bases. Preferiblemente, la región bicatenaria es una región bicatenaria corta, que comprende típicamente 5 o más pares de bases consecutivas, formada mediante el apareamiento de dos hebras de polinucleótidos parcialmente complementarias. Esa "región de doble hebra" del adaptador se refiere a una región en la que las dos hebras se aparean y no implica ninguna conformación estructural particular. En algunas realizaciones, la región bicatenaria comprende 20 o menos pares de bases consecutivas, tales como 10 o menos o 5 o menos pares de bases consecutivas.
La estabilidad de la región bicatenaria puede incrementarse y, por tanto, se reduce su longitud potencialmente, mediante la inclusión de nucleótidos no naturales que presentan un apareamiento de bases más fuerte que los pares de bases estándar de Watson-Crick. Preferiblemente, las dos hebras del adaptador son complementarias en un 100% en la región de doble hebra.
Cuando el adaptador está fijado al polinucleótido diana, la región monocatenaria no complementaria puede formar los extremos 5’ y 3' del polinucleótido que se va a secuenciar. La expresión "región monocatenaria no complementaria" se refiere a una región del adaptador en donde las secuencias de las dos hebras de polinucleótidos que forman el adaptador exhiben un grado de no complementariedad tal, que las dos hebras no son capaces de aparearse completamente entre sí en condiciones de apareamiento estándar para una reacción PCR.
La región monocatenaria no complementaria es proporcionada por diferentes porciones de las mismas dos hebras de polinucleótidos que forman la región bicatenaria. El límite inferior de la longitud de la porción monocatenaria se determinará típicamente en función, por ejemplo, de proporcionar una secuencia adecuada para la unión de un cebador para la extensión del cebador, una PCR y/o secuenciación. En teoría, no existe un límite superior en la longitud de la región no emparejada, excepto que, en general, es ventajoso minimizar la longitud total del adaptador, por ejemplo, para facilitar la separación de los adaptadores no unidos de las estructuras artificiales de adaptador-diana después de la etapa o etapas de fijación. Por lo tanto, generalmente se prefiere que la región monocatenaria no complementaria del adaptador tenga una longitud de 50 o menos nucleótidos consecutivos, tal como una longitud de 40 o menos, 30 o menos, o 25 o menos nucleótidos consecutivos.
Los extremos monocatenarios del adaptador se modifican para evitar la digestión con una exonucleasa. Por ejemplo, el extremo 3’ puede modificarse para evitar la digestión con una exonucleasa 3', y el extremo 5’ puede modificarse para evitar la digestión con una exonucleasa 5'. Para los fines de la presente descripción, una modificación que "evita" la digestión con una exonucleasa, inhibe la actividad de la exonucleasa en relación con su acción en un extremo no modificado. Preferiblemente, una modificación que evita la digestión con una exonucleasa, elimina la capacidad de la exonucleasa para digerir la hebra de polinucleótido.
Los extremos libres de las regiones monocatenarias del adaptador pueden modificarse de cualquier manera adecuada para evitar la actividad exonucleasa. En algunas realizaciones, los extremos libres de las regiones monocatenarias del adaptador comprenden un enlace fosforotioato. Preferiblemente, los enlaces entre los tres nucleótidos terminales de los extremos libres de las regiones monocatenarias del adaptador comprenden enlaces fosforotioato. Para los fines de la presente descripción, un extremo de un polinucleótido cuyos enlaces entre los tres nucleótidos terminales comprenden enlaces fosforotioato, puede denominarse un extremo que comprende tres enlaces fosforotioato. Pueden introducirse enlaces de fosforotioato en un extremo 5’ o un extremo 3' de un polinucleótido de cualquier manera adecuada, como es bien conocido en la técnica. Los oligonucleótidos que comprenden enlaces de fosforotioato terminales pueden adquirirse a partir de varios proveedores comerciales que incluyen, por ejemplo, Integrated DNA Technologies y Sigma-Aldrich.
En algunas realizaciones, una proteína de unión a ADN monocatenario (SSB) se une a los extremos libres de las regiones monocatenarias del adaptador para proteger los extremos libres del adaptador de una degradación con exonucleasas. Puede usarse cualquier SSB adecuada para unir las regiones monocatenarias del adaptador para proteger las regiones monocatenarias de la actividad exonucleasa. Ejemplos de SSBs adecuadas incluyen la SSB del virus del herpes simple (HSV-1) (Mapelli M, Panjikar S, Tucker PA (2005). "The crystal structure of the herpes simplex virus 1 ssDNA-binding protein suggests the structural basis for flexible, cooperative single-stranded DNA binding". J Biol Chem. 280 (4): 2990-7); la SSB de E. coli (Meyer RR, Laine PS (Diciembre 1990). "The single-stranded DNA-binding protein of Escherichia coli". Microbiol. Rev. 54 (4): 342-80); las SSBs mitocondriales eucariotas, tales como la SSB mitocondrial humana (mtSSB) (Tiranti, V; Rocchi, M; DiDonato, S; Zeviani, M (30 April 1993). "Cloning of human and rat cDNAs encoding the mitochondrial single-stranded DNA-binding protein (SSB)". Gene. 126 (2): 219-25) y la SSB de Saccharomyces cerevisiae (Van Dyck, E; Foury, F; Stillman, B; Brill, SJ (Septiembre 1992). "A single-stranded DNA binding protein required for mitochondrial DNA replication in S. cerevisiae is homologous to E. coli SSB". The EMBO Journal. 11 (9): 3421-30); y la proteína de replicación A (Wold, MS (1997). "Replication protein A: heterotrimeric, single-stranded DNA-binding protein required for eukaryotic DNA metabolism". Annual Review of Biochemistry. 66 (1): 61 -92). Las SSBs están disponibles comercialmente a partir de varios proveedores, incluidos ThermoFisher Scientific (número de catálogo 70032Z500UG) y Sigma-Aldrich (número de MDL MFCD00213047).
Las SSBs se pueden unir a los extremos libres monocatenarios del adaptador antes, durante o después de la ligación del adaptador al polinucleótido diana. Si las SSBs unidas interfieren con la reacción de ligación, las SSBs se unen preferiblemente a los extremos libres monocatenarios del adaptador después de que los adaptadores se liguen con el polinucleótido diana. Después de la ligación del adaptador con el polinucleótido diana, pueden permanecer las siguientes especies de polinucleótidos: adaptador, adaptador-diana y adaptador-diana-adaptador. Los extremos libres monocatenarios de los adaptadores estarán protegidos de la actividad exonucleasa por las SSBs unidas, mientras que la región bicatenaria del adaptador y las moléculas de adaptador-diana serán susceptibles a la actividad exonucleasa. Tras la degradación con la exonucleasa, el adaptador-diana-adaptador con SSBs unidas permanecerá presente. Antes de hibridar los polinucleótidos de adaptador-diana-adaptador con una superficie sólida que tiene oligonucleótidos complementarios a al menos una secuencia de un extremo libre de un adaptador, las SSBs pueden eliminarse para facilitar la hibridación. Las SSBs se pueden eliminar de cualquier manera adecuada. Por ejemplo, las SSBs pueden eliminarse bajo condiciones de desnaturalización.
En algunas realizaciones, los extremos libres de las regiones monocatenarias del adaptador incluyen un grupo de biotina al que pueden unirse avidina o estreptavidina, para evitar la degradación con una exonucleasa. La biotina se puede fijar a los extremos libres 5’ y 3' del adaptador de cualquier manera adecuada. Por ejemplo, la biotina puede incorporarse en un extremo 5’ o 3' de un adaptador mediante la incorporación enzimática de un nucleótido marcado con biotina, mediante una modificación química del extremo 5’ o 3' para fijar la biotina, mediante el uso de cebadores de oligonucleótidos marcados y similares. A modo de ejemplo, se puede incorporar biotina en un extremo 3’ usando, por ejemplo, una desoxinucleotidil transferasa terminal (TdT) para catalizar la incorporación de nucleótidos no dirigida por un molde, de un nucleótido biotinilado en el extremo 3'-OH de un ADN monocatenario. Un ejemplo de un kit para fijar una biotina a un extremo 3’ de un extremo libre de un adaptador, es el kit para marcar el extremo 3' de la biotina de ThermoScientific Pierce (número de catálogo 89818), que incorporaba un ribonucleótido biotinilado en 1-3 (biotin-11 -UTP) en el extremo 3’ del ADN monocatenario usando TdT.
El nucleótido marcado con biotina puede comprender un enlazador escindible, tal como un enlace disulfuro, que se puede escindir, por ejemplo, con ditiotreitol para liberar la biotina (y cualquier avidina o estreptavidina). Los marcadores de biotina con enlazadores escindibles, incluidos los nucleótidos marcados con biotina que tienen enlazadores escindibles, están disponibles comercialmente a partir de varios proveedores, tales como Integrated DNA Technologies, Inc. (IDT) de Skokie, IL.
La avidina o estreptavidina pueden unirse al adaptador antes, durante o después de la ligación del adaptador al polinucleótido diana. Si la avidina o la estreptavidina unidas interfieren con la reacción de ligación, la avidina o la estreptavidina se unen preferiblemente a los extremos libres monocatenarios del adaptador después de que los adaptadores se ligan al polinucleótido diana. Después de la ligación del adaptador al polinucleótido diana, pueden permanecer las siguientes especies de polinucleótidos: adaptador, adaptador-diana y adaptador-diana-adaptador. Los extremos libres monocatenarios de los adaptadores estarán protegidos de la actividad exonucleasa a través de la avidina o estreptavidina unidas, mientras que la región bicatenaria del adaptador y las moléculas de adaptador-diana serán susceptibles a la actividad exonucleasa. Después de la degradación de la exonucleasa, el adaptador-diana-adaptador con avidina o estreptavidina unida permanecerá presente. Antes de hibridar los polinucleótidos de adaptador-dianaadaptador con una superficie sólida que tiene oligonucleótidos complementarios a al menos una secuencia de un extremo libre de un adaptador, la avidina o la estreptavidina pueden eliminarse para facilitar la hibridación. La avidina o la estreptavidina se pueden eliminar de cualquier manera adecuada. Preferiblemente, el marcador de biotina comprende un enlazador escindible que permite eliminar la biotina y la avidina o estreptavidina unidas.
En algunas realizaciones, los extremos libres de las regiones monocatenarias del adaptador están unidos mediante anticuerpos dirigidos a los adaptadores en forma de Y para evitar la degradación de los extremos monocatenarios 5’ y 3' del adaptador a través de una exonucleasa.
Preferiblemente, los extremos del adaptador que forman la región bicatenaria del adaptador son susceptibles a la actividad exonucleasa. Preferiblemente, los extremos del adaptador que forman la región bicatenaria del adaptador son al menos tan susceptibles a la actividad exonucleasa como los extremos que contienen nucleótidos no modificados. En algunas realizaciones, los extremos del adaptador que forman la región bicatenaria del adaptador contienen nucleótidos sin modificar.
Las hebras individuales de oligonucleótidos se pueden mezclar y aparear para producir un adaptador que tiene una porción bicatenaria y una porción monocatenaria para ligar la porción bicatenaria a un fragmento diana bicatenario.
Al menos una entre la primera o la segunda hebra que forma el adaptador incluye una secuencia de marcador de indicador específica de la colección. La secuencia del marcador de indicador se puede fijar a los polinucleótidos diana de cada colección ligando el adaptador a la diana antes de que la muestra se inmovilice para la secuenciación. El marcador de indicador no está formado el mismo por una parte del polinucleótido diana, sino que se convierte en una parte del molde para la amplificación. El marcador de indicador puede ser una secuencia sintética de nucleótidos que se añade a la diana como una parte de la etapa de preparación del molde. Por consiguiente, un marcador de indicador específico de una colección es un marcador de la secuencia de ácido nucleico que se fija a cada una de las moléculas diana de una colección particular, cuya presencia es indicativa o se usa para identificar la colección a partir de la que se aislaron las moléculas diana.
Preferiblemente, la secuencia del marcador de indicador tiene 20 nucleótidos o menos de longitud. Por ejemplo, la secuencia del marcador de indicador puede tener una longitud de 1 a 10 nucleótidos o de 4 a 6 nucleótidos. Un marcador de indicador de cuatro nucleótidos ofrece la posibilidad de multiplexar 256 muestras en la misma matriz, un marcador de indicador de seis bases permite procesar 4096 muestras en la misma matriz. Los adaptadores pueden contener más de un marcador de indicador para que se puedan incrementar las posibilidades de multiplexación.
La secuencia de un marcador de indicador específica de una colección puede estar ubicada en una región monocatenaria, bicatenaria, o incluir las regiones monocatenarias y bicatenarias del adaptador. Preferiblemente, la secuencia del marcador de indicador está en una región monocatenaria del adaptador.
Los adaptadores pueden incluir cualquier otra secuencia adecuada además de la secuencia del marcador de indicador. Por ejemplo, los adaptadores pueden comprender secuencias de cebadores de extensión universal, que normalmente se encuentran en el extremo 5’ o 3' del adaptador y el polinucleótido resultante para la secuenciación. Las secuencias del cebador de extensión universal se pueden hibridar con cebadores complementarios unidos a una superficie de un sustrato sólido. Los cebadores complementarios comprenden un extremo 3’ libre a partir del cual una polimerasa u otra enzima adecuada puede añadir nucleótidos para extender la secuencia usando el polinucleótido de la colección hibridado como molde, dando como resultado una hebra inversa del polinucleótido de la colección acoplada a la superficie sólida. Tal extensión puede formar parte de una tanda de secuenciación o una amplificación de las agrupaciones.
En algunas realizaciones, los adaptadores comprenden una o varias secuencias de cebadores de secuenciación universal. Las secuencias de cebadores de secuenciación universal pueden unirse a cebadores de secuenciación para permitir la secuenciación de una secuencia de marcador de indicador, una secuencia diana o una secuencia de marcador de indicador y una secuencia diana.
La secuencia de nucleótidos precisa de los adaptadores generalmente no es un objeto de la invención y puede ser seleccionada por el usuario de manera que los elementos de la secuencia deseada se incluyan en última instancia en las secuencias comunes de la colección de los moldes obtenidos a partir de los adaptadores para, por ejemplo, proporcionar sitios de unión para conjuntos particulares de cebadores de extensión universal y/o cebadores de secuenciación.
Preferiblemente, el adaptador se fija a ambos extremos de un polipéptido diana para producir un polinucleótido que tiene una secuencia de nucleótidos de primer adaptador-diana-segundo adaptador. El primer y el segundo adaptador pueden ser iguales o diferentes. Preferiblemente, el primer y el segundo adaptador son iguales. En tales realizaciones, el polinucleótido resultante tendrá una secuencia de nucleótidos de primer adaptador-diana-primer adaptador. Si el primer y el segundo adaptador son diferentes, al menos uno entre el primer y el segundo adaptador comprende una secuencia de marcador de indicador específica de la colección.
Se entenderá que una "secuencia de primer adaptador-diana-segundo adaptador", una "secuencia de primer adaptador-diana-primer adaptador" o una "secuencia de adaptador-diana-adaptador" se refiere a la orientación de los adaptadores entre sí y con la diana y no significa necesariamente que la secuencia no pueda incluir secuencias adicionales, tales como secuencias de enlazadores, por ejemplo.
Se pueden preparar otras colecciones de una manera similar, cada una de las cuales incluye al menos una secuencia de marcador de indicador específica de la colección o combinaciones de secuencias de marcador de indicador diferentes de una secuencia de marcador de indicador o una combinación de secuencias de marcador de indicador de las otras colecciones.
Después de ligar los adaptadores con los polinucleótidos diana, los polinucleótidos resultantes pueden someterse a un proceso de purificación para mejorar la pureza de los polinucleótidos de adaptador-diana-adaptador, eliminando al menos una porción de los adaptadores no incorporados. Puede usarse cualquier proceso de purificación adecuado, tal como electroforesis, cromatografía de exclusión por tamaño o similares. En algunas realizaciones, pueden emplearse perlas paramagnéticas de inmovilización inversa en fase sólida (SPRI) para separar los polinucleótidos de adaptador-dianaadaptador de los adaptadores no fijados. Si bien tales procesos pueden mejorar la pureza de los polinucleótidos de adaptador-diana-adaptador resultantes, es probable que queden sin fijar algunos oligonucleótidos de adaptador.
El proceso de purificación se puede realizar en cada colección por separado o en colecciones agrupadas.
Tratamiento con exonucleasa
Las soluciones o composiciones que comprenden los polinucleótidos de adaptador-diana-adaptador resultantes, ya sea que se hayan sometido primero a una purificación o no, junto con cualquier oligonucleótido adaptador no incorporado o polinucleótido diana, se someten a un tratamiento con una exonucleasa para digerir los polinucleótidos que tienen un extremo 5’ desprotegido o un extremo 3’ desprotegido, incluidos los adaptadores no incorporados.
Puede usarse cualquier exonucleasa adecuada. Preferiblemente, la exonucleasa tiene actividad exonucleasa 5’ y 3'. Una exonucleasa que tiene "actividad exonucleasa 5’" es una exonucleasa que digiere el ADN en dirección 5' a 3’. Una exonucleasa que tiene "actividad exonucleasa 3’" es una exonucleasa que digiere el ADN en dirección 3' a 5’. La exonucleasa puede comprender actividad para ADN bicatenario sin corte de cadena sencilla. Un ejemplo de una exonucleasa adecuada que tiene actividad exonucleasa 5’ y 3' y tiene actividad para el ADN bicatenario sin corte de hebra sencilla, es la exonucleasa V, que es un complejo RecBCD de E. coli y está disponible, por ejemplo, en New England Biolabs (n° de cat. M0345S/L).
En algunas realizaciones, se pueden emplear dos exonucleasas, una con actividad exonucleasa 5’ y la otra con actividad exonucleasa 3'. Ejemplos de exonucleasas que tienen actividad exonucleasa 5’ incluyen la exonucleasa lambda (New England Biolabs) y la exonucleasa VIII truncada (New England Biolabs). Un ejemplo de una exonucleasa que tiene actividad exonucleasa 3’ es la exonucleasa T (New England Biolabs).
El tratamiento con exonucleasas se puede realizar en cada colección por separado o en colecciones agrupadas. Después del tratamiento con la exonucleasa, se puede realizar una etapa de purificación, como la descrita anteriormente, antes de inmovilizar los polinucleótidos sobre una superficie sólida para la secuenciación.
Si las colecciones no se han agrupado, pueden agruparse antes de inmovilizarlas sobre una superficie de secuenciación.
Preparación de muestras inmovilizadas para la secuenciación
Las preparaciones de colecciones tratadas con exonucleasa agrupadas se pueden inmovilizar después sobre una superficie sólida como preparación para una secuenciación. La secuenciación se puede realizar como una matriz de moléculas individuales o se pueden amplificar antes de la secuenciación. La amplificación se puede llevar a cabo usando uno o varios cebadores inmovilizados. El o los cebadores inmovilizados pueden ser un césped sobre una superficie plana, agrupaciones sobre una superficie plana, en pocillos de una estructura de pocillos múltiples, en un grupo de perlas o similares. El conjunto de perlas se puede aislar en una emulsión con una sola perla en cada "compartimento" de la emulsión. Con una concentración de solo un molde por "compartimento", solo se amplifica un único molde en cada perla.
La expresión "amplificación en fase sólida" tal y como se usa en este documento, se refiere a cualquier reacción de amplificación de polinucleótidos llevada a cabo sobre o en asociación con un soporte sólido, de manera que todos o una porción de los productos amplificados se inmovilizan sobre el soporte sólido a medida que se forman. En particular, la expresión incluye la reacción en cadena de la polimerasa en fase sólida (PCR en fase sólida) y la amplificación isotérmica en fase sólida, que son reacciones análogas a la amplificación en fase de solución estándar, excepto que uno o ambos cebadores directos e inversos de la amplificación están inmovilizados sobre el soporte sólido. La PCR en fase sólida incluye sistemas como las emulsiones, en donde un cebador está anclado a una perla y el otro está en solución libre, y la formación de colonias en matrices de geles en fase sólida, en donde un cebador está anclado a la superficie y el otro en solución libre.
Aunque la descripción incluye métodos de amplificación en "fase sólida" en los que solo se inmoviliza un cebador de la amplificación (el otro cebador suele estar presente en una solución libre), se prefiere que el soporte sólido se proporcione con los cebadores directos e inversos inmovilizados. En la práctica, habrá una "pluralidad" de cebadores directos idénticos y/o una "pluralidad" de cebadores inversos idénticos, inmovilizados sobre el soporte sólido, ya que el procedimiento de amplificación requiere un exceso de cebadores para mantener la amplificación. Las referencias en el presente documento a cebadores directos e inversos deben interpretarse en consecuencia como que incluyen una "pluralidad" de dichos cebadores, a menos que el contexto indique lo contrario.
Como apreciará el lector experto, cualquier reacción de amplificación dada requiere al menos un tipo de cebador directo y al menos un tipo de cebador inverso, específico para el molde que se va a amplificar. Sin embargo, en ciertas realizaciones, los cebadores directos e inversos pueden comprender porciones específicas de un molde con la secuencia idéntica, y pueden tener una secuencia y estructura de nucleótidos completamente idéntica (incluyendo cualquier modificación que no sea de nucleótido). En otras palabras, es posible llevar a cabo la amplificación en fase sólida usando solo un tipo de cebador, y tales métodos de cebador único están incluidos dentro del alcance de la invención. Otras realizaciones pueden usar cebadores directos e inversos que contienen secuencias específicas de un molde idénticas pero que difieren en algunas otras características estructurales. Por ejemplo, un tipo de cebador puede contener una modificación no nucleotídica que no está presente en el otro.
A lo largo de esta descripción, los términos "P5" y "P7" se utilizan cuando se hace referencia a adaptadores y/o a cebadores de amplificación. Se entenderá que se puede usar cualquier cebador de amplificación adecuado en los métodos presentados en este documento, y que el uso de P5 y P7 es únicamente para realizaciones ejemplares. Los usos de cebadores de amplificación tales como P5 y P7 en celdas de flujo se conocen en la técnica, como se ejemplifica en las descripciones de los documentos WO 2007/010251, w O 2006/064199, WO 2005/065814, WO 2015/106941, WO 1998/044151 y WO 2000/018957, cada uno de los cuales se incorpora como referencia en su totalidad. Por ejemplo, cualquier cebador de amplificación directo adecuado, ya sea inmovilizado o en solución, puede ser útil en los métodos presentados en este documento para la hibridación con una secuencia complementaria y la amplificación de una secuencia. De manera similar, cualquier cebador de amplificación inverso adecuado, ya sea inmovilizado o en solución, puede ser útil en los métodos presentados en este documento para la hibridación con una secuencia complementaria y la amplificación de una secuencia. Un experto en la técnica sabrá cómo diseñar y usar secuencias de cebadores que sean adecuadas para la captura y amplificación de ácidos nucleicos, tal y como se presenta en este documento.
Los cebadores para una amplificación en fase sólida se inmovilizan preferiblemente mediante fijación covalente de un solo punto al soporte sólido en el extremo 5’ del cebador o cerca del mismo, dejando libre la porción específica del molde del cebador para hibridarla con su molde afín y el grupo hidroxilo 3' libre para la extensión del cebador. Cualquier medio de fijación covalente adecuado conocido en la técnica puede usarse para este fin. La química de fijación elegida dependerá de la naturaleza del soporte sólido y de cualquier derivatización o funcionalización que se le aplique. El cebador mismo puede incluir un resto, que puede ser una modificación química no nucleotídica, para facilitar la fijación. En algunas realizaciones, el cebador incluye un nucleófilo que contiene azufre, tal como fosforotioato o tiofosfato, en el extremo 5’. La superficie del soporte sólido puede incluir o estar modificada para incluir un resto al que se puede fijar el nucleófilo que contiene azufre. Por ejemplo, un nucleófilo que contiene azufre puede unirse a un grupo bromoacetamida. En algunas realizaciones, un hidrogel de poliacrilamida con soporte sólido comprende un grupo bromoacetamida para unirse a un nucleófilo que contiene azufre. Un medio más particular para fijar cebadores y moldes a un soporte sólido es mediante la unión de fosforotioato 5’ a un hidrogel compuesto por acrilamida polimerizada y N-(5-bromoacetamidilpentil)acrilamida (BRAPA), tal y como se describe completamente en el documento WO/2005065814.
Los soportes sólidos que comprenden un sustrato inerte o una matriz (por ejemplo, portaobjetos de vidrio, perlas de polímero, etc.) se pueden "funcionalizar", por ejemplo, mediante la aplicación de una capa o un revestimiento de un material intermedio que comprende grupos reactivos que permiten la fijación covalente a biomoléculas, tales como como polinucleótidos. Ejemplos de tales soportes incluyen, pero no se limitan a, hidrogeles de poliacrilamida sostenidos sobre un sustrato inerte, tal como vidrio. En tales realizaciones, las biomoléculas (por ejemplo, polinucleótidos) se pueden fijar de forma covalente directamente al material intermedio (por ejemplo, el hidrogel), pero el material intermedio mismo puede estar fijado de forma no covalente al sustrato o la matriz (por ejemplo, el sustrato de vidrio). La expresión " fijación covalente a un soporte sólido" debe interpretarse en consecuencia como que incluye ese tipo de disposición.
Las muestras de la colección agrupadas se pueden amplificar sobre una superficie sólida que contiene un cebador de amplificación directo e inverso. En algunas realizaciones, las colecciones agrupadas de polinucleótidos se utilizan para preparar matrices agrupadas de colonias de poliácido nucleico, análogas a las descritas en los documentos de publicación de patente de EE.UU. n° 2005/0100900, patente de EE.Uu . n° 7.115.400, WO 00/18957 y WO 98/44151, mediante amplificación en fase sólida y más particularmente amplificación isotérmica en fase sólida. Los términos "agrupación" y "colonia" se usan indistintamente en este documento para referirse a un sitio discreto sobre un soporte sólido, compuesto por una pluralidad de hebras de ácido nucleico inmovilizadas idénticas y una pluralidad de hebras de ácido nucleico complementarias inmovilizadas idénticas. La expresión "matriz agrupada" se refiere a una matriz formada a partir de tales agrupaciones o colonias. En este contexto, el término "matriz" no debe entenderse como que requiera una disposición ordenada de agrupaciones.
La expresión fase sólida, o superficie, se usa para que signifique una matriz plana en donde se fijan los cebadores a una superficie plana, por ejemplo, un portaobjetos de microscopio de vidrio, sílice o plástico o dispositivos de celda de flujo similares; perlas, en donde uno o dos cebadores se fijan a las perlas y las perlas se amplifican; una matriz de perlas sobre una superficie después de que las perlas se hayan amplificado; o similar.
Las expresiones "superficie sólida", "soporte sólido" y otros equivalentes gramaticales en este documento, se refieren a cualquier material que sea apropiado o pueda modificarse para que sea apropiado para la fijación de los polinucleótidos molde. Como apreciarán los expertos en la técnica, el número de posibles sustratos es muy grande. Los posibles sustratos incluyen, entre otros, vidrio y vidrio modificado o funcionalizado, plásticos (incluidos acrílicos, poliestireno y copolímeros de estireno y otros materiales, polipropileno, polietileno, polibutileno, poliuretanos, Teflón™, etc.), polisacáridos, nailon o nitrocelulosa, cerámica, resinas, sílice o materiales a base de sílice que incluyen silicio y silicio modificado, carbono, metales, vidrios inorgánicos, plásticos, haces de fibras ópticas y una variedad de otros polímeros. Los soportes sólidos y las superficies sólidas particularmente útiles para algunas realizaciones se encuentran dentro de un aparato de celda de flujo. Las celdas de flujo ejemplares se exponen con más detalle a continuación.
En algunas realizaciones, el soporte sólido comprende una superficie con patrón. Una "superficie con patrón" se refiere a una disposición de diferentes regiones en o sobre una capa expuesta de un soporte sólido. Por ejemplo, una o varias de las regiones pueden ser características en las que están presentes uno o varios cebadores de amplificación. Las características pueden estar separadas por regiones intersticiales en donde los cebadores de amplificación no están presentes. En algunas realizaciones, el patrón puede ser un formato x-y de características que están en filas y columnas. En algunas realizaciones, el patrón puede ser una disposición repetida de características y/o regiones intersticiales. En algunas realizaciones, el patrón puede ser una disposición aleatoria de características y/o regiones intersticiales. Superficies modeladas ejemplares que pueden usarse en los métodos y composiciones establecidos en este documento, se describen en los documentos de patente de EE.UU. n° 8.778.848, 8.778.849, 9.079.148 y de publicación de patente de EE.UU. n° 2014/0243224.
En algunas realizaciones, el soporte sólido comprende una serie de pocillos o depresiones en una superficie. Esto se puede preparar tal y como se conoce generalmente en la técnica usando una variedad de técnicas, que incluyen, pero no se limitan a, fotolitografía, técnicas de estampación, técnicas de moldeo y técnicas de micrograbado. Como apreciarán los expertos en la técnica, la técnica utilizada dependerá de la composición y la forma del sustrato de la matriz.
Las características en una superficie con patrón pueden ser pocillos en una matriz de pocillos (por ejemplo, micropocillos o nanopocillos) sobre vidrio, silicio, plástico u otros soportes sólidos adecuados con un gel con patrón, unido covalentemente, tal como poli(N-(5-azidoacetamidilpentil)acrilamida-co-acrilamida) (PAZAM, véanse, por ejemplo, los documentos de publicación de patente de EE.UU. n° 2013/184796, WO 2016/066586 y Wo 2015/002813). El procedimiento crea almohadillas de gel que se utilizan para la secuenciación que pueden ser estables durante las ejecuciones de una secuenciación con una gran cantidad de ciclos. La unión covalente del polímero a los pocillos es útil para mantener el gel en las características estructuradas a lo largo de la vida útil del sustrato estructurado durante una variedad de usos. Sin embargo, en muchas realizaciones, no es necesario que el gel esté unido covalentemente a los pocillos. Por ejemplo, en algunas condiciones se puede utilizar acrilamida sin silano (SFA, véase, por ejemplo, el documento de patente de EE.UU. n° 8.563.477) que no está fijada covalentemente a ninguna parte del sustrato estructurado, como material de gel.
En realizaciones particulares, se puede preparar un sustrato estructurado modelando un material de soporte sólido con pocillos (por ejemplo, micropocillos o nanopocillos), recubriendo el soporte con patrón con un material de gel (por ejemplo, PAZAM, SFA o variantes modificadas químicamente de los mismos, como la versión azidolizada de SFA (azido-SFA)) y puliendo el soporte recubierto con gel, por ejemplo, mediante pulido químico o mecánico, reteniendo así el gel en los pocillos pero eliminando o inactivando sustancialmente todo el gel de las regiones intersticiales en la superficie del sustrato estructurado entre los pocillos. Los ácidos nucleicos del cebador pueden fijarse al material de gel. Una solución de ácidos nucleicos diana (por ejemplo, un genoma humano fragmentado) se puede poner entonces en contacto con el sustrato pulido, de manera que los ácidos nucleicos diana individuales sembrarán los pocillos individuales mediante interacciones con cebadores fijados al material del gel; sin embargo, los ácidos nucleicos diana no ocuparán las regiones intersticiales debido a la ausencia o inactividad del material del gel. La amplificación de los ácidos nucleicos diana se limitará a los pocillos, ya que la ausencia o inactividad del gel en las regiones intersticiales evita la migración hacia el exterior de la colonia de ácidos nucleicos en crecimiento. El procedimiento se puede producir convenientemente, pudiéndose expandir y utiliza métodos convencionales de micro o nanopreparación.
La expresión "celda de flujo", tal y como se usa en este documento, se refiere a una cámara que comprende una superficie sólida a través de la cual pueden fluir uno o varios reactivos fluidos. Ejemplos de celdas de flujo y sistemas fluidos relacionados y plataformas de detección que pueden usarse fácilmente en los métodos de la presente descripción, se describen, por ejemplo, en Bentley et al., Nature 456:53-59 (2008), documentos WO 04/018497; US 7.057.026; WO 91/06678; WO 07/123744; US 7.329.492; US 7.211.414; US 7.315.019; US 7.405.281 y US 2008/0108082.
En algunas realizaciones, el soporte sólido o su superficie no es plana, tal como la superficie interior o exterior de un tubo o recipiente. En algunas realizaciones, el soporte sólido comprende microesferas o perlas. Por "microesferas" o "perlas" o "partículas" o equivalentes gramaticales en el presente documento, se entiende pequeñas partículas discretas. Las composiciones de perlas adecuadas incluyen, pero no se limitan a, plásticos, cerámica, vidrio, poliestireno, metilestireno, polímeros acrílicos, materiales paramagnéticos, sol de toria, grafito de carbono, dióxido de titanio, látex o dextranos reticulados tales como sefarosa, celulosa, nailon, micelas reticuladas y teflón, todos ellos se pueden emplear así como cualquier otro material descrito en este documento para soportes sólidos. La "Microsphere Detection Guide" de Bangs Laboratories, Fishers Ind., es una guía útil. En determinadas realizaciones, las microesferas son microesferas o perlas magnéticas.
Las perlas no tienen que ser esféricas; se pueden utilizar partículas irregulares. Alternativa o adicionalmente, las perlas pueden ser porosas. Los tamaños de las perlas varían de nanómetros, es decir, 100 nm, a milímetros, es decir, 1 mm, prefiriéndose perlas de aproximadamente 0,2 micrones a aproximadamente 200 micrones, y siendo particularmente preferidas de aproximadamente 0,5 a aproximadamente 5 micrones, aunque en algunas realizaciones se pueden usar perlas más pequeñas o más grandes.
Las matrices agrupadas se pueden preparar utilizando un procedimiento de termociclado, tal y como se describe en el documento WO/9844151, o un procedimiento mediante el cual la temperatura se mantiene constante, y los ciclos de extensión y desnaturalización se realizan mediante cambios de reactivos. Esos métodos de amplificación isotérmica se describen en los documentos de solicitud de patente WO/0246456 y US 2008/0009420. Debido a las temperaturas más bajas requeridas en el procedimiento isotérmico, este es particularmente preferido.
Se apreciará que cualquiera de las metodologías de amplificación descritas en el presente documento o generalmente conocidas en la técnica se puede utilizar con cebadores universales o específicos de la diana, para amplificar fragmentos de ADN inmovilizados. Los métodos adecuados para la amplificación incluyen, entre otros, la reacción en cadena de la polimerasa (PCR), la amplificación por desplazamiento de cadena (SDA), la amplificación mediada por transcripción (TMA) y la amplificación basada en la secuencia de ácidos nucleicos (NASBA), tal y como se describe en el documento de patente de EE.UU. n° 8.003.354. Los métodos de amplificación anteriores se pueden emplear para amplificar uno o varios ácidos nucleicos de interés. Por ejemplo, se puede utilizar una PCR, que incluye PCR múltiple, SDA, TMA, NASBA y similares para amplificar fragmentos de ADN inmovilizados. En algunas realizaciones, los cebadores dirigidos específicamente al polinucleótido de interés se incluyen en la reacción de amplificación.
Otros métodos adecuados para la amplificación de polinucleótidos pueden incluir las tecnologías de extensión y ligación de oligonucleótidos, amplificación de círculo rodante (RCA) (Lizardi et al., Nat. Genet. 19:225-232 (1998)) y ensayo de ligación de oligonucleótidos (OLA) (véanse en general los documentos de Pat. de EE.UU. n° 7.582.420, 5.185.243, 5.679.524 y 5.573.907; EP 0320308 B1; EP 0336731 B1; EP 0439182 B1; WO 90/01069; WO 89/12696; y WO 89/09835). Se apreciará que estas metodologías de amplificación pueden diseñarse para amplificar fragmentos de ADN inmovilizados. Por ejemplo, en algunas realizaciones, el método de amplificación puede incluir reacciones de amplificación con una sonda de ligación o de ensayo de ligación de oligonucleótidos (OLA) que contienen cebadores dirigidos específicamente al ácido nucleico de interés. En algunas realizaciones, el método de amplificación puede incluir una reacción de ligación-extensión de cebador que contiene cebadores dirigidos específicamente al ácido nucleico de interés. Como ejemplo no limitante de cebadores de extensión y ligación de cebadores que pueden diseñarse específicamente para amplificar un ácido nucleico de interés, la amplificación puede incluir cebadores usados para el ensayo GoldenGate (Illumina, Inc., San Diego, CA), tal y como se ejemplifica en los documentos de Pat. de EE.UU. n27.582.420 y 7.611.869.
Los métodos de amplificación isotérmica ejemplares que pueden usarse en un método de la presente descripción incluyen, pero no se limitan a, amplificación con desplazamiento múltiple (MDA), tal y como se ejemplifica, por ejemplo, en Dean et al., Proc. Natl. Acad. Sci. USA 99:5261-66 (2002) o amplificación de ácido nucleico por desplazamiento de cadena isotérmica, ejemplificada, por ejemplo, en el documento de Pat. de EE.UU. n° 6.214.587. Otros métodos no basados en una PCR que pueden usarse en la presente descripción incluyen, por ejemplo, la amplificación por desplazamiento de cadena (SDA) que se describe, por ejemplo, en Walker et al., Molecular Methods for Virus Detection, Academic Press, Inc., 1995; los documentos de Pat. de EE.u U. n° 5.455.166 y 5.130.238 y Walker et al., Nucl. Acids Res. 20:1691-96 (1992) o la amplificación por desplazamiento de cadena hiperramificada que se describe, por ejemplo, en Lage et al., Genome Res. 13:294-307 (2003)). Pueden usarse métodos de amplificación isotérmica con la polimerasa Phi 29 por desplazamiento de cadena o el fragmento grande de la polimerasa de ADN Bst, 5’ -> 3' exo- para la amplificación de cebadores aleatorios de ADN genómico. El uso de esas polimerasas aprovecha su alta procesividad y su actividad de desplazamiento de cadena. La alta procesividad permite que las polimerasas produzcan fragmentos de 10 a 20 kb de longitud. Como se ha expuesto anteriormente, se pueden producir fragmentos más pequeños en condiciones isotérmicas usando polimerasas que tienen baja procesividad y actividad de desplazamiento de hebra, tales como la polimerasa Klenow. Una descripción adicional de las reacciones, condiciones y componentes de una amplificación, se establece en detalle en la descripción del documento de Pat. de EE.UU. n° 7.670.810.
Otro método de amplificación de polinucleótidos que es útil en la presente descripción es la PCR marcada que usa una población de cebadores con dos dominios que tienen una región 5’ constante seguida de una región 3' aleatoria tal y como se describe, por ejemplo, en Grothues et al. Nucleic Acids Res. 21 (5):1321 -2 (1993). Las primeras rondas de la amplificación se llevan a cabo para permitir una multitud de iniciaciones sobre un ADN desnaturalizado con calor, basándose en la hibridación individual de la región 3’ sintetizada aleatoriamente. Debido a la naturaleza de la región 3’, se contempla que los sitios de iniciación sean aleatorios en todo el genoma. A partir de entonces, los cebadores no unidos pueden eliminarse y puede tener lugar una replicación adicional utilizando cebadores complementarios a la región 5’ constante.
En algunas realizaciones, la amplificación isotérmica se puede realizar usando una amplificación por exclusión cinética (KEA), también denominada amplificación por exclusión (ExAmp). Se puede preparar una colección de ácidos nucleicos de la presente descripción usando un método que incluye una etapa de hacer reaccionar un reactivo de la amplificación para producir una pluralidad de sitios de amplificación, en donde cada uno incluye una población sustancialmente clonal de amplicones procedentes de un ácido nucleico diana individual que se ha sembrado en el sitio. En algunas realizaciones, la reacción de amplificación prosigue hasta que se genera un número suficiente de amplicones como para llenar la capacidad del sitio de amplificación respectivo. Llenar un sitio ya sembrado hasta su capacidad de esta manera inhibe que los ácidos nucleicos diana se depositen y amplifiquen en el sitio, produciendo así una población clonal de amplicones en el sitio. En algunas realizaciones, se puede lograr una clonalidad aparente, incluso si un sitio de amplificación no está lleno hasta su capacidad antes de que llegue un segundo ácido nucleico diana al sitio. En algunas condiciones, la amplificación de un primer ácido nucleico diana puede llevarse a cabo hasta un punto en el que se prepara un número suficiente de copias para poder competir eficazmente o superar la producción de copias de un segundo ácido nucleico diana que se transporta al sitio. Por ejemplo, en una realización que usa un procedimiento de amplificación en puente sobre una característica circular que es menor de 500 nm de diámetro, se ha determinado que después de 14 ciclos de amplificación exponencial para un primer ácido nucleico diana, la contaminación de un segundo ácido nucleico diana en el mismo sitio producirá un número insuficiente de amplicones contaminantes como para poder afectar negativamente al análisis de la secuenciación mediante síntesis en una plataforma de secuenciación de Illumina.
Como se demuestra en el ejemplo anterior, los sitios de amplificación en una matriz pueden ser, pero no tienen que ser, completamente clonales en realizaciones particulares. Más bien, para algunas aplicaciones, un sitio de amplificación individual puede estar poblado predominantemente por amplicones de un primer ácido nucleico diana y también puede tener un nivel bajo de amplicones contaminantes de un segundo ácido nucleico diana. Una matriz puede tener uno o varios sitios de amplificación que tienen un nivel bajo de amplicones contaminantes, siempre que el nivel de contaminación no tenga un impacto inaceptable sobre un uso posterior de la matriz. Por ejemplo, cuando la matriz se va a utilizar en una aplicación de detección, un nivel aceptable de contaminación sería un nivel que no afecta a la señal del ruido o a la resolución de la técnica de detección de una manera inaceptable. Por consiguiente, la clonalidad aparente será generalmente relevante para un uso o aplicación particular de una matriz preparada mediante los métodos expuestos en este documento. Los niveles de contaminación ejemplares que pueden ser aceptables en un sitio de amplificación individual para aplicaciones particulares incluyen, pero no se limitan a, como máximo 0,1%, 0,5%, 1%, 5%, 10% o 25% de amplicones contaminantes. Una matriz puede incluir uno o varios sitios de amplificación que tengan esos niveles ejemplares de amplicones contaminantes. Por ejemplo, hasta el 5%, 10%, 25%, 50%, 75% o incluso el 100% de los sitios de amplificación en una matriz pueden tener algunos amplicones contaminantes. Se entenderá que en una matriz u otra colección de sitios, al menos el 50%, 75%, 80%, 85%, 90%, 95% o 99% o más de los sitios pueden ser clonales o aparentemente clonales.
En algunas realizaciones, la exclusión cinética puede ocurrir cuando un procedimiento tiene lugar a una tasa lo suficientemente rápida para excluir de manera efectiva que ocurra otro evento o procedimiento. Tomemos, por ejemplo, la preparación de una matriz de ácidos nucleicos en donde los sitios de la matriz se siembran aleatoriamente con ácidos nucleicos diana de una solución y se generan copias del ácido nucleico diana en un procedimiento de amplificación para rellenar cada uno de los sitios sembrados hasta su capacidad. De acuerdo con los métodos de exclusión cinética de la presente descripción, los procedimientos de siembra y amplificación pueden proceder simultáneamente en condiciones en las que la tasa de amplificación excede la tasa de siembra. Como tal, la tasa relativamente rápida a la que se hacen las copias en un sitio que ha sido sembrado por un primer ácido nucleico diana excluirá eficazmente que un segundo ácido nucleico se siembre en el sitio de la amplificación. Los métodos de amplificación por exclusión cinética se pueden llevar a cabo tal y como se describe en detalle en la descripción del documento de publicación de EE.UU. n° 2013/0338042, que se incorpora en este documento como referencia en su totalidad.
La exclusión cinética puede aprovechar una tasa relativamente lenta para iniciar la amplificación (por ejemplo, una tasa lenta para realizar una primera copia de un ácido nucleico diana) frente a una tasa relativamente rápida para realizar copias posteriores del ácido nucleico diana (o de la primera copia del ácido nucleico diana). En el ejemplo del párrafo anterior, la exclusión cinética se produce debido a la tasa relativamente lenta de siembra del ácido nucleico diana (p. ej., una difusión o transporte relativamente lento) frente a la tasa relativamente rápida a la que se produce la amplificación para llenar el sitio con copias de la semilla del ácido nucleico. En otra realización ejemplar, la exclusión cinética puede ocurrir debido a un retraso en la formación de una primera copia de un ácido nucleico diana que se ha sembrado en un sitio (por ejemplo, una activación retardada o lenta) frente a la tasa relativamente rápida a la que se realizan las copias posteriores para llenar el sitio. En este ejemplo, un sitio individual puede haber sido sembrado con varios ácidos nucleicos diana diferentes (por ejemplo, varios ácidos nucleicos diana pueden estar presentes en cada sitio antes de la amplificación). Sin embargo, la formación de la primera copia para cualquier ácido nucleico diana dado se puede activar aleatoriamente, de modo que la tasa promedio de formación de la primera copia sea relativamente lenta en comparación con la tasa a la que se generan las copias posteriores. En ese caso, aunque un sitio individual puede haber sido sembrado con varios ácidos nucleicos diana diferentes, la exclusión cinética permitirá que solo uno de esos ácidos nucleicos diana sea amplificado. Más específicamente, una vez que se ha activado un primer ácido nucleico diana para la amplificación, el sitio se llenará rápidamente hasta su capacidad con sus copias, evitando así que se produzcan copias de un segundo ácido nucleico diana en el sitio.
Un reactivo de amplificación puede incluir componentes adicionales que faciliten la formación de amplicones y, en algunos casos, aumenten la tasa de formación de amplicones. Un ejemplo es una recombinasa. La recombinasa puede facilitar la formación de amplicones al permitir una invasión/extensión de forma repetida. Más específicamente, una recombinasa puede facilitar la invasión de un ácido nucleico diana a través de la polimerasa y la extensión de un cebador con la polimerasa usando el ácido nucleico diana como molde para la formación de amplicones. Este procedimiento se puede repetir como una reacción en cadena en la que los amplicones producidos en cada ronda de invasión/extensión sirven como moldes en una ronda posterior. El procedimiento puede ocurrir más rápidamente que una PCR estándar, ya que no se requiere un ciclo de desnaturalización (por ejemplo, mediante calentamiento o desnaturalización química). Como tal, la amplificación facilitada por una recombinasa se puede llevar a cabo de forma isotérmica. Generalmente es deseable incluir ATP u otros nucleótidos (o en algunos casos análogos no hidrolizables de los mismos) en un reactivo de amplificación facilitado por la recombinasa para facilitar la amplificación. Una mezcla de recombinasa y proteína de unión monocatenaria (SSB) es particularmente útil ya que la SSB puede facilitar aún más la amplificación. Las formulaciones ejemplares para una amplificación facilitada por recombinasa incluyen las vendidas comercialmente como kits TwistAmp por TwistDx (Cambridge, Reino Unido). Los componentes útiles del reactivo de amplificación facilitado por una recombinasa y las condiciones de reacción se establecen en los documentos de patente de EE.UU. n° 5.223.414 y 7.399.590, cuyo contenido se incorpora en esta memoria como referencia.
Otro ejemplo de un componente que puede incluirse en un reactivo de amplificación para facilitar la formación de amplicones y en algunos casos para aumentar la tasa de formación de amplicones es una helicasa. La helicasa puede facilitar la formación de amplicones al permitir una reacción en cadena de formación de amplicones. El procedimiento puede ocurrir más rápidamente que la PCR estándar ya que no se requiere un ciclo de desnaturalización (por ejemplo, mediante calentamiento o desnaturalización química). Como tal, la amplificación facilitada por una helicasa se puede llevar a cabo de forma isotérmica. Una mezcla de helicasa y de proteína de unión monocatenaria (SSB) es particularmente útil ya que la SSB puede facilitar aún más la amplificación. Las formulaciones ejemplares para la amplificación facilitada por helicasa incluyen las que se venden comercialmente como kits IsoAmp de Biohelix (Beverly, MA). Además, se describen ejemplos de formulaciones útiles que incluyen una proteína helicasa en los documentos US 7.399.590 y US 7.829.284, cada uno de los cuales se incorpora en esta memoria como referencia.
Otro ejemplo más de un componente que puede incluirse en un reactivo de amplificación para facilitar la formación de amplicones y, en algunos casos, aumentar la tasa de formación de amplicones, es una proteína de unión al origen.
Uso en secuenciación/métodos de secuenciación
Los polinucleótidos inmovilizados procedentes de las colecciones agrupadas se pueden secuenciar de cualquier manera adecuada. Preferiblemente, la secuenciación se realiza mediante una secuenciación por síntesis en la que nucleótidos se añaden sucesivamente a un grupo hidroxilo 3’ libre de un cebador de secuenciación, utilizando los polinucleótidos inmovilizados como molde, dando como resultado la síntesis de una cadena polinucleotídica en la dirección 5' a 3’. La naturaleza del nucleótido añadido se determina preferiblemente después de cada adición de un nucleótido. Las técnicas de secuenciación que utilizan una secuenciación por ligación, en donde no se secuencian todas las bases contiguas, y técnicas como la secuenciación distintiva masiva en paralelo (MPSS), en las que las bases se eliminan de las hebras en la superficie, en lugar de añadirlas a ellas, también están dentro del alcance de la descripción, al igual que las técnicas que utilizan la detección de una liberación de pirofosfato (pirosecuenciación). Esas técnicas basadas en la pirosecuenciación son particularmente aplicables a matrices de secuenciación de perlas en donde las perlas se han amplificado en una emulsión, de modo que en cada perla se amplifica un único molde de la molécula de la colección.
El punto de inicio de la reacción de secuenciación puede proporcionarse apareando un cebador de la secuenciación con un producto de la reacción de amplificación en fase sólida. A este respecto, uno o ambos adaptadores añadidos durante la formación de la colección de moldes pueden incluir una secuencia de nucleótidos que permite el apareamiento de un cebador de secuenciación con polinucleótidos inmovilizados, tales como los polinucleótidos de adaptador-diana-adaptador.
La secuencia del marcador de indicador y la secuencia diana se pueden determinar en una sola lectura a partir de un solo cebador de la secuenciación, o en múltiples lecturas a partir de más de un cebador de la secuenciación. En el caso de dos lecturas procedentes de dos cebadores de la secuenciación, la "lectura del marcador de indicador" y la "lectura diana" se pueden realizar en cualquier orden, con una etapa de desnaturalización adecuada para eliminar el cebador hibridado después de que se complete la primera lectura de la secuenciación. Las etapas de desnaturalización adecuadas pueden incluir formamida, hidróxido o calor, tal y como se conoce generalmente en la técnica.
Los productos de las reacciones de amplificación en fase sólida en las que los cebadores de amplificación directa e inversa se inmovilizan covalentemente sobre la superficie sólida, pueden ser las denominadas estructuras "en puente" formadas mediante el apareamiento de pares de hebras de polinucleótidos inmovilizadas y hebras complementarias inmovilizadas, en donde ambas hebras se fijan al soporte sólido en el extremo 5’. Las matrices compuestas por esas estructuras en puente proporcionan moldes ineficaces para la secuenciación de ácidos nucleicos, ya que la hibridación de un cebador de secuenciación convencional con una de las hebras inmovilizadas no se ve favorecida en comparación con el apareamiento de esa hebra con su hebra complementaria inmovilizada en condiciones estándar para una hibridación. Se describen ejemplos de amplificación en puente o en agrupación, por ejemplo, en los documentos de patente de EE.UU. n° 7.985.565 y 7.115.400.
Con el fin de proporcionar moldes más adecuados para la secuenciación de ácidos nucleicos, se prefiere eliminar sustancialmente la totalidad o eliminar o desplazar al menos una porción de una de las hebras inmovilizadas en la estructura "en puente" para generar un molde que sea al menos parcialmente monocatenario. La porción del molde que es monocatenaria estará así disponible para la hibridación con un cebador de la secuenciación. El procedimiento de eliminar toda o una porción de una hebra inmovilizada en una estructura de ácido nucleico bicatenario "en puente", puede denominarse en el presente documento "linealización" y se describe con más detalle en los documentos WO 2007/010251, WO 2006/064199, WO 2005/065814, WO 2015/106941, WO 1998/044151 y WO 2000/018957.
Las estructuras de moldes en puente se pueden linealizar mediante la escisión de una o ambas hebras con una endonucleasa de restricción o mediante la escisión de una hebra con una endonucleasa que corta una hebra sencilla. Se pueden usar otros métodos de escisión como alternativa a las enzimas de restricción o enzimas que cortan una hebra sencilla, que incluyen, entre otros, la escisión química (p. ej., escisión de un enlace diol con peryodato), escisión de sitios abásicos mediante escisión con endonucleasa (por ejemplo, 'USER', como la suministrada por NEB, número de catálogo M5505S), o mediante exposición al calor o álcali, escisión de ribonucleótidos incorporados en productos de amplificación constituidos de lo contrario por desoxirribonucleótidos, escisión fotoquímica o escisión de un enlazador peptídico.
Se apreciará que una etapa de linealización puede no ser esencial si la reacción de amplificación en fase sólida se realiza solo con un cebador inmovilizado covalentemente y el otro en solución libre.
Después de la etapa de escisión, independientemente del método utilizado para la escisión, el producto de la reacción de escisión puede someterse a condiciones de desnaturalización para eliminar la o las porciones de hebras escindidas que no están fijadas al soporte sólido. Las condiciones de desnaturalización adecuadas, por ejemplo, solución de hidróxido de sodio, solución de formamida o calor, serán evidentes para el lector experto haciendo referencia a los protocolos estándar de biología molecular (Sambrook et al., 2001, Molecular Cloning, A Laboratory Manual, tercera edición, Cold Spring Harbor Laboratory Press, NY; Current Protocols, compiladores Ausubel et al.). La desnaturalización da como resultado la producción de un molde de secuenciación que es parcial o sustancialmente monocatenario. A continuación, puede iniciarse una reacción de secuenciación mediante la hibridación de un cebador de secuenciación con la porción monocatenaria del molde.
Por tanto, en algunas realizaciones, una reacción de secuenciación comprende hibridar un cebador de la secuenciación con una región monocatenaria de un producto de amplificación linealizado, incorporando secuencialmente uno o varios nucleótidos en una hebra polinucleotídica complementaria a la región de la hebra molde amplificada que se va a secuenciar, identificando la base presente en uno o varios de los nucleótidos incorporados y determinando así la secuencia de una región de la hebra molde.
Un método de secuenciación preferido que puede usarse, se basa en el uso de nucleótidos modificados que tienen bloques 3’ eliminables, por ejemplo tal y como se describe en los documentos WO 2004/018497 y de patente de EE.UU. n° 7.057.026. Una vez que el nucleótido modificado se ha incorporado a la cadena polinucleotídica en crecimiento, complementaria a la región del molde que se está secuenciando, no hay ningún grupo 3'-OH libre disponible para dirigir una extensión adicional de la secuencia y, por lo tanto, la polimerasa no puede añadir más nucleótidos. Una vez que se ha determinado la naturaleza de la base incorporada en la cadena en crecimiento, el bloque 3’ puede eliminarse para permitir la adición del siguiente nucleótido sucesivo. Al ordenar los productos obtenidos usando esos nucleótidos modificados, es posible deducir la secuencia de ADN del molde de ADN. Tales reacciones pueden realizarse en un solo experimento si cada uno de los nucleótidos modificados tiene un marcador diferente fijado al mismo, del cual se sabe que corresponde a la base particular, para facilitar una discriminación entre las bases añadidas durante cada etapa de incorporación. Alternativamente, se puede llevar a cabo una reacción por separado en donde están contenidos cada uno de los nucleótidos modificados por separado.
Los nucleótidos modificados pueden ser portadores de un marcador para facilitar su detección. Un marcador fluorescente, por ejemplo, puede usarse para la detección de nucleótidos modificados. Por tanto, cada tipo de nucleótido puede ser portador de un marcador fluorescente diferente, por ejemplo, tal y como se describe en el documento WO 2007/135368. Sin embargo, no es necesario que el marcador detectable sea un marcador fluorescente. Puede usarse cualquier marcador que permita la detección de un nucleótido incorporado.
Un método para detectar nucleótidos marcados con fluorescencia comprende el uso de luz láser con una longitud de onda específica para los nucleótidos marcados, o el uso de otras fuentes de iluminación adecuadas. La fluorescencia del marcador en el nucleótido puede detectarse mediante una cámara CCD u otros medios de detección adecuados. La instrumentación adecuada para registrar las imágenes de matrices agrupadas se describe en el documento WO 2007/123744.
Por supuesto, se puede emplear cualquier otro método de secuenciación adecuado. Preferiblemente, el método de secuenciación se basa en la incorporación sucesiva de nucleótidos en una cadena de polinucleótidos. Las técnicas alternativas adecuadas incluyen, por ejemplo, pirosecuenciación, FISSEQ (secuenciación fluorescente in situ), MPSS y secuenciación mediante métodos basados en ligación, por ejemplo, tal y como se describe en el documento de patente de EE.UU. n° 6.306.597.
La muestra de ácido nucleico se puede analizar adicionalmente para obtener una segunda lectura desde el extremo opuesto del fragmento. La metodología para secuenciar ambos extremos de una agrupación se describe en los documentos de solicitudes pendientes de tramitación WO 2007/010252 y WO 2008/041002. En un ejemplo, la serie de etapas se puede realizar del modo siguiente; generar agrupaciones, linealizar, hibridar el primer cebador de secuenciación y obtener la primera lectura de secuenciación. Se puede eliminar el primer cebador de secuenciación, se puede hibridar un segundo cebador y secuenciar el marcador de indicador. La hebra de polinucleótidos se puede "revertir" entonces sobre la superficie, sintetizando una copia complementaria de los cebadores inmovilizados restantes usados en la amplificación de la agrupación. Este procedimiento de síntesis de nuevo de las hebras regenera la agrupación de doble hebra. La hebra molde original se puede eliminar para linealizar la hebra sintetizada de nuevo que luego se puede hibridar con un cebador de secuenciación y secuenciar en una tercera tanda de secuenciación.
En los casos en los que se emplea la síntesis de nuevo de la hebra, ambas hebras pueden inmovilizarse en la superficie de una manera que permita la posterior liberación de una porción de la hebra inmovilizada. Esto se puede lograr a través de varios mecanismos tal y como se describe en el documento WO 2007/010251. Por ejemplo, un cebador puede contener un nucleótido de uracilo, lo que significa que la hebra se puede escindir en la base de uracilo usando las enzimas uracil glicosilasa (UDG) que elimina la base de nucleósido y la endonucleasa VIII que escinde el nucleótido abásico. Esta combinación de enzimas está disponible como la enzima USER™ de New England Biolabs (n° de cat. M5505). El segundo cebador puede comprender un nucleótido de 8-oxoguanina, que luego es escindido por la enzima FPG (NEB n° de cat. M0240). Este diseño de cebadores proporciona el control de qué cebador se escinde en qué punto del procedimiento, y también en qué parte de la agrupación se produce la escisión. Los cebadores también pueden modificarse químicamente, por ejemplo, con una modificación de disulfuro o diol que permite la escisión química en ubicaciones específicas.
Haciendo ahora referencia a la Fig. 1, se muestra un dibujo esquemático de un adaptador 100 que se puede usar de acuerdo con varias realizaciones descritas en este documento. El adaptador 100 representado comprende una región bicatenaria 110 y una región monocatenaria no complementaria 120. La región bicatenaria 110 se puede fijar a un polinucleótido diana bicatenario. En la realización representada, los extremos libres de cada hebra de la porción monocatenaria 120 están modificados (indicados por "X") para proteger los extremos de la actividad exonucleasa. En contraste, el extremo 3’ de una hebra y el extremo 5' de la otra hebra que forman la porción bicatenaria 110 son susceptibles de una degradación con exonucleasas. Si el adaptador 100 no está fijado a un fragmento diana de doble hebra, el adaptador no incorporado puede ser digerido por una o varias exonucleasas que tienen actividad exonucleasa 5’ y 3'. Debido a que la exonucleasa comenzará la digestión de la porción bicatenaria 110, la exonucleasa preferiblemente tiene actividad para el ADN bicatenario sin corte de cadena sencilla.
Una hebra representada del adaptador 100 comprende una secuencia de cebador de extensión universal 130, una secuencia de marcador de indicador 132 y una secuencia de cebador de secuenciación 134. La otra hebra representada del adaptador 100 comprende una secuencia de cebador de extensión universal 140, una secuencia de marcador de indicador 142 y una secuencia de cebador de secuenciación 144.
Las secuencias de cebadores de extensión universal 130, 140 se pueden hibridar con oligonucleótidos de cebadores de extensión fijados a una superficie sólida con fines de amplificación o secuenciación (si el adaptador 100 estaba fijado a un polinucleótido diana). La secuencia del cebador de extensión universal 140, o una parte de la misma, también se puede hibridar con un cebador de secuenciación para secuenciar la secuencia del marcador de indicador 142. Alternativamente, la hebra puede comprender una secuencia de cebador de secuenciación adicional (no mostrada).
La secuencia del cebador de secuenciación 134 se puede hibridar con un cebador de secuenciación para permitir la secuenciación de la secuencia del marcador de indicador 132. La secuencia del marcador de indicador 142 y la secuencia del marcador de indicador 132 pueden ser iguales o diferentes.
La secuencia del cebador de secuenciación 144 se puede hibridar con un cebador de secuenciación para permitir la secuenciación de una secuencia de polinucleótidos diana (si se fija al adaptador 100).
La secuencia de los cebadores de secuenciación 134, 144 se pueden hibridar, por ejemplo, con cebadores de PCR si los adaptadores están fijados a una diana en un procedimiento de múltiples etapas, tal y como se ha descrito anteriormente.
Se entenderá que un adaptador adecuado para uso en varias realizaciones descritas en este documento, puede tener más o menos características de secuencia, u otras características de secuencia, que las descritas con respecto a la Fig. 1.
Haciendo ahora referencia a la Fig. 2 , se muestra un dibujo esquemático de un polinucleótido molde 200 de una colección que tiene una secuencia de adaptador 100 - molde 210 - adaptador 100. El polinucleótido molde 210 es bicatenario y está fijado a una porción bicatenaria de los adaptadores 100. Los extremos de las porciones monocatenarias de los adaptadores se modifican para protegerlos de la digestión con exonucleasas (indicado por "X"). Debido a que los adaptadores 100 están ligados a ambos extremos del fragmento diana bicatenario 210, el polinucleótido molde resultante 200 es resistente a la digestión con exonucleasa.
Haciendo ahora referencia a la Fig. 3 , se muestra un dibujo esquemático que ilustra los resultados de la incubación de productos de reacción y reactivos de una ligación de adaptador-diana con una exonucleasa 400. Después de la ligación de un adaptador 100 a un fragmento diana 210, se produce como resultado algún adaptador no incorporado restante 100, un fragmento diana 210 y un polinucleótido molde 200. Si la solución o la composición resultante 500 se incuba con una exonucleasa 400 que tiene actividad exonucleasa 5’ y actividad exonucleasa 5', el adaptador no incorporado 100 y el fragmento diana 210 serán digeridos por la exonucleasa 400 (véase la parte inferior de la Fig.3). Después del tratamiento con exonucleasa, la solución resultante puede purificarse y el polinucleótido molde 200 puede inmovilizarse sobre una superficie sólida para la secuenciación.
Haciendo ahora referencia a la Fig. 4 , se muestra una ilustración esquemática de un procedimiento para la amplificación de agrupaciones de un polinucleótido molde 200 procedente de una colección en una superficie sólida 300 para preparar la secuenciación. En el primer panel, el polinucleótido molde 200 que tiene extremos modificados (para protegerlo frente a una nucleasa) se hibrida con un primer cebador de extensión 310 fijado a la superficie sólida 300. Por ejemplo, una secuencia del cebador de extensión universal 140 representado en la Fig. 1 de la porción de adaptador, se puede hibridar con el primer cebador de extensión 310.
El primer cebador de extensión 310 comprende un extremo 3’ libre, por lo que se pueden añadir nucleótidos al extremo 3' utilizando el polinucleótido molde 200 como molde para producir una hebra molde de copia 201 (véase el segundo panel) fijada a la superficie sólida 300 en presencia de una polimerasa adecuada. La hebra del molde 200 puede ser eliminada y la hebra de la copia 201 se puede hibridar con un segundo cebador de extensión 320 fijado a la superficie sólida 300 (véase el tercer panel). Por ejemplo, la secuencia del cebador de extensión universal 130 representada en la Fig. 1 de la porción del adaptador, se puede hibridar con el segundo cebador de extensión 320.
El segundo cebador de extensión 320 comprende un extremo 3’ libre y, por lo tanto, se pueden añadir nucleótidos al extremo 3' utilizando el polinucleótido del molde de la copia 201 como molde para producir una hebra molde amplificada 202 (véase el cuarto panel) fijada a la superficie sólida 300 en presencia de una polimerasa adecuada. Se pueden realizar rondas adicionales de amplificación para producir una agrupación de hebras moldes de copias 201 y hebras molde amplificadas 202.
Con fines ilustrativos, el quinto panel de la Fig. 3 representa la hebra molde de la copia 201 y la amplificada 202 en forma lineal.
Haciendo ahora referencia a la Fig. 5 , se muestra un dibujo esquemático que ilustra cómo el tratamiento con exonucleasas para eliminar los adaptadores no incorporados puede mitigar el salto de indicador. Los dos primeros paneles de la Fig. 5 son los mismos que los dos primeros paneles de la Fig. 4. Como se muestra en el panel inferior izquierdo de la Fig. 5 , un adaptador residual no incorporado (no fijado a un polinucleótido diana), o una hebra 104 del mismo, se puede hibridar con una porción del adaptador de la hebra molde de la copia 201 (por ejemplo, la hibridación puede ocurrir en la región bicatenaria del adaptador y la porción del adaptador del polinucleótido molde). La hebra del adaptador 104 puede proceder de una colección diferente a la colección a partir de la cual se ha obtenido la hebra molde de la copia 201. En consecuencia, la hebra del adaptador 104 puede tener una secuencia de marcador de indicador que es diferente a la secuencia de marcador de indicador asociada con la hebra molde de la copia 201. La hebra del adaptador 104 puede servir como un cebador eficaz para extender y copiar la hebra molde de la copia 201. Se producirá una hebra amplificada en la que un marcador de indicador incorrecto (marcador de indicador procedente de la hebra del adaptador 104 procedente de una segunda colección) se asociará con un polinucleótido diana procedente de otra colección (polinucleótido diana del polinucleótido molde 201 procedente de una primera colección). En una ronda posterior de amplificación, un polinucleótido indexado incorrectamente podrá fijarse a la superficie 300. Sin embargo, tal y como se ilustra en el panel inferior derecho de la Fig. 5 , si los adaptadores no incorporados se digieren mediante un tratamiento con exonucleasa, la hebra del adaptador no está disponible para servir como cebador de extensión y se mitiga el salto de indicador.
Haciendo ahora referencia a las Figs. 6A y 6B, se ilustra la naturaleza del fenómeno de salto de indicador. La Fig.
6A muestra cómo las lecturas de una muestra determinada se desmultiplexan incorrectamente y se mezclan con una muestra diferente después de la desmultiplexación. La Fig. 6B demuestra el salto de indicador en un sistema de indicador doble, que conduce a combinaciones inesperadas de secuencias de marcador de indicador.
Haciendo ahora referencia a las Figs. 7A y 7B, se ilustra el enfoque general para medir la tasa de salto de indicador en un sistema dado. La Fig. 7A muestra un diseño ejemplar de una placa de adaptador doble, en la que cada pocillo individual de una placa de 96 pocillos contiene una sola pareja de secuencias de marcador de indicador (12 indicadores P7 diferentes combinados con 8 indicadores P5 diferentes). La Fig. 7B muestra una configuración experimental destinada a medir la tasa de salto de indicador, en la que se utilizan 8 combinaciones únicas de marcador de indicador doble (es decir, no se espera que ningún indicador P5 se empareje con más de un indicador P7 y viceversa). Las combinaciones inesperadas de marcadores de indicadores (por ejemplo, D505-D703) se identifican fácilmente como ejemplos de salto de indicador.
Haciendo ahora referencia a las Figs. 8A y 8B, se ilustra el efecto de los adaptadores no ligados sobre la tasa de salto de indicador. La Fig. 8A muestra un aumento de 6 veces en el índice de salto asociado con un aumento del 50% de adaptadores libres. La Fig. 8B muestra un efecto aproximadamente lineal del adaptador bifurcado libre sobre la tasa de salto de indicador dentro del intervalo sometido a ensayo. Los inventores también observaron un efecto más pronunciado de los adaptadores P7 monocatenarios libres sobre la tasa de salto de indicador, en comparación con los adaptadores P5 monocatenarios libres (datos no mostrados).
Ejemplos
Ejemplo 1: Protocolo de muestra para el tratamiento con exonucleasa con bloqueo de 3’ de colecciones indexadas con adaptadores protegidos
Este protocolo explica cómo realizar un tratamiento con exonucleasa con bloqueo de 3’ de colecciones de ADN protegidas para reducir el salto de indicador. Este método está diseñado para realizarse en grupos de colecciones de ADN antes de la etapa de desnaturalización y la posterior generación de agrupaciones, utilizando Illumina HiSeq® 4000 y plataformas de secuenciación similares que utilizan celdas de flujo con patrones y agrupaciones basadas en ExAmp (p. ej., HiSeq® X y NovaSeq®).
Se ha observado que el salto de indicador ocurre cuando se asignan secuencias de indicador incorrectas a la secuencia del inserto, lo que da lugar a una asignación incorrecta de la muestra. La realización de este tratamiento sobre grupos de muestras de ADN antes de ejecutar una HiSeq® 4000, debería reducir los niveles de salto de indicador hasta un nivel que no se puede predecir de manera consistente en este estadio.
Se puede considerar que el flujo de trabajo del tratamiento implica cuatro etapas: (i) producir un conjunto de muestras de ADN; (ii) realizar el tratamiento, (iii) purificar la muestra y cuantificar; y (iv) agrupar y secuenciar un conjunto de muestras.
Productos/Equipamiento: Los productos y el equipamiento pueden ser suministrados por un usuario de la secuenciación o un fabricante. Los productos suministrados por el usuario pueden incluir un conjunto de muestras de la colección de ADN: 30 pl a una concentración que se utilizará para la desnaturalización durante el agrupamiento. El usuario también puede suministrar etanol al 80% (EtOH) recién preparado.
La Tabla 1 a continuación ilustra algunos productos y equipamientos que pueden utilizarse.
Tabla 1: Productos y equipamientos
Figure imgf000022_0002
Un fabricante de secuenciación puede suministrar EMX (mezcla de exonucleasas, del inglés “Exonuclease Mix”), BMX (mezcla de bloqueo, del inglés “Blocking Mix”); RSB (tampón de resuspensión) y SPB (perlas de purificación de muestras).
La EMX puede incluir un tampón de exonucleasa (NEBuffer 4, NEB n° de cat. B7004S: acetato de potasio 50 mM, Tris-acetato 20 mM, acetato de magnesio 10 mM, DTT 1 mM) y exonucleasa V (New England Biolabs, n° de cat. M0345S/L).
La BMX puede incluir una mezcla previa de secuenciación (tampón Tris, cloruro de sodio, sacarosa, sulfato de magnesio, EDTA y Tween 20), una mezcla de ddNTPs, polimerasa de ADN Pol19 y transferasa terminal TDT.
El RSB puede incluir un tampón Tris, pH 8,5.
Las SPB pueden incluir perlas Agencourt® AMPure® XP (Beckman Coulter, n° de cat. A63880). Las SPB deben agitarse antes de cada uso. Las SPB deben agitarse en vórtice con frecuencia para asegurarse de que las perlas se distribuyen uniformemente. Las SPB deben aspirarse y dispensarse lentamente debido a la viscosidad de la solución.
Algunos de los productos se deben almacenar y preparar tal y como se indica en la Tabla 2 a continuación.
Tabla 2: Almacenamiento y preparación de los productos
Figure imgf000022_0001
El siguiente programa de EMX se puede guardar en el termociclador: (i) elija la opción de precalentamiento de la tapa y ajústela a 100°C; (ii) 37°C durante 5 minutos; (iii) 70°C durante 30 minutos; y (iv) mantener a 4°C.
El siguiente programa de BMX se puede guardar en el termociclador: (i) elija la opción de tapa precalentada y ajuste a 100°C; (ii) 38°C durante 20 minutos; (iii) 60°C durante 20 minutos; y (iv) mantener a 4°C.
Las muestras se pueden tratar del modo siguiente: (i) centrifugar la EMX a 600 x g durante 5 segundos; (ii) añadir 27 pl del conjunto de muestras de la colección de ADN a un tubo de PCR; (iii) añadir 5 pl de EMX a cada muestra en cada tubo de PCR y luego mezclar bien pipeteando hacia arriba y hacia abajo; (iv) incubar colocando en el termociclador y ejecutando el programa de EMX; (v) centrifugar la BMX a 600 x g durante 5 segundos; (vi) añadir 32 pl de BMX directamente a cada reacción de exonucleasa en cada tubo de PCR y luego mezclar bien pipeteando hacia arriba y hacia abajo; e (vii) incubar colocando en el termociclador y ejecutando el programa de BMX. Cada tubo contiene 64 pl.
La muestra agrupada y tratada se puede purificar de la siguiente manera: (1) agitar en vórtice las SPB hasta que estén bien dispersas; (2) añadir 60 pl de SPB a cada tubo de tratamiento de muestra y mezclar bien pipeteando hacia arriba y hacia abajo; (3) incubar a temperatura ambiente durante 5 minutos; (4) colocar sobre un soporte magnético y esperar hasta que el líquido esté claro (2-5 minutos); (5) retirar y desechar todo el material sobrenadante de cada tubo; (6) lavar 2 veces del modo siguiente: (a) añadir 200 pl de EtOH al 80% recién preparado a cada tubo, (b) incubar sobre el soporte magnético durante 30 segundos, y (c) retirar y desechar todo el material sobrenadante de cada tubo; (7) usar una pipeta de 20 pl para eliminar el EtOH residual de cada tubo; (8) secar al aire sobre el soporte magnético durante 5 minutos; (9) añadir 22,5 pl de RSB a cada tubo; (10) retirar del soporte magnético y luego mezclar bien pipeteando hacia arriba y hacia abajo; (11) incubar a temperatura ambiente durante 2 minutos; (12) colocar sobre un soporte magnético y esperar hasta que el líquido esté claro (2-5 minutos); (13) transferir 20 pl de material sobrenadante a un tubo nuevo; (14) cuantificar las colecciones si es necesario y proceder a la agrupación estándar para la plataforma HiSeq® 4000, comenzando con la etapa de desnaturalización con NaOH; y (15) almacenar entre -25°C y -15°C si no se agrupa inmediatamente.
Ejemplo 2: Reducción del índice de salto mediante tratamiento con exonucleasa con bloqueo de 3’ de colecciones indexadas con adaptadores protegidos
El protocolo de tratamiento expuesto anteriormente en el Ejemplo 1, se aplicó en combinación con los siguientes materiales, equipamientos y métodos para agrupar y secuenciar en una plataforma Illumina.
Condiciones experimentales: (1) Colección TrueSeq® de 450 pb de NA12878 humano (Coriell Institute) sin PCR preparada usando adaptadores protegidos con fosforotioato, cargada a 300 pM; (2) el instrumento HiSeq® X y los productos químicos de SBS de illumina de acuerdo con las instrucciones del fabricante; (3) celda de flujo ILS v3 de 550 nm; (4) amplificación ExAmp como se ha descrito anteriormente; y (5) 50% de aumento rápido del adaptador: adaptador bifurcado libre procedente de la placa de adaptador doble (DAP) de Illumina añadido a la colección de moldes antes de la desnaturalización, neutralización, adición de mezcla ExAmp y agrupamiento.
Los resultados de este experimento se resumen en la Tabla 3 a continuación y la FIG. 9.
Tabla 3: Reducción del salto de indicador mediante tratamiento con exonucleasa de los adaptadores protegidos con bloqueo de 3’
Figure imgf000023_0001
Tal y como se ha ilustrado anteriormente, el salto de indicador se redujo con el tratamiento con exonucleasa de los adaptadores protegidos combinado con un bloqueo de 3’.
Además de los documentos ya citados en esta solicitud, se hace referencia a tres solicitudes de patente provisional tituladas de forma idéntica: "Compositions and methods for improving sample identical in indexed nucleic acid libraries". Además de los documentos citados anteriormente en esta solicitud, se hace referencia a tres solicitudes de patente provisional tituladas de forma idéntica: "Compositions and methods for improving sample identification in indexed nucleic acid libraries" que se presentaron el mismo día que la solicitud provisional para la cual la presente solicitud reivindica prioridad (documento de solicitud de patente provisional de EE.UU. n° de expediente 62/488.824, 62/488.825 y 62/488.833, que se presentaron el 23 de abril de 2018).

Claims (15)

REIVINDICACIONES
1. Un método que comprende:
proporcionar una primera pluralidad de fragmentos de polinucleótidos diana bicatenarios, teniendo cada fragmento un primer extremo y un segundo extremo;
proporcionar un primer oligonucleótido adaptador que comprende una primera hebra que tiene un extremo 5’ y un extremo 3' y una segunda hebra que tiene un extremo 5’ y un extremo 3',
en donde el primer oligonucleótido adaptador comprende (i) una región bicatenaria que comprende el extremo 5’ de la primera hebra y el extremo 3' de la segunda hebra, y (ii) una región monocatenaria en la que la primera y la segunda hebras son monocatenarias, en donde la región monocatenaria comprende el extremo 3’ de la primera hebra y el extremo 5' de la segunda hebra,
en donde el primer oligonucleótido adaptador comprende una primera secuencia específica de la colección,
en donde el extremo 3’ de la primera hebra se modifica para evitar la digestión con una enzima que tiene actividad exonucleasa 3' y en donde el extremo 5’ de la segunda hebra se modifica para evitar la digestión con una enzima que tiene actividad exonucleasa 5';
incubar el primer oligonucleótido adaptador y la primera pluralidad de fragmentos de polinucleótidos diana bicatenarios en condiciones adecuadas para ligar el extremo 5’ de la primera hebra del primer adaptador y el extremo 3' de la segunda hebra del primer adaptador con el primer y el segundo extremos de los fragmentos de polinucleótidos diana bicatenarios para producir una primera colección de polinucleótidos que comprende secuencias de primer adaptadordiana-primer adaptador; y
poner en contacto la primera colección de polinucleótidos con una exonucleasa, en donde la exonucleasa comprende una actividad exonucleasa monocatenaria 3’ y 5', para degradar selectivamente los oligonucleótidos del primer adaptador que no están ligados a los fragmentos de polinucleótidos diana bicatenarios.
2. Un método según la reivindicación 1, en el que la exonucleasa comprende una actividad para ADN bicatenario sin corte de hebra sencilla para degradar los fragmentos de polinucleótidos diana bicatenarios a los que los oligonucleótidos del primer adaptador no están ligados por ambos extremos.
3. Un método según la reivindicación 1 o la reivindicación 2,
en el que el extremo 3’ de la primera hebra del primer adaptador comprende un enlace fosforotioato, en donde una proteína de unión a ADN monocatenario está unida al extremo 3' de la primera hebra del primer adaptador, en donde una biotina está fijada al extremo 3’ de la primera hebra del primer adaptador o en donde un anticuerpo se fija al extremo 3’ de la primera hebra del primer adaptador; y
en el que el extremo 5’ de la segunda hebra del primer adaptador comprende un enlace fosforotioato, en donde una proteína de unión a ADN monocatenario está unida al extremo 5' de la segunda hebra del primer adaptador, en donde una biotina está fijada al extremo 5’ de la segunda hebra del primer adaptador o en donde un anticuerpo se fija al extremo 5’ de la segunda hebra del primer adaptador.
4. Un método según la reivindicación 1 o la reivindicación 2, en el que el extremo 3’ de la primera hebra del primer adaptador comprende tres enlaces fosforotioato, y en donde el extremo 5' de la segunda hebra del primer adaptador comprende tres enlaces fosforotioato.
5. Un método según una cualquiera de las reivindicaciones 1 a 4, en donde se purifica la primera colección de polinucleótidos.
6. Un método según una cualquiera de las reivindicaciones 1 a 5, que comprende además:
proporcionar un sustrato que tiene una superficie que comprende una pluralidad de oligonucleótidos fijados que tienen un extremo 3’ libre; y
poner en contacto la superficie del sustrato con una composición que comprende la primera colección purificada de polinucleótidos en condiciones que permiten la hibridación de una porción de una hebra del primer adaptador de las secuencias del primer adaptador-diana-primer adaptador con al menos una porción de los oligonucleótidos fijados a la superficie del sustrato; que comprende además opcionalmente extender los oligonucleótidos fijados a la superficie del sustrato desde el extremo 3’ libre mediante la incorporación de nucleótidos complementarios a una secuencia de los polinucleótidos del primer adaptador-diana-primer adaptador hibridados con los oligonucleótidos fijados para producir una copia del polinucleótido hibridado de la primera colección, de modo que la copia se fija a la superficie del sustrato; que comprende además opcionalmente amplificar la copia fijada a la superficie del sustrato.
7. Un adaptador de oligonucleótidos para ligar con un polinucleótido diana antes de la secuenciación, que comprende: una primera hebra de oligonucleótidos que tiene un extremo 5’ y un extremo 3'; y
una segunda hebra de oligonucleótidos que tiene un extremo 5’ y un extremo 3',
en donde una región del extremo 5’ de la primera hebra comprende nucleótidos complementarios a nucleótidos en una región del extremo 3' de la segunda hebra, de modo que las regiones complementarias son bicatenarias, en donde una región del extremo 3’ de la primera hebra y una región del extremo 5' de la segunda hebra son suficientemente no complementarias para ser monocatenarias,
en donde al menos una entre la primera hebra y la segunda hebra comprende una secuencia de marcador de indicador específica de la colección, y
en donde el extremo 3’ de la primera hebra se modifica para evitar la digestión con una enzima que tiene actividad exonucleasa 3' y en donde el extremo 5’ de la segunda hebra se modifica para evitar la digestión con una enzima que tiene actividad exonucleasa 5'.
8. Un adaptador de oligonucleótidos según la reivindicación 7,
en el que la región bicatenaria es bicatenaria en condiciones de ligación estándar, y
en el que las regiones monocatenarias son monocatenarias en condiciones de ligación estándar.
9. Un adaptador de oligonucleótidos según la reivindicación 7 o la reivindicación 8,
en el que el extremo 3’ de la primera hebra comprende un enlace fosforotioato, en donde una proteína de unión a ADN monocatenario está unida al extremo 3' de la primera hebra, en donde una biotina está fijada al extremo 3’ de la primera hebra o en donde un anticuerpo se fija al extremo 3’ de la primera hebra; y
en el que el extremo 5’ de la segunda hebra comprende un enlace fosforotioato, en donde una proteína de unión a ADN monocatenario está unida al extremo 5' de la segunda hebra, en donde una biotina está fijada al extremo 5’ de la segunda hebra o en donde un anticuerpo se fija al extremo 5’ de la segunda hebra.
10. Un adaptador de oligonucleótidos según la reivindicación 7 o la reivindicación 8, en el que el extremo 3’ de la primera hebra comprende tres enlaces fosforotioato, y en el que el extremo 5' de la segunda hebra comprende tres enlaces fosforotioato.
11. Una composición que comprende un adaptador según una cualquiera de las reivindicaciones 7-10; y una exonucleasa.
12. Una composición que comprende:
un adaptador según una cualquiera de las reivindicaciones 7-10; y
una pluralidad de fragmentos de polinucleótidos diana bicatenarios, en donde cada fragmento tiene un primer extremo y un segundo extremo; comprendiendo además opcionalmente una ligasa.
13. Una composición que comprende:
una pluralidad de polinucleótidos que comprenden una secuencia de primer adaptador-diana-segundo adaptador, en donde la secuencia diana es bicatenaria, una región del primer adaptador en las proximidades de la diana es bicatenaria, una región del segundo adaptador en las proximidades de la diana es bicatenaria, una región del primer adaptador distal a la diana comprende dos hebras sencillas, teniendo cada una un extremo, y una región del segundo adaptador distal a la diana comprende dos hebras sencillas, teniendo cada una un extremo,
en donde al menos una hebra de las dos hebras sencillas del primer o el segundo adaptador comprende una secuencia de marcador de indicador específica de la colección, y
en donde cada extremo de las dos cadenas sencillas del primer y del segundo adaptador se modifican para evitar la digestión con una exonucleasa.
14. Una composición según la reivindicación 13, en la que cada extremo de las dos hebras sencillas del primer y del segundo adaptador comprende un enlace fosforotioato; o en donde cada extremo de las dos hebras sencillas del primer y del segundo adaptador comprende tres enlaces fosforotioato.
15. Una composición según las reivindicaciones 13 o 14, que comprende además:
un adaptador que comprende una primera hebra de oligonucleótidos que tiene un extremo 5’ y un extremo 3'; y una segunda hebra de oligonucleótidos que tiene un extremo 5’ y un extremo 3',
en donde una región del extremo 5’ de la primera hebra comprende nucleótidos complementarios a nucleótidos en una región del extremo 3' de la segunda hebra, de modo que las regiones complementarias son bicatenarias, en donde una región del extremo 3’ de la primera hebra y una región del extremo 5' de la segunda hebra son suficientemente no complementarias para ser monocatenarias,
en donde al menos una entre la primera hebra y la segunda hebra comprende una secuencia de marcador de indicador específica de la colección, y
en donde el extremo 3’ de la primera hebra se modifica para evitar la digestión con una enzima que tiene actividad exonucleasa 3' y en donde el extremo 5’ de la segunda hebra se modifica para evitar la digestión con una enzima que tiene actividad exonucleasa 5'.
ES18723273T 2017-04-23 2018-04-23 Composiciones y métodos para mejorar la identificación de muestras en colecciones de ácidos nucleicos indexadas Active ES2893528T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201762488830P 2017-04-23 2017-04-23
PCT/US2018/028867 WO2018200380A1 (en) 2017-04-23 2018-04-23 Compositions and methods for improving sample identification in indexed nucleic acid libraries

Publications (1)

Publication Number Publication Date
ES2893528T3 true ES2893528T3 (es) 2022-02-09

Family

ID=62117116

Family Applications (2)

Application Number Title Priority Date Filing Date
ES18723273T Active ES2893528T3 (es) 2017-04-23 2018-04-23 Composiciones y métodos para mejorar la identificación de muestras en colecciones de ácidos nucleicos indexadas
ES21168956T Active ES2929837T3 (es) 2017-04-23 2018-04-23 Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácidos nucleicos indexados

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES21168956T Active ES2929837T3 (es) 2017-04-23 2018-04-23 Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácidos nucleicos indexados

Country Status (10)

Country Link
US (1) US10995369B2 (es)
EP (2) EP3615690B1 (es)
CN (1) CN111094584A (es)
AU (1) AU2018260627A1 (es)
CA (1) CA3060979C (es)
DK (2) DK3615690T3 (es)
ES (2) ES2893528T3 (es)
FI (1) FI3872187T3 (es)
SG (1) SG11201909918XA (es)
WO (1) WO2018200380A1 (es)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6656733B2 (ja) 2013-08-05 2020-03-04 ツイスト バイオサイエンス コーポレーション 新規合成した遺伝子ライブラリ
US10669304B2 (en) 2015-02-04 2020-06-02 Twist Bioscience Corporation Methods and devices for de novo oligonucleic acid assembly
WO2016172377A1 (en) 2015-04-21 2016-10-27 Twist Bioscience Corporation Devices and methods for oligonucleic acid library synthesis
JP6982362B2 (ja) 2015-09-18 2021-12-17 ツイスト バイオサイエンス コーポレーション オリゴ核酸変異体ライブラリーとその合成
CN108698012A (zh) 2015-09-22 2018-10-23 特韦斯特生物科学公司 用于核酸合成的柔性基底
US9895673B2 (en) 2015-12-01 2018-02-20 Twist Bioscience Corporation Functionalized surfaces and preparation thereof
GB2568444A (en) 2016-08-22 2019-05-15 Twist Bioscience Corp De novo synthesized nucleic acid libraries
KR102217487B1 (ko) 2016-09-21 2021-02-23 트위스트 바이오사이언스 코포레이션 핵산 기반 데이터 저장
CN110366613A (zh) 2016-12-16 2019-10-22 特韦斯特生物科学公司 免疫突触的变体文库及其合成
CA3054303A1 (en) 2017-02-22 2018-08-30 Twist Bioscience Corporation Nucleic acid based data storage
WO2018170169A1 (en) 2017-03-15 2018-09-20 Twist Bioscience Corporation Variant libraries of the immunological synapse and synthesis thereof
US10995369B2 (en) 2017-04-23 2021-05-04 Illumina, Inc. Compositions and methods for improving sample identification in indexed nucleic acid libraries
CN110785492B (zh) 2017-04-23 2024-04-30 伊鲁米纳剑桥有限公司 用于改进编索引的核酸文库中的样品鉴定的组合物和方法
CA3059952C (en) 2017-04-23 2023-04-18 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
CA3059840C (en) 2017-04-23 2022-04-26 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
WO2018231864A1 (en) 2017-06-12 2018-12-20 Twist Bioscience Corporation Methods for seamless nucleic acid assembly
CA3066744A1 (en) 2017-06-12 2018-12-20 Twist Bioscience Corporation Methods for seamless nucleic acid assembly
SG11202002194UA (en) 2017-09-11 2020-04-29 Twist Bioscience Corp Gpcr binding proteins and synthesis thereof
WO2019079769A1 (en) 2017-10-20 2019-04-25 Twist Bioscience Corporation HEATED NANOWELLS FOR THE SYNTHESIS OF POLYNUCLEOTIDES
US10936953B2 (en) 2018-01-04 2021-03-02 Twist Bioscience Corporation DNA-based digital information storage with sidewall electrodes
WO2019222706A1 (en) 2018-05-18 2019-11-21 Twist Bioscience Corporation Polynucleotides, reagents, and methods for nucleic acid hybridization
AU2019391274A1 (en) 2018-12-05 2021-01-07 Illumina Cambridge Limited Methods and compositions for cluster generation by bridge amplification
JP2022513546A (ja) 2018-12-18 2022-02-09 イルミナ ケンブリッジ リミテッド 単一表面プライマーを使用したペアエンドシーケンシングのための方法および組成物
KR20210148122A (ko) * 2019-02-25 2021-12-07 트위스트 바이오사이언스 코포레이션 차세대 시퀀싱을 위한 조성물 및 방법
JP2022522668A (ja) 2019-02-26 2022-04-20 ツイスト バイオサイエンス コーポレーション 抗体を最適化するための変異体核酸ライブラリ
SG11202109322TA (en) 2019-02-26 2021-09-29 Twist Bioscience Corp Variant nucleic acid libraries for glp1 receptor
US11210554B2 (en) 2019-03-21 2021-12-28 Illumina, Inc. Artificial intelligence-based generation of sequencing metadata
US11676685B2 (en) 2019-03-21 2023-06-13 Illumina, Inc. Artificial intelligence-based quality scoring
US11593649B2 (en) 2019-05-16 2023-02-28 Illumina, Inc. Base calling using convolutions
AU2020298294A1 (en) 2019-06-21 2022-02-17 Twist Bioscience Corporation Barcode-based nucleic acid sequence assembly
US20210265009A1 (en) 2020-02-20 2021-08-26 Illumina, Inc. Artificial Intelligence-Based Base Calling of Index Sequences
EP4107735A2 (en) 2020-02-20 2022-12-28 Illumina, Inc. Artificial intelligence-based many-to-many base calling
GB202007970D0 (en) * 2020-05-28 2020-07-15 Cambridge Entpr Ltd Method
CN116323970A (zh) 2020-09-11 2023-06-23 伊鲁米纳剑桥有限公司 使用发夹衔接子从测序文库中富集靶序列的方法
BR112023019894A2 (pt) 2021-03-29 2023-11-14 Illumina Inc Composições e métodos para avaliar os danos ao dna em uma biblioteca e normalizar a distorção do tamanho do amplicon
US20220336054A1 (en) 2021-04-15 2022-10-20 Illumina, Inc. Deep Convolutional Neural Networks to Predict Variant Pathogenicity using Three-Dimensional (3D) Protein Structures
US20230005253A1 (en) 2021-07-01 2023-01-05 Illumina, Inc. Efficient artificial intelligence-based base calling of index sequences
US20230212667A1 (en) 2021-12-29 2023-07-06 Illumina Cambridge Limited Methods of nucleic acid sequencing using surface-bound primers

Family Cites Families (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
CA1323293C (en) 1987-12-11 1993-10-19 Keith C. Backman Assay using template-dependent nucleic acid probe reorganization
CA1341584C (en) 1988-04-06 2008-11-18 Bruce Wallace Method of amplifying and detecting nucleic acid sequences
WO1989009835A1 (en) 1988-04-08 1989-10-19 The Salk Institute For Biological Studies Ligase-based amplification method
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
DE68927373T2 (de) 1988-06-24 1997-03-20 Amgen Inc Verfahren und mittel zum nachweis von nukleinsäuresequenzen
ATE138106T1 (de) 1988-07-20 1996-06-15 David Segev Verfahren zur amplifizierung und zum nachweis von nukleinsäuresequenzen
US5185243A (en) 1988-08-25 1993-02-09 Syntex (U.S.A.) Inc. Method for detection of specific nucleic acid sequences
CA2044616A1 (en) 1989-10-26 1991-04-27 Roger Y. Tsien Dna sequencing
CA2035010C (en) 1990-01-26 1996-12-10 Keith C. Backman Method of amplifying target nucleic acids applicable to both polymerase and ligase chain reactions
US5573907A (en) 1990-01-26 1996-11-12 Abbott Laboratories Detecting and amplifying target nucleic acids using exonucleolytic activity
US5223414A (en) 1990-05-07 1993-06-29 Sri International Process for nucleic acid hybridization and amplification
US5455166A (en) 1991-01-31 1995-10-03 Becton, Dickinson And Company Strand displacement amplification
EP0754240B1 (en) 1994-02-07 2003-08-20 Beckman Coulter, Inc. Ligase/polymerase-mediated genetic bit analysis of single nucleotide polymorphisms and its use in genetic analysis
CA2185239C (en) 1994-03-16 2002-12-17 Nanibhushan Dattagupta Isothermal strand displacement nucleic acid amplification
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
AU6846698A (en) 1997-04-01 1998-10-22 Glaxo Group Limited Method of nucleic acid amplification
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
US7611869B2 (en) 2000-02-07 2009-11-03 Illumina, Inc. Multiplexed methylation detection methods
EP1368460B1 (en) 2000-07-07 2007-10-31 Visigen Biotechnologies, Inc. Real-time sequence determination
EP1354064A2 (en) 2000-12-01 2003-10-22 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
AR031640A1 (es) 2000-12-08 2003-09-24 Applied Research Systems Amplificacion isotermica de acidos nucleicos en un soporte solido
US6849404B2 (en) 2001-05-07 2005-02-01 Bioneer Corporation Polymerase chain reaction of DNA of which base sequence is completely unidentified
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
US7399590B2 (en) 2002-02-21 2008-07-15 Asm Scientific, Inc. Recombinase polymerase amplification
SI3002289T1 (en) 2002-08-23 2018-07-31 Illumina Cambridge Limited MODIFIED NUCLEOTES FOR POLYUCULOTIDE SEQUENCING
CA2498764C (en) 2002-09-20 2015-11-10 New England Biolabs, Inc. Helicase dependent amplification of nucleic acids
WO2004081183A2 (en) 2003-03-07 2004-09-23 Rubicon Genomics, Inc. In vitro dna immortalization and whole genome amplification using libraries generated from randomly fragmented dna
US9045796B2 (en) 2003-06-20 2015-06-02 Illumina, Inc. Methods and compositions for whole genome amplification and genotyping
JP2007525571A (ja) 2004-01-07 2007-09-06 ソレクサ リミテッド 修飾分子アレイ
EP3415641B1 (en) 2004-09-17 2023-11-01 Pacific Biosciences Of California, Inc. Method for analysis of molecules
WO2006064199A1 (en) 2004-12-13 2006-06-22 Solexa Limited Improved method of nucleotide detection
WO2007145612A1 (en) 2005-06-06 2007-12-21 454 Life Sciences Corporation Paired end sequencing
CN101641449B (zh) * 2005-06-23 2014-01-29 科因股份有限公司 用于多态性的高通量鉴定和检测的策略
GB0514936D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Preparation of templates for nucleic acid sequencing
GB0514910D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Method for sequencing a polynucleotide template
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
GB0522310D0 (en) * 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
EP2021503A1 (en) 2006-03-17 2009-02-11 Solexa Ltd. Isothermal methods for creating clonal single molecule arrays
SG170802A1 (en) 2006-03-31 2011-05-30 Solexa Inc Systems and devices for sequence by synthesis analysis
US8178360B2 (en) 2006-05-18 2012-05-15 Illumina Cambridge Limited Dye compounds and the use of their labelled conjugates
US7833716B2 (en) 2006-06-06 2010-11-16 Gen-Probe Incorporated Tagged oligonucleotides and their use in nucleic acid amplification methods
US7754429B2 (en) 2006-10-06 2010-07-13 Illumina Cambridge Limited Method for pair-wise sequencing a plurity of target polynucleotides
US8343746B2 (en) 2006-10-23 2013-01-01 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
WO2008093098A2 (en) 2007-02-02 2008-08-07 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
WO2010003132A1 (en) 2008-07-02 2010-01-07 Illumina Cambridge Ltd. Using populations of beads for the fabrication of arrays on surfaces
US20100062494A1 (en) 2008-08-08 2010-03-11 President And Fellows Of Harvard College Enzymatic oligonucleotide pre-adenylation
CA2792433C (en) 2010-03-08 2016-10-11 Gerassimos Makrigiorgos Full cold-pcr enrichment with reference blocking sequence
US8778848B2 (en) 2011-06-09 2014-07-15 Illumina, Inc. Patterned flow-cells useful for nucleic acid analysis
US8778849B2 (en) 2011-10-28 2014-07-15 Illumina, Inc. Microarray fabrication system and method
US8938309B2 (en) 2012-01-16 2015-01-20 Greatbatch Ltd. Elevated hermetic feedthrough insulator adapted for side attachment of electrical conductors on the body fluid side of an active implantable medical device
CA2862552A1 (en) * 2012-01-26 2013-08-01 Nugen Technologies, Inc. Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
WO2013177220A1 (en) * 2012-05-21 2013-11-28 The Scripps Research Institute Methods of sample preparation
US8895249B2 (en) 2012-06-15 2014-11-25 Illumina, Inc. Kinetic exclusion amplification of nucleic acid libraries
US9512422B2 (en) 2013-02-26 2016-12-06 Illumina, Inc. Gel patterned surfaces
CA2905144C (en) 2013-03-14 2023-08-22 Lyle J. Arnold Methods for amplification of nucleic acids on solid support
EP3919624A3 (en) 2013-07-01 2021-12-29 Illumina, Inc. Catalyst-free surface functionalization and polymer grafting
ES2764096T3 (es) 2013-08-19 2020-06-02 Abbott Molecular Inc Bibliotecas de secuenciación de próxima generación
WO2015069374A1 (en) 2013-11-07 2015-05-14 Agilent Technologies, Inc. Plurality of transposase adapters for dna manipulations
US9677132B2 (en) 2014-01-16 2017-06-13 Illumina, Inc. Polynucleotide modification on solid support
US20180044668A1 (en) * 2014-10-14 2018-02-15 Bgi Shenzhen Co., Limited Mate pair library construction
CN114805710B (zh) 2014-10-31 2023-11-17 伊鲁米纳剑桥有限公司 聚合物以及dna共聚物涂层
AU2016219328B2 (en) 2015-02-10 2022-04-21 Illumina, Inc. Methods and compositions for analyzing cellular components
US10513732B2 (en) * 2015-07-13 2019-12-24 New York University Sequencing methods and kits
US9850484B2 (en) 2015-09-30 2017-12-26 The General Hospital Corporation Comprehensive in vitro reporting of cleavage events by sequencing (Circle-seq)
GB201615486D0 (en) * 2016-09-13 2016-10-26 Inivata Ltd Methods for labelling nucleic acids
US10995369B2 (en) 2017-04-23 2021-05-04 Illumina, Inc. Compositions and methods for improving sample identification in indexed nucleic acid libraries
CN110785492B (zh) 2017-04-23 2024-04-30 伊鲁米纳剑桥有限公司 用于改进编索引的核酸文库中的样品鉴定的组合物和方法
CA3059840C (en) 2017-04-23 2022-04-26 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
CA3059952C (en) 2017-04-23 2023-04-18 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries

Also Published As

Publication number Publication date
US10995369B2 (en) 2021-05-04
DK3615690T3 (da) 2021-11-15
EP3615690B1 (en) 2021-09-08
CN111094584A (zh) 2020-05-01
DK3872187T3 (da) 2022-12-05
CA3060979C (en) 2023-07-11
WO2018200380A8 (en) 2019-12-05
ES2929837T3 (es) 2022-12-02
EP3872187B1 (en) 2022-09-21
WO2018200380A1 (en) 2018-11-01
SG11201909918XA (en) 2019-11-28
EP3872187A1 (en) 2021-09-01
US20180305751A1 (en) 2018-10-25
AU2018260627A1 (en) 2019-11-14
EP3615690A1 (en) 2020-03-04
FI3872187T3 (fi) 2022-12-15
CA3060979A1 (en) 2018-11-01

Similar Documents

Publication Publication Date Title
ES2893528T3 (es) Composiciones y métodos para mejorar la identificación de muestras en colecciones de ácidos nucleicos indexadas
ES2882608T3 (es) Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácidos nucleicos indexados
ES2889585T3 (es) Composiciones y métodos para mejorar la identificación de muestras en colecciones de ácidos nucleicos indexadas
ES2959047T3 (es) Bibliotecas de genoma completo de célula individual para la secuenciación de metilación
US10975430B2 (en) Compositions and methods for improving sample identification in indexed nucleic acid libraries
CA2976786A1 (en) Dna sequencing using controlled strand displacement
CN113528628A (zh) 用于基因组应用和治疗应用的核酸分子的克隆复制和扩增的系统和方法
US20210230689A1 (en) Compositions and methods for improving sample identification in indexed nucleic acid libraries
CN110997932B (zh) 用于甲基化测序的单细胞全基因组文库