ES2889585T3 - Composiciones y métodos para mejorar la identificación de muestras en colecciones de ácidos nucleicos indexadas - Google Patents

Composiciones y métodos para mejorar la identificación de muestras en colecciones de ácidos nucleicos indexadas Download PDF

Info

Publication number
ES2889585T3
ES2889585T3 ES18727420T ES18727420T ES2889585T3 ES 2889585 T3 ES2889585 T3 ES 2889585T3 ES 18727420 T ES18727420 T ES 18727420T ES 18727420 T ES18727420 T ES 18727420T ES 2889585 T3 ES2889585 T3 ES 2889585T3
Authority
ES
Spain
Prior art keywords
adapter
target
stranded
sample
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18727420T
Other languages
English (en)
Inventor
Michael Chesney
Vincent Smith
Claire Bevis-Mott
Jonathan Boutell
Angela Kalbande
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Illumina Cambridge Ltd
Original Assignee
Illumina Cambridge Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina Cambridge Ltd filed Critical Illumina Cambridge Ltd
Application granted granted Critical
Publication of ES2889585T3 publication Critical patent/ES2889585T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B20/00Methods specially adapted for identifying library members
    • C40B20/04Identifying library members by means of a tag, label, or other readable or detectable entity associated with the library members, e.g. decoding processes
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/14Solid phase synthesis, i.e. wherein one or more library building blocks are bound to a solid support during library creation; Particular methods of cleavage from the solid support
    • C40B50/16Solid phase synthesis, i.e. wherein one or more library building blocks are bound to a solid support during library creation; Particular methods of cleavage from the solid support involving encoding steps
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/14Solid phase synthesis, i.e. wherein one or more library building blocks are bound to a solid support during library creation; Particular methods of cleavage from the solid support
    • C40B50/18Solid phase synthesis, i.e. wherein one or more library building blocks are bound to a solid support during library creation; Particular methods of cleavage from the solid support using a particular method of attachment to the solid support
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B70/00Tags or labels specially adapted for combinatorial chemistry or libraries, e.g. fluorescent tags or bar codes
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B80/00Linkers or spacers specially adapted for combinatorial chemistry or libraries, e.g. traceless linkers or safety-catch linkers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Una composición que comprende: una primera pluralidad de moléculas de adaptador-diana-adaptador que comprenden fragmentos diana bicatenarios aislados a partir de una primera fuente, en donde el adaptador comprende un primer adaptador universal específico de la muestra, en donde el primer adaptador universal específico de la muestra comprende (i) una región de ácido nucleico bicatenario, y (ii) una región de hebras de ácido nucleico no complementarias monocatenarias que comprenden al menos un sitio de unión de un cebador universal, en donde el primer adaptador universal específico de la muestra comprende además un primer conjunto de secuencias de marcadores específicos de la muestra que diferencia la primera pluralidad de moléculas de adaptador-diana-adaptador de las moléculas de adaptador-diana-adaptador que se originan a partir de una fuente diferente, en donde el primer conjunto de secuencias de marcadores específicos de la muestra está presente en las hebras de ácido nucleico no complementario monocatenario, y una exonucleasa en donde la exonucleasa comprende una actividad ADN exonucleasa 5' a 3' y una actividad ADN exonucleasa 3' a 5' y en donde las moléculas de adaptador-diana-adaptador comprenden una modificación en cada uno de los extremos 3' para bloquear la actividad ADN exonucleasa 3' a 5'.

Description

DESCRIPCIÓN
Composiciones y métodos para mejorar la identificación de muestras en colecciones de ácidos nucleicos indexadas
Campo
La presente descripción se refiere a composiciones que comprenden moléculas de adaptador-diana-adaptador y una exonucleasa y al uso de dicha exonucleasa en métodos para degradar adaptadores no ligados a fragmentos diana.
Antecedentes
Las mejoras en la tecnología de secuenciación de próxima generación (NGS) han aumentado en gran medida la velocidad de la secuenciación y la obtención de datos, lo que ha dado como resultado un rendimiento masivo de muestras de plataformas de secuenciación actuales. Hace aproximadamente 10 años, Illumina Genome Analyzer era capaz de generar hasta 1 gigabyte de datos de secuencias por ejecución. En la actualidad, la serie de sistemas Illumina NovaSeq™ es capaz de generar hasta 2 terabytes de datos en dos días, lo que representa un aumento de capacidad superior a 2000 veces.
Un aspecto de la puesta en marcha de esta mayor capacidad es la multiplexación, la cual añade secuencias únicas, denominadas indicadores, a cada fragmento de ADN durante la preparación de una colección. Esto permite agrupar y secuenciar un gran número de colecciones simultáneamente durante una única ejecución de la secuenciación. Las ganancias en el rendimiento por la multiplexación vienen con una capa adicional de complejidad, ya que las lecturas de la secuenciación procedentes de colecciones agrupadas deben identificarse y clasificarse computacionalmente en un proceso denominado desmultiplexación, antes del análisis final de los datos. Una asignación incorrecta de los indicadores entre las colecciones multiplexadas, es un problema conocido que ha afectado a las tecnologías NGS desde el momento en que se desarrolló la multiplexación de muestras (Kircher et al., 2012, Nucleic Acids Res., vol.40, n° 1).
Los siguientes documentos pueden resultar útiles para comprender la invención. El documento US2006292611 describe un método para preparar un fragmento de ácido nucleico diana para producir un ácido nucleico más pequeño que comprende los dos extremos del ácido nucleico diana. Específicamente, proporciona estrategias de clonación y manipulación de ADN para aislar los dos extremos de un ácido nucleico diana grande en una única estructura de ADN pequeña para una rápida clonación, secuenciación o amplificación. El documento EP1256630 describe un procedimiento para amplificar el ADN de un organismo a través de la reacción en cadena de la polimerasa (PCR) sin ninguna información sobre el cebador necesario para amplificar el ADN de un organismo. El documento W02007052006 describe un método para preparar una colección de polinucleótidos molde que tienen secuencias comunes en sus extremos 5’ y en sus extremos 3' y también el uso de la colección de moldes en métodos de amplificación de ácidos nucleicos en fase sólida.
Compendio de la solicitud
De acuerdo con la presente invención, se proporciona una composición que comprende moléculas de adaptadordiana-adaptador y una exonucleasa, tal y como se reivindica en la reivindicación 1; y un método para degradar adaptadores no ligados a fragmentos diana, tal y como se reivindica en la reivindicación 10. Se exponen realizaciones adicionales de la invención en las reivindicaciones dependientes. También se describen en este documento composiciones y métodos asociados, para ayudar en la comprensión de la invención, pero estos no forman parte de la invención reivindicada. Los ejemplos o realizaciones descritos en el presente documento que no entran dentro de la definición de las reivindicaciones, no forman parte de la presente invención.
Se observa un salto o un cambio de indicador cuando las moléculas de una colección de ADN secuenciada contienen una secuencia de indicador diferente a la que estaba presente en el adaptador de la colección durante la preparación de la colección. El salto del indicador puede ocurrir durante la preparación de la muestra o durante la amplificación en grupo de colecciones multiplexadas agrupadas. Un mecanismo que causa el salto del indicador implica la presencia de moléculas de adaptadores libres no ligados, presentes después de la preparación de una colección.
Sin pretender estar limitado por la teoría, el problema del salto del indicador tiene múltiples modos, algunos de los cuales implican la presencia de moléculas de adaptador no ligadas residuales y/o productos incompletos que quedan después de la preparación de una colección. Una clase de salto de indicador puede estar provocado por moléculas de adaptadores libres no ligados que tienen una secuencia de extensión de cebador universal específica, por ejemplo, P7', presentes en el conjunto de colecciones, que pueden contribuir a la formación de colecciones con indicadores intercambiados. Este problema se puede prevenir mediante el uso de una exonucleasa 5’ que se dirige específicamente a la hebra del adaptador P7' para su degradación. Esto se puede lograr, por ejemplo, mediante el uso de una exonucleasa que tiene tendencia a digerir los extremos 5’ bicatenarios o mediante el uso de modificaciones del extremo 5' para predisponer a una degradación mediada por exonucleasas de las moléculas de ADN del adaptador.
Las moléculas de adaptadores P7’ libres no ligados, presentes después de la preparación de una colección pueden aparearse con el cebador P7 inmovilizado en una superficie sobre un sustrato, como una celda de flujo y servir como molde para la generación de un cebador modificado inmovilizado sobre una superficie, más largo que contiene una secuencia de indicador específica, por ejemplo, i7 y una secuencia que se une a un cebador universal común. El cebador en la superficie modificado tendría entonces complementariedad con las moléculas de la colección en la región 3’ del adaptador de la molécula indicadora, lo que permitiría la generación de una molécula de la colección unida a la superficie con una secuencia indicadora i7 diferente a la presente en la molécula de la colección original.
Este mecanismo de salto de indicador puede reducirse o eliminarse mediante el uso de una exonucleasas 5’ para degradar selectivamente las moléculas de adaptador P7' no ligadas. Un modo de degradación selectiva implica el uso de una exonucleasa 5’ con actividad exonucleasa 5' a 3’ que tiene tendencia a degradar moléculas de ADN de doble hebra. Este enfoque podría usarse en el contexto de un método de preparación de colecciones utilizando adaptadores bifurcados, con un extremo bicatenario (que contiene posiblemente un extremo protuberante 3’ corto) y un extremo monocatenario "bifurcado". Después de una ligación con colecciones de insertos de muestras, la colección resultante contiene regiones "bifurcadas" monocatenarias en ambos extremos. Quedan algunas moléculas de adaptador no ligadas que incluyen el extremo bicatenario. A continuación, la hebra P7’ de esa molécula de adaptador se puede dirigir a una diana para degradarla mediante el uso de una exonucleasa 5' a 3’ que tiene tendencia a digerir el ADN bicatenario. El uso de una exonucleasa 5’ a 3' que se dirige selectivamente a un extremo bicatenario fosforilado en 5’, ayuda a limitar la actividad de la exonucleasa a los adaptadores no ligados.
Otro modo de degradación selectiva implica el uso de una exonucleasa 5’ con actividad exonucleasa 5' a 3’ y actividad ADN exonucleasa 3' a 5’. Este enfoque también podría usarse en el contexto de un método de preparación de colecciones usando adaptadores bifurcados, con un extremo bicatenario (que contiene posiblemente un extremo protuberante 3’ corto) y un extremo monocatenario "bifurcado". Después de una ligación con colecciones de insertos de muestras, quedan algunas moléculas de adaptador no ligadas que incluyen el extremo bicatenario. La hebra P7’ de esa molécula de adaptador se puede dirigir entonces a una diana para degradarla mediante el uso de una exonucleasa 5' con actividad exonucleasa 5’ a 3' y actividad ADN exonucleasa 3’ a 5', pero la actividad ADN exonucleasa 3’ a 5' puede reducirse mediante el uso de una modificación en cada uno de los extremos 3’ de un adaptador para bloquear la actividad exonucleasa 3' a 5’. Esta modificación evita la digestión de las moléculas de adaptador-diana-adaptador desde los extremos libres 3’. Una modificación opcional se encuentra en el extremo monocatenario "bifurcado" en 5’. Esta modificación evita la digestión de moléculas de adaptador-diana-adaptador desde los extremos 5’ libres.
Una clase de salto de indicador puede deberse a productos incompletos presentes en el conjunto de colecciones. Durante la producción de colecciones se pueden formar especies incompletas, tales como moléculas de adaptadordiana que no incluyen la estructura deseada de una molécula diana flanqueada en cada extremo por moléculas de adaptadores y moléculas diana que no tienen una molécula de adaptador fijada en ninguno de los extremos. Estas especies pueden contribuir a la formación de colecciones con indicadores intercambiados, actuando como cebadores para reacciones de extensión no deseadas.
Este mecanismo de salto de indicador puede reducirse o eliminarse mediante el uso de exonucleasas que tienen actividad exonucleasa 3’ a 5' para degradar selectivamente productos incompletos presentes en el conjunto de colecciones. Este enfoque también podría usarse en el contexto de un método de preparación de colecciones usando adaptadores bifurcados, con un extremo bicatenario (que contiene posiblemente un extremo protuberante 3’ corto) y un extremo monocatenario "bifurcado". Después de la ligación con las colecciones de insertos de muestras, quedan algunos productos incompletos que incluyen un extremo bicatenario y un extremo monocatenario "bifurcado" o dos extremos bicatenarios. Esos extremos bicatenarios pueden ser el objeto de una degradación mediante el uso de una exonucleasa que tiene actividad exonucleasa 3’ a 5' que tiene tendencia hacia moléculas de ADN bicatenarias. El uso de una exonucleasa 3’ a 5' que se dirige selectivamente a los extremos 3’ romos o rebajados puede ayudar a limitar la actividad de la exonucleasa a los productos incompletos.
Una clase de salto de indicador puede estar causado por moléculas de adaptadores libres no ligados que tienen una secuencia de extensión de cebador universal específica, por ejemplo P7’, presente en el conjunto de colecciones o productos incompletos, tales como moléculas de adaptador-diana que no incluyen un polinucleótido diana flanqueado en cada extremo por moléculas de adaptador, que pueden contribuir a la formación de colecciones con indicadores intercambiados, que actúan como cebadores para reacciones de extensión no deseadas. Este problema puede evitarse introduciendo bloqueos en 3’ dentro de moléculas de adaptadores libres no ligados que tienen una secuencia de extensión de cebador universal específica, por ejemplo P7', o productos incompletos presentes en el conjunto de colecciones.
En el presente documento se describen composiciones y métodos para mitigar el salto de un indicador y su efecto sobre la calidad de los datos de una secuenciación.
Tal y como se usa en el presente documento, la expresión "cada uno", cuando se usa haciendo referencia a una colección de elementos, se entiende que identifica un elemento individual en la colección, pero no se refiere necesariamente a cada elemento de la colección, a menos que el contexto indique claramente lo contrario.
Tal y como se usa en el presente documento, la expresión "ácido nucleico" pretende ser coherente con su uso en la técnica e incluye ácidos nucleicos con anillo que se encuentran de forma natural o análogos funcionales de los mismos. Los análogos funcionales particularmente útiles son capaces de hibridarse con un ácido nucleico de una manera específica de la secuencia o pueden usarse como molde para la replicación de una secuencia de nucleótidos particular. Los ácidos nucleicos de origen natural generalmente tienen una estructura principal que contiene enlaces fosfodiéster. Una estructura análoga puede tener un enlace principal alternativo que incluye cualquiera entre una variedad de los conocidos en la técnica. Los ácidos nucleicos de origen natural generalmente tienen un azúcar desoxirribosa (por ejemplo, que se encuentra en el ácido desoxirribonucleico (ADN)) o un azúcar ribosa (por ejemplo, que se encuentra en el ácido ribonucleico (ARN)). Un ácido nucleico puede contener cualquiera entre una variedad de análogos de esos restos de azúcar que se conocen en la técnica. Un ácido nucleico puede incluir bases naturales o no naturales. A este respecto, un ácido desoxirribonucleico natural puede tener una o varias bases seleccionadas a partir del grupo que consiste en adenina, timina, citosina o guanina y un ácido ribonucleico puede tener una o varias bases seleccionadas a partir del grupo que consiste en uracilo, adenina, citosina o guanina. Las bases no naturales útiles que se pueden incluir en un ácido nucleico se conocen en la técnica. El término "diana", cuando se usa haciendo referencia a un ácido nucleico, se entiende que es un identificador semántico del ácido nucleico en el contexto de un método o una composición establecidos en este documento y no limita necesariamente la estructura o la función del ácido nucleico más allá de lo que se indique explícitamente de otro modo.
Tal y como se usa en este documento, el término "transporte" se refiere al movimiento de una molécula a través de un fluido. El término puede incluir un transporte pasivo, como el movimiento de unas moléculas a lo largo de su gradiente de concentración (por ejemplo, difusión pasiva). El término también puede incluir un transporte activo mediante el cual las moléculas pueden moverse a lo largo de su gradiente de concentración o en contra de su gradiente de concentración. Por tanto, el transporte puede incluir la aplicación de energía para mover una o varias moléculas en una dirección deseada o hacia una ubicación deseada, tal como un sitio de amplificación.
Tal y como se usa en este documento, la expresión "secuencia universal" se refiere a una región de una secuencia que es común a dos o más moléculas de ácido nucleico, por ejemplo, moléculas de adaptador-diana-adaptador, en donde las moléculas también tienen regiones de la secuencia que difieren entre sí. Una secuencia universal que está presente en diferentes miembros de una colección de moléculas puede permitir la captura de múltiples ácidos nucleicos diferentes usando una población de ácidos nucleicos de captura universales que son complementarios a una porción de la secuencia universal, por ejemplo, un sitio de unión para un cebador de extensión universal. Los ejemplos de sitios de unión para un cebador de extensión universal incluyen secuencias que son idénticas o complementarias a los cebadores P5 y P7. De manera similar, una secuencia universal presente en diferentes miembros de una colección de moléculas puede permitir la replicación o amplificación de múltiples ácidos nucleicos diferentes, usando una población de cebadores universales que son complementarios a una porción de la secuencia universal, por ejemplo, un sitio de unión de un cebador universal. Por tanto, un ácido nucleico de captura universal o un cebador universal incluye una secuencia que se puede hibridar específicamente con una secuencia universal. Las moléculas de ácido nucleico diana se pueden modificar para fijar adaptadores universales (también denominados en el presente documento adaptadores), por ejemplo, en uno o ambos extremos de las diferentes secuencias diana, como se describe en el presente documento.
Los términos "P5" y "P7" pueden usarse cuando se hace referencia a cebadores de amplificación, por ejemplo, cebadores de extensión de cebadores universales. Los términos "P5’" (P5 prima) y "P7'" (P7 prima) se refieren al complemento de P5 y P7, respectivamente. Se entenderá que se puede usar cualquier cebador de amplificación adecuado en los métodos presentados en el presente documento y que el uso de P5 y P7 es únicamente a modo de ejemplo. Los usos de cebadores de amplificación tales como P5 y P7 en celdas de flujo se conocen en la técnica, tal y como se ejemplifica en las descripciones de los documentos WO 2007/010251, WO 2006/064199, WO 2005/065814, WO 2015/106941, WO 1998/044151 y WO 2000/018957. Por ejemplo, cualquier cebador de amplificación directa adecuado, ya sea inmovilizado o en solución, puede ser útil en los métodos presentados en este documento para la hibridación con una secuencia complementaria y la amplificación de una secuencia. De manera similar, cualquier cebador de amplificación inversa adecuado, ya sea inmovilizado o en solución, puede ser útil en los métodos presentados en este documento para la hibridación con una secuencia complementaria y la amplificación de una secuencia. Un experto en la técnica sabrá cómo diseñar y usar secuencias de cebadores que sean adecuadas para la captura y amplificación de ácidos nucleicos tal y como se presentan en este documento.
Tal y como se usa en este documento, "amplificar", "amplificando" o "reacción de amplificación" y sus derivados, se refieren generalmente a cualquier acción o procedimiento mediante el cual al menos una porción de una molécula de ácido nucleico se replica o se copia en al menos una molécula de ácido nucleico adicional. La molécula de ácido nucleico adicional incluye opcionalmente una secuencia que es sustancialmente idéntica o sustancialmente complementaria a al menos una porción de la molécula de ácido nucleico molde. La molécula de ácido nucleico molde puede ser monocatenaria o bicatenaria y la molécula de ácido nucleico adicional puede ser independientemente monocatenaria o bicatenaria. La amplificación incluye opcionalmente una replicación lineal o exponencial de una molécula de ácido nucleico. En algunos casos, esa amplificación se puede realizar usando condiciones isotérmicas; en otros, esa amplificación puede incluir un termociclado. En algunos ejemplos, la amplificación es una amplificación múltiple que incluye la amplificación simultánea de una pluralidad de secuencias diana en una única reacción de amplificación. En algunos ejemplos, "amplificación" incluye la amplificación de al menos alguna porción de ácidos nucleicos a base de ADN y ARN, sola o en combinación. La reacción de amplificación puede incluir cualquiera de los procedimientos de amplificación conocidos por un experto en la técnica. En algunos casos, la reacción de amplificación incluye la reacción en cadena de la polimerasa (PCR).
Tal y como se usa en este documento, "condiciones de la amplificación" y sus derivados, generalmente se refiere a condiciones adecuadas para amplificar una o varias secuencias de ácido nucleico. Esa amplificación puede ser lineal o exponencial. En algunos ejemplos, las condiciones de la amplificación pueden incluir condiciones isotérmicas o, alternativamente, pueden incluir condiciones de termociclado o una combinación de condiciones isotérmicas y de termociclado. En algunos ejemplos, las condiciones adecuadas para amplificar una o varias secuencias de ácido nucleico incluyen condiciones para la reacción en cadena de la polimerasa (PCR). Normalmente, las condiciones de la amplificación se refieren a una mezcla de reacción que es suficiente para amplificar ácidos nucleicos tales como una o varias secuencias diana o para amplificar una secuencia diana amplificada, ligada a uno o varios adaptadores, por ejemplo, una secuencia diana amplificada ligada a un adaptador. Generalmente, las condiciones de la amplificación incluyen un catalizador para la amplificación o para la síntesis de ácidos nucleicos, por ejemplo, una polimerasa; un cebador que posee algún grado de complementariedad con el ácido nucleico que se va a amplificar; y nucleótidos, tales como desoxirribonucleótidos trifosfatos (dNTPs) para promover la extensión del cebador una vez que se hibrida con el ácido nucleico. Las condiciones de la amplificación pueden requerir una hibridación o un apareamiento de un cebador con un ácido nucleico, una extensión del cebador y una etapa de desnaturalización en la que el cebador extendido se separa de la secuencia de ácido nucleico que se amplifica. Normalmente, pero no necesariamente, las condiciones de la amplificación pueden incluir un termociclado; en algunos casos, las condiciones de la amplificación incluyen una pluralidad de ciclos en los que se repiten las etapas de apareamiento, extensión y separación. Normalmente, las condiciones de la amplificación incluyen cationes tales como Mg2+ o Mn2+ y también pueden incluir diversos modificadores de la fuerza iónica.
Tal y como se usa en este documento, "reamplificación" y sus derivados se refieren generalmente a cualquier procedimiento mediante el cual al menos una porción de una molécula de ácido nucleico amplificada, se amplifica adicionalmente a través de cualquier procedimiento de amplificación adecuado (denominado en algunas realizaciones amplificación "secundaria"), produciendo así una molécula de ácido nucleico reamplificada. No es necesario que la amplificación secundaria sea idéntica al procedimiento de amplificación original, mediante el cual se había producido la molécula de ácido nucleico amplificada; tampoco es necesario que la molécula de ácido nucleico reamplificada sea completamente idéntica o completamente complementaria a la molécula de ácido nucleico amplificada; todo lo que se requiere es que la molécula de ácido nucleico reamplificada incluya al menos una porción de la molécula de ácido nucleico amplificada o su complemento. Por ejemplo, la reamplificación puede implicar el uso de diferentes condiciones de la amplificación y/o diferentes cebadores, incluyendo cebadores específicos de la diana diferentes de los de la amplificación primaria.
Tal y como se usa en este documento, la expresión "reacción en cadena de la polimerasa" ("PCR") se refiere al método de Mullis, documentos de Patente de EE.UU. n° 4.683.195 y 4.683.202, que describen un método para aumentar la concentración de un segmento de un polinucleótido de interés en una mezcla de ADN genómico sin clonación ni purificación. Este procedimiento de amplificación del polinucleótido de interés consiste en introducir un gran exceso de dos cebadores oligonucleotídicos en la mezcla de ADN que contiene el polinucleótido deseado de interés, seguido de una serie de ciclos térmicos en presencia de una ADN polimerasa. Los dos cebadores son complementarios a sus respectivas hebras del polinucleótido bicatenario de interés. La mezcla se desnaturaliza primero a una temperatura más alta y luego los cebadores se aparean con secuencias complementarias dentro del polinucleótido de la molécula de interés. Después del apareamiento, los cebadores se extienden con una polimerasa para formar una nueva pareja de hebras complementarias. Las etapas de desnaturalización, apareamiento del cebador y extensión de la polimerasa se pueden repetir muchas veces (denominadas termociclado) para obtener una concentración elevada de un segmento amplificado del polinucleótido deseado de interés. La longitud del segmento amplificado del polinucleótido deseado de interés (amplicón) se determina por las posiciones relativas de los cebadores entre sí y, por lo tanto, esa longitud es un parámetro controlable. En virtud de la repetición del procedimiento, el método se denomina "reacción en cadena de la polimerasa" (en adelante, "PCR"). Debido a que los segmentos amplificados deseados del polinucleótido de interés se convierten en las secuencias de ácido nucleico predominantes (en términos de concentración) en la mezcla, se dice que están "amplificados mediante PCR". En una modificación del método descrito anteriormente, las moléculas de ácido nucleico diana pueden amplificarse con PCR usando una pluralidad de parejas de cebadores diferentes, en algunos casos, una o varias parejas de cebadores por cada molécula de ácido nucleico diana de interés, formando así una reacción PCR múltiple.
Tal y como se define en el presente documento, "amplificación múltiple" se refiere a una amplificación selectiva y no aleatoria de dos o más secuencias diana dentro de una muestra, usando al menos un cebador específico de la diana. En algunos casos, la amplificación múltiple se realiza de manera que algunas o todas las secuencias diana se amplifican dentro de un único recipiente de reacción. El "ple" o "n° de veces" de una amplificación múltiple dada se refiere generalmente al número de diferentes secuencias específicas de una diana que se amplifican durante esa amplificación múltiple única. El n° de veces puede ser de aproximadamente 12 veces, 24 veces, 48 veces, 96 veces, 192 veces, 384 veces, 768 veces, 1536 veces, 3072 veces, 6144 veces o superior. También es posible detectar las secuencias diana amplificadas mediante varias metodologías diferentes (p. ej., electroforesis en gel seguida de densitometría, cuantificación con un bioanalizador o PCR cuantitativa, hibridación con una sonda marcada; incorporación de cebadores biotinilados seguida de detección de un conjugado de avidina-enzima; incorporación de trifosfatos de desoxinucleótido marcados con 32P en la secuencia diana amplificada).
Tal y como se usa en este documento, el término "cebador" y sus derivados se refieren generalmente a cualquier polinucleótido que se puede hibridar con una secuencia diana de interés. Normalmente, el cebador actúa como un sustrato sobre el que se pueden polimerizar nucleótidos mediante una polimerasa; en algunas realizaciones, sin embargo, el cebador puede incorporarse en la hebra de ácido nucleico sintetizada y proporcionar un sitio en el que se puede hibridar otro cebador para cebar la síntesis de una nueva hebra que es complementaria a la molécula de ácido nucleico sintetizada. El cebador puede estar compuesto por cualquier combinación de nucleótidos o análogos de los mismos. En algunas realizaciones, el cebador es un oligonucleótido o polinucleótido monocatenario. Los términos "polinucleótido" y "oligonucleótido" se usan indistintamente en el presente documento para referirse a una forma polimérica de nucleótidos de cualquier longitud y pueden comprender ribonucleótidos, desoxirribonucleótidos, análogos de los mismos o mezclas de los mismos. Debe entenderse que los términos incluyen, como equivalentes, análogos de ADN o ARN preparados a partir de análogos de nucleótidos y que son aplicables a polinucleótidos monocatenarios (tales como sentido o antisentido) y bicatenarios. El término, tal y como se usa en el presente documento, también incluye ADNc, que es ADN complementario o copia producido a partir de un molde de ARN, por ejemplo, mediante la acción de una transcriptasa inversa. Este término se refiere solo a la estructura primaria de la molécula. Por tanto, el término incluye ácido desoxirribonucleico ("ADN") de cadena triple, doble y simple, así como a ácido ribonucleico ("ARN") de cadena triple, doble y simple.
Tal y como se usa en este documento, "secuencias diana amplificadas" y sus derivados, se refiere generalmente a una secuencia de ácido nucleico producida amplificando las secuencias diana usando cebadores específicos de una diana y los métodos proporcionados en este documento. Las secuencias diana amplificadas pueden ser del mismo sentido (es decir, la hebra positiva) o antisentido (es decir, la hebra negativa) con respecto a las secuencias diana.
Tal y como se usa en este documento, los términos "ligando", "ligación" y sus derivados se refieren generalmente al procedimiento para unir covalentemente dos o más moléculas entre sí, por ejemplo, unir covalentemente dos o más moléculas de ácido nucleico entre sí. En algunas realizaciones, la ligación incluye unir las mellas entre nucleótidos adyacentes de ácidos nucleicos. En algunas realizaciones, la ligación incluye formar un enlace covalente entre un extremo de una primera molécula de ácido nucleico y un extremo de una segunda molécula de ácido nucleico. En algunas realizaciones, la ligación puede incluir la formación de un enlace covalente entre un grupo fosfato 5’ de un ácido nucleico y un grupo hidroxilo 3' de un segundo ácido nucleico, formando de este modo una molécula de ácido nucleico ligada. Generalmente, para los fines de esta descripción, una secuencia diana amplificada se puede ligar a un adaptador para generar una secuencia diana amplificada ligada a un adaptador. El experto en la materia reconocerá que una reacción de ligación puede no dar como resultado la unión de todas las moléculas presentes en la reacción.
Tal y como se usa en este documento, "ligasa" y sus derivados, se refiere generalmente a cualquier agente capaz de catalizar la ligación de dos moléculas de sustrato. En algunas realizaciones, la ligasa incluye una enzima capaz de catalizar la unión de mellas entre nucleótidos adyacentes de un ácido nucleico. En algunas realizaciones, la ligasa incluye una enzima capaz de catalizar la formación de un enlace covalente entre un fosfato 5’ de una molécula de ácido nucleico y un hidroxilo 3' de otra molécula de ácido nucleico formando de este modo una molécula de ácido nucleico ligada. Las ligasas adecuadas pueden incluir, la ADN ligasa de T4, la ARN ligasa de T4 y la ADN ligasa de E. coli.
Tal y como se usa en este documento, "condiciones de ligación" y sus derivados, generalmente se refiere a condiciones adecuadas para ligar dos moléculas entre sí. En algunas realizaciones, las condiciones de ligación son adecuadas para sellar mellas o huecos entre ácidos nucleicos. Tal y como se usa en este documento, el término mella o hueco es consistente con el uso del término en la técnica. Normalmente, se puede ligar una mella o un hueco en presencia de una enzima, tal como una ligasa, a una temperatura y un pH adecuados. En algunas realizaciones, la ADN ligasa de T4 puede unirse a una mella entre ácidos nucleicos a una temperatura de aproximadamente 70-72°C.
Tal y como se usa en este documento, el término "adaptador" y sus derivados, por ejemplo, adaptador universal, se refiere generalmente a cualquier oligonucleótido lineal que se puede ligar con una molécula de ácido nucleico de la descripción. En algunas realizaciones, el adaptador es sustancialmente no complementario al extremo 3’ o al extremo 5' de cualquier secuencia diana presente en la muestra. En algunas realizaciones, las longitudes adecuadas del adaptador están en el intervalo de aproximadamente 10-100 nucleótidos, aproximadamente 12-60 nucleótidos y aproximadamente 15-50 nucleótidos de longitud. Generalmente, el adaptador puede incluir cualquier combinación de nucleótidos y/o de ácidos nucleicos. En algunos aspectos, el adaptador puede incluir uno o varios grupos escindibles en una o varias ubicaciones. En otro aspecto, el adaptador puede incluir una secuencia que es sustancialmente idéntica o sustancialmente complementaria, a al menos una porción de un cebador, por ejemplo, un cebador universal. En algunas realizaciones, el adaptador puede incluir un código de barras o un marcador para ayudar en la corrección de errores aguas abajo, la identificación o la secuenciación.
Los términos "adaptador" y "conector" se utilizan indistintamente.
La expresión "celda de flujo", tal y como se usa en el presente documento, se refiere a una cámara que comprende una superficie sólida a través de la cual pueden fluir uno o varios reactivos fluidos. Ejemplos de celdas de flujo y sistemas fluidos relacionados y plataformas de detección que pueden usarse cómodamente en los métodos de la presente descripción, se describen, por ejemplo, en Bentley et al., Nature 456:53-59 (2008), los documentos WO 04/018497; US 7.057.026; WO 91/06678; WO 07/123744; US 7.329.492; US 7.211.414; US 7.315.019; US 7.405.281 y US 2008/0108082.
Tal y como se usa en este documento, el término "amplicón" cuando se usa haciendo referencia a un ácido nucleico, significa el producto de copiar el ácido nucleico, en donde el producto tiene una secuencia de nucleótidos que es igual o complementaria a al menos una porción de la secuencia de nucleótidos del ácido nucleico. Un amplicón se puede producir mediante cualquiera entre una variedad de métodos de amplificación que usan como molde el ácido nucleico o un amplicón del mismo, incluyendo, por ejemplo, extensión de la polimerasa, reacción en cadena de la polimerasa (PCR), amplificación de círculo rodante (RCA), extensión por ligación o reacción en cadena de ligación. Un amplicón puede ser una molécula de ácido nucleico que tiene una única copia de una secuencia de nucleótidos particular (por ejemplo, un producto de PCR) o múltiples copias de la secuencia de nucleótidos (por ejemplo, un producto concatamérico de RCA). Un primer amplicón de un ácido nucleico diana es normalmente una copia complementaria. Los amplicones posteriores son copias que se crean, después de la generación del primer amplicón, a partir del ácido nucleico diana o a partir del primer amplicón. Un amplicón posterior puede tener una secuencia que sea sustancialmente complementaria al ácido nucleico diana o sustancialmente idéntica al ácido nucleico diana.
Tal y como se usa en este documento, la expresión "sitio de amplificación" se refiere a un sitio en o sobre una matriz, en donde se pueden generar uno o varios amplicones. Un sitio de amplificación puede configurarse además para contener, retener o fijar al menos un amplicón que se genera en el sitio.
Tal y como se usa en el presente documento, el término "matriz" se refiere a una población de sitios que se pueden diferenciar entre sí según la ubicación relativa. Las diferentes moléculas que se encuentran en diferentes sitios de una matriz se pueden diferenciar entre sí según las ubicaciones de los sitios en la matriz. Un sitio individual de una matriz puede incluir una o varias moléculas de un tipo particular. Por ejemplo, un sitio puede incluir una única molécula de ácido nucleico diana que tiene una secuencia particular o un sitio puede incluir varias moléculas de ácido nucleico que tienen la misma secuencia (y/o una secuencia complementaria, de la misma). Los sitios de una matriz pueden ser características diferentes ubicadas sobre el mismo sustrato. Las características ejemplares incluyen, sin limitación, pocillos en un sustrato, perlas (u otras partículas) en o sobre un sustrato, proyecciones desde un sustrato, crestas en un sustrato o canales en un sustrato. Los sitios de una matriz pueden ser sustratos distintos, siendo cada uno portador de una molécula diferente. Se pueden identificar diferentes moléculas fijadas a sustratos distintos, según las ubicaciones de los sustratos sobre una superficie a la que están asociados los sustratos o según las ubicaciones de los sustratos en un líquido o gel. Las matrices ejemplares en las que se ubican sustratos distintos sobre una superficie incluyen, sin limitación, aquellas que tienen perlas en los pocillos.
Tal y como se usa en este documento, el término "capacidad", cuando se usa haciendo referencia a un sitio y a un material de ácido nucleico, significa la cantidad máxima de material de ácido nucleico que se puede encontrar en el sitio. Por ejemplo, el término puede referirse al número total de moléculas de ácido nucleico que se pueden encontrar en el sitio en una condición particular. También se pueden usar otras medidas que incluyen, por ejemplo, la masa total de material de ácido nucleico o el número total de copias de una secuencia de nucleótidos particular que se puede encontrar en el sitio en una condición particular. Normalmente, la capacidad de un sitio para un ácido nucleico diana será sustancialmente equivalente a la capacidad del sitio para amplicones del ácido nucleico diana.
Tal y como se usa en este documento, la expresión "agente de captura" se refiere a un material, un producto químico, una molécula o un resto de la misma que es capaz de fijar, retener o unirse a una molécula diana (por ejemplo, un ácido nucleico diana). Los agentes de captura ejemplares incluyen un ácido nucleico de captura que es complementario a al menos una porción de un ácido nucleico diana, un miembro de una pareja de unión receptor-ligando (por ejemplo, avidina, estreptavidina, biotina, lectina, carbohidrato, proteína que se une a ácido nucleico, epítopo, anticuerpo, etc.) capaz de unirse a un ácido nucleico diana (o a un resto de unión fijado al mismo) o un reactivo químico capaz de formar un enlace covalente con un ácido nucleico diana (o un resto de unión fijado al mismo).
Tal y como se usa en este documento, la expresión "población clonal" se refiere a una población de ácidos nucleicos que es homogénea con respecto a una secuencia de nucleótidos particular. La secuencia homogénea tiene normalmente una longitud de al menos 10 nucleótidos, pero puede ser incluso más larga, incluyendo, por ejemplo, una longitud de al menos 50, 100, 250, 500 o 1000 nucleótidos. Una población clonal se puede obtener a partir de un único ácido nucleico diana o de un ácido nucleico molde. Normalmente, todos los ácidos nucleicos de una población clonal tendrán la misma secuencia de nucleótidos. Se entenderá que puede tener lugar un pequeño número de mutaciones (por ejemplo, debidas a artefactos de la amplificación) en una población clonal, sin apartarse de la clonalidad.
El término "y/o" significa uno o todos los elementos enumerados o una combinación de dos o más de los elementos enumerados.
Las palabras "preferido" y "preferiblemente" se refieren a realizaciones de la invención que pueden proporcionar ciertos beneficios, bajo ciertas circunstancias. Sin embargo, también se pueden preferir otras realizaciones, en las mismas circunstancias o en otras. Además, la enumeración de una o varias realizaciones preferidas no implica que otras realizaciones no sean útiles y no pretende excluir otras realizaciones del alcance de la invención.
El término "comprende" y variaciones del mismo no tienen un significado limitante cuando esos términos aparecen en la descripción y las reivindicaciones.
Se entiende que siempre que se describen realizaciones en el presente documento con el lenguaje "incluir", "incluye" o "que incluye" y similares, también se proporcionan realizaciones análogas descritas en términos de "que consiste en" y/o "que consiste esencialmente en".
A menos que se especifique lo contrario, "un", "una", "el, la" y "al menos uno, una" se usan indistintamente y significan uno, una o más de uno, una.
También en el presente documento, las descripciones de intervalos numéricos por los extremos incluyen todos los números incluidos dentro de ese intervalo (por ejemplo, 1 a 5 incluye 1, 1,5, 2, 2,75, 3, 3,80, 4, 5, etc.).
Para cualquier método descrito en este documento que incluya etapas discretas, las etapas pueden realizarse en cualquier orden factible. Y, según sea apropiado, cualquier combinación de dos o más etapas puede realizarse simultáneamente.
Breve descripción de las Figuras
Las FIGs. 1, 2, 3 y 4 son dibujos esquemáticos de un adaptador de acuerdo con varios aspectos de la descripción presentada en este documento.
Las FIGs. 5, 6, 7 y 8 son dibujos esquemáticos de un polinucleótido molde que tiene una molécula de adaptador-diana-adaptador (que puede incluir un adaptador o una porción del mismo) generalmente como se muestra en las FIGs. 1, 2, 3 o 4, respectivamente) de acuerdo con varios aspectos de la descripción presentada en este documento.
Las FIGs. 9A y 9B ilustran la naturaleza del fenómeno de salto de indicador. La FIG. 9A muestra cómo las lecturas procedentes de una muestra dada se desmultiplexan incorrectamente y se mezclan con una muestra diferente después de la desmultiplexación. La FIG. 9B muestra el salto de indicador en un sistema de indicador doble, en donde esto conduce a combinaciones inesperadas de secuencias de marcadores de indicadores.
Las FIGs. 10A y 10B ilustran el enfoque general para medir la tasa de salto de indicador en un sistema dado. La FIG. 10A muestra un diseño ejemplar de una placa de adaptador doble, en donde cada pocillo individual de una placa de 96 pocillos contiene una sola pareja de secuencias de marcadores de indicadores. La FIG. 10B muestra una configuración experimental destinada a medir la tasa de salto de un indicador, en donde solo se utilizan combinaciones únicas de marcadores de indicadores dobles.
Las FIGs. 11A y 11B ilustran el efecto de los adaptadores no ligados sobre la tasa de salto de indicador. La FIG. 11A muestra un aumento de 6 veces en el salto de indicador asociado con un aumento rápido del 50% de adaptadores libres. La FIG. 11B muestra un efecto aproximadamente lineal del adaptador bifurcado libre sobre la tasa de salto de indicador dentro del intervalo sometido a ensayo.
Las FIGs. 12A y 12B ilustran el efecto del tratamiento con exonucleasa de acuerdo con la presente invención sobre las tasas de salto de indicador en el flujo de trabajo de una preparación de colecciones sin PCR de Illumina TruSeq® PCR-Free, con (FIG. 12B) y sin (FIG. 12A) bloqueo del extremo 3'.
La FIG. 13 muestra el efecto de un tratamiento combinado con exonucleasa y bloqueo en 3’ de acuerdo con la presente invención, sobre las tasas de salto de indicador en el flujo de trabajo de una preparación de colecciones sin PCR de Illumina TruSeq® PCR-Free, con y sin un aumento rápido de adaptador libre.
Los dibujos esquemáticos no están necesariamente a escala. Los números similares utilizados en las figuras se refieren a componentes, etapas y análogos similares. Sin embargo, se entenderá que el uso de un número para referirse a un componente en una figura dada, no pretende limitar el componente en otra figura etiquetada con el mismo número. Además, el uso de diferentes números para referirse a los componentes, no pretende indicar que los diferentes componentes numerados no pueden ser iguales o similares a otros componentes numerados.
Descripción detallada
Fragmentos diana de cadena doble
En una realización, una composición incluye una pluralidad de fragmentos diana bicatenarios. Las expresiones "fragmento diana", "fragmento de ácido nucleico diana", "molécula diana", "molécula de ácido nucleico diana" y "ácido nucleico diana" se usan indistintamente para referirse a moléculas de ácido nucleico que se desea secuenciar, como en una matriz. El ácido nucleico diana puede ser esencialmente cualquier ácido nucleico de secuencia conocida o desconocida. Puede ser, por ejemplo, un fragmento de ADN genómico o ADNc. La secuenciación puede dar como resultado la determinación de la secuencia de la molécula diana completa o de una parte. Las dianas pueden obtenerse a partir de una muestra de ácido nucleico primario que se ha fragmentado aleatoriamente. Las dianas se pueden procesar en moldes adecuados para la amplificación, mediante la colocación de secuencias de amplificación universales, por ejemplo, secuencias presentes en un adaptador universal, en los extremos de cada fragmento diana. Las dianas también se pueden obtener a partir de una muestra de ARN primario mediante transcripción inversa para obtener ADNc.
La muestra de ácido nucleico primario puede originarse en forma de ADN bicatenario (ADNds) (por ejemplo, fragmentos de ADN genómico, productos de amplificación y de PCR, y similares) a partir de una muestra o se puede haber originado en forma monocatenaria a partir de una muestra, tal como ADN o ARN y convertir a la forma de ADNds. A modo de ejemplo, las moléculas de ARNm se pueden copiar en ADNc de doble hebra adecuados para uso en el método descrito en este documento, usando métodos convencionales bien conocidos en la técnica. La secuencia precisa de las moléculas de polinucleótidos de una muestra de ácido nucleico primario, generalmente no es un material para la invención y puede ser conocida o desconocida.
En un ejemplo, las moléculas de polinucleótidos procedentes de una muestra de ácido nucleico primario son moléculas de ARN. El ARN aislado a partir de muestras específicas se convierte primero en ADN de doble hebra usando métodos conocidos en la técnica. De acuerdo con la presente descripción, el ADN de doble hebra, independientemente de si se aisló como ARN o ADN, se marca o se indexa con un marcador específico de la muestra. Normalmente, un marcador específico de una muestra está presente como parte de un adaptador universal. Se pueden generar diferentes preparaciones de un ADN de doble hebra de ese tipo, incluyendo marcadores específicos de una muestra, en paralelo, a partir de ARN aislado de diferentes muestras específicas. Posteriormente, diferentes preparaciones de ADN bicatenario que incluyen diferentes marcadores específicos de una muestra, se pueden mezclar, secuenciar en masa y determinar la identidad de cada fragmento diana secuenciado, con respecto a la muestra a partir de la cual se había aislado/obtenido, en virtud de la presencia de un marcador específico de la muestra. Con ciertas condiciones, el salto de indicador da como resultado que los marcadores específicos de la muestra que marcan diferentes fuentes, se mezclen o combinen de modo que un solo fragmento diana tiene, por ejemplo, un marcador específico de la muestra que identifica una fuente en un extremo y un marcador específico de la muestra que identifica una fuente diferente en el otro extremo. Esto puede dar lugar a una contaminación cruzada de la muestra, lo que puede confundir los resultados de los experimentos de secuenciación. Los métodos descritos en este documento reducen el salto de indicador.
En una realización, las moléculas de polinucleótidos primarios procedentes de una muestra de ácido nucleico primario son moléculas de ADN. Más particularmente, las moléculas de polinucleótidos primarios representan el complemento genético completo de un organismo y son moléculas de ADN genómico que incluyen secuencias tanto de intrones como de exones, así como secuencias reguladoras no codificantes, tales como secuencias de promotores y potenciadores. En una realización, pueden usarse subconjuntos particulares de secuencias de polinucleótidos o ADN genómico, tales como, por ejemplo, cromosomas particulares. Aún más particularmente, se desconoce la secuencia de las moléculas de polinucleótidos primarios. Aún más particularmente, las moléculas de polinucleótidos primarios son moléculas de ADN genómico humano. Los fragmentos de ADN diana se pueden tratar química o enzimáticamente antes o después de cualquier proceso de fragmentación aleatoria y antes o después de la ligación de las secuencias de adaptadores universales.
Tal y como se define en el presente documento, "muestra" y sus derivados, se usan en su sentido más amplio e incluyen cualquier espécimen, cultivo y similar que se sospecha que incluye una diana. En algunos casos, la muestra comprende ADN, ARN, PNA, LNA, formas quiméricas o híbridas de ácidos nucleicos. La muestra puede incluir cualquier espécimen biológico, clínico, quirúrgico, agrícola, atmosférico o acuático que contenga uno o varios ácidos nucleicos. El término también incluye cualquier muestra de ácido nucleico aislado, tal como ADN genómico, un espécimen de ácido nucleico recién congelado o incrustado en parafina o fijado con formalina. También se prevé que la muestra pueda ser de un solo individuo, de una colección de muestras de ácido nucleico de miembros genéticamente relacionados, de muestras de ácido nucleico de miembros genéticamente no relacionados, de muestras de ácido nucleico (que coinciden) procedentes de un solo individuo, tal como una muestra de tumor y una muestra de tejido normal, o de una muestra procedente de una sola fuente que contiene dos formas distintas de material genético, tal como ADN materno y fetal, obtenido a partir de un sujeto materno o la presencia de ADN bacteriano contaminante en una muestra que contiene ADN vegetal o animal. La fuente de material de ácido nucleico puede incluir ácidos nucleicos obtenidos a partir de un recién nacido, por ejemplo, tal y como se usa normalmente para el cribado de recién nacidos.
La muestra de ácido nucleico puede incluir material de peso molecular elevado, como ADN genómico (ADNg). La muestra puede incluir material de peso molecular bajo, como moléculas de ácido nucleico obtenidas a partir de FFPE o muestras de ADN archivadas. En otro caso, el material de bajo peso molecular incluye ADN fragmentado enzimática o mecánicamente. La muestra puede incluir ADN circulante exento de células. La muestra puede incluir moléculas de ácido nucleico obtenidas a partir de biopsias, tumores, raspados, hisopos, sangre, moco, orina, plasma, semen, cabello, microdisecciones por captura con láser, resecciones quirúrgicas y otras muestras clínicas u obtenidas en un laboratorio. La muestra puede ser una muestra epidemiológica, agrícola, forense o patógena. La muestra puede incluir moléculas de ácido nucleico obtenidas a partir de un animal, tal como una fuente humana o de mamífero. La muestra puede incluir moléculas de ácido nucleico obtenidas a partir de una fuente que no sea de mamífero, tal como una planta, bacteria, virus u hongo. La fuente de las moléculas de ácido nucleico puede ser una muestra o una especie archivada o extinta.
Además, los métodos y composiciones descritos en este documento pueden ser útiles para amplificar una muestra de ácido nucleico que tiene moléculas de ácido nucleico de baja calidad, tal como ADN genómico degradado y/o fragmentado procedente de una muestra forense. Las muestras forenses pueden incluir ácidos nucleicos obtenidos a partir de la escena de un crimen, ácidos nucleicos obtenidos a partir de una base de datos de ADN de personas desaparecidas, ácidos nucleicos obtenidos a partir de un laboratorio asociado con una investigación forense, o incluir muestras forenses obtenidas por agencias de seguridad, uno o varios servicios militares o cualquier personal de ese tipo. La muestra de ácido nucleico puede ser una muestra purificada o un material lisado que contiene ADN crudo, por ejemplo, obtenido a partir de un hisopo bucal, papel, tela u otro sustrato que puede estar impregnado con saliva, sangre u otros fluidos corporales. Como tal, la muestra de ácido nucleico puede comprender pequeñas cantidades de ADN o porciones fragmentadas, tal como ADN genómico. Las secuencias diana pueden estar presentes en uno o varios fluidos corporales que incluyen, pero no se limitan a, sangre, esputo, plasma, semen, orina y suero. Las secuencias diana pueden obtenerse a partir de muestras de cabello, piel, tejidos, autopsias o restos de una víctima. Los ácidos nucleicos que incluyen una o varias secuencias diana se pueden obtener a partir de un animal o un ser humano fallecido. Las secuencias diana pueden incluir ácidos nucleicos obtenidos a partir de ADN no humano, tal como ADN microbiano, vegetal o entomológico. Las secuencias diana o las secuencias diana amplificadas se dirigen a fines de identificación humana. La descripción se refiere en general a métodos para identificar características de una muestra forense. La descripción se refiere en general a métodos de identificación humana que utilizan uno o varios cebadores específicos de una diana, descritos en este documento o uno o varios cebadores específicos de una diana diseñados usando los criterios de diseño de cebadores descritos en el presente documento. Una muestra de identificación forense o humana que contiene al menos una secuencia diana puede amplificarse usando uno cualquiera o varios de los cebadores específicos de una diana descritos en este documento o usando los criterios de cebador descritos en este documento.
Ejemplos adicionales de fuentes de muestras biológicas pueden incluir organismos completos, así como una muestra obtenida a partir de un paciente. La muestra biológica puede obtenerse a partir de cualquier tejido o fluido biológico y puede estar en una variedad de formas, incluyendo tejido y fluido líquidos, tejido sólido y formas conservadas tales como formas secas, congeladas y fijadas. La muestra puede ser de cualquier tejido, célula o fluido biológico. Tales muestras incluyen esputo, sangre, suero, plasma, células sanguíneas (p. ej., glóbulos blancos), líquido ascítico, orina, saliva, lágrimas, esputo, fluido vaginal (secreción), lavados obtenidos durante un procedimiento médico (p. ej., lavados pélvicos u otros lavados obtenidos durante una biopsia, endoscopia o cirugía), muestras de tejido, aspirado de pezón, muestras de biopsia con aguja fina o con núcleo, fluidos corporales que contienen células, ácidos nucleicos que flotan libremente, fluido peritoneal y fluido pleural o células de los mismos. Las muestras biológicas también pueden incluir secciones de tejidos tales como secciones congeladas o fijadas, tomadas con fines histológicos o células microdisecadas o partes extracelulares de las mismas. La muestra puede ser una muestra de sangre, como por ejemplo, una muestra de sangre completa. En otro ejemplo, la muestra es una muestra de una gota de sangre seca sin procesar (DBS). En otro ejemplo adicional, la muestra es una muestra incluida en parafina fijada con formalina (FFPE). En otro ejemplo adicional, la muestra es una muestra de saliva. En otro ejemplo adicional, la muestra es una muestra de una mancha de saliva seca (DSS).
La fragmentación aleatoria se refiere a la fragmentación de una molécula de polinucleótido procedente de una muestra de ácido nucleico primario de forma no ordenada por medios enzimáticos, químicos o mecánicos. Esos métodos de fragmentación son conocidos en la técnica y utilizan métodos convencionales (Sambrook y Russell, Molecular Cloning, A Laboratory Manual, tercera edición). En un ejemplo, la fragmentación utiliza métodos descritos en Gunderson et al. (documento WO 2016/130704). Para mayor claridad, generar fragmentos más pequeños de una pieza más grande de ácido nucleico a través de una amplificación mediante PCR específica de tales fragmentos más pequeños, no es equivalente a fragmentar la pieza más grande de ácido nucleico, porque la pieza más grande de la secuencia de ácido nucleico permanece intacta (es decir, no se fragmenta con la amplificación mediante PCR). Además, la fragmentación aleatoria está diseñada para producir fragmentos, independientemente de la identidad de secuencia o la posición de los nucleótidos que comprenden y/o rodean la ruptura. Más particularmente, la fragmentación aleatoria es por medios mecánicos, tales como nebulización o sometiendo a ultrasonidos para producir fragmentos desde aproximadamente 50 pares de bases de longitud a aproximadamente 1500 pares de bases de longitud, aún más particularmente de 50-700 pares de bases de longitud, aún más particularmente de 50­ 400 pares de bases de longitud. Lo más particularmente, el método se utiliza para generar fragmentos más pequeños de 50-150 pares de bases de longitud.
La fragmentación de moléculas de polinucleótidos por medios mecánicos (nebulización, sometiendo a ultrasonidos e Hydroshear, por ejemplo) da como resultado fragmentos con una mezcla heterogénea de extremos romos y protuberantes 3’ y 5'. Por lo tanto, es deseable reparar los extremos de los fragmentos usando métodos o kits (tales como el kit de reparación de extremos de terminación de ADN de Lucigen) conocidos en la técnica por generar extremos que son óptimos para la inserción, por ejemplo, en sitios romos de vectores de clonación. En un ejemplo particular, los extremos de los fragmentos de la población de ácidos nucleicos tienen extremos romos. Más particularmente, los extremos de los fragmentos tienen extremos romos y están fosforilados. El resto fosfato se puede introducir mediante tratamiento enzimático, por ejemplo, usando polinucleótido cinasa.
En un ejemplo particular, las secuencias de los fragmentos diana se preparan con nucleótidos sobresalientes únicos mediante, por ejemplo, la actividad de ciertos tipos de ADN polimerasa, tal como la polimerasa Taq o la polimerasa exo minus de Klenow que tiene una actividad transferasa terminal no dependiente del molde que añade un solo desoxinucleótido, por ejemplo, desoxiadenosina (A) a los extremos 3’ de una molécula de ADN, por ejemplo, un producto de la PCR. Esas enzimas se pueden usar para añadir un solo nucleótido 'A' al extremo 3’ con extremos romos de cada hebra de los fragmentos diana de doble hebra. Por lo tanto, se podía añadir una 'A' al extremo 3’ de cada hebra reparada en el extremo de los fragmentos diana de doble hebra, mediante una reacción con la polimerasa Taq o exo minus de Klenow, mientras que la estructura del polinucleótido adaptador universal podía ser una estructura en forma de T con un extremo protuberante T compatible, presente en el extremo 3’ de cada región del ácido nucleico bicatenario del adaptador universal. Esa modificación del extremo también evita la autoligación tanto del vector como de la diana, de modo que existe una tendencia para la formación de moléculas de adaptadordiana-adaptador ligadas combinadas.
Adaptadores universales
El método incluye fijar un adaptador universal a cada extremo de los fragmentos diana bicatenarios aislados a partir de una fuente para dar como resultado moléculas de adaptador-diana-adaptador. La fijación puede ser a través de técnicas convencionales de preparación de colecciones , usando ligación o mediante tagmentación (escisión y marcado) usando complejos de transposasa (Gunderson et al., documento WO 2016/130704).
En una realización, los fragmentos diana bicatenarios de cada muestra fragmentada específica se tratan ligando primero moléculas idénticas de adaptadores universales ('adaptadores no emparejados', cuyas características generales se definen a continuación y se describen con más detalle en el documento de solicitud pendiente de tramitación de Gormley et al., documento US 7.741.463 y Bignell et al., documento US 8.053.192) con los extremos 5’ y 3' de los fragmentos diana bicatenarios (que pueden ser de secuencia conocida, parcialmente conocida o desconocida) para formar moléculas de adaptador-diana-adaptador. En una realización, el adaptador universal incluye todas las secuencias necesarias para inmovilizar las moléculas de adaptador-diana-adaptador sobre una matriz para una secuenciación posterior. En otra realización, se usa una etapa de PCR para modificar adicionalmente el adaptador universal presente en cada molécula de adaptador-diana-adaptador antes de la inmovilización y la secuenciación. Por ejemplo, se lleva a cabo una reacción de extensión de cebador inicial, usando un sitio de unión a cebador universal en el que se forman productos de extensión complementarios a ambas cadenas de cada molécula de adaptador-diana-adaptador individual y añaden un sitio de cebador de extensión universal. Los productos de la extensión de cebador resultantes y, opcionalmente, las copias amplificadas de los mismos, proporcionan colectivamente una colección de polinucleótidos molde que se pueden inmovilizar y luego secuenciar. Las expresiones sitio de unión de cebador universal y sitio de cebador de extensión universal se describen detalladamente en el presente documento. El término colección se refiere a la agrupación de fragmentos diana que contienen secuencias comunes conocidas en sus extremos 3’ y 5' y también puede denominarse colección modificada en 3’ y 5'.
Los polinucleótidos de adaptadores universales utilizados en el método de la descripción se denominan en el presente documento adaptadores "mal emparejados" porque, como se explicará con más detalle en el presente documento, los adaptadores incluyen una región con secuencia que no coincide, es decir, no están formados mediante un apareamiento de las hebras de polinucleótidos que es totalmente complementario.
Los adaptadores mal emparejados para uso en el presente documento, se forman mediante el apareamiento de dos hebras de polinucleótidos parcialmente complementarias para proporcionar, cuando las dos hebras se aparean, al menos una región bicatenaria, también denominada región de ácido nucleico bicatenario y al menos una región monocatenaria no emparejada, también denominada región de hebras de ácido nucleico no complementarias monocatenarias.
La "región bicatenaria" del adaptador universal es una región bicatenaria corta, que normalmente incluye 5 o más pares de bases consecutivas, formada mediante el apareamiento de las dos hebras de polinucleótidos parcialmente complementarias. Esta expresión se refiere a una región de ácido nucleico de doble hebra en la que las dos hebras se aparean y no implica ninguna conformación estructural particular. Tal y como se usa en este documento, el término "bicatenario", cuando se usa haciendo referencia a una molécula de ácido nucleico, significa que sustancialmente todos los nucleótidos en la molécula de ácido nucleico están unidos con un hidrógeno a un nucleótido complementario. Un ácido nucleico parcialmente bicatenario puede tener al menos 10%, 25%, 50%, 60%, 70%, 80%, 90% o 95% de sus nucleótidos unidos por un hidrógeno a un nucleótido complementario.
Generalmente es ventajoso que la región bicatenaria sea lo más corta posible sin pérdida de función. En este contexto, 'función' se refiere a la capacidad de la región bicatenaria para formar un dúplex estable en condiciones de reacción convencionales para una reacción de ligación de ácido nucleico, catalizada con una enzima, que será bien conocida por el lector experto (por ejemplo, incubación a una temperatura en el intervalo de 4°C a 25°C en un tampón de ligación apropiado para la enzima), de modo que las dos hebras que forman el adaptador universal permanezcan parcialmente apareadas durante la ligación del adaptador universal a una molécula diana. No es absolutamente necesario que la región bicatenaria sea estable en las condiciones utilizadas normalmente en las etapas del apareamiento de la extensión del cebador o las reacciones de PCR.
Debido a que los adaptadores universales idénticos están ligados a ambos extremos de cada molécula diana, la secuencia diana en cada molécula de adaptador-diana-adaptador estará flanqueada por secuencias complementarias obtenidas a partir de la región bicatenaria de los adaptadores universales. Cuanto más larga sea la región bicatenaria y, por tanto, las secuencias complementarias obtenidas a partir de la misma en las estructuras de adaptador-diana-adaptador, mayor será la posibilidad de que la estructura de adaptador-diana-adaptador sea capaz de replegarse y emparejar las bases consigo misma en esas regiones de autocomplementariedad interna en las condiciones de apareamiento utilizadas en la extensión del cebador y/o la PCR. Por lo tanto, generalmente se prefiere que la región bicatenaria tenga 20 o menos, 15 o menos o 10 o menos pares de bases de longitud con el fin de reducir este efecto. La estabilidad de la región bicatenaria puede incrementarse y, por tanto, reducir su longitud potencialmente, mediante la inclusión de nucleótidos no naturales que presentan un apareamiento de bases más fuerte que los pares de bases convencionales de Watson-Crick.
En un ejemplo, las dos hebras del adaptador universal son 100% complementarias en la región de doble hebra. Se apreciará que se pueden tolerar uno o varios desapareamientos de nucleótidos dentro de la región bicatenaria, siempre que las dos hebras sean capaces de formar un dúplex estable en condiciones de ligación convencionales.
Los adaptadores universales para uso en este documento incluirán generalmente una región bicatenaria que forma el extremo "ligable" del adaptador, es decir, el extremo que se une a un fragmento diana bicatenario en la reacción de ligación. El extremo ligable del adaptador universal puede ser romo o, en otras realizaciones, pueden estar presentes extremos protuberantes cortos 5’ o 3', de uno o varios nucleótidos para facilitar/promover la ligación. El nucleótido terminal 5’ en el extremo ligable del adaptador universal normalmente se fosforila para permitir el enlace fosfodiéster con un grupo hidroxilo 3' en el polinucleótido diana.
La expresión "región no emparejada'' se refiere a una región del adaptador universal, la región de hebras de ácido nucleico no complementarias monocatenarias, en la que las secuencias de las dos hebras de polinucleótidos que forman el adaptador universal muestran un grado de no complementariedad tal, que la dos hebras no son capaces de aparearse completamente entre sí en condiciones de apareamiento estándar para una extensión del cebador o una reacción PCR. La región o las regiones no emparejadas pueden mostrar algún grado de apareamiento en condiciones de reacción estándar para una reacción de ligación catalizada con enzimas, siempre que las dos hebras vuelvan a la forma monocatenaria en condiciones de apareamiento en una reacción de amplificación.
La región de las hebras de ácido nucleico no complementarias monocatenarias incluye al menos un sitio de unión para el cebador universal. Un sitio de unión para el cebador universal es una secuencia universal que se puede usar para la amplificación y/o la secuenciación de un fragmento diana ligado al adaptador universal.
La región de las hebras de ácido nucleico no complementarias monocatenarias también incluye al menos un marcador específico de la muestra. El método de la invención usa marcadores específicos de la muestra como marcadores característicos de la fuente de fragmentos diana particulares sobre una matriz. Generalmente, el marcador específico de la muestra es una secuencia sintética de nucleótidos que forma parte del adaptador universal que se añade a los fragmentos diana como parte de la etapa de preparación del molde o la colección. En consecuencia, un marcador específico de la muestra es un marcador de la secuencia de ácido nucleico que se fija a cada una de las moléculas diana de una muestra particular, cuya presencia es indicativa o se usa para identificar, la muestra o la fuente a partir de la cual se aíslan las moléculas diana.
Preferiblemente, el marcador específico de la muestra puede tener hasta 20 nucleótidos de longitud, más preferiblemente 1-10 nucleótidos y lo más preferiblemente 4-6 nucleótidos de longitud. Un marcador de cuatro nucleótidos ofrece la posibilidad de multiplexar 256 muestras sobre la misma matriz, un marcador de seis bases permite procesar 4096 muestras sobre la misma matriz.
La región de las hebras de ácido nucleico no complementarias monocatenarias también incluye al menos un sitio de unión para extensión de un cebador universal. Se puede usar un sitio de unión para extensión de un cebador universal para capturar múltiples ácidos nucleicos diferentes, por ejemplo, múltiples moléculas de adaptador-dianaadaptador diferentes usando una población de ácidos nucleicos de captura universal que son complementarios al sitio de unión para extensión de un cebador universal. En una realización, el sitio de unión para extensión de un cebador universal forma parte del adaptador universal cuando está ligado a los fragmentos diana bicatenarios y en otra realización, el sitio de unión para extensión de un cebador universal se añade al adaptador universal después de que el adaptador universal está ligado a los fragmentos diana de doble hebra. La adición se puede realizar utilizando métodos de rutina, incluyendo los métodos basados en PCR.
Debe entenderse que la "región no emparejada" la proporcionan diferentes porciones de las mismas dos cadenas polinucleotídicas que forman la región o regiones bicatenarias. Los desapareamientos en la estructura del adaptador pueden ser que una hebra sea más larga que la otra, de modo que haya una región de una sola hebra en una de las hebras o una secuencia seleccionada de tal manera que las dos hebras no se hibriden y, por lo tanto, formen una región de una sola hebra en ambas cadenas. Los desapareamientos también pueden estar en forma de "burbujas", en las que ambos extremos de la(s) estructura(s) del adaptador universal son capaces de hibridarse entre sí y formar un dúplex, pero la región central no. La porción de la(s) hebra(s) que forman la región no emparejada no se aparea en las condiciones en las que otras porciones de las mismas dos hebras se aparean para formar una o varias regiones de doble hebra. Para evitar dudas, debe entenderse que un extremo protuberante monocatenario o de base única en el extremo 3’ de un dúplex polinucleotídico que posteriormente se liga con las secuencias diana, no constituye una "región no emparejada" en el contexto de esta descripción.
El límite inferior de la longitud de la región no emparejada se determinará normalmente por la función, por ejemplo, la necesidad de proporcionar una secuencia adecuada para i) la unión de un cebador para la extensión del cebador, PCR y/o secuenciación (por ejemplo, la unión de un cebador a un sitio de unión de cebador universal) o para ii) la unión de un ácido nucleico de captura universal para la inmovilización de un adaptador-diana-adaptador sobre una superficie (por ejemplo, unión de un ácido nucleico de captura universal a un sitio de unión de extensión de cebador universal). En teoría, no existe un límite superior en la longitud de la región no emparejada, excepto que, en general, es ventajoso minimizar la longitud total del adaptador universal, por ejemplo, para facilitar la separación de los adaptadores universales no unidos de las estructuras de adaptador-diana-adaptador después de la etapa de ligación. Por lo tanto, generalmente se prefiere que la región no emparejada tenga menos de 50 o menos de 40 o menos de 30 o menos de 25 nucleótidos consecutivos de longitud.
La secuencia de nucleótidos precisa de los adaptadores universales generalmente no es un material para la invención y puede ser seleccionada por el usuario de manera que los elementos de la secuencia deseada se incluyan en última instancia en las secuencias comunes de la colección de moldes obtenidos a partir de los adaptadores universales, por ejemplo, para proporcionar sitios de unión para conjuntos particulares de cebadores de amplificación universales y/o cebadores de la secuenciación y/o ácidos nucleicos de captura universal. Pueden incluirse elementos de secuencias adicionales, por ejemplo, para proporcionar sitios de unión para la secuenciación de cebadores que finalmente se usarán en la secuenciación de las moléculas molde en la colección, o productos obtenidos a partir de la amplificación de la colección de moldes, por ejemplo, sobre un soporte sólido.
Aunque la secuencia de nucleótidos precisa del adaptador universal generalmente no limita la descripción, las secuencias de las hebras individuales en la región no emparejada deben ser del tipo que ninguna hebra individual muestre autocomplementariedad interna, lo que podría conducir a un autoapareamiento, formación de estructuras con forma de horquilla, etc., en condiciones de apareamiento estándar. Se debe evitar el autoapareamiento de una hebra en la región no emparejada, ya que puede evitar o reducir la unión específica de un cebador de amplificación con esa hebra.
Los adaptadores mal emparejados se forman preferiblemente a partir de dos cadenas de ADN, pero pueden incluir mezclas de nucleótidos naturales y no naturales (por ejemplo, uno o varios ribonucleótidos) unidos por una mezcla de enlaces de cadena principal fosfodiéster y no fosfodiéster. Pueden incluirse otras modificaciones no nucleotídicas tales como, por ejemplo, restos de biotina, grupos de bloqueo y restos de captura para la fijación a una superficie sólida, tal y como se describe con más detalle a continuación.
Los adaptadores universales pueden contener modificaciones resistentes a exonucleasas, tales como enlaces fosforotioato. Esas modificaciones reducen el número de dímeros de adaptadores presentes en la colección, ya que los dos adaptadores no pueden someterse a una ligación sin eliminar sus extremos protuberantes no complementarios. Los adaptadores se pueden tratar con una enzima exonucleasa antes de la reacción de ligación con la diana, para garantizar que los extremos protuberantes de las hebras no se puedan eliminar durante el proceso de ligación. El tratamiento de los adaptadores de esta manera, reduce la formación de los dímeros de adaptadores en la etapa de ligación.
Ligación y amplificación
Los métodos de ligación son conocidos en la técnica y usan métodos estándar. Esos métodos usan enzimas ligasas tales como ADN ligasa, para efectuar o catalizar la unión de los extremos de las dos cadenas de polinucleótidos, en este caso, del adaptador universal y de los fragmentos diana de doble cadena, de manera que se forman enlaces covalentes. El adaptador universal puede contener un resto 5'-fosfato con el fin de facilitar la unión al 3'-OH presente en el fragmento diana. El fragmento diana de doble hebra contiene un resto 5'-fosfato, ya sea residual del proceso de cizallamiento o añadido mediante una etapa de tratamiento enzimático y se ha reparado en los extremos y, opcionalmente, extendido mediante una base o bases protuberantes, para proporcionar un 3’-OH apto para la ligación. En este contexto, la unión significa un enlace covalente de las cadenas de polinucleótidos que no estaban previamente unidas covalentemente. En un aspecto particular de la descripción, esa unión tiene lugar mediante la formación de un enlace fosfodiéster entre las dos cadenas de polinucleótidos, pero pueden usarse otros medios de enlace covalente (por ejemplo, enlaces en la cadena principal que no son fosfodiéster).
Tal y como se describe en el presente documento, los adaptadores universales usados en la ligación están completos e incluyen un sitio de unión para el cebador universal, una secuencia de un marcador específico de la muestra y un sitio de unión para el cebador de extensión universal. La pluralidad resultante de moléculas de adaptador-diana-adaptador puede usarse para preparar muestras inmovilizadas para una secuenciación.
También, tal y como se describe en el presente documento, los adaptadores universales usados en la ligación incluyen un sitio de unión para el cebador universal y una secuencia de un marcador específico de la muestra y no incluyen un sitio de unión para el cebador de extensión universal. La pluralidad resultante de moléculas de adaptador-diana-adaptador puede modificarse adicionalmente para incluir secuencias específicas, tales como un sitio de unión para el cebador de extensión universal. Los métodos para la adición de secuencias específicas, tales como un sitio de unión para el cebador de extensión universal, a los cebadores universales que se ligan a fragmentos diana bicatenarios, incluyen métodos basados en PCR y son conocidos en la técnica y se describen, por ejemplo, en Bignell et al. (documento US 8.053.192) y Gunderson et al. (documento WO2016/130704).
Cuando se modifica un adaptador universal, se prepara una reacción de amplificación. El contenido de una reacción de amplificación es conocido por un experto en la técnica e incluye sustratos apropiados (tales como dNTPs), enzimas (por ejemplo, una ADN polimerasa) y componentes tampón necesarios para una reacción de amplificación. En general, las reacciones de amplificación requieren al menos dos cebadores para la amplificación, a menudo denominados cebadores 'directos' e 'inversos' (oligonucleótidos cebadores) que son capaces de aparearse específicamente con una parte de la secuencia de polinucleótidos que se va a amplificar en las condiciones encontradas en la etapa de apareamiento del cebador de cada ciclo de una reacción de amplificación. Los cebadores directos e inversos pueden ser idénticos. Por lo tanto, los oligonucleótidos cebadores deben incluir una 'porción específica del adaptador-diana', que es una secuencia de nucleótidos capaz de aparearse con una parte, es decir, una secuencia que se une al cebador, en la molécula de polinucleótidos que se va a amplificar (o el complemento de la misma si el molde se considera como una sola hebra) durante el etapa de apareamiento.
Los cebadores de la amplificación pueden ser universales para todas las muestras o uno de los cebadores directo o inverso puede ser portador de la secuencia del marcador que codifica la fuente de la muestra. Los cebadores de la amplificación se pueden hibridar a lo largo de la región del marcador del adaptador ligado, en cuyo caso se necesitarán cebadores únicos para cada ácido nucleico de la muestra. La reacción de amplificación se puede realizar con más de dos cebadores de la amplificación. Para evitar la amplificación de los dímeros de adaptadoradaptador ligados, los cebadores de la amplificación pueden modificarse para contener nucleótidos que se hibridan a lo largo de todo el adaptador ligado y en el molde ligado (o los dNTPs fijados al extremo 3’ del mismo). Este primer cebador de la amplificación se puede modificar y tratar para ayudar a evitar una digestión con exonucleasa de las hebras y, por lo tanto, puede ser ventajoso tener un primer cebador de la amplificación que sea universal y pueda amplificar todas las muestras, en lugar de modificar y tratar cada uno de los cebadores marcados por separado. El cebador marcado se puede introducir como un tercer cebador específico de la muestra en la reacción de amplificación, pero no es necesario modificarlo ni tratarlo especialmente para reducir la digestión con exonucleasas. En ese caso, el tercer cebador de la amplificación que es portador del marcador, debe contener una secuencia que sea la misma que al menos una porción del primer cebador de la amplificación de modo que pueda usarse para amplificar el dúplex resultante de la extensión del primer cebador de la amplificación.
En el contexto de la presente descripción, la expresión 'molécula de polinucleótido que se va a amplificar', se refiere a la molécula de adaptador-diana-adaptador original o inicial, añadida a la reacción de amplificación. La 'porción específica del adaptador-diana' en los cebadores de la amplificación directos e inversos, se refiere a una secuencia capaz de aparearse con el adaptador-diana-adaptador original o inicial presente al comienzo de la reacción de amplificación y la referencia a la longitud de la 'porción específica del adaptador-diana', se refiere a la longitud de la secuencia en el cebador que se aparea con el adaptador-diana inicial. Se apreciará que si los cebadores contienen cualquier secuencia de nucleótidos que no se aparea con el adaptador-diana inicial en el primer ciclo de amplificación, entonces esa secuencia puede copiarse en los productos de la amplificación (asumiendo que el cebador no contiene un resto que evita la lectura a través de la polimerasa). Por tanto, las hebras del molde amplificadas producidas en el primer ciclo y los siguientes ciclos de amplificación pueden ser más largas que las hebras del adaptador-diana de partida.
Debido a que los adaptadores mal apareados pueden tener diferentes longitudes, la longitud de la secuencia del adaptador añadida a los extremos 3’ y 5' de cada hebra, puede ser diferente. Los cebadores de la amplificación también pueden tener diferentes longitudes entre sí y se pueden hibridar con diferentes longitudes del adaptador y, por lo tanto, se puede controlar la longitud añadida a los extremos de cada hebra. En el caso de una PCR anidada, los tres o más cebadores de la amplificación se pueden diseñar para que sean más largos que el cebador utilizado para amplificar el amplicón anterior, de modo que la longitud de los nucleótidos añadidos es totalmente controlable y puede ascender a cientos de pares de bases, si se desea. En un ejemplo, el primer cebador de la amplificación añade 13 bases al adaptador ligado y el tercer cebador de la amplificación añade 27 bases más, de manera que un extremo del amplicón tiene 40 bases más de longitud que el brazo corto de la estructura de adaptador-diana. El brazo corto del adaptador tiene 20 bases de longitud, lo que significa que el molde preparado comprende la región genómica más 60 bases añadidas al final. El segundo cebador de la amplificación tiene 25 bases más de longitud que el brazo largo del adaptador, que tiene una longitud de 32 bases más la T adicional que se hibrida a través del nucleósido DATP añadido a la muestra genómica. Por tanto, el molde preparado comprende el fragmento genómico, más el DATP añadido, más 57 bases conocidas. Así, en su totalidad, una hebra de cada dúplex del molde comprende desde el extremo 5’: 60 bases conocidas, T, el fragmento genómico, A, 57 bases conocidas, extremo 3'. Esa hebra es totalmente complementaria a una secuencia: 5'-57 bases conocidas, T, fragmento genómico, A, 60 bases conocidas-extremo 3’. Las longitudes 57 y 6 son arbitrarias y se muestran con fines de aclaración y no deben considerarse como limitantes. La longitud de las secuencias añadidas puede ser de 20-100 bases o más, dependiendo del diseño experimental deseado.
Los cebadores directos e inversos pueden tener una longitud suficiente para hibridarse con la totalidad de la secuencia del adaptador y al menos una base de la secuencia diana (o el nucleótido DNTP añadido como un extremo protuberante 3’ en las cadenas diana). Los cebadores directos e inversos también pueden contener una región que se extiende más allá de la estructura del adaptador y, por lo tanto, los cebadores de la amplificación pueden tener al menos 20-100 bases de longitud. Los cebadores directos e inversos pueden tener longitudes significativamente diferentes; por ejemplo, uno puede tener de 20-40 bases, mientras que el otro puede tener de 40-100 bases de longitud. Las secuencias de nucleótidos de las porciones específicas del adaptador-diana de los cebadores directos e inversos se seleccionan para lograr una hibridación específica con las secuencias del adaptador-diana que se amplificarán en las condiciones de las etapas de apareamiento de la reacción de amplificación, minimizando al mismo tiempo la hibridación no específica con cualquier otra secuencia diana presente.
Los lectores expertos apreciarán que no es estrictamente necesario que la porción específica del adaptador-diana sea complementaria en un 100%, se puede lograr un nivel satisfactorio de apareamiento específico con secuencias que sean menos que perfectamente complementarias. En particular, normalmente se pueden tolerar uno o dos desapareamiento en la porción específica del adaptador-diana, sin que afecten de forma adversa a la especificidad hacia el molde. Por lo tanto, la expresión "porción específica del adaptador-diana" no debe interpretarse en el sentido de que requiere una complementariedad del 100% con el adaptador-diana. Sin embargo, debe cumplirse el requisito de que los cebadores no se apareen de manera no específica con regiones del adaptador-diana distintas de sus respectivas secuencias de unión al cebador.
Los cebadores de la amplificación son generalmente estructuras polinucleotídicas monocatenarias. También pueden contener una mezcla de bases naturales y no naturales y también enlaces con la cadena principal naturales y no naturales, siempre que cualquier modificación no natural no impida la función como cebador, que se define como la capacidad de aparearse con una hebra polinucleotídica molde durante las condiciones de la reacción de amplificación y actuar como punto de inicio para la síntesis de una nueva hebra polinucleotídica complementaria a la hebra molde.
Los cebadores pueden comprender adicionalmente modificaciones químicas no nucleotídicas, por ejemplo fosforotioatos, para aumentar la resistencia frente a exonucleasas, siempre que las modificaciones no impidan la función del cebador. Las modificaciones pueden facilitar, por ejemplo, la fijación del cebador a un soporte sólido, por ejemplo, un resto de biotina. Ciertas modificaciones pueden mejorar por sí mismas la función de la molécula como cebador o pueden proporcionar alguna otra funcionalidad útil, como proporcionar un sitio de escisión para permitir que el cebador (o una hebra polinucleotídica extendida obtenida a partir del mismo) se escinda desde un soporte sólido.
Cuando los marcadores se fijan a los adaptadores, la amplificación se puede llevar a cabo en las muestras agrupadas o no agrupadas. Cuando se utilizan adaptadores universales, los marcadores forman parte de los cebadores de la amplificación y, por lo tanto, cada muestra se amplifica de forma independiente antes de la agrupación. Las muestras de ácido nucleico agrupadas se pueden procesar luego para la secuenciación.
Eliminación de moléculas no deseables
Las secuencias polinucleotídicas ligadas combinadas (las moléculas de adaptador-diana-adaptador), las estructuras polinucleotídicas de adaptadores universales no ligados y/o los productos incompletos se exponen a condiciones para reducir o eliminar hasta un nivel indetectable, la cantidad de moléculas no deseables, por ejemplo, estructuras polinucleotídicas de adaptadores universales no ligados y/o productos incompletos. Los métodos para reducir las moléculas no deseables se pueden realizar en cada colección por separado o en muestras agrupadas. Pueden usarse métodos de purificación en gel o de inmovilización sólida de fase inversa (SPRI). Los métodos de purificación en gel y SPRI para la separación de moléculas de ADN no ligadas, tales como las estructuras polinucleotídicas de adaptadores universales no ligados descritas en el presente documento, son conocidos por el experto en la materia y son rutinarios y pueden ser aplicados fácilmente por el experto para eliminar los productos incompletos.
En una realización preferida, las moléculas no deseables, tales como las estructuras polinucleotídicas de adaptadores universales no ligados, se eliminan mediante una exonucleasa. En una realización, las exonucleasas útiles en este documento tienen una actividad ADN exonucleasa 5’ a 3' y una exonucleasa tiene preferencia por el ADN de doble hebra. En una realización, una exonucleasa se dirige específicamente al extremo 5’ de un ADN bicatenario, en donde el extremo 5' tiene un fosfato 5’. En otra realización, una exonucleasa se dirige específicamente al extremo 5’ de un ADN bicatenario, en donde el extremo 5' no tiene un fosfato 5’. Sin pretender estar limitado, el uso de exonucleasas útiles en este documento que tienen una actividad ADN exonucleasa 5’ a 3', está diseñado para eliminar al menos una hebra de los adaptadores universales no ligados mediante digestión en el extremo 5’ de la región bicatenaria de los adaptadores universales.
En una realización, una exonucleasa útil en este documento tiene una actividad ADN exonucleasa 5’ a 3' que tiene preferencia por el ADN de doble hebra que tiene un fosfato 5’ en el extremo 5' de la región del ácido nucleico de doble hebra de un adaptador universal. Ejemplos de exonucleasas 5’ a 3' que tienen preferencia por ADNds que tienen un fosfato 5’ en el extremo 5' de la región del ácido nucleico bicatenario, incluyen la exonucleasa lambda (New England Biolabs). La presencia del fosfato 5’ en el extremo 5' de la región bicatenaria predispone una exonucleasa tal como la exonucleasa lambda, para el extremo 5’ de la región bicatenaria de un adaptador universal no ligado. En una realización, el extremo 5’ de la hebra que forma parte de la región de hebras de ácido nucleico no complementarias monocatenarias que no incluye un fosfato 5'. En una realización, el extremo 5’ de la hebra que forma parte de la región monocatenaria se modifica para reducir la capacidad de la exonucleasa para utilizarla como sustrato.
En otra realización, una exonucleasa útil en este documento tiene actividad ADN exonucleasa tanto de 5’ a 3' como de 3’ a 5'. Cuando una exonucleasa de este tipo tiene preferencia por el ADN bicatenario, pero también usa ADN monocatenario como sustrato, los adaptadores universales usados para la ligación pueden incluir dos tipos de modificaciones. Una modificación está en el extremo 3’ de la región monocatenaria para bloquear la actividad ADN exonucleasa 3' a 5’. Esa modificación evita la digestión de las moléculas de adaptador-diana-adaptador desde los extremos 3’ libres. La segunda modificación está en el extremo 5’ de la hebra que forma parte de la región de hebras de ácido nucleico no complementarias monocatenarias. Esa modificación evita la digestión de moléculas de adaptadordiana-adaptador de los extremos 5’ libres. Ejemplos de modificaciones incluyen la inclusión de enlaces fosforotioato. Ejemplos de exonucleasas que tienen una actividad ADN exonucleasa 5’ a 3' y una actividad ADN exonucleasa de 3’ a 5' y tienen preferencia por ADN de doble hebra, incluyen la exonucleasa VIII truncada (New England Biolabs).
En una realización preferida, las moléculas no deseables, tales como los productos incompletos, se eliminan mediante una exonucleasa. En una realización, las exonucleasas útiles en el presente documento tienen una actividad ADN exonucleasa 3’ a 5' y, opcionalmente, una exonucleasa tiene preferencia por el ADN de doble hebra que tiene extremos romos o tiene un extremo 3’ rebajado. También se describe una exonucleasa que tiene una actividad ADN exonucleasa 3’ a 5' que tiene una actividad reducida sobre el ADN monocatenario (p. ej., tiene preferencia por el ADN bicatenario) y/o una actividad reducida en una extensión 3’ cuando la cadena sencilla tiene una longitud de 4 bases o más (por ejemplo, tiene preferencia por el ADN bicatenario que tiene una extensión 3’ monocatenaria de 3 bases o menos). Sin pretender ser limitante, el uso de exonucleasas útiles en este documento que tienen una actividad ADN exonucleasa 3’ a 5', está diseñado para eliminar al menos una hebra de productos incompletos mediante digestión en el extremo 3’ de la región bicatenaria del producto incompleto. Ejemplos de productos incompletos incluyen moléculas de adaptador-diana y moléculas diana que no incluyen un adaptador en ninguno de los extremos. Ejemplos de exonucleasas 3’ a 5' con preferencia por un ADN bicatenario que tiene extremos 3’ romos o rebajados, incluyen la exonucleasa III (New England Biolabs).
Durante o después del tratamiento con una exonucleasa, pueden aparecer diversos compuestos y composiciones. Por ejemplo, puede dar lugar a un compuesto o composición que comprende un polinucleótido que tiene una secuencia de nucleótidos de adaptador-diana-adaptador en la que un extremo 3’ del polinucleótido está bloqueado para la actividad exonucleasa. Puede dar lugar a una colección o una composición que comprende una pluralidad de polinucleótidos de ese tipo bloqueados en 3’. Puede dar lugar a colecciones agrupadas y composiciones que comprenden colecciones agrupadas de tales polinucleótidos. Las composiciones pueden comprender además adaptadores universales que no están fijados a los polinucleótidos diana y/o a productos incompletos.
A modo de ejemplo adicional, puede dar lugar a una composición que comprende un polinucleótido que tiene una secuencia de nucleótidos de adaptador-diana-adaptador y una exonucleasa. De manera similar, puede dar lugar a una composición que comprende una colección de polinucleótidos y la exonucleasa. Puede dar lugar a composiciones que comprenden colecciones agrupadas de tales polinucleótidos y la exonucleasa. Las composiciones pueden comprender además adaptadores universales que no están fijados a los polinucleótidos diana.
Bloqueo de 3'
En una realización, además de reducir o eliminar la cantidad de moléculas no deseables, tales como adaptadores no ligados y/o productos incompletos, las secuencias polinucleotídicas ligadas combinadas (las moléculas de adaptador-diana-adaptador) y las moléculas no deseables, por ejemplo, polinucleótidos adaptadores universales no ligados, están opcionalmente bloqueados en 3’, lo que significa que los polinucleótidos se modifican para evitar la incorporación de nucleótidos en el extremo 3' para extender el polinucleótido o el oligonucleótido desde el extremo 3’. El bloqueo de 3’ se puede realizar en cada colección por separado o en colecciones agrupadas.
La composición resultante puede someterse a una reacción de bloqueo de 3’ para bloquear los extremos 3' de los polinucleótidos u oligonucleótidos en la muestra, tales como polinucleótidos de adaptador-diana-adaptador o adaptadores universales no ligados residuales. La extensión de un oligonucleótido o un polinucleótido que tiene el extremo 3’ bloqueado mediante la adición de nucleótidos adicionales en dirección 5' a 3’, se evita debido al extremo 3' bloqueado.
El bloqueo de 3' se puede realizar de cualquier manera adecuada. Por ejemplo, un resto bloqueante puede fijarse covalentemente a un grupo hidroxilo 3’ en el extremo 3' para evitar la extensión desde el extremo 3’.
El grupo bloqueante 3'-OH puede eliminarse, de modo que el átomo de carbono 3’ se fija a un grupo con la estructura -O-Z, en la que Z es cualquiera entre -C(R')2-O-R", -C(R')2-N(R")2, -C(R')2-N(H)R", -C(R')2-S-R" y -C(R')2-F, en donde cada R" es o forma parte de un grupo protector escindible; cada R' es independientemente un átomo de hidrógeno, un grupo alquilo, alquilo sustituido, arilalquilo, alquenilo, alquinilo, arilo, heteroarilo, heterocíclico, acilo, ciano, alcoxi, ariloxi, heteroariloxi o amido o un marcador detectable fijado a través de un grupo de enlace; o (R')2 representa un grupo alquilideno de fórmula =C(R''')2 en donde cada R'" puede ser igual o diferente y se selecciona a partir del grupo que comprende átomos de hidrógeno y halógeno y grupos alquilo; y en donde dicha molécula puede reaccionar para producir un producto intermedio en el que cada R" se intercambia por H o, en donde Z es -C(R')2-F, el F se intercambia por OH, SH o NH2, preferiblemente OH, que se disocia el producto intermedio en condiciones acuosas para producir una molécula con 3'OH libre; con la condición de que cuando Z es -C(R')2-S-R", ambos grupos R' no son H. Cuando el grupo bloqueante es cualquiera entre -C(R')2-O-R", -C(R')2-N(R")2, -C(R')2-N(H)R", -C(R')2-S-R" y -C(R')2-F, es decir, de fórmula Z, cada R' puede ser independientemente H o un alquilo. Preferiblemente, Z tiene la fórmula -C(R')2-O-R", -C(R')2-N(R")2, -C(R')2-N(H)R" y -C(R')2-SR". De manera especialmente preferida, Z tiene la fórmula -C(R')2-O-R", -C(R')2-N(R")2 y -C(R')2-SR". R" puede ser un grupo bencilo o un grupo bencilo sustituido. Un ejemplo de grupos de estructura -O-Z en donde Z es -C(R')2-N(R")2, son aquellos en los que -N(R")2 es azido (-N3). Un ejemplo de ese tipo es azidometilo en el que cada R' es H. Alternativamente, R' en los grupos Z de fórmula -C(R')2-N3 y otros grupos Z pueden ser cualquiera de los otros grupos descritos en este documento. Ejemplos de grupos R' típicos incluyen alquilo C1-6, particularmente metilo y etilo. Otros ejemplos de grupos bloqueantes de 3’ adecuados se proporcionan en Greene et al., "Protective Groups in Organic Synthesis", John Wiley & Sons, Nueva York (1991), documentos de Pat. de EE.UU.
n2 5.990.300, 5.872.244, 6.232.465, 6.214.987, 5.808.045, 5.763.594, 7.057.026, 7.566.537, 7.785.796, 8.148.064, 8.394.586, 9.388.463, 9.410.200, 7.427.673, 7.772.384, 8.158.346, 9.121.062, 7.541.444, 7.771.973, 8.071.739, 8.597.881, 9.121.060, 9.388.464, 8.399.188, 8.808.988, 9.051.612, 9.469.873 y documentos de publicaciones de EE.UU. n22016/0002721 y 2016/0060692.
El grupo bloqueante puede permanecer unido covalentemente durante los procesos posteriores asociados con la inmovilización de polinucleótidos de adaptador-diana-adaptador sobre una superficie sólida y la secuenciación.
En algunas realizaciones, se incorpora un didesoxinucleótido (ddNTP) en el extremo 3’ de un polinucleótido para bloquear el extremo 3'. El ddNTP puede incorporarse de cualquier manera adecuada. En algunas realizaciones, se incorpora un ddNTP mediante una desoxinucleotidil transferasa terminal (TdT). Las TdTs son capaces de incorporar nucleótidos en el extremo 3’ de un ADN monocatenario o bicatenario sin molde. En algunas realizaciones, se incorpora un ddNTP en un extremo 3’ mediante una TdT en presencia de una ADN polimerasa, tal como, por ejemplo, la polimerasa Pol19, Pol812 o Pol963. Se proporcionan ejemplos de otras polimerasas adecuadas en los documentos de Pat. de E E . U u . n° 8.460.910, 8.852.910, 8.623.628, 9.273.352, 9.447.389 y los documentos de publicaciones de EE.UU. n22015/0376582, 2016/0032377, 2016/0090579, 2016/0115461.
En algunos casos, se añade al extremo 3’ un trifosfato de didesoxiuridina marcado con digoxigenina usando una transferasa terminal para bloquear el extremo 3'. Los kits para añadir trifosfato de didesoxiuridina marcado con digoxigenina a un extremo 3’ de un polinucleótido, están disponibles, por ejemplo, en Sigma-Aldrich.
También se puede emplear cualquier otro procedimiento adecuado para modificar los extremos 3’ de los polinucleótidos.
Durante o después del bloqueo de 3’ pueden aparecer diversos compuestos y composiciones. Por ejemplo, puede dar lugar a un compuesto o una composición que comprende un polinucleótido que tiene una secuencia de nucleótidos de adaptador-diana-adaptador en el que se bloquea un extremo 3’ del polinucleótido. Puede dar lugar a una colección o una composición que comprende una pluralidad de tales polinucleótidos bloqueados en 3’. Puede dar lugar a colecciones agrupadas y composiciones que comprenden colecciones agrupadas de tales polinucleótidos. Las composiciones pueden comprender además adaptadores universales que no están fijados a los polinucleótidos diana.
A modo de ejemplo adicional, puede dar lugar a una composición que comprende un polinucleótido que tiene una secuencia de nucleótidos de adaptador-diana-adaptador y una enzima y un reactivo para bloquear los extremos 3’ del polinucleótido. De manera similar, puede dar lugar a una composición que comprende una colección de polinucleótidos y la enzima y el reactivo. Puede dar lugar a composiciones que comprenden colecciones agrupadas de tales polinucleótidos y la enzima y el reactivo. Las composiciones pueden comprender además oligonucleótidos de adaptadores que no están fijados a los polinucleótidos diana. En algunas realizaciones, las composiciones comprenden un ddNTP. Las composiciones pueden comprender además una ADN polimerasa, tal como, por ejemplo, la polimerasa Pol19, Pol812 o Pol963.
Las composiciones adicionales pueden incluir un polinucleótido que tiene una secuencia de nucleótidos de adaptador-diana-adaptador, una enzima y un reactivo para bloquear los extremos 3’ del polinucleótido y una exonucleasa. De manera similar, puede dar lugar a una composición que comprende una colección de polinucleótidos, la enzima y el reactivo y la exonucleasa. Puede dar lugar a composiciones que comprenden colecciones agrupadas de tales polinucleótidos, la enzima y el reactivo y la exonucleasa. Las composiciones pueden comprender además oligonucleótidos de adaptadores que no están fijados a los polinucleótidos diana. En algunas realizaciones, las composiciones comprenden un ddNTP. Las composiciones pueden comprender además una ADN polimerasa, tal como, por ejemplo, la polimerasa Pol19, Pol812 o Pol963.
Después del bloqueo, se puede realizar una etapa de purificación, como la descrita anteriormente, antes de inmovilizar los polinucleótidos sobre una superficie sólida para la secuenciación.
Los métodos para reducir o eliminar la cantidad de estructuras polinucleotídicas de adaptadores universales no ligados y los métodos para boquear en 3’ los polinucleótidos, pueden realizarse de forma simultánea o secuencial en cualquier orden.
Si las colecciones no se han agrupado, pueden agruparse antes de inmovilizarlas sobre una superficie de secuenciación.
El tratamiento con exonucleasas descrito en el presente documento para reducir o eliminar adaptadores universales no ligados, puede usarse inmediatamente después de la ligación o puede usarse siguiendo los métodos basados en una PCR para añadir un sitio de unión para el cebador de extensión universal.
Preparación de muestras inmovilizadas para la secuenciación
La pluralidad de moléculas de adaptador-diana-adaptador procedentes de una o varias fuentes, se inmovilizan a continuación y se amplifican antes de la secuenciación. Se conocen en la técnica métodos para fijar moléculas de adaptador-diana-adaptador procedentes de una o varias fuentes a un sustrato. Asimismo, los métodos para amplificar moléculas de adaptador-diana-adaptador inmovilizadas incluyen, pero no se limitan a, amplificación en puente y exclusión cinética. Los métodos para inmovilizar y amplificar antes de la secuenciación se describen, por ejemplo, en Bignell et al. (documento US 8.053.192), Gunderson et al. (documento WO2016/130704), Shen et al. (documento US 8.895.249) y Pipenburg et al. (documento US 9.309.502).
A continuación, se puede inmovilizar una muestra, incluidas las muestras agrupadas, como una preparación para la secuenciación. La secuenciación se puede realizar como una matriz de moléculas individuales o se puede amplificar antes de la secuenciación. La amplificación se puede llevar a cabo utilizando uno o varios cebadores inmovilizados. El o los cebadores inmovilizados pueden ser un césped sobre una superficie plana o sobre un conjunto de perlas. El conjunto de perlas se puede aislar en una emulsión con una sola perla en cada "compartimento" de la emulsión. Con una concentración de solo un molde por "compartimento", se amplifica únicamente un único molde sobre cada perla.
La expresión "amplificación en fase sólida" tal y como se usa en este documento, se refiere a cualquier reacción de amplificación de un ácido nucleico llevada a cabo sobre o en asociación con un soporte sólido, de manera que todos o una porción de los productos amplificados se inmovilizan sobre el soporte sólido a medida que se forman. En particular, la expresión incluye la reacción en cadena de la polimerasa en fase sólida (PCR en fase sólida) y la amplificación isotérmica en fase sólida, que son reacciones análogas a la amplificación en fase de solución estándar, excepto que uno o ambos cebadores de la amplificación directa e inversa, están inmovilizados sobre el soporte sólido. La PCR en fase sólida incluye sistemas tales como las emulsiones, en donde un cebador está anclado sobre una perla y el otro está en solución libre y la formación de colonias en matrices de gel en fase sólida en las que un cebador está anclado a la superficie y el otro en solución libre.
En algunos ejemplos, el soporte sólido comprende una superficie con patrón. Una "superficie con patrón" se refiere a una disposición de diferentes regiones en o sobre una capa expuesta de un soporte sólido. Por ejemplo, una o varias de las regiones pueden ser características en donde están presentes uno o varios cebadores de la amplificación. Las características pueden estar separadas por regiones intersticiales en donde no están presentes cebadores de la amplificación. En algunas realizaciones, el patrón puede tener un formato x-y de características que están en filas y columnas. El patrón puede ser una disposición repetida de características y/o regiones intersticiales. El patrón puede ser una disposición aleatoria de características y/o regiones intersticiales. Ejemplos de superficies con patrón se pueden usar en los métodos y las composiciones tal y como se indica en este documento y se describe en los documentos de Pat. de EE.UU. n28.778.848, 8.778.849 y 9.079.148 y de publicación de EE.UU. n22014/0243224.
En algunos casos, el soporte sólido comprende una serie de pocillos o depresiones en una superficie. Esto se puede preparar como se conoce generalmente en la técnica, usando una variedad de técnicas, que incluyen, pero no se limitan a, fotolitografía, técnicas de estampación, técnicas de moldeo y técnicas de micrograbado. Como apreciarán los expertos en la técnica, la técnica utilizada dependerá de la composición y la forma del sustrato de la matriz.
Las características en una superficie con patrón pueden ser pocillos en una serie de pocillos (por ejemplo, micropocillos o nanopocillos) sobre vidrio, silicio, plástico u otros soportes sólidos adecuados con un gel con patrón, unido covalentemente, tal como poli(N-(5-azidoacetamidilpentil)acrilamida-co-acrilamida) (PAZAM, véanse, por ejemplo, los documentos de publicación de EE.UU. n° 2013/184796, WO 2016/066586 y WO 2015/002813). El procedimiento crea almohadillas de gel que se utilizan para la secuenciación que pueden ser estables durante las ejecuciones de una secuenciación con una gran cantidad de ciclos. La unión covalente del polímero a los pocillos es útil para mantener el gel en las características estructuradas a lo largo de la vida útil del sustrato estructurado durante una variedad de usos. Sin embargo, en muchos casos, no es necesario que el gel esté unido covalentemente a los pocillos. Por ejemplo, en algunas condiciones se puede utilizar acrilamida sin silano (SFA, véase, por ejemplo, el documento de Pat. de EE.UU. n° 8.563.477) que no está fijado covalentemente a ninguna parte del sustrato estructurado, como material de gel.
Se puede preparar un sustrato estructurado modelando un material de soporte sólido con pocillos (por ejemplo, micropocillos o nanopocillos), recubriendo el soporte con patrón con un material de gel (por ejemplo, PAZAM, SFA o variantes modificadas químicamente de los mismos, como la versión azidolizada de SFA (azido- SFA)) y puliendo el soporte recubierto de gel, por ejemplo mediante un pulido químico o mecánico, reteniendo así el gel en los pocillos pero eliminando o inactivando sustancialmente todo el gel de las regiones intersticiales en la superficie del sustrato estructurado entre los pocillos. Los ácidos nucleicos de cebadores se pueden fijar al material de gel. Una solución de ácidos nucleicos diana (por ejemplo, un genoma humano fragmentado) se puede poner en contacto con el sustrato pulido, de manera que los ácidos nucleicos diana individuales se sembrarán en pocillos individuales mediante interacciones con cebadores fijados al material del gel; sin embargo, los ácidos nucleicos diana no ocuparán las regiones intersticiales debido a la ausencia o inactividad del material del gel. La amplificación de los ácidos nucleicos diana se limitará a los pocillos, ya que la ausencia o inactividad del gel en las regiones intersticiales evita la migración hacia el exterior de la colonia de ácidos nucleicos en crecimiento. El procedimiento se puede producir convenientemente, pudiéndose expandir y utiliza métodos convencionales de micro o nanofabricación.
Aunque la descripción incluye métodos de amplificación en "fase sólida" en los que solo se inmoviliza un cebador de la amplificación (el otro cebador suele estar presente en solución libre), se prefiere que el soporte sólido se proporcione con los cebadores directos e inversos inmovilizados. En la práctica, habrá una "pluralidad" de cebadores directos idénticos y/o una "pluralidad" de cebadores inversos idénticos, inmovilizados sobre el soporte sólido, ya que el procedimiento de amplificación requiere un exceso de cebadores para mantener la amplificación. Las referencias en el presente documento a cebadores directos e inversos deben interpretarse en consecuencia como que incluyen una "pluralidad" de tales cebadores, a menos que el contexto indique lo contrario.
Como apreciará el lector experto, cualquier reacción de amplificación dada requiere al menos un tipo de cebador directo y al menos un tipo de cebador inverso, específico para el molde que se va a amplificar. Sin embargo, los cebadores directos e inversos pueden comprender porciones específicas del molde con una secuencia idéntica y pueden tener una secuencia y estructura de nucleótidos completamente idéntica (incluyendo cualquier modificación que no sea del nucleótido). En otras palabras, es posible llevar a cabo la amplificación en fase sólida usando solo un tipo de cebador y tales métodos de cebador único están incluidos dentro del alcance de la invención. Otros ejemplos pueden usar cebadores directos e inversos que contienen secuencias específicas del molde idénticas pero que difieren en algunas otras características estructurales. Por ejemplo, un tipo de cebador puede contener una modificación no nucleotídica que no está presente en el otro.
Los cebadores para la amplificación en fase sólida se inmovilizan preferiblemente mediante una fijación covalente de un solo punto al soporte sólido en o cerca del extremo 5’ del cebador, dejando la porción específica del molde del cebador libre para aparearse con su molde afín y el grupo hidroxilo 3' libre para la extensión del cebador. Cualquier medio de fijación covalente adecuado conocido en la técnica puede usarse para este fin. La química de fijación elegida dependerá de la naturaleza del soporte sólido y de cualquier derivatización o funcionalización que se le aplique. El cebador mismo puede incluir un resto, que puede ser una modificación química no nucleotídica, para facilitar la fijación. El cebador puede incluir un nucleófilo que contiene azufre, tal como fosforotioato o tiofosfato, en el extremo 5’. En el caso de hidrogeles de poliacrilamida con soporte sólido, ese nucleófilo se unirá a un grupo bromoacetamida presente en el hidrogel. Un medio más particular para fijar cebadores y moldes a un soporte sólido es mediante la fijación de fosforotioato 5’ a un hidrogel compuesto por acrilamida polimerizada y N-(5-bromoacetamidilpentil)acrilamida (BRAPA), tal y como se describe completamente en el documento WO 05/065814.
Ciertos ejemplos pueden hacer uso de soportes sólidos compuestos por un sustrato inerte o matriz (por ejemplo, portaobjetos de vidrio, perlas de polímero, etc.) que se ha "funcionalizado", por ejemplo, mediante la aplicación de una capa o revestimiento de un material intermedio que comprende grupos reactivos que permiten la fijación covalente a biomoléculas, tales como polinucleótidos. Ejemplos de tales soportes incluyen hidrogeles de poliacrilamida sujetas sobre un sustrato inerte como el vidrio. En tales ejemplos, las biomoléculas (por ejemplo, polinucleótidos) pueden estar fijadas covalentemente de forma directa al material intermedio (por ejemplo, el hidrogel), pero el material intermedio puede estar fijado el mismo de forma no covalente al sustrato o la matriz (por ejemplo, el sustrato de vidrio). La expresión "fijación covalente a un soporte sólido" debe interpretarse en consecuencia como que incluye ese tipo de disposición.
Las muestras reunidas se pueden amplificar sobre perlas, en donde cada perla contiene un cebador de la amplificación directo e inverso. En un ejemplo particular, la colección de moldes preparados según el primer, el segundo o el tercer aspecto de este documento, se usa para preparar matrices agrupadas de colonias de ácido nucleico, análogas a las descritas en el documento de publicación de EE.UU. n° 2005/0100900, los documentos de Pat. de EE.UU. n° 7.115.400, WO 00/18957 y WO 98/44151, mediante una amplificación en fase sólida y más particularmente una amplificación isotérmica en fase sólida. Los términos "agrupación" y "colonia" se usan indistintamente en el presente documento para referirse a un sitio discreto sobre un soporte sólido, compuesto por una pluralidad de hebras de ácido nucleico inmovilizadas idénticas y una pluralidad de hebras de ácido nucleico complementarias inmovilizadas idénticas. La expresión "matriz agrupada" se refiere a una matriz formada a partir de tales agrupaciones o colonias. En este contexto, el término "matriz" no debe entenderse como que requiera una disposición ordenada de agrupaciones.
La expresión "fase sólida" o "superficie" se entiende que significa una matriz plana en la que los cebadores están fijados a una superficie plana, por ejemplo, portaobjetos de microscopio de vidrio, sílice o plástico o dispositivos de celda de flujo similares; perlas, en las que uno o dos cebadores se fijan a las perlas y las perlas se amplifican; o una matriz de perlas sobre una superficie después de que las perlas se hayan amplificado.
Las matrices agrupadas se pueden preparar mediante un procedimiento de termociclado, tal y como se describe en el documento WO 98/44151 o un procedimiento mediante el cual la temperatura se mantiene constante y los ciclos de extensión y desnaturalización se realizan mediante cambios de reactivos. Esos métodos de amplificación isotérmica se describen en los documentos con números de solicitud de patente WO 02/46456 y publicación de EE.UU. n° 2008/0009420. Debido a las temperaturas más bajas requeridas en el procedimiento isotérmico, esto es particularmente preferido.
Se apreciará que cualquiera de las metodologías de amplificación descritas en este documento o conocidas generalmente en la técnica, se puede utilizar con cebadores universales o específicos de una diana para amplificar fragmentos de ADN inmovilizados. Los métodos adecuados para una amplificación incluyen la reacción en cadena de la polimerasa (PCR), la amplificación por desplazamiento de cadena (SDA), la amplificación mediada por transcripción (TMA) y la amplificación basada en la secuencia de ácidos nucleicos (NASBA), tal y como se describe en el documento de Pat. de EE.UU. n° 8.003.354. Los métodos de amplificación anteriores se pueden emplear para amplificar uno o varios ácidos nucleicos de interés. Por ejemplo, se puede utilizar una PCR, que incluye PCR múltiple, SDA, TMA, NASBA y similares para amplificar fragmentos de ADN inmovilizados. En algunos casos, los cebadores dirigidos específicamente al polinucleótido de interés se incluyen en la reacción de amplificación.
Otros métodos adecuados para la amplificación de polinucleótidos pueden incluir las tecnologías de extensión y ligación de oligonucleótidos, amplificación por círculo rodante (RCA) (Lizardi et al., Nat. Genet. 19: 225-232 (1998)) y ensayo de ligación de oligonucleótidos (OLA) (véanse en general los documentos de Pat. de EE.UU. n° 7.582.420, 5.185.243, 5.679.524 y 5.573.907; EP 0 320 308 B1; EP 0 336 731 B1; EP 0 439 182 B1; WO 90/01069; WO 89/12696; y WO 89/09835). Se apreciará que esas metodologías de amplificación pueden diseñarse para amplificar fragmentos de ADN inmovilizados. Por ejemplo, el método de amplificación puede incluir reacciones de amplificación con sonda de ligación o ensayo de ligación de oligonucleótidos (OLA) que contienen cebadores dirigidos específicamente al ácido nucleico de interés. El método de amplificación puede incluir una reacción de ligaciónextensión de cebadores que contiene cebadores dirigidos específicamente al ácido nucleico de interés. Como ejemplo de cebadores de extensión y ligación de cebadores que pueden diseñarse específicamente para amplificar un ácido nucleico de interés, la amplificación puede incluir cebadores usados para el ensayo GoldenGate (Illumina, Inc., San Diego, CA) tal y como se ejemplifica en los documentos de Pat. de EE.UU. n° 7.582.420 y 7.611.869.
Los métodos de amplificación isotérmica ejemplares que se pueden usar en un método de la presente descripción, incluyen la amplificación por desplazamiento múltiple (MDA) tal y como se ejemplifica, por ejemplo, en Dean et al.. Proc. Natl. Acad. Sci. USA 99:5261-66 (2002) o la amplificación de ácido nucleico por desplazamiento de cadena isotérmica, ejemplificada, por ejemplo, con el documento de Pat. de EE.UU. n° 6.214.587. Otros métodos no basados en la PCR que pueden usarse en la presente descripción, incluyen, por ejemplo, amplificación por desplazamiento de cadena (SDA) que se describe, por ejemplo, en Walker et al., Molecular Methods for Virus Detection, Academic Press, Inc., 1995; los documentos de Pat. de EE.UU. n° 5.455.166 y 5.130.238 y Walker et al., Nucl. Acids Res. 20:1691-96 (1992) o la amplificación por desplazamiento de cadena hiperramificada que se describe, por ejemplo, en Lage et al., Genome Res. 13:294-307 (2003). Pueden usarse métodos de amplificación isotérmica con la polimerasa Phi 29 de desplazamiento de cadena o el fragmento grande de la ADN polimerasa Bst, 5’ -> 3' exo- para la amplificación aleatoria de cebadores de ADN genómico. El uso de esas polimerasas aprovecha su alta procesividad y actividad de desplazamiento de cadena. La alta procesividad permite que las polimerasas produzcan fragmentos de 10-20 kb de longitud. Tal y como se ha expuesto anteriormente, se pueden producir fragmentos más pequeños en condiciones isotérmicas usando polimerasas que tienen baja procesividad y actividad de desplazamiento de cadena, como la polimerasa Klenow. Una descripción adicional de las reacciones, condiciones y componentes de amplificación se establece en detalle en la descripción del documento de Pat. de EE.UU. n27.670.810.
Otro método de amplificación de polinucleótidos que es útil en la presente descripción es la PCR marcada que usa una población de cebadores con dos dominios que tienen una región 5’ constante seguida de una región 3' aleatoria como se describe, por ejemplo, en Grothues et al. Nucleic Acids Res. 21 (5):1321 -2 (1993). Las primeras rondas de amplificación se llevan a cabo para permitir una multitud de iniciaciones sobre ADN desnaturalizado con calor, basándose en la hibridación individual de la región 3’ sintetizada aleatoriamente. Debido a la naturaleza de la región 3’, se contempla que los sitios de iniciación sean aleatorios en todo el genoma. A continuación, los cebadores no unidos pueden eliminarse y puede tener lugar una replicación adicional utilizando cebadores complementarios a la región 5’ constante.
En algunos casos, la amplificación isotérmica se puede realizar utilizando una amplificación por exclusión cinética (KEA), también denominada amplificación por exclusión (ExAmp). Se puede preparar una colección de ácidos nucleicos de la presente descripción usando un método que incluye una etapa de hacer reaccionar un reactivo de amplificación para producir una pluralidad de sitios de amplificación, en donde cada uno incluye una población sustancialmente clonal de amplicones procedentes de un ácido nucleico diana individual que se ha sembrado en el sitio. En algunos casos, la reacción de amplificación continúa hasta que se genera un número suficiente de amplicones para llenar la capacidad del sitio de amplificación respectivo. Llenar un sitio ya sembrado hasta su capacidad de esta manera inhibe que los ácidos nucleicos diana lleguen y se amplifiquen en el sitio, produciendo así una población clonal de amplicones en el sitio. En algunas realizaciones, se puede lograr una clonalidad aparente incluso si un sitio de amplificación no está lleno hasta su capacidad antes de que llegue un segundo ácido nucleico diana al sitio. En algunas condiciones, la amplificación de un primer ácido nucleico diana puede llevarse a cabo hasta un punto en el que se prepara un número suficiente de copias para competir eficazmente o superar la producción de copias de un segundo ácido nucleico diana que se transporta al sitio. Por ejemplo, en un ejemplo que emplea un procedimiento de amplificación en puente sobre una característica circular que es menor de 500 nm de diámetro, se ha determinado que después de 14 ciclos de amplificación exponencial para un primer ácido nucleico diana, la contaminación procedente de un segundo ácido nucleico diana en el mismo sitio producirá un número insuficiente de amplicones contaminantes para afectar negativamente al análisis de la secuenciación mediante síntesis en una plataforma de secuenciación de Illumina.
Los sitios de amplificación en una matriz pueden ser, pero no necesariamente, completamente clonales en realizaciones particulares. Más bien, para algunas aplicaciones, un sitio de amplificación individual puede estar poblado predominantemente con amplicones procedentes de un primer ácido nucleico diana y también puede tener un nivel bajo de amplicones contaminantes procedentes de un segundo ácido nucleico diana. Una matriz puede tener uno o varios sitios de amplificación que tengan un nivel bajo de amplicones contaminantes, siempre que el nivel de contaminación no tenga un impacto inaceptable sobre un uso posterior de la matriz. Por ejemplo, cuando la matriz se va a utilizar en una aplicación de detección, un nivel aceptable de contaminación sería un nivel que no afecta a la señal del ruido o a la resolución de la técnica de detección de una manera inaceptable. Por consiguiente, la clonalidad aparente será generalmente relevante para un uso o una aplicación particular de una matriz preparada mediante los métodos expuestos en este documento. Los niveles de contaminación ejemplares que pueden ser aceptables en un sitio de amplificación individual para aplicaciones particulares, incluyen como máximo 0,1%, 0,5%, 1%, 5%, 10% o 25% de amplicones contaminantes. Una matriz puede incluir uno o varios sitios de amplificación que tengan esos niveles ejemplares de amplicones contaminantes. Por ejemplo, hasta el 5%, 10%, 25%, 50%, 75% o incluso el 100% de los sitios de amplificación en una matriz pueden tener algunos amplicones contaminantes. Se entenderá que en una matriz u otra colección de sitios, al menos el 50%, 75%, 80%, 85%, 90%, 95% o 99% o más de los sitios pueden ser clonales o aparentemente clonales.
La exclusión cinética puede ocurrir cuando un proceso ocurre con una tasa lo suficientemente rápida como para excluir eficazmente que ocurra otro evento o proceso. Tomemos, por ejemplo, la preparación de una matriz de ácidos nucleicos en donde los sitios de la matriz se siembran aleatoriamente con ácidos nucleicos diana procedentes de una solución y se generan copias del ácido nucleico diana en un procedimiento de amplificación para llenar cada uno de los sitios sembrados hasta su capacidad. De acuerdo con los métodos de exclusión cinética de la presente descripción, los procedimientos de siembra y amplificación pueden proceder simultáneamente en condiciones en las que la tasa de amplificación excede a la tasa de siembra. Como tal, la tasa relativamente rápida con la que se realizan las copias en un sitio que ha sido sembrado por un primer ácido nucleico diana, excluirá eficazmente que un segundo ácido nucleico siembre el sitio para la amplificación. Los métodos de amplificación por exclusión cinética se pueden realizar como se describe detalladamente en la descripción del documento de publicación de solicitud de EE.UU. n° 2013/0338042.
La exclusión cinética puede aprovechar una tasa relativamente lenta para iniciar la amplificación (por ejemplo, una tasa lenta para realizar una primera copia de un ácido nucleico diana) frente a una tasa relativamente rápida para realizar copias posteriores del ácido nucleico diana (o de la primera copia del ácido nucleico diana). En el ejemplo del párrafo anterior, la exclusión cinética se produce debido a la tasa relativamente lenta de siembra del ácido nucleico diana (p. ej., difusión o transporte relativamente lento) frente a la tasa relativamente rápida a la que se produce la amplificación para llenar el sitio con copias de la semilla del ácido nucleico. En otro ejemplo, la exclusión cinética puede tener lugar debido a un retraso en la formación de una primera copia de un ácido nucleico diana que se ha sembrado en un sitio (p. ej., activación retardada o lenta) frente a la tasa relativamente rápida con la que se realizan las copias posteriores para llenar el sitio. En este ejemplo, un sitio individual se puede haber sembrado con varios ácidos nucleicos diana diferentes (por ejemplo, varios ácidos nucleicos diana pueden estar presentes en cada sitio antes de la amplificación). Sin embargo, la formación de la primera copia para cualquier ácido nucleico diana dado se puede activar aleatoriamente, de modo que la tasa promedio de formación de la primera copia sea relativamente lenta en comparación con la tasa con la que se generan las copias posteriores. En este caso, aunque un sitio individual se puede haber sembrado con varios ácidos nucleicos diana diferentes, la exclusión cinética permitirá que solo uno de esos ácidos nucleicos diana sea amplificado. Más específicamente, una vez que se ha activado un primer ácido nucleico diana para la amplificación, el sitio se llenará rápidamente hasta su capacidad con sus copias, evitando así que se produzcan copias de un segundo ácido nucleico diana en el sitio.
Un reactivo de amplificación puede incluir componentes adicionales que faciliten la formación de amplicones y, en algunos casos, aumenten la tasa de formación de amplicones. Un ejemplo es una recombinasa. La recombinasa puede facilitar la formación de amplicones al permitir una invasión/extensión repetida. Más específicamente, la recombinasa puede facilitar la invasión de un ácido nucleico diana mediante la polimerasa y la extensión de un cebador con la polimerasa, usando el ácido nucleico diana como molde para la formación de amplicones. Este procedimiento se puede repetir como una reacción en cadena en la que los amplicones producidos en cada ronda de invasión/extensión sirven como moldes en una ronda posterior. El procedimiento puede ocurrir más rápidamente que la PCR estándar ya que no requiere un ciclo de desnaturalización (por ejemplo, mediante calentamiento o desnaturalización química). Como tal, la amplificación facilitada por una recombinasa se puede llevar a cabo de forma isotérmica. Generalmente es deseable incluir ATP u otros nucleótidos (o en algunos casos análogos no hidrolizables de los mismos) en un reactivo de amplificación facilitado por la recombinasa para facilitar la amplificación. Una mezcla de recombinasa y proteína de unión monocatenaria (SSB) es particularmente útil ya que una SSB puede facilitar aún más la amplificación. Las formulaciones ejemplares para una amplificación facilitada por una recombinasa incluyen las vendidas comercialmente como kits TwistAmp por TwistDx (Cambridge, Reino Unido). Los componentes útiles del reactivo de amplificación facilitado por la recombinasa y las condiciones de reacción se establecen en los documentos US 5.223.414 y US 7.399.590.
Otro ejemplo de un componente que puede incluirse en un reactivo de amplificación para facilitar la formación de amplicones y en algunos casos para aumentar la tasa de formación de amplicones, es una helicasa. La helicasa puede facilitar la formación de amplicones al permitir una reacción en cadena de formación de amplicones. El procedimiento puede ocurrir más rápidamente que la PCR estándar ya que no se requiere un ciclo de desnaturalización (por ejemplo, mediante calentamiento o desnaturalización química). Como tal, la amplificación facilitada por una helicasa se puede llevar a cabo de forma isotérmica. Una mezcla de helicasa y proteína de unión monocatenaria (SSB) es particularmente útil ya que la SSB puede facilitar aún más la amplificación. Las formulaciones ejemplares para la amplificación facilitada por la helicasa incluyen las que se venden comercialmente como kits IsoAmp de Biohelix (Beverly, MA). Además, se describen ejemplos de formulaciones útiles que incluyen una proteína helicasa en los documentos US 7.399.590 y US 7.829.284.
Otro ejemplo adicional de un componente que puede incluirse en un reactivo de amplificación para facilitar la formación de amplicones y, en algunos casos, aumentar la tasa de formación de amplicones, es una proteína de unión al origen.
Uso en secuenciación/métodos de secuenciación
Después de fijar las moléculas de adaptador-diana-adaptador a una superficie, se determina la secuencia de las moléculas de adaptador-diana-adaptador inmovilizadas y amplificadas. La secuenciación se puede llevar a cabo usando cualquier técnica de secuenciación adecuada y los métodos para determinar la secuencia de moléculas de adaptador-diana-adaptador inmovilizadas y amplificadas, incluyendo la síntesis de nuevo de cadenas, son conocidos en la técnica y se describen, por ejemplo, en Bignell et al. (documento US 8.053.192), Gunderson et al. (documento WO2016/130704), Shen et al. (documento US 8.895.249) y Pipenburg et al. (documento US 9.309.502).
Los métodos descritos en el presente documento se pueden usar junto con una variedad de técnicas de secuenciación de ácidos nucleicos. Las técnicas particularmente aplicables son aquellas en las que los ácidos nucleicos se fijan a ubicaciones fijas en una matriz, de modo que sus posiciones relativas no cambian y en donde se forman repetidamente imágenes de la matriz. Son particularmente aplicables los ejemplos en los que se obtienen imágenes en diferentes canales de color, por ejemplo, coincidiendo con diferentes marcadores utilizados para distinguir un tipo de base de nucleótido de otro. En algunos ejemplos, el procedimiento para determinar la secuencia de nucleótidos de un ácido nucleico diana puede ser un procedimiento automatizado. Los ejemplos preferidos incluyen técnicas de secuenciación por síntesis ("SBS").
Las técnicas de SBS generalmente implican la extensión enzimática de una hebra de ácido nucleico naciente mediante la adición iterativa de nucleótidos frente a una hebra molde. En los métodos tradicionales de SBS, en cada entrega se puede proporcionar un monómero de un solo nucleótido a un nucleótido diana en presencia de una polimerasa. Sin embargo, en los métodos descritos en el presente documento, se puede proporcionar más de un tipo de monómero nucleotídico a un ácido nucleico diana en presencia de una polimerasa en una entrega.
La SBS puede utilizar monómeros de nucleótidos que tienen un resto terminador o aquellos que carecen de restos terminadores. Los métodos que utilizan monómeros de nucleótidos que carecen de terminadores incluyen, por ejemplo, la pirosecuenciación y la secuenciación utilizando nucleótidos marcados con Y-fosfato, como se expone con más detalle a continuación. En los métodos que utilizan monómeros de nucleótidos que carecen de terminadores, el número de nucleótidos añadidos en cada ciclo es generalmente variable y depende de la secuencia molde y del modo de entrega de los nucleótidos. Para las técnicas de SBS que utilizan monómeros de nucleótidos que tienen un resto terminador, el terminador puede ser eficazmente irreversible en las condiciones de secuenciación utilizadas, como es el caso de la secuenciación tradicional de Sanger que utiliza didesoxinucleótidos, o el terminador puede ser reversible como es el caso de los métodos de secuenciación desarrollados por Solexa (ahora Illumina, Inc.).
Las técnicas de SBS pueden utilizar monómeros de nucleótidos que tienen un resto marcador o aquellos que carecen de un resto marcador. Por consiguiente, los eventos de incorporación pueden detectarse basándose en una característica del marcador, tal como la fluorescencia del marcador; una característica del monómero nucleotídico, tal como el peso molecular o la carga; un subproducto de la incorporación del nucleótido, tal como la liberación de pirofosfato; o similares. En los casos en los que dos o más nucleótidos diferentes están presentes en un reactivo de secuenciación, los diferentes nucleótidos pueden distinguirse entre sí o alternativamente, los dos o más marcadores diferentes pueden ser indistinguibles, según las técnicas de detección que se utilicen. Por ejemplo, los diferentes nucleótidos presentes en un reactivo de secuenciación pueden tener diferentes marcadores y se pueden distinguir usando ópticas apropiadas, tal y como se ejemplifica mediante los métodos de secuenciación desarrollados por Solexa (ahora Illumina, Inc.).
Los ejemplos preferidos incluyen técnicas de pirosecuenciación. La pirosecuenciación detecta la liberación de pirofosfato inorgánico (PPi) a medida que se incorporan nucleótidos particulares en la hebra naciente (Ronaghi, M., Karamohamed, S., Pettersson, B., Uhlen, M. y Nyren, P. (1996) "Real-time DNA sequencing using detection of pyrophosphate release". Analytical Biochemistry 242(1), 84-9; Ronaghi, M. (2001) "Pyrosequencing sheds light on DNA sequencing". Genome Res. 11(1), 3-11; Ronaghi, M., Uhlen, M. y Nyren, P. (1998) "A sequencing method based on real-time pyrophosphate". Science 281 (5375), 363; documentos de Pat. de E E . u U . n° 6.210.891; 6.258.568 y 6.274.320). En la pirosecuenciación, el PPi liberado puede detectarse convirtiéndolo inmediatamente en trifosfato de adenosina (ATP) a través de la ATP sulfurasa y el nivel de ATP generado se detecta mediante fotones producidos por luciferasa. Los ácidos nucleicos que se van a secuenciar se pueden fijar a características en una matriz y se pueden obtener imágenes de la matriz para capturar las señales quimioluminiscentes que se producen debido a la incorporación de nucleótidos en las características de la matriz. Se puede obtener una imagen después de que la matriz se trate con un tipo de nucleótido particular (por ejemplo, A, T, C o G). Las imágenes obtenidas después de la adición de cada tipo de nucleótido diferirán con respecto a qué características se detectan en la matriz. Esas diferencias en la imagen reflejan el contenido de secuencia diferente de las características sobre la matriz. Sin embargo, las ubicaciones relativas de cada característica permanecerán sin cambios en las imágenes. Las imágenes pueden almacenarse, procesarse y analizarse utilizando los métodos establecidos en este documento. Por ejemplo, las imágenes obtenidas después del tratamiento de la matriz con cada tipo de nucleótido diferente, se pueden manejar de la misma manera que se ejemplifica en el presente documento para imágenes obtenidas a partir de diferentes canales de detección para métodos de secuenciación basados en terminadores reversibles.
En otro tipo ejemplar de SBS, la secuenciación cíclica se logra mediante una adición escalonada de nucleótidos terminadores reversibles que contienen, por ejemplo, un marcador de colorante escindible o fotoblanqueable, tal y como se describe, por ejemplo, en el documento WO 04/018497 y el documento de Pat. de EE.UU. n° 7.057.026. Este enfoque está siendo comercializado por Solexa (ahora Illumina Inc.) y también se describe en los documentos WO 91/06678 y WO 07/123.744. La disponibilidad de los terminadores marcados con fluorescencia en los que se puede revertir tanto la terminación como el marcador fluorescente escindido, facilita la secuenciación de terminación cíclica reversible (CRT) eficiente. Las polimerasas también pueden diseñarse conjuntamente para incorporar y extenderse eficazmente a partir de esos nucleótidos modificados.
Preferiblemente, en realizaciones de secuenciación basadas en terminadores reversibles, los marcadores no inhiben sustancialmente la extensión bajo las condiciones de reacción de SBS. Sin embargo, los marcadores de detección pueden eliminarse, por ejemplo, mediante escisión o degradación. Las imágenes pueden capturarse tras la incorporación de marcadores en características de ácidos nucleicos en la matriz. En realizaciones particulares, cada ciclo implica el suministro simultáneo de cuatro tipos de nucleótidos diferentes a la matriz y cada tipo de nucleótido tiene un marcador espectralmente distinto. A continuación, se pueden obtener cuatro imágenes, cada una de las cuales utiliza un canal de detección que es selectivo para uno de los cuatro marcadores diferentes. Alternativamente, se pueden añadir secuencialmente diferentes tipos de nucleótidos y se puede obtener una imagen de la matriz entre cada etapa de adición. En tales ejemplos, cada imagen mostrará características de ácidos nucleicos que han incorporado nucleótidos de un tipo particular. Diferentes características estarán presentes o ausentes en las diferentes imágenes debido al diferente contenido de la secuencia de cada característica. Sin embargo, la posición relativa de las características permanecerá sin cambios en las imágenes. Las imágenes obtenidas a partir de esos métodos de terminación reversible-SBS pueden almacenarse, procesarse y analizarse, tal y como se establece en el presente documento. Después de la etapa de captura de imágenes, los marcadores se pueden eliminar y los restos terminadores reversibles se pueden eliminar para ciclos posteriores de adición y detección de nucleótidos. Una eliminación de los marcadores después de que se hayan detectado en un ciclo particular y antes de un ciclo posterior, puede proporcionar la ventaja de reducir la señal de fondo y la diafonía entre los ciclos. A continuación se exponen ejemplos de marcadores útiles y de métodos de eliminación.
En ejemplos particulares, algunos o todos los monómeros de nucleótidos pueden incluir terminadores reversibles. Los terminadores reversibles/fluoróforos escindibles pueden incluir fluoróforos unidos al resto de ribosa a través de un enlace éster 3’ (Metzker, Genome Res. 15:1767-1776 (2005)). Otros enfoques han separado la química del terminador de la escisión del marcador de fluorescencia (Ruparel et al., Proc Natl Acad Sci USA 102:5932-7 (2005). Ruparel et al. han descrito el desarrollo de terminadores reversibles que usaban un pequeño grupo alilo 3’ para bloquear la extensión, pero que podían desbloquearse fácilmente mediante un tratamiento corto con un catalizador de paladio. El fluoróforo se fijaba a la base mediante un enlazador fotoescindible que podía escindirse fácilmente mediante una exposición de 30 segundos a luz UV de longitud de onda larga. Por tanto, como enlazador escindible se puede utilizar una reducción con disulfuro o una fotoescisión. Otro enfoque para la terminación reversible es el uso de la terminación natural que se produce después de la colocación de un colorante voluminoso sobre un dNTP. La presencia de un colorante voluminoso cargado sobre el dNTP, puede actuar como un terminador eficaz a través de un impedimento estérico y/o electrostático. La presencia de un evento de incorporación evita otras incorporaciones, a menos que se elimine el colorante. La escisión del colorante elimina el fluoróforo y revierte eficazmente la terminación. También se describen ejemplos de nucleótidos modificados en los documentos de Pat. de EE.UU. n27.427.673 y 7.057.026.
Los sistemas y métodos de SBS ejemplares adicionales que se pueden utilizar con los métodos y sistemas descritos en este documento se describen en los documentos de publicación de EE.UU. n° 2007/0166705, 2006/0188901, 2006/0240439, 2006/0281109, 2012/0270305 y 2013/0260372, de Pat. de EE.UU. n27.057.026, publicación PCT n2 WO 05/065814, de publicación de solicitud de EE.UU. n° 2005/0100900 y publicaciones de PCT n° WO 06/064199 y WO 07/010.251.
Algunos ejemplos pueden utilizar la detección de cuatro nucleótidos diferentes usando menos de cuatro marcadores diferentes. Por ejemplo, la SBS se puede realizar utilizando métodos y sistemas descritos en los materiales incorporados del documento de publicación de EE.UU. n° 2013/0079232. Como primer ejemplo, se puede detectar una pareja de tipos de nucleótidos con la misma longitud de onda, pero distinguirlos en función de la diferencia de la intensidad de un miembro de la pareja en comparación con el otro, o en función de un cambio en un miembro de la pareja (p. ej., mediante modificación química, modificación fotoquímica o modificación física) lo que hace que la señal aparente aparezca o desaparezca en comparación con la señal detectada para el otro miembro de la pareja. Como segundo ejemplo, se pueden detectar tres de cuatro tipos de nucleótido diferentes en condiciones particulares, mientras que un cuarto tipo de nucleótidos carece de un marcador que sea detectable en esas condiciones o se detecta mínimamente en esas condiciones (por ejemplo, detección mínima debido a la fluorescencia de fondo, etc.). La incorporación de los primeros tres tipos de nucleótidos en un ácido nucleico se puede determinar basándose en la presencia de sus respectivas señales y la incorporación del cuarto tipo de nucleótido en el ácido nucleico se puede determinar basándose en la ausencia o la detección mínima de cualquier señal. Como tercer ejemplo, un tipo de nucleótido puede incluir marcador(es) que se detectan en dos canales diferentes, mientras que otros tipos de nucleótidos se detectan en no más de uno de los canales. Las tres configuraciones ejemplares mencionadas anteriormente no se consideran mutuamente excluyentes y pueden usarse en varias combinaciones. Un ejemplo que combina los tres ejemplos es un método de SBS basado en la fluorescencia que utiliza un primer tipo de nucleótido que se detecta en un primer canal (por ejemplo, dATP que tiene un marcador que se detecta en el primer canal cuando se excita con una primera longitud de onda de excitación), un segundo tipo de nucleótido que se detecta en un segundo canal (por ejemplo, dCTP que tiene un marcador que se detecta en el segundo canal cuando se excita con una segunda longitud de onda de excitación), un tercer tipo de nucleótido que se detecta tanto en el primer como en el segundo canal (por ejemplo, dTTP que tiene al menos un marcador que se detecta en ambos canales cuando se excita con la primera y/o la segunda longitud de onda de excitación) y un cuarto tipo de nucleótido que carece de marcador que no se detecta, o solo mínimamente, en ninguno de los canales (por ejemplo, dGTP que no tiene marcador).
Además, tal y como se describe en los materiales incorporados del documento de publicación de EE.UU. n° 2013/0079232, los datos de una secuenciación se pueden obtener utilizando un solo canal. En los llamados enfoques de secuenciación de un solo colorante, el primer tipo de nucleótido se marca pero el marcador se elimina después de que se genera la primera imagen y el segundo tipo de nucleótido se marca solo después de que se genera una primera imagen. El tercer tipo de nucleótido conserva su marcador tanto en la primera como en la segunda imagen y el cuarto tipo de nucleótido permanece sin marcar en ambas imágenes.
Algunos ejemplos pueden utilizar la secuenciación mediante técnicas de ligación. Tales técnicas utilizan una ADN ligasa para incorporar oligonucleótidos e identificar la incorporación de tales oligonucleótidos. Los oligonucleótidos tienen normalmente diferentes marcadores que se correlacionan con la identidad de un nucleótido particular en una secuencia con la que se hibridan los oligonucleótidos. Al igual que con otros métodos de SBS, se pueden obtener imágenes tras el tratamiento de una matriz de características de los ácidos nucleicos con los reactivos de secuenciación marcados. Cada imagen mostrará características de los ácidos nucleicos que han incorporado marcadores de un tipo particular. Diferentes características estarán presentes o ausentes en las diferentes imágenes debido al diferente contenido en secuencia de cada característica, pero la posición relativa de las características permanecerá sin cambios en las imágenes. Las imágenes obtenidas a partir de métodos de secuenciación basados en la ligación pueden almacenarse, procesarse y analizarse tal y como se establece en el presente documento. Los sistemas y métodos de SBS ejemplares que se pueden utilizar con los métodos y sistemas descritos en este documento, se describen en los documentos de Pat. de EE.UU. n° 6.969.488, 6.172.218 y 6.306.597.
Algunos ejemplos pueden utilizar la secuenciación de nanoporos (Deamer, D. W. & Akeson, M. "Nanopores and nucleic acids: prospects for ultrarapid sequencing". Trends Biotechnol. 18, 147-151 (2000); Deamer, D. y D. Branton, "Characterization of nucleic acids by nanopore analysis", Acc. Chem. Res. 35:817-825 (2002); Li, J., M. Gershow, D. Stein, E. Brandin y J. A. Golovchenko, "DNA molecules and configurations in a solid-state nanopore microscope" Nat. Mater. 2: 611-615 (2003)). En tales ejemplos, el ácido nucleico diana pasa a través de un nanoporo. El nanoporo puede ser un poro sintético o una proteína de membrana biológica, como la a-hemolisina. A medida que el ácido nucleico diana pasa a través del nanoporo, cada pareja de bases se puede identificar midiendo las fluctuaciones en la conductancia eléctrica del poro (documento de Pat. de EE.UU. n° 7.001.792; Soni, G. V. & Meller, "A. Progress toward ultrafast DNA sequencing using solid-state nanopores". Clin. Chem. 53, 1996-2001 (2007); Healy, K. "Nanopore-based single-molecule DNA analysis". Nanomed. 2, 459-481 (2007); Cockroft, S. L., Chu, J., Amorin, M. & Ghadiri, M. R. "A single-molecule nanopore device detects DNA polymerase activity with singlenucleotide resolution". J. Am. Chem. Soc. 130, 818-820 (2008)). Los datos obtenidos a partir de la secuenciación de nanoporos se pueden almacenar, procesar y analizar tal y como se establece en este documento. En particular, los datos se pueden tratar como una imagen de acuerdo con el tratamiento ejemplar de imágenes ópticas y otras imágenes que se expone en este documento.
Algunos ejemplos pueden utilizar métodos que implican el seguimiento en tiempo real de la actividad de la ADN polimerasa. Las incorporaciones de nucleótidos se pueden detectar mediante interacciones de transferencia de energía por resonancia de fluorescencia (FRET) entre una polimerasa que es portadora de un fluoróforo y nucleótidos marcados con Y-fosfato, tal y como se describe, por ejemplo, en los documentos de Pat. de EE.UU. n° 7.329.492 y 7.211.414 o las incorporaciones de nucleótidos se pueden detectar con guías de onda de modo cero, tal y como se describe, por ejemplo, en el documento de Pat. de EE.UU. n° 7.315.019 y usando análogos de nucleótidos fluorescentes y polimerasas modificadas, tal y como se describe, por ejemplo, en los documentos de Pat. de EE.UU. n° 7.405.281 y de publicación de EE.UU. n° 2008/0108082. La iluminación se puede restringir a un volumen de la escala de zeptolitros alrededor de una polimerasa unida a la superficie, de modo que se pueda observar la incorporación de nucleótidos marcados con fluorescencia con un ruido de fondo bajo (Levene, M. J. et al. "Zero-mode waveguides for single-molecule analysis at high concentrations". Science 299, 682-686 (2003); Lundquist, P. M. et al. "Parallel confocal detection of single molecules in real time". Opt. Lett. 33, 1026-1028 (2008); Korlach, J. et al. "Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nano structures". Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008)). Las imágenes obtenidas a partir de esos métodos pueden almacenarse, procesarse y analizarse como se establece en este documento.
Algunos ejemplos de SBS incluyen la detección de un protón liberado tras la incorporación de un nucleótido en un producto de extensión. Por ejemplo, la secuenciación basada en la detección de protones liberados puede utilizar un detector eléctrico y técnicas asociadas que están disponibles comercialmente en Ion Torrent (Guilford, CT, una subsidiaria de Life Technologies) o métodos y sistemas de secuenciación descritos en los documentos de publicación de EE.UU. n22009/0026082; 2009/0127589; 2010/0137143; y 2010/0282617. Los métodos expuestos en esta memoria para amplificar ácidos nucleicos diana usando exclusión cinética, pueden aplicarse fácilmente a sustratos usados para detectar protones. Más específicamente, los métodos establecidos en el presente documento pueden usarse para producir poblaciones clonales de amplicones que se usan para detectar protones.
Los métodos de SBS anteriores se pueden llevar a cabo ventajosamente en formatos múltiples, de modo que se manipulan simultáneamente múltiples ácidos nucleicos diana diferentes. Se pueden tratar diferentes ácidos nucleicos diana en un recipiente de reacción común o sobre la superficie de un sustrato particular. Esto permite la entrega conveniente de reactivos de secuenciación, la eliminación de reactivos que no han reaccionado y la detección de eventos de incorporación de una manera múltiple. En los ejemplos que utilizan ácidos nucleicos diana unidos a la superficie, los ácidos nucleicos diana pueden tener un formato de matriz. En un formato de matriz, los ácidos nucleicos diana pueden unirse normalmente a una superficie de una manera espacialmente distinguible. Los ácidos nucleicos diana pueden unirse mediante una fijación covalente directa, fijación a una perla u otra partícula o unión a una polimerasa u otra molécula que esté fijada a la superficie. La matriz puede incluir una única copia de un ácido nucleico diana en cada sitio (también denominada característica) o pueden estar presentes múltiples copias que tienen la misma secuencia en cada sitio o característica. Pueden producirse múltiples copias mediante métodos de amplificación tales como la amplificación en puente o la PCR en emulsión, como se describen con más detalle a continuación.
Los métodos establecidos en este documento pueden usar matrices que tengan características con cualquiera entre una variedad de densidades que incluyen, por ejemplo, al menos aproximadamente 10 características/cm2, 100 características/cm2, 500 características/cm2, 1.000 características/cm2, 5.000 características/cm2, 10.000 características/cm2, 50.000 características/cm2, 100.000 características/cm2, 1.000.000 características/cm2, 5.000.000 características/cm2 o más elevadas.
Una ventaja de los métodos expuestos en este documento es que proporcionan una detección rápida y eficaz de una pluralidad de ácidos nucleicos diana en paralelo. Por consiguiente, la presente descripción proporciona sistemas integrados capaces de preparar y detectar ácidos nucleicos usando métodos conocidos en la técnica, tales como los ejemplificados anteriormente. Por tanto, un sistema integrado de la presente descripción puede incluir componentes fluidos capaces de suministrar reactivos de amplificación y/o reactivos de secuenciación a uno o a varios fragmentos de ADN inmovilizado, comprendiendo el sistema componentes tales como bombas, válvulas, depósitos, líneas de fluidos y similares. Una celda de flujo puede configurarse y/o usarse en un sistema integrado para la detección de ácidos nucleicos diana. Se describen celdas de flujo ejemplares, por ejemplo, en los documentos de publicación de EE.UU. n° 2010/0111768 y 2012/0270305. Tal y como se ejemplifica para las celdas de flujo, uno o varios de los componentes fluidos de un sistema integrado pueden usarse para un método de amplificación y para un método de detección. Tomando una realización de una secuenciación de ácidos nucleicos como ejemplo, se pueden usar uno o varios de los componentes fluidos de un sistema integrado para un método de amplificación establecido en este documento y para la administración de reactivos de secuenciación en un método de secuenciación tal como los ejemplificados anteriormente. Alternativamente, un sistema integrado puede incluir sistemas fluidos distintos para llevar a cabo métodos de amplificación y para llevar a cabo métodos de detección. Los ejemplos de sistemas de secuenciación integrados que son capaces de crear ácidos nucleicos amplificados y también de determinar la secuencia de los ácidos nucleicos incluyen, sin limitación, la plataforma MiSeq™ (Illumina, Inc., San Diego, CA) y los dispositivos descritos en el documento de publicación de EE.UU. n° 2012/0270305.
Refiriéndonos ahora a la FIG. 1, se muestra un dibujo esquemático de un adaptador 100. El adaptador 100 representado comprende una región 110 bicatenaria y una región 120 monocatenaria no complementaria. La región 110 bicatenaria puede fijarse a un polinucleótido diana bicatenario. En la realización representada, el extremo 5’ de la hebra en la región 110 bicatenaria incluye un fosfato 5' opcional (indicado por "W"), que ayuda tanto en la ligación del adaptador 100 a un polinucleótido diana bicatenario como en la digestión con una exonucleasa que tiene actividad exonucleasa 5’ a 3' que tiene preferencia por el ADN bicatenario que incluye un fosfato 5’ terminal. Opcionalmente, el extremo 5’ libre de la hebra de la porción monocatenaria 120, se modifica para proteger el extremo de una actividad exonucleasa (indicado por "X"), por ejemplo, el extremo 5' libre de la hebra de la porción monocatenaria 120 no incluye un fosfato 5’. Si el adaptador 100 no está fijado a un fragmento diana bicatenario, el adaptador no incorporado puede degradarse a través de una o varias exonucleasas que tienen actividad exonucleasa 5’ a 3' que tiene preferencia por el ADN bicatenario. La hebra que tiene 140, 142 y 144 se degrada selectivamente, dejando intactas la otra hebra y las moléculas de adaptador-diana-adaptador. La modificación opcional en el extremo 5’ libre de la hebra de la porción 120 monocatenaria puede ayudar a reducir la actividad residual que puede tener la exonucleasa 5' a 3’ para el ADN monocatenario. Si el adaptador 100 forma parte de un producto incompleto, por ejemplo, un adaptador 100 está fijado a una molécula diana bicatenaria, el producto incompleto puede ser degradado por una o varias exonucleasas que tienen actividad exonucleasa 3’ a 5' que tiene preferencia por el ADN bicatenario que tiene un extremo 3’ romo o rebajado. La hebra que tiene 130, 132 y 134 se degrada selectivamente, dejando intactas la otra hebra y las moléculas de adaptador-diana-adaptador.
Refiriéndonos ahora a la FIG. 2, se muestra un dibujo esquemático de un adaptador 200. En el adaptador representado, los extremos libres de cada hebra de la porción 220 monocatenaria están modificados (indicados por "Y") para proteger los extremos de la actividad exonucleasa. Si el adaptador 100 no se fija a un fragmento diana bicatenario, el adaptador no incorporado puede ser digerido por una o varias exonucleasas que tengan tanto actividad exonucleasa 5’ a 3' como actividad exonucleasa 3’ a 5'. La protección de los dos extremos libres de cada hebra de la porción 220 monocatenaria evita que la exonucleasa utilice como sustrato las moléculas de adaptador-diana-adaptador deseadas. Si el adaptador 200 forma parte de un producto incompleto, por ejemplo, un adaptador 200 está fijado a una molécula diana bicatenaria, el producto incompleto puede ser degradado por una o varias exonucleasas que tienen actividad exonucleasa 3’ a 5' que tiene preferencia por el ADN bicatenario que tiene un extremo 3’ romo o rebajado. La protección de los dos extremos libres de cada hebra de la porción 220 monocatenaria, evita que la exonucleasa utilice como sustrato las moléculas de adaptador-diana-adaptador deseadas.
Refiriéndonos ahora a la FIG. 3, se muestra un dibujo esquemático de un adaptador 300. En el adaptador representado, el extremo 5’ de la hebra en la región 310 bicatenaria incluye un fosfato 5' opcional (indicado por "W"), que ayuda tanto en la ligación del adaptador 300 a un polinucleótido diana bicatenario como en la digestión mediante una exonucleasa que tiene actividad exonucleasa 5’ a 3' que tiene preferencia por el ADN bicatenario que incluye un fosfato 5’ terminal. La región 310 bicatenaria puede fijarse a un polinucleótido diana bicatenario si los extremos 3’ no están bloqueados. Cada hebra del adaptador 300 comprende un extremo 3’ bloqueado, indicado por "Z". Si el adaptador 300 no está fijado a un fragmento diana bicatenario, el adaptador no incorporado puede ser digerido por una o varias exonucleasas que tengan tanto actividad exonucleasa 5’ a 3' como actividad exonucleasa 3’ a 5'. Cualquier secuencia de adaptador restante, no degradada por la exonucleasa, no puede actuar como cebador para la extensión de alguna secuencia polinucleotídica durante las reacciones de secuenciación y/o amplificación subsiguientes.
Refiriéndonos ahora a la FIG. 4, se muestra un dibujo esquemático de un adaptador 400. En el adaptador representado, el extremo 5’ de la hebra en la región 410 bicatenaria incluye un fosfato 5' opcional (indicado por "W"), que ayuda en la ligación del adaptador 400 a un polinucleótido diana bicatenario. La región 410 bicatenaria se puede fijar a un polinucleótido diana bicatenario. En aquellas realizaciones en las que un adaptador se fija a una molécula diana bicatenaria (un producto incompleto), el producto incompleto puede ser digerido por una o varias exonucleasas que tienen una actividad exonucleasa 3’ a 5' que tiene preferencia por el ADN bicatenario que tiene un extremo 3’ romo o rebajado.
Una hebra representada del adaptador 100 o 200 o 300 o 400, comprende un sitio de unión del cebador de extensión universal 130 o 230 o 330 o 430 (por ejemplo, P5), una secuencia de marcador 132 o 232 o 332 o 432 (por ejemplo, i5) y un sitio de unión del cebador de secuenciación 134 o 234 o 334 o 434 (por ejemplo, SBS3). La otra hebra representada del adaptador 100 o 200 o 300 o 400, comprende un sitio de unión del cebador de extensión universal 140 o 240 o 340 o 440 (por ejemplo, P7’), una secuencia de marcador 142 o 242 o 342 o 442 (por ejemplo, i7) y un sitio de unión del cebador de secuenciación 144 o 244 o 344 o 444 (por ejemplo, SBS12').
Los sitios de unión del cebador de extensión universal 130 o 230 o 330 o 430 (por ejemplo, P5), 140 o 240 o 340 o 440 (por ejemplo, P7’) se pueden hibridar con oligonucleótidos de cebadores de extensión fijados a una superficie sólida con fines de amplificación o secuenciación (si el adaptador 100 o 200 o 300 o 400 estaba fijado a un polinucleótido diana). El sitio de unión del cebador de extensión universal 140 o 240 o 340 o 440 (por ejemplo, P7’) o una porción del mismo, también se puede hibridar con un cebador de secuenciación para secuenciar la secuencia de marcador indexado 142 o 242 o 342 o 442 (por ejemplo, i7). Alternativamente, la hebra puede comprender una secuencia de cebador de secuenciación adicional (no mostrada).
El sitio de unión del cebador de secuenciación 134 o 234 o 334 o 434 (por ejemplo, SBS3) se puede hibridar con un cebador de secuenciación para permitir la secuenciación de la secuencia de marcador indexado 132 o 232 o 332 o 432 (por ejemplo, i5). La secuencia de marcador 142 o 242 o 342 o 442 y la secuencia de marcador 132 o 232 o 332 o 432 pueden ser iguales o diferentes.
El sitio de unión del cebador de secuenciación 144 o 244 o 344 o 444 (por ejemplo, SBS12') se puede hibridar con un cebador de secuenciación para permitir la secuenciación de una secuencia de polinucleótidos diana (si está fijada al adaptador 100 o 200 o 300 o 400).
Los sitios de unión del cebador de secuenciación 134 o 234 o 334 o 434 (p. ej., SBS3), 144 o 244 o 344 o 444 (p. ej., SBS12') se pueden hibridar, por ejemplo, con cebadores de PCR, si los adaptadores están fijados a una diana en un procedimiento de etapas múltiples, tal y como se ha descrito anteriormente.
Se entenderá que un adaptador adecuado para uso en la presente descripción puede tener más o menos características de secuencia, u otras características de secuencia, que las descritas con respecto a las FIG. 1, FIG. 2, FIG. 3 y FIG. 4.
Refiriéndonos ahora a la FIG. 5 , se muestra un dibujo esquemático de un adaptador-diana-adaptador 500 de una colección que tiene una secuencia de adaptador 100 - molde 510 - adaptador 100. El adaptador-diana-adaptador 510 es bicatenario y está fijado a una porción bicatenaria de los adaptadores 100. Los extremos 5’ de las porciones monocatenarias de los adaptadores se modifican para protegerlas de la digestión con exonucleasas (indicados por "X"). Debido a que los adaptadores 100 están ligados a ambos extremos del fragmento 510 bicatenario diana, no hay secuencias bicatenarias disponibles en una molécula de adaptador-diana-adaptador para una exonucleasa, por lo que el adaptador-diana-adaptador 400 resultante es resistente a la digestión con una exonucleasa.
Refiriéndonos ahora a la FIG. 6 , se muestra un dibujo esquemático de un adaptador-diana-adaptador 600 de una colección que tiene una secuencia de adaptador 200 - molde 610 - adaptador 200. El adaptador-diana-adaptador 610 es bicatenario y está fijado a una porción bicatenaria de los adaptadores 200. Los extremos de las porciones monocatenarias de los adaptadores se modifican para protegerlos de una digestión con exonucleasas (indicados por "Y"). Debido a que los adaptadores 200 están ligados a ambos extremos del fragmento diana 610 bicatenario, no hay secuencias monocatenarias no bloqueadas disponibles en una molécula de adaptador-diana-adaptador para una exonucleasa, por lo que el adaptador-diana-adaptador 600 resultante es resistente a la digestión con una exonucleasa.
Refiriéndonos ahora a la FIG. 7 , se muestra un dibujo esquemático de un adaptador-diana-adaptador 700 de una colección que tiene una secuencia de adaptador 300 - molde 710 - adaptador 300. El adaptador-diana-adaptador 710 es bicatenario y está fijado a una porción bicatenaria de los adaptadores 300. Los extremos de las regiones monocatenarias de los adaptadores se modifican para evitar que actúen como cebadores para la extensión de cualquier polinucleótido en una celda de flujo. La FIG. 7 además muestra un dibujo esquemático de un adaptador que no estaba completamente degradado por una exonucleasa. Se muestra una hebra monocatenaria de un adaptador 300. Ese adaptador monocatenario no puede actuar como cebador para la extensión de ningún polinucleótido en una celda de flujo.
Refiriéndonos ahora a la FIG. 8A, se muestra un dibujo esquemático de un producto incompleto de un adaptadordiana 800 de una colección que tiene una secuencia de adaptador 400 - molde 810. El adaptador-diana 800 es bicatenario y está fijado a una porción bicatenaria del adaptador 400. La FIG. 8B muestra además un dibujo esquemático de un resultado de la digestión de un producto 800 incompleto con una exonucleasa que tiene actividad exonucleasa 3’ a 5' que tiene preferencia por un ADN bicatenario que tiene un extremo 3’ romo o rebajado. La digestión de una hebra de la porción bicatenaria de un adaptador-diana 800 desde 3’ a 5' puede dar lugar a dos moléculas monocatenarias. Una hebra es un adaptador-diana 830 monocatenario. La otra hebra de adaptador 820 corresponde a una de las regiones monocatenarias de un adaptador 400. En ese caso, los polinucleótidos presentes en el grupo de colecciones están bloqueados en 3’, tal y como se indica con "Z", después de la exposición a una exonucleasa que tiene actividad exonucleasa 3’ a 5' que tiene preferencia por un ADN bicatenario que tiene un extremo 3’ romo o rebajado. Esos adaptador-diana 830 monocatenarios y la cadena del adaptador 820 bloqueados en 3’ no pueden actuar como cebadores para la extensión de ningún polinucleótido en una celda de flujo.
Refiriéndonos ahora a las FIGS. 9A y 9B, se ilustra la naturaleza del fenómeno de salto de indicador. La FIG. 9A muestra cómo las lecturas procedentes de una muestra determinada se desmultiplexan incorrectamente y se mezclan con una muestra diferente después de la desmultiplexación. La FIG. 9B demuestra el salto de indicador en un sistema de indicador doble, lo que conduce a combinaciones inesperadas de secuencias de marcadores indexados.
Refiriéndonos ahora a las FIGS. 10A y 10B, se ilustra el enfoque general para medir la tasa de salto de indicador en un sistema dado. La FIG. 10A muestra un diseño ejemplar de una placa de adaptador doble, en la que cada pocillo individual de una placa de 96 pocillos contiene una pareja único de secuencias de marcadores indexados (12 indicadores de P7 diferentes combinados con 8 indicadores de P5 diferentes). La FIG. 10B muestra una configuración experimental destinada a medir la tasa de salto de indicador, en la que se utilizan 8 combinaciones únicas de marcadores de indicadores dobles (es decir, no se espera que ningún indicador de P5 se empareje con más de un indicador de P7 y viceversa). Las combinaciones inesperadas de marcadores indexados (por ejemplo, D505-D703) se identifican fácilmente como ejemplos de salto de indicador.
Refiriéndonos ahora a las FIGS. 11A y 11B, se ilustra el efecto de adaptadores no ligados sobre la tasa de salto de indicador. La FIG. 11A muestra un aumento de 6 veces en el salto de indicador asociado con un aumento del 50% de adaptadores libres. La FIG. 11B muestra un efecto aproximadamente lineal del adaptador bifurcado libre sobre la tasa de salto de indicador dentro del intervalo sometido a ensayo. Los inventores también observaron un efecto más pronunciado de los adaptadores P7 monocatenarios libres sobre la tasa de salto de indicador, en comparación con los adaptadores P5 monocatenarios libres (datos no mostrados).
Refiriéndonos ahora a las FIGS. 12A y 12B, se ilustra el efecto de un tratamiento con exonucleasa sobre las tasas de salto de indicador en el flujo de trabajo de una preparación de colecciones sin PCR con TruSeq® de Illumina, solo y en combinación con un bloqueo de 3’, respectivamente. Se observaron disminuciones significativas en el salto de indicador en ambos casos, aunque se observó una reducción más fuerte con el tratamiento combinado de la exonucleasa y el bloqueo de 3’.
La presente invención se ilustra adicionalmente con referencia a los siguientes ejemplos.
Ejemplos
Ejemplo 1: Protocolo de muestra para el tratamiento con exonucleasa con bloqueo de 3’ opcional de colecciones indexadas
Este protocolo explica cómo realizar un tratamiento con exonucleasa, ya sea solo o combinado con un bloqueo de 3’ de colecciones de ADN, para reducir el salto de indicador. Este método está diseñado para realizarse en conjuntos de colecciones de ADN antes de la etapa de desnaturalización y la posterior generación de agrupaciones utilizando Illumina HiSeq® 4000 y plataformas de secuenciación similares que utilizan celdas de flujo con patrones y agrupaciones basadas en ExAmp (p. ej., HiSeq® X y NovaSeq®).
Se ha observado que el salto de indicador ocurre cuando se asignan secuencias de indicador incorrectas a la secuencia del inserto, lo que da lugar a una asignación incorrecta en la muestra. La realización de este tratamiento sobre grupos de muestras de ADN antes de ejecutar una HiSeq® 4000, debería reducir los niveles de salto de indicador hasta un nivel que no se puede predecir de manera consistente en este estadio.
Se puede considerar que el flujo de trabajo del tratamiento implica cuatro etapas: (i) producir un conjunto de muestras de ADN; (ii) realizar el tratamiento, (iii) purificar las muestras y cuantificar; y (iv) agrupar y secuenciar un conjunto de muestras.
Productos/Equipamiento: Los productos que se van a emplear y el equipamiento pueden ser suministrados por un usuario de la secuenciación o estar fabricados. Los productos suministrados por el usuario pueden incluir un conjunto de muestras de una colección de ADN: 30 pl con una concentración que se utilizará para la desnaturalización durante la agrupación. El usuario también puede suministrar etanol al 80% (EtOH) recién preparado.
La Tabla 1 a continuación ilustra algunos de los productos y equipamientos que pueden utilizarse.
Tabla 1: Productos y equipamientos
Figure imgf000028_0002
Un fabricante de secuenciación puede suministrar EMX (mezcla de exonucleasas, del inglés “Exonuclease Mix”), BMX (mezcla de bloqueo, del inglés “Blocking Mix”), RSB (tampón de resuspensión, del inglés “Resuspension Buffer”) y SPB (perlas de purificación de muestras, del inglés “Sample Purification Beads”).
La EMX puede incluir un tampón de exonucleasa (glicina-KOH 67 mM, MgCl2 2,5 mM, 50 pg/ml de BSA) y exonucleasa Lambda (New England Biolabs, n° de cat. M0262S/L).
La BMX puede incluir una premezcla de secuenciación (tampón Tris, cloruro de sodio, sacarosa, sulfato de magnesio, EDTA y Tween 20), una mezcla de ddNTPs, ADN polimerasa Pol19 y transferasa terminal TDT.
El RSB puede incluir un tampón Tris, pH 8,5.
Las SPB pueden incluir perlas AgenCourt® AMPure® XP (Beckman Coulter, n° de cat. A63880). Las SPB deben agitarse en vórtice antes de cada uso. Las SPB deben agitarse en vórtice con frecuencia para asegurarse de que las perlas se distribuyen uniformemente. Las SPB se deben aspirar y dispensar lentamente debido a la viscosidad de la solución.
Algunos de los productos deben almacenarse y prepararse tal y como se indica en la Tabla 2 a continuación.
Tabla 2: Almacenamiento y preparación de los productos
Figure imgf000028_0001
El siguiente programa de EMX se puede guardar en el termociclador: (i) elija la opción de tapa precalentada y ajústela a 100°C; (ii) 37°C durante 30 minutos; (iii) 75°C durante 10 minutos; y (iv) mantener a 4°C.
El siguiente programa de BMX se puede guardar en el termociclador: (i) elija la opción de tapa precalentada y ajústela a 100°C; (ii) 38°C durante 20 minutos; (iii) 60°C durante 20 minutos; y (iv) mantener a 4°C.
Para el tratamiento únicamente con exonucleasa, las muestras pueden tratarse como sigue: (i) centrifugue la EMX a 600 x g durante 5 segundos; (ii) añada 27 pl del conjunto de muestras de la colección de ADN al tubo de PCR; (iii) añada 5 pl de EMX a cada muestra en cada tubo de PCR y luego mezcle bien pipeteando hacia arriba y hacia abajo; (iv) incubar colocando en el termociclador y ejecutando el programa de EMX. Cada tubo contiene 32 pl.
Para el tratamiento con exonucleasa más bloqueo de 3’, las muestras pueden tratarse como sigue: (i) centrifugue la EMX a 600 x g durante 5 segundos; (ii) añada 27 pl del conjunto de muestras de la colección de ADN al tubo de PCR; (iii) añada 5 pl de EMX a cada muestra en cada tubo de PCR y luego mezcle bien pipeteando hacia arriba y hacia abajo; (iv) incubar colocando en el termociclador y ejecute el programa de EMX; (v) centrifugue la BMX a 600 x g durante 5 segundos; (vi) añada 32 pl de BMX directamente a cada reacción de exonucleasa en cada tubo de PCR y luego mezcle bien pipeteando hacia arriba y hacia abajo; e (vii) incubar colocando en el termociclador y ejecutando el programa de BMX. Cada tubo contiene 64 pl.
La muestra agrupada tratada se puede purificar de la siguiente manera: (1) agite con vórtice las SPB hasta que estén bien dispersas; (2) añada 60 pl de SPB a cada tubo de tratamiento de muestra y mezcle bien pipeteando hacia arriba y hacia abajo; (3) incubar a temperatura ambiente durante 5 minutos; (4) coloque sobre un soporte magnético y espere hasta que el líquido esté claro (2-5 minutos); (5) retire y elimine todo el material sobrenadante de cada tubo; (6) lave 2 veces como sigue: (a) añada 200 pl de EtOH al 80% recién preparado a cada tubo, (b) incubar sobre el soporte magnético durante 30 segundos y (c) retire y elimine todo el material sobrenadante de cada tubo; (7) use una pipeta de 20 pl para eliminar el EtOH residual de cada tubo; (8) seque al aire sobre el soporte magnético durante 5 minutos; (9) añada 22,5 pl de RSB a cada tubo; (10) retire del soporte magnético y luego mezcle bien pipeteando hacia arriba y hacia abajo; (11) incubar a temperatura ambiente durante 2 minutos; (12) coloque sobre un soporte magnético y espere hasta que el líquido esté claro (2-5 minutos); (13) transfiera 20 pl de material sobrenadante a un tubo nuevo; (14) cuantifique las colecciones si es necesario y proceda a una agrupación estándar para la plataforma HiSeq® 4000 comenzando con el etapa de desnaturalización con NaOH; y (15) almacene entre -25°C y -15°C si no se agrupa inmediatamente.
Ejemplo 2: Reducción del salto indicador mediante tratamiento con exonucleasa con bloqueo de 3’ de colecciones indexadas
El protocolo del tratamiento expuesto anteriormente en el Ejemplo 1, se aplicó en combinación con los siguientes materiales, equipamiento y métodos para agrupar y secuenciar en la plataforma de Illumina.
Condiciones experimentales: (1) Colección sin PCR TrueSeq® de 450 pb de NA12878 humano (Coriell Institute) cargada a 300 pM; (2) el aparato HiSeq® X y los productos químicos de SBS de Illumina de acuerdo con las instrucciones del fabricante; (3) celda de flujo ILS v3 de 550 nm; (4) amplificación ExAmp tal y como se descrito anteriormente; y (5) 50% de aumento rápido del adaptador: adaptador bifurcado libre procedente de la placa de adaptador doble (DAP) de Illumina añadido a la colección de moldes antes de la desnaturalización, neutralización, adición de mezcla ExAmp y agrupamiento.
Los resultados de este experimento se resumen en Tabla 3 a continuación y la FIG. 13.
Tabla 3: Reducción del salto de indicador mediante tratamiento con exonucleasa con bloqueo de 3’
Figure imgf000029_0001
Tal y como se ha ilustrado anteriormente, el salto de indicador se redujo con el tratamiento de exonucleasa combinado con el bloqueo de 3’ de las colecciones de ADN.
A menos que se indique lo contrario, los parámetros numéricos empleados en la memoria descriptiva y las reivindicaciones son aproximaciones que pueden variar dependiendo de las propiedades deseadas que se pretenden obtener mediante la presente invención. Cada parámetro numérico debe interpretarse al menos de cara al número de dígitos significativos notificados y aplicando técnicas de redondeo ordinarias.
A pesar de que los intervalos numéricos y los parámetros que establecen el amplio alcance de la invención son aproximaciones, los valores numéricos establecidos en los ejemplos específicos se indican con la mayor precisión posible. Sin embargo, todos los valores numéricos contienen inherentemente un margen que resulta necesariamente de la desviación estándar encontrada en sus respectivas mediciones en las pruebas.

Claims (15)

REIVINDICACIONES
1. Una composición que comprende:
una primera pluralidad de moléculas de adaptador-diana-adaptador que comprenden fragmentos diana bicatenarios aislados a partir de una primera fuente,
en donde el adaptador comprende un primer adaptador universal específico de la muestra,
en donde el primer adaptador universal específico de la muestra comprende
(i) una región de ácido nucleico bicatenario, y
(ii) una región de hebras de ácido nucleico no complementarias monocatenarias que comprenden al menos un sitio de unión de un cebador universal,
en donde el primer adaptador universal específico de la muestra comprende además un primer conjunto de secuencias de marcadores específicos de la muestra que diferencia la primera pluralidad de moléculas de adaptador-diana-adaptador de las moléculas de adaptador-diana-adaptador que se originan a partir de una fuente diferente, en donde el primer conjunto de secuencias de marcadores específicos de la muestra está presente en las hebras de ácido nucleico no complementario monocatenario, y
una exonucleasa en donde la exonucleasa comprende una actividad ADN exonucleasa 5’ a 3' y una actividad ADN exonucleasa 3’ a 5' y en donde las moléculas de adaptador-diana-adaptador comprenden una modificación en cada uno de los extremos 3’ para bloquear la actividad ADN exonucleasa 3' a 5’.
2. La composición según la reivindicación 1, que comprende además los primeros adaptadores universales específicos de la muestra no fijados a un fragmento diana.
3. La composición según la reivindicación 1, en donde la exonucleasa comprende una actividad ADN exonucleasa 5’ a 3' que tiene preferencia por el ADN bicatenario que comprende un fosfato 5’ en el extremo 5' de la región de ácido nucleico bicatenario.
4. La composición según la reivindicación 3, en donde la exonucleasa es una exonucleasa lambda.
5. La composición según la reivindicación 1, en donde la exonucleasa comprende una actividad ADN exonucleasa 3’ a 5' que tiene preferencia por el ADN de doble hebra que tiene extremos romos y/o que tiene un extremo 3’ rebajado.
6. La composición según la reivindicación 1, en donde la composición comprende además una segunda pluralidad de moléculas de adaptador-diana-adaptador que comprenden fragmentos diana bicatenarios aislados a partir de una segunda fuente,
en donde el adaptador comprende un segundo adaptador universal específico de la muestra que comprende un segundo conjunto de secuencias de marcadores específicos de la muestra que diferencia las primera y segunda pluralidades de moléculas de adaptador-diana-adaptador.
7. La composición según la reivindicación 6, en donde los extremos 3’ de las primera y segunda pluralidades de moléculas de adaptador-diana-adaptador o una combinación de las mismas, están bloqueados.
8. La composición según la reivindicación 2, en donde los extremos 3’ de los primeros adaptadores universales específicos de la muestra no fijados a un fragmento diana, están bloqueados.
9. La composición según la reivindicación 1, que comprende además una desoxinucleotidil transferasa terminal, un ddNTP, una ADN polimerasa o una combinación de los mismos.
10. Un método que comprende:
proporcionar una primera solución de una pluralidad de fragmentos diana bicatenarios aislados a partir de una primera fuente;
ligar un primer adaptador universal específico de la muestra a ambos extremos de los fragmentos diana bicatenarios procedentes de la primera fuente para formar una primera pluralidad de moléculas de adaptador-diana-adaptador,
en donde cada una de la primera pluralidad de moléculas de adaptador-diana-adaptador comprende un fragmento diana flanqueado por el primer adaptador universal específico de la muestra,
en donde el primer adaptador universal específico de la muestra comprende (i) una región de ácido nucleico bicatenario y (ii) una región de hebras de ácido nucleico no complementarias monocatenarias que comprenden al menos un sitio de unión de un cebador universal,
en donde el primer adaptador universal específico de la muestra comprende además un primer conjunto de secuencias de marcadores específicos de la muestra que diferencia la primera pluralidad de moléculas de adaptador-diana-adaptador de las moléculas de adaptador-diana-adaptador que se originan a partir de una fuente diferente, en donde el primer conjunto de secuencias de marcadores específicos de la muestra está presente en las hebras de ácido nucleico no complementarias monocatenarias, y
en donde la ligación fija covalentemente la región de ácido nucleico bicatenario del primer adaptador universal específico de la muestra a cada extremo de los fragmentos diana bicatenarios procedentes de la primera fuente; y
poner en contacto la solución con una exonucleasa, en donde la exonucleasa comprende una actividad ADN exonucleasa 5’ a 3' que tiene preferencia por el ADN bicatenario,
en donde la exonucleasa degrada selectivamente los primeros adaptadores universales específicos de la muestra que están presentes en la primera solución no ligados a un fragmento diana
poner en contacto la solución con una exonucleasa, en donde la exonucleasa tiene actividad ADN exonucleasa 3’ a 5', en donde los primeros adaptadores universales específicos de la muestra no fijados a un fragmento diana y una primera pluralidad de moléculas de adaptador-diana-adaptador comprenden una modificación en cada uno de los extremos 3’ para bloquear la actividad ADN exonucleasa 3' a 5’.
11. El método según la reivindicación 10, en donde la exonucleasa comprende una actividad ADN exonucleasa 5’ a 3' que tiene preferencia por el ADN bicatenario que comprende un fosfato 5’ en el extremo 5' de la región de ácido nucleico bicatenario.
12. El método según la reivindicación 11, en donde la exonucleasa es una exonucleasa lambda.
13. El método según la reivindicación 10, que además comprende:
proporcionar una segunda solución de una pluralidad de fragmentos diana bicatenarios aislados a partir de una segunda fuente;
ligar un segundo adaptador universal específico de la muestra a ambos extremos de los fragmentos diana bicatenarios procedentes de la segunda fuente para formar una segunda pluralidad de moléculas de adaptador-diana-adaptador,
en donde cada una de la segunda pluralidad de moléculas de adaptador-diana-adaptador comprende un fragmento diana procedente de la segunda fuente flanqueado por el segundo adaptador universal específico de la muestra,
en donde el segundo adaptador universal específico de la muestra comprende (i) una región de ácido nucleico bicatenario y (ii) una región de hebras de ácido nucleico no complementarias monocatenarias que comprende al menos un sitio de unión de un cebador universal,
en donde el segundo adaptador universal específico de la muestra comprende además un segundo conjunto de secuencias de marcadores específicos de la muestra que diferencia la segunda pluralidad de moléculas de adaptador-diana-adaptador de las moléculas de adaptador-diana-adaptador que se originan a partir de una fuente diferente, en donde el segundo conjunto de secuencias de marcadores específicos de la muestra está presente en las hebras de ácido nucleico no complementarias monocatenarias, y
en donde la ligación fija covalentemente la región de ácido nucleico bicatenario del segundo adaptador universal específico de la muestra a cada extremo de los fragmentos diana bicatenarios procedentes de la segunda fuente; y
poner en contacto la solución con una exonucleasa, en donde la exonucleasa comprende una actividad ADN exonucleasa 5’ a 3' que tiene preferencia por el ADN bicatenario,
en donde la exonucleasa degrada selectivamente los segundos adaptadores universales específicos de la muestra presentes en la segunda solución no ligados a un fragmento diana y que comprende adicionalmente bloquear los extremos 3’ de las primera y segunda pluralidades de moléculas de adaptadordiana-adaptador.
14. El método según la reivindicación 13, en donde el bloqueo comprende incorporar enzimáticamente un didesoxinucleótido en los extremos 3’ de las primera y segunda pluralidades de moléculas de adaptador-dianaadaptador y los extremos 3' de los primer y segundo adaptadores universales específicos de la muestra que no están fijados a un fragmento diana.
15. El método según la reivindicación 13, que comprende además:
proporcionar una superficie que comprende una pluralidad de sitios de amplificación,
en donde los sitios de amplificación comprenden al menos dos poblaciones de ácidos nucleicos monocatenarios fijados que tienen un extremo 3’ libre, y
poner en contacto la superficie que comprende los sitios de amplificación con una mezcla de las primera y segunda pluralidades de moléculas de adaptador-diana-adaptador en condiciones adecuadas para producir una pluralidad de sitios de amplificación que comprenden cada uno una población clonal de amplicones procedentes de una molécula de adaptador-diana-adaptadora individual.
ES18727420T 2017-04-23 2018-04-23 Composiciones y métodos para mejorar la identificación de muestras en colecciones de ácidos nucleicos indexadas Active ES2889585T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201762488825P 2017-04-23 2017-04-23
PCT/IB2018/000497 WO2018197945A1 (en) 2017-04-23 2018-04-23 Compositions and methods for improving sample identification in indexed nucleic acid libraries

Publications (1)

Publication Number Publication Date
ES2889585T3 true ES2889585T3 (es) 2022-01-12

Family

ID=62245363

Family Applications (1)

Application Number Title Priority Date Filing Date
ES18727420T Active ES2889585T3 (es) 2017-04-23 2018-04-23 Composiciones y métodos para mejorar la identificación de muestras en colecciones de ácidos nucleicos indexadas

Country Status (9)

Country Link
US (1) US11459610B2 (es)
EP (2) EP3913053A1 (es)
CN (1) CN110785492B (es)
AU (2) AU2018259202B2 (es)
CA (1) CA3059839C (es)
DK (1) DK3615671T3 (es)
ES (1) ES2889585T3 (es)
SG (1) SG11201909914RA (es)
WO (1) WO2018197945A1 (es)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SG11201909394PA (en) 2017-04-23 2019-11-28 Illumina Inc Compositions and methods for improving sample identification in indexed nucleic acid libraries
EP3913053A1 (en) 2017-04-23 2021-11-24 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
CA3059840C (en) 2017-04-23 2022-04-26 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
CN111094584A (zh) 2017-04-23 2020-05-01 伊鲁米那股份有限公司 用于改进编索引的核酸文库中的样品鉴定的组合物和方法
KR20210098842A (ko) 2018-12-05 2021-08-11 일루미나 케임브리지 리미티드 브릿지 증폭에 의한 클러스터 생성을 위한 방법 및 조성물
AU2019411272A1 (en) 2018-12-18 2021-01-07 Illumina Cambridge Limited Methods and compositions for paired end sequencing using a single surface primer
EP3899037B1 (en) 2018-12-19 2023-10-18 Illumina, Inc. Methods for improving polynucleotide cluster clonality priority
CN110409001B (zh) * 2019-07-25 2022-11-15 北京贝瑞和康生物技术有限公司 一种构建捕获文库的方法和试剂盒
US20240093287A1 (en) * 2020-07-30 2024-03-21 Ginkgo Bioworks, Inc. Methods and compositions for reducing index hopping
CN111961710B (zh) * 2020-08-12 2024-04-26 苏州金唯智生物科技有限公司 一种样本处理方法及设备
EP4211261A1 (en) 2020-09-11 2023-07-19 Illumina Cambridge Limited Methods of enriching a target sequence from a sequencing library using hairpin adaptors
EP4200444A4 (en) * 2020-10-30 2024-09-25 Singular Genomics Systems Inc METHODS AND COMPOSITIONS FOR REDUCING NUCLEOTIDE IMPURITIES
KR20230163434A (ko) 2021-03-29 2023-11-30 일루미나, 인코포레이티드 라이브러리에서 dna 손상을 평가하고 앰플리콘 크기 바이어스를 정규화하기 위한 조성물 및 방법
AU2022424380A1 (en) 2021-12-29 2024-01-18 Illumina, Inc. Methods of nucleic acid sequencing using surface-bound primers
WO2023196572A1 (en) 2022-04-07 2023-10-12 Illumina Singapore Pte. Ltd. Altered cytidine deaminases and methods of use
WO2024073043A1 (en) 2022-09-30 2024-04-04 Illumina, Inc. Methods of using cpg binding proteins in mapping modified cytosine nucleotides
WO2024073047A1 (en) 2022-09-30 2024-04-04 Illumina, Inc. Cytidine deaminases and methods of use in mapping modified cytosine nucleotides
WO2024069581A1 (en) 2022-09-30 2024-04-04 Illumina Singapore Pte. Ltd. Helicase-cytidine deaminase complexes and methods of use
WO2024118903A1 (en) 2022-11-30 2024-06-06 Illumina, Inc. Chemoenzymatic correction of false positive uracil transformations
WO2024147904A1 (en) 2023-01-06 2024-07-11 Illumina, Inc. Reducing uracils by polymerase

Family Cites Families (99)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
AU622426B2 (en) 1987-12-11 1992-04-09 Abbott Laboratories Assay using template-dependent nucleic acid probe reorganization
CA1341584C (en) 1988-04-06 2008-11-18 Bruce Wallace Method of amplifying and detecting nucleic acid sequences
WO1989009835A1 (en) 1988-04-08 1989-10-19 The Salk Institute For Biological Studies Ligase-based amplification method
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
AU634969B2 (en) 1988-06-24 1993-03-11 Amgen, Inc. Method and reagents for detecting nucleic acid sequences
EP0425563B1 (en) 1988-07-20 1996-05-15 David Segev Process for amplifying and detecting nucleic acid sequences
US5185243A (en) 1988-08-25 1993-02-09 Syntex (U.S.A.) Inc. Method for detection of specific nucleic acid sequences
WO1991006678A1 (en) 1989-10-26 1991-05-16 Sri International Dna sequencing
EP0439182B1 (en) 1990-01-26 1996-04-24 Abbott Laboratories Improved method of amplifying target nucleic acids applicable to both polymerase and ligase chain reactions
US5573907A (en) 1990-01-26 1996-11-12 Abbott Laboratories Detecting and amplifying target nucleic acids using exonucleolytic activity
US5223414A (en) 1990-05-07 1993-06-29 Sri International Process for nucleic acid hybridization and amplification
US5455166A (en) 1991-01-31 1995-10-03 Becton, Dickinson And Company Strand displacement amplification
DE69531542T2 (de) 1994-02-07 2004-06-24 Beckman Coulter, Inc., Fullerton Ligase/polymerase-vermittelte analyse genetischer elemente von einzelnukleotid-polymorphismen und ihre verwendung in der genetischen analyse
AU687535B2 (en) 1994-03-16 1998-02-26 Gen-Probe Incorporated Isothermal strand displacement nucleic acid amplification
US6214987B1 (en) 1994-09-02 2001-04-10 Andrew C. Hiatt Compositions for enzyme catalyzed template-independent formation of phosphodiester bonds using protected nucleotides
US5990300A (en) 1994-09-02 1999-11-23 Andrew C. Hiatt Enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides
US5763594A (en) 1994-09-02 1998-06-09 Andrew C. Hiatt 3' protected nucleotides for enzyme catalyzed template-independent creation of phosphodiester bonds
US5872244A (en) 1994-09-02 1999-02-16 Andrew C. Hiatt 3' protected nucleotides for enzyme catalyzed template-independent creation of phosphodiester bonds
US5808045A (en) 1994-09-02 1998-09-15 Andrew C. Hiatt Compositions for enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides
US6232465B1 (en) 1994-09-02 2001-05-15 Andrew C. Hiatt Compositions for enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
ATE545710T1 (de) 1997-04-01 2012-03-15 Illumina Cambridge Ltd Verfahren zur vervielfältigung von nukleinsäuren
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
US7611869B2 (en) 2000-02-07 2009-11-03 Illumina, Inc. Multiplexed methylation detection methods
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
JP2004513619A (ja) 2000-07-07 2004-05-13 ヴィジゲン バイオテクノロジーズ インコーポレイテッド リアルタイム配列決定
US7211414B2 (en) 2000-12-01 2007-05-01 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
AR031640A1 (es) 2000-12-08 2003-09-24 Applied Research Systems Amplificacion isotermica de acidos nucleicos en un soporte solido
CA2344599C (en) * 2001-05-07 2011-07-12 Bioneer Corporation Selective polymerase chain reaction of dna of which base sequence is completely unknown
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
GB0129012D0 (en) 2001-12-04 2002-01-23 Solexa Ltd Labelled nucleotides
US7399590B2 (en) 2002-02-21 2008-07-15 Asm Scientific, Inc. Recombinase polymerase amplification
US8030000B2 (en) 2002-02-21 2011-10-04 Alere San Diego, Inc. Recombinase polymerase amplification
WO2004018497A2 (en) 2002-08-23 2004-03-04 Solexa Limited Modified nucleotides for polynucleotide sequencing
US7282328B2 (en) 2002-09-20 2007-10-16 New England Biolabs, Inc. Helicase dependent amplification of nucleic acids
WO2004081183A2 (en) 2003-03-07 2004-09-23 Rubicon Genomics, Inc. In vitro dna immortalization and whole genome amplification using libraries generated from randomly fragmented dna
US20050053980A1 (en) 2003-06-20 2005-03-10 Illumina, Inc. Methods and compositions for whole genome amplification and genotyping
GB0321306D0 (en) 2003-09-11 2003-10-15 Solexa Ltd Modified polymerases for improved incorporation of nucleotide analogues
EP2789383B1 (en) 2004-01-07 2023-05-03 Illumina Cambridge Limited Molecular arrays
WO2006044078A2 (en) 2004-09-17 2006-04-27 Pacific Biosciences Of California, Inc. Apparatus and method for analysis of molecules
WO2006064199A1 (en) 2004-12-13 2006-06-22 Solexa Limited Improved method of nucleotide detection
EP1888743B1 (en) 2005-05-10 2011-08-03 Illumina Cambridge Limited Improved polymerases
US20090233291A1 (en) 2005-06-06 2009-09-17 454 Life Sciences Corporation Paired end sequencing
WO2007145612A1 (en) * 2005-06-06 2007-12-21 454 Life Sciences Corporation Paired end sequencing
GB0514936D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Preparation of templates for nucleic acid sequencing
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
WO2007107710A1 (en) 2006-03-17 2007-09-27 Solexa Limited Isothermal methods for creating clonal single molecule arrays
EP3722409A1 (en) 2006-03-31 2020-10-14 Illumina, Inc. Systems and devices for sequence by synthesis analysis
US7833716B2 (en) 2006-06-06 2010-11-16 Gen-Probe Incorporated Tagged oligonucleotides and their use in nucleic acid amplification methods
WO2008042067A2 (en) 2006-09-28 2008-04-10 Illumina, Inc. Compositions and methods for nucleotide sequencing
US7754429B2 (en) 2006-10-06 2010-07-13 Illumina Cambridge Limited Method for pair-wise sequencing a plurity of target polynucleotides
AU2007309504B2 (en) 2006-10-23 2012-09-13 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
GB2457851B (en) 2006-12-14 2011-01-05 Ion Torrent Systems Inc Methods and apparatus for measuring analytes using large scale fet arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
WO2008093098A2 (en) 2007-02-02 2008-08-07 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
EP2242855A1 (en) * 2008-02-05 2010-10-27 Roche Diagnostics GmbH Paired end sequencing
US8198028B2 (en) 2008-07-02 2012-06-12 Illumina Cambridge Limited Using populations of beads for the fabrication of arrays on surfaces
US20100062494A1 (en) 2008-08-08 2010-03-11 President And Fellows Of Harvard College Enzymatic oligonucleotide pre-adenylation
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US8623603B2 (en) 2010-03-08 2014-01-07 Dana-Farber Cancer Institute, Inc. Full cold-PCR enrichment with reference blocking sequence
US8951781B2 (en) 2011-01-10 2015-02-10 Illumina, Inc. Systems, methods, and apparatuses to image a sample for biological or chemical analysis
US8778848B2 (en) 2011-06-09 2014-07-15 Illumina, Inc. Patterned flow-cells useful for nucleic acid analysis
ES2752653T3 (es) 2011-09-23 2020-04-06 Illumina Inc Métodos y composiciones para la secuenciación de ácidos nucleicos
WO2013063382A2 (en) 2011-10-28 2013-05-02 Illumina, Inc. Microarray fabrication system and method
EP2628504A1 (en) 2012-01-16 2013-08-21 Greatbatch Ltd. EMI filtered co-connected hermetic feedthrough, feedthrough capacitor and leadwire assembly for an active implantable medical device
US9650628B2 (en) 2012-01-26 2017-05-16 Nugen Technologies, Inc. Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library regeneration
WO2013151622A1 (en) 2012-04-03 2013-10-10 Illumina, Inc. Integrated optoelectronic read head and fluidic cartridge useful for nucleic acid sequencing
EP3514243B1 (en) 2012-05-21 2022-08-17 The Scripps Research Institute Methods of sample preparation
US8895249B2 (en) 2012-06-15 2014-11-25 Illumina, Inc. Kinetic exclusion amplification of nucleic acid libraries
US9119523B2 (en) 2012-07-02 2015-09-01 General Electric Company Dishwasher appliance with rack assembly projections
US9512422B2 (en) 2013-02-26 2016-12-06 Illumina, Inc. Gel patterned surfaces
FR3002551B1 (fr) 2013-02-26 2015-08-14 Anton Percy Spielmann Procede de tricotage d'un element chaussant et element chaussant obtenu par un tel procede.
WO2014142921A1 (en) 2013-03-14 2014-09-18 Illumina, Inc. Modified polymerases for improved incorporation of nucleotide analogues
CA2903095C (en) 2013-03-15 2018-02-13 Xiaohai Liu Modified nucleosides or nucleotides
CN105431554B (zh) 2013-07-01 2019-02-15 Illumina公司 无催化剂的表面官能化和聚合物接枝
EP3626866B1 (en) 2013-08-19 2021-03-24 Abbott Molecular Inc. Next-generation sequencing libraries
JP6626830B2 (ja) 2013-11-07 2019-12-25 アジレント・テクノロジーズ・インクAgilent Technologies, Inc. Dna操作のための複数のトランスポザーゼアダプター
US9677132B2 (en) 2014-01-16 2017-06-13 Illumina, Inc. Polynucleotide modification on solid support
EP3702471A1 (en) 2014-06-27 2020-09-02 Illumina, Inc. Modified polymerases for improved incorporation of nucleotide analogues
EP3201355B1 (en) 2014-09-30 2019-07-31 Illumina, Inc. Modified polymerases for improved incorporation of nucleotide analogues
EP3632944B1 (en) 2014-10-31 2021-12-01 Illumina Cambridge Limited Polymers and dna copolymer coatings
WO2016130704A2 (en) 2015-02-10 2016-08-18 Illumina, Inc. Methods and compositions for analyzing cellular components
US9850484B2 (en) * 2015-09-30 2017-12-26 The General Hospital Corporation Comprehensive in vitro reporting of cleavage events by sequencing (Circle-seq)
WO2018144216A1 (en) * 2017-01-31 2018-08-09 Counsyl, Inc. Methods and compositions for enrichment of target polynucleotides
EP3913053A1 (en) 2017-04-23 2021-11-24 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
CA3059840C (en) 2017-04-23 2022-04-26 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
SG11201909394PA (en) 2017-04-23 2019-11-28 Illumina Inc Compositions and methods for improving sample identification in indexed nucleic acid libraries
CN111094584A (zh) 2017-04-23 2020-05-01 伊鲁米那股份有限公司 用于改进编索引的核酸文库中的样品鉴定的组合物和方法

Also Published As

Publication number Publication date
EP3615671B1 (en) 2021-07-21
WO2018197945A1 (en) 2018-11-01
EP3615671A1 (en) 2020-03-04
CN110785492B (zh) 2024-04-30
SG11201909914RA (en) 2019-11-28
US11459610B2 (en) 2022-10-04
CA3059839A1 (en) 2018-11-01
DK3615671T3 (da) 2021-10-18
AU2018259202A1 (en) 2019-11-07
EP3913053A1 (en) 2021-11-24
US20180305753A1 (en) 2018-10-25
AU2018259202B2 (en) 2022-03-24
AU2022202505A1 (en) 2022-06-02
CN110785492A (zh) 2020-02-11
CA3059839C (en) 2023-01-03

Similar Documents

Publication Publication Date Title
ES2889585T3 (es) Composiciones y métodos para mejorar la identificación de muestras en colecciones de ácidos nucleicos indexadas
ES2929837T3 (es) Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácidos nucleicos indexados
ES2959047T3 (es) Bibliotecas de genoma completo de célula individual para la secuenciación de metilación
ES2882608T3 (es) Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácidos nucleicos indexados
ES2764096T3 (es) Bibliotecas de secuenciación de próxima generación
DK3161152T3 (en) Methods and compositions using one-sided transposition
CN113528628A (zh) 用于基因组应用和治疗应用的核酸分子的克隆复制和扩增的系统和方法
ES2877205T3 (es) Preparación de muestras para la amplificación de ácido nucleico
CN115667507A (zh) 用于长读出测序的多核苷酸条形码
US20210355518A1 (en) Generating nucleic acids with modified bases using recombinant terminal deoxynucleotidyl transferase
JP2023533418A (ja) シークエンシングライブラリーの収率を増加させるための方法
EP3899037B1 (en) Methods for improving polynucleotide cluster clonality priority
CN110832086A (zh) 用于制造用于基于序列的遗传检验的对照的组合物和方法