ES2937929T3 - Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácido nucleico indexadas - Google Patents

Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácido nucleico indexadas

Info

Publication number
ES2937929T3
ES2937929T3 ES21157377T ES21157377T ES2937929T3 ES 2937929 T3 ES2937929 T3 ES 2937929T3 ES 21157377 T ES21157377 T ES 21157377T ES 21157377 T ES21157377 T ES 21157377T ES 2937929 T3 ES2937929 T3 ES 2937929T3
Authority
ES
Spain
Prior art keywords
polynucleotide
adapter
amplification
target
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES21157377T
Other languages
English (en)
Inventor
Eric Hans Vermaas
Mahdieh Khosroheidari
Claire Bevis-Mott
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Illumina Cambridge Ltd
Illumina Inc
Original Assignee
Illumina Cambridge Ltd
Illumina Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina Cambridge Ltd, Illumina Inc filed Critical Illumina Cambridge Ltd
Application granted granted Critical
Publication of ES2937929T3 publication Critical patent/ES2937929T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B20/00Methods specially adapted for identifying library members
    • C40B20/04Identifying library members by means of a tag, label, or other readable or detectable entity associated with the library members, e.g. decoding processes
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/14Solid phase synthesis, i.e. wherein one or more library building blocks are bound to a solid support during library creation; Particular methods of cleavage from the solid support
    • C40B50/16Solid phase synthesis, i.e. wherein one or more library building blocks are bound to a solid support during library creation; Particular methods of cleavage from the solid support involving encoding steps
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B50/00Methods of creating libraries, e.g. combinatorial synthesis
    • C40B50/14Solid phase synthesis, i.e. wherein one or more library building blocks are bound to a solid support during library creation; Particular methods of cleavage from the solid support
    • C40B50/18Solid phase synthesis, i.e. wherein one or more library building blocks are bound to a solid support during library creation; Particular methods of cleavage from the solid support using a particular method of attachment to the solid support
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B70/00Tags or labels specially adapted for combinatorial chemistry or libraries, e.g. fluorescent tags or bar codes
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B80/00Linkers or spacers specially adapted for combinatorial chemistry or libraries, e.g. traceless linkers or safety-catch linkers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

La presente invención se refiere a composiciones y métodos para mejorar la tasa de identificación correcta de muestras en preparaciones de bibliotecas de ácidos nucleicos indexados para secuenciación multiplex de próxima generación modificando o bloqueando los extremos 5' y 3' de polinucleótidos indexados agrupados de múltiples muestras, con una exonucleasa opcional. tratamiento, previo a la amplificación y secuenciación. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácido nucleico indexadas
Campo
La presente descripción se refiere, entre otras cosas, a la secuenciación de polinucleótidos de múltiples bibliotecas; y más especialmente a aumentar la probabilidad de que la secuenciación identifique adecuadamente la biblioteca a partir de la cual se originaron los polinucleótidos.
Antecedentes
Las mejoras en las metodologías de secuenciación han permitido la secuenciación de ácidos polinucleicos agrupados o multiplexados de diferentes bibliotecas en un único protocolo de secuenciación. Puede añadirse una secuencia específica de la biblioteca (una “ etiqueta de índice” ) a los ácidos polinucleicos de cada biblioteca de modo que pueda identificarse adecuadamente el origen de cada ácido polinucleico secuenciado. La secuencia de etiqueta de índice puede añadirse a los ácidos polinucleicos de una bibliotecapor ejemplo, ligando adaptadores que comprenden la secuencia de etiqueta de índice a los extremos de los ácidos polinucleicos.
Los adaptadores pueden contener secuencias adicionales a la secuencia de etiqueta de índice, tal como una secuencia de cebador de extensión universal y una secuencia de cebador de secuenciación universal. La secuencia del cebador de extensión universal puede, entre otras cosas, hibridar con un primer oligonucleótido unido a una superficie sólida. El primer oligonucleótido puede tener un extremo 3' libre desde el que una polimerasa puede añadir nucleótidos para extender la secuencia utilizando el polinucleótido de biblioteca hibridado como patrón (o plantilla), dando lugar a una cadena inversa del polinucleótido de biblioteca que está unido a la superficie sólida. Pueden unirse copias adicionales de cadenas directa e inversa a la superficie sólida a través de amplificación de clústeres. Un ejemplo de amplificación de clústeres es la amplificación puente en la que el extremo 3' de polinucleótidos previamente amplificados que se unen a la superficie sólida hibridan con segundos oligonucleótidos unidos a la superficie sólida. El segundo oligonucleótido puede tener un extremo 3' libre desde el cual una polimerasa puede añadir nucleótidos para extender la secuencia utilizando el polinucleótido de cadena inversa acoplado como patrón, dando lugar a una cadena directa del polinucleótido de biblioteca que se acopla a la superficie sólida mediante el segundo oligonucleótido. El proceso puede repetirse para producir clústeres de cadenas directas e inversas acopladas a la superficie sólida. Las cadenas directas o las cadenas inversas pueden retirarse, por ejemplo, mediante escisión, antes de la secuenciación.
Un cebador de secuenciación puede hibridar con una parte de una cadena de polinucleótidos acoplada al soporte sólido. Por ejemplo, el cebador de secuenciación puede hibridar con una secuencia cebadora de secuenciación universal, si está presente. La secuenciación puede producirse mediante múltiples rondas de adición de nucleótidos al cebador de secuenciación utilizando el polinucleótido acoplado como patrón y detectando la identidad de los nucleótidos añadidos. La hibridación del cebador de secuenciación puede producirse en un lugar en la cadena de polinucleótidos acoplada para permitir la identificación de secuencia de la secuencia de etiqueta de índice, así como en una secuencia diana del polinucleótido acoplada a la superficie sólida, o pueden emplearse cebadores de secuenciación distintos para secuenciar por separado la secuencia de etiqueta de índice y la secuencia diana. Por lo tanto, la secuencia diana puede indexarse a una biblioteca de origen particular basándose en la secuencia de etiqueta de índice asociada con la secuencia diana.
A pesar de la inclusión de una secuencia de etiqueta de índice específico de biblioteca a cada ácido polinucleico a secuenciar, pueden producirse errores en la identificación del origen de biblioteca de un ácido polinucleico secuenciado debido a un fenómeno conocido como salto de índice. El salto de índice se produce cuando las secuencias de etiquetas de índice de una biblioteca se añaden inadvertidamente a un ácido polinucleico de una biblioteca distinta. El salto de índice puede producirse durante la preparación de la biblioteca o la amplificación de clústeres de los polinucleótidos en una celda de flujo u otro soporte sólido adecuado para la secuenciación. El salto de índice puede alterar los resultados de la secuenciación, tal como dar lugar a una asignación incorrecta del origen de biblioteca de un polinucleótido secuenciado o descartar los resultados de secuenciación.
En WO2013177220A1 se describen métodos, composiciones y kits para métodos para su uso en análisis de ácido nucleico, para permitir una secuenciación dirigida, multiplexada y de alto rendimiento más fiable y precisa. Los métodos, composiciones y kits pueden utilizarse para secuenciar loci diana de ácido nucleico, marcado de biblioteca de secuenciación asistida de novo para secuenciación y separación en fases de novo.
El documento WO2015069374A1 se refiere a adaptadores de transposasa y usos de los mismos, que incluyen usos en la preparación de moléculas de ADN, amplificación in vitro, secuenciación de ácidos nucleicos y análisis de bibliotecas de ADN para secuencias de interés, así como provisión de ácido nucleico.
En Rahul Sinha Y COL., “ Index Switching Causes “ Spreading-Of-Signal” Among Multiplexed Samples In Illumina HiSeq 4000 DNA Sequencing” , bioRxiv, doi: 10.1101/125724, (20170409), se analiza la precisión de la identificación de la muestra y los problemas de identificación errónea de la muestra, especialmente al multiplexar las muestras.
En KIRCHER M Y COL., “ Double indexing overcomes inaccuracies in multiplex sequencing on the Illumina platform” , NUCLEIC ACIDS RESEARCH, OXFORD UNIVERSITY PRESS, GB, vol. 40, n.° 1, doi: 10.1093/ NAR/GKR771, ISSN 1362-4962, (20120101), páginas e3-1, (20111021), se explica la precisión de la identificación de la muestra y los problemas de la identificación errónea de la muestra, que abordaron utilizando doble indexación que, según hallaron, elimina estos problemas y aumenta tanto el ámbito como la precisión de la secuenciación multiplexada.
Breve resumen
Según la invención, se proporciona un polinucleótido preparado para la secuenciación, que comprende una secuencia adaptador-diana-adaptador, donde la secuencia del adaptador comprende una secuencia específica de la biblioteca, en donde el polinucleótido es de cadena doble en una región que comprende la diana y al menos una parte del adaptador en ambos extremos de la diana, y en donde los extremos 5' y 3' del polinucleótido en una región de la secuencia del adaptador son de cadena simple, donde los extremos 5' se modifican para impedir su digestión por una enzima que tiene actividad exonucleasa 5', y donde los extremos 3' se modifican para inhibir la digestión por parte de una enzima que tiene actividad exonucleasa 3', para inhibir la adición de nucleótidos al extremo 3' por parte de una enzima que tiene actividad polimerasa, o para inhibir la digestión por parte de una enzima que tiene actividad exonucleasa 3' y para inhibir la adición de nucleótidos al extremo 3' por una enzima que tiene actividad polimerasa.
La invención también proporciona un método que comprende secuenciar al menos una parte del polinucleótido mencionado anteriormente; y un método que comprende hibridar una parte de una de las regiones monocatenarias de la secuencia adaptadora del polinucleótido mencionado anteriormente con un oligonucleótido unido a una superficie, donde el oligonucleótido tiene un extremo 3' libre.
Otro aspecto de la invención proporciona una composición que comprende el polinucleótido mencionado anteriormente y un método que comprende incubar una exonucleasa con dicha composición.
En las reivindicaciones dependientes se exponen otras realizaciones de la invención.
El polinucleótido de la invención y preparado para la inmovilización para la secuenciación tiene una secuencia adaptador-diana-adaptador. La secuencia del adaptador comprende una secuencia específica de la biblioteca. El polinucleótido es bicatenario en una región que comprende la diana y al menos en una parte del adaptador en ambos extremos de la diana. Los extremos 5' y 3' del polinucleótido en una región de la secuencia del adaptador son monocatenarios. Los extremos 5' se modifican para impedir la digestión por una enzima que tiene actividad de exonucleasa 5'. Los extremos 3' se modifican para inhibir (i) inhibir la digestión mediante una enzima que tiene actividad exonucleasa 3', (ii) inhibir la adición de nucleótidos al extremo 3' por una enzima que tiene actividad polimerasa, o (iii) inhibir la digestión mediante una enzima que tiene actividad exonucleasa 3' e inhibir la adición de nucleótidos al extremo 3' mediante una enzima que tiene actividad polimerasa.
En algunas realizaciones, las composiciones comprenden el polinucleótido y una exonucleasa.
Los métodos, polinucleótidos y composiciones descritos en la presente memoria pueden ser útiles para mitigar el salto de índice, por ejemplo, mediante el bloqueo de extremos 3' de polinucleótidos, que incluyen adaptadores no incorporados, o la degradación de polinucleótidos no bloqueados, que incluyen adaptadores no incorporados, durante la preparación de la muestra de biblioteca. Al bloquear los extremos 3' de los adaptadores no incorporados, los adaptadores no incorporados no pueden extenderse durante la amplificación de clústeres si los adaptadores hibridan con una secuencia polinucleotídica adaptador-diana-adaptador durante la amplificación de clústeres. De forma adicional o alternativa, los polinucleótidos que no están bloqueados en el extremo 3' pueden ser degradados por una exonucleasa para mitigar el salto de índice.
Los métodos asociados también se describen en la presente memoria para ayudar a comprender la invención, pero estos no forman parte de la invención reivindicada. Los ejemplos o realizaciones descritos en la presente memoria que no están incluidos en la definición de las reivindicaciones no forman parte de la presente invención.
Breve descripción de los dibujos
La siguiente descripción detallada puede entenderse mejor cuando se lee junto con los siguientes dibujos.
La Figura 1 es un dibujo esquemático que ilustra un proceso para producir polinucleótidos patrón modificados en 5' y bloqueados en 3'.
La Figura 2 es un dibujo esquemático de una realización de un adaptador según diversos aspectos de la descripción presentada en la presente memoria.
La Figura 3 es un dibujo esquemático de una realización de un polinucleótido patrón que tiene una secuencia adaptador-diana-adaptador (que puede incluir un adaptador de forma general como se muestra en la Figura 2) según varios aspectos de la descripción presentada en la presente memoria.
La Figura 4 es un dibujo esquemático que ilustra un proceso para la amplificación de clústeres que emplea una realización de un polinucleótido patrón (que puede ser el polinucleótido patrón representado en la Figura 3) según varios aspectos de la descripción presentada en la presente memoria.
La Figura 5 es un dibujo esquemático que ilustra una realización de cómo el bloqueo de 3' permite mitigar el salto de índice.
La Figura 6 es un dibujo esquemático que ilustra cómo el tratamiento con exonucleasa permite mitigar el salto de índice según varias realizaciones descritas en la presente memoria.
Las Figuras 7A y 7B ilustran la naturaleza del fenómeno de salto de índice. La Figura 7A muestra cómo las lecturas de una muestra dada se desmultiplexan incorrectamente y se mezclan con una muestra distinta después de la desmultiplexación. La Figura 7B muestra el salto de índice en un sistema de índice dual, donde da lugar a combinaciones inesperadas de secuencias de etiqueta de índice.
Las Figuras 8A y 8B ilustran el enfoque general para medir la tasa de salto de índice en un sistema dado. La Figura 8A muestra una disposición ilustrativa de una placa adaptadora dual, en donde cada pocillo individual de una placa de 96 pocillos contiene un par único de secuencias de etiqueta de índice. La Figura 8B muestra una configuración experimental dirigida a medir la velocidad de salto de índice, donde solo se utilizan combinaciones únicas de etiqueta de índice doble.
Las Figuras 9A y 9B ilustran el efecto de los adaptadores no ligados sobre la tasa de salto de índice. La Figura 9A muestra un aumento de 6 veces en el salto de índice asociado a una adición de 50 % de adaptadores libres. La Figura 9B muestra un efecto aproximadamente lineal del adaptador ahorquillado libre sobre la tasa de salto de índice dentro del intervalo analizado.
La Figura 10 muestra el efecto de la exonucleasa combinada y el tratamiento de bloqueo en extremo 3' en las tasas de salto de índice en el flujo de trabajo de preparación de la biblioteca Illumina TruSeq® Nano (PCR), comparando el rendimiento de los adaptadores estándar y los adaptadores protegidos contra PCR según la presente invención.
Los dibujos esquemáticos no son necesariamente a escala. Números idénticos utilizados en las figuras se refieren a componentes, pasos, y similares, idénticos. Sin embargo, se entenderá que el uso de un número para referirse a un componente en una figura dada no pretende estar limitado al componente en otra figura etiquetada con el mismo número. Además, el uso de números distintos para referirse a componentes no pretende indicar que los distintos componentes numerados no puedan ser iguales o similares a otros componentes numerados.
Descripción detallada
Definiciones
Todos los términos científicos y técnicos utilizados en la presente memoria tienen los significados comúnmente utilizados en la técnica salvo que se indique lo contrario. Las definiciones proporcionadas en la presente memoria tienen por objeto facilitar la comprensión de determinados términos utilizados con frecuencia en la presente memoria y no pretenden limitar el ámbito de la presente descripción.
Como se utiliza en la presente memoria, las formas singulares “ un” , “ uno” , “ una” , “ el” y “ la” incluyen referentes plurales salvo que el contexto indique claramente lo contrario. Por lo tanto, por ejemplo, la referencia a una “ secuencia de etiqueta de índice” incluye ejemplos que tienen dos o más de tales “ secuencias de etiqueta de índice” salvo que el contexto indique claramente lo contrario.
Como se utiliza en esta memoria descriptiva y en las reivindicaciones adjuntas, el término “ o” se emplea de forma general en su sentido que incluye “ y/o” salvo que el contenido indique claramente lo contrario. El término “ y/o” significa uno o todos los elementos enumerados o una combinación de dos o más de los elementos enumerados. El uso de “ y/o” en algunos casos no implica que el uso de “ o” en otros casos puede no significar “ y/o” .
Como se utiliza en la presente memoria, “tienen” , “ tiene” , “ que tiene” , “ incluyen” , “ incluye” , “ que incluye” , “ comprenden” , “ comprende” , “ que comprende” o similares se utilizan en su sentido inclusivo abierto, y de forma general significan “ incluyen, aunque no de forma limitativa” , “ incluye, pero no se limita a” , o “ que incluye, aunque no de forma limitativa” .
“ Opcional” u “ opcionalmente” significa que el evento, circunstancia o componente descrito posteriormente puede producirse o no, y que la descripción incluye instancias en las que el evento, circunstancia o componente se produce e instancias en las que no se produce.
Las palabras “ preferido” y “ preferiblemente” se refieren a realizaciones de la descripción que pueden proporcionar determinados beneficios, en determinadas circunstancias. Sin embargo, también puede haber otras realizaciones preferidas, en las mismas o en distintas circunstancias. Además, la mención de una o más realizaciones preferidas no implica que otras realizaciones no sean útiles y no pretende excluir otras realizaciones del ámbito de la tecnología de la invención.
También en la presente memoria, las enumeraciones de intervalos numéricos mediante extremos incluyen todos los números comprendidos dentro de ese intervalo (por ejemplo, 1 a 5 incluye 1, 1,5, 2, 2,75, 3, 3,80, 4, 5, etc.). Cuando un intervalo de valores es “ mayor que” , “ menor que” , etc. un valor particular, ese valor está incluido dentro del intervalo.
Salvo que se indique expresamente lo contrario, de ningún modo se pretende que las etapas de los métodos establecidos en la presente memoria deban llevarse a cabo en un orden específico. Por lo tanto, cuando una reivindicación de método no menciona realmente un orden a seguir para sus etapas o no se indica específicamente de otro modo en las reivindicaciones o descripciones que las etapas se deben limitar a un orden específico, de ningún modo se inferirá un orden particular. Cualquier característica o aspecto único o múltiple mencionado en cualquier reivindicación puede combinarse o permutarse con cualquier otra característica o aspecto mencionado en cualquier otra reivindicación o reivindicaciones.
Si bien pueden describirse diversas características, elementos o etapas de realizaciones particulares utilizando la expresión de transición “ que comprende” , debe entenderse que están implícitas las realizaciones alternativas, incluidas las que pueden describirse utilizando las expresiones de transición “ que consiste” o “ que consiste esencialmente en” . Por lo tanto, por ejemplo, las realizaciones alternativas implícitas para un polinucleótido que comprende una secuencia adaptador-diana-adaptador incluyen realizaciones donde el polinucleótido consiste en la secuencia adaptador-diana-adaptador y en realizaciones donde el polinucleótido consiste esencialmente en la secuencia adaptador-diana-adaptador.
Como se utiliza en la presente memoria, “ proporcionar” en el contexto de un polinucleótido, composición o artículo significa fabricar el polinucleótido, composición o artículo, adquirir el polinucleótido, composición o artículo u obtener de cualquier otra forma el compuesto, composición o artículo.
Como se utiliza en la presente memoria, “ amplificar” , “ amplificando” o “ reacción de amplificación” y sus derivados, se refieren de forma general a cualquier acción o proceso mediante el cual al menos una parte de un polinucleótido (por ejemplo, polinucleótido patrón) se replica o copia a al menos un polinucleótido adicional. El polinucleótido adicional incluye opcionalmente una secuencia que es sustancialmente idéntica o sustancialmente complementaria a al menos alguna parte del polinucleótido patrón. El polinucleótido patrón puede ser monocatenario o bicatenario y el polinucleótido adicional puede ser independientemente monocatenario o bicatenario. La amplificación incluye opcionalmente la replicación lineal o exponencial de un polinucleótido. En algunas realizaciones, dicha amplificación puede hacerse utilizando condiciones isotérmicas; en otras realizaciones, dicha amplificación puede incluir termociclado. En algunas realizaciones, la amplificación es una amplificación multiplexada que incluye la amplificación simultánea de múltiples secuencias diana en una única reacción de amplificación. En algunas realizaciones, la “ amplificación” incluye la amplificación de al menos alguna parte de los ácidos nucleicos basados en ADN y ARN solos o en combinación. La reacción de amplificación puede incluir cualquiera de los procesos de amplificación conocidos por un experto en la técnica. En algunas realizaciones, la reacción de amplificación incluye la reacción en cadena de la polimerasa (PCR).
Como se utiliza en la presente memoria, el término “ polimerasa” pretende ser consistente con su uso en la técnica e incluye, por ejemplo, una enzima que produce una réplica complementaria de un polinucleótido utilizando el polinucleótido como una cadena patrón. De forma típica, las polimerasas de ADN se unen a la hebra patrón y luego se mueven hacia abajo de la cadena patrón añadiendo secuencialmente nucleótidos al grupo hidroxilo libre del extremo 3' de una cadena en crecimiento de ácido nucleico. Las ADN polimerasas sintetizan de forma típica moléculas de ADN complementarias a partir de patrones de ADN y las ARN polimerasas sintetizan de forma típica moléculas de ARN a partir de patrones de ADN (transcripción). Las polimerasas pueden utilizar una cadena corta de ARN o ADN, llamada cebador, para iniciar el crecimiento de la cadena. Algunas polimerasas pueden desplazar la cadena corriente arriba del sitio donde están añadiendo bases a una cadena. Se dice que dichas polimerasas desplazan la cadena, lo que significa que tienen una actividad que elimina una cadena complementaria de una cadena patrón que lee la polimerasa. Ejemplos de polimerasas que tienen actividad de desplazamiento de cadena incluyen, de modo no limitativo, el fragmento grande de polimerasa de Bst (Bacillus stearothermophilus), la polimerasa exo-Klenow o exo-polimerasa T7 de grado de secuenciación. Algunas polimerasas degradan la cadena delante de ellas, reemplazándola efectivamente por la cadena en crecimiento por detrás (actividad exonucleasa 5'). Algunas polimerasas tienen una actividad que degrada la cadena detrás de ellas (actividad exonucleasa 3'). Se han modificado algunas polimerasas útiles, ya sea por mutación o de otro modo, para reducir o eliminar la actividad exonucleasa 3' y/o 5'.
Como se define en la presente memoria, “ amplificación multiplexada” se refiere a la amplificación selectiva y no aleatoria de dos o más secuencias diana dentro de una muestra utilizando al menos un cebador específico de diana. En algunos casos, la amplificación multiplexada se realiza de forma que algunas o todas las secuencias diana se amplifiquen dentro de un único recipiente de reacción. El “ plexi” o “ plex” de una amplificación multiplexada dada se refiere generalmente al número de secuencias específicas de diana diferentes que se amplifican durante esa amplificación multiplexada individual. En algunos casos, el plexi puede ser aproximadamente 12-plex, 24-plex, 48-plex, 96-plex, 192-plex, 384-plex, 768-plex, 1536-plex, 3072-plex, 6144-plex o superior. También es posible detectar las secuencias diana amplificadas mediante varias metodologías distintas (por ejemplo, electroforesis en gel seguida de densitometría, cuantificación con un bioanalizador o PCR cuantitativa, hibridación con una sonda marcada; incorporación de cebadores biotinilados seguida de detección de conjugado de enzima y avidina; incorporación de deoxinucleótidos trifosfato marcados con 32P en la secuencia diana amplificada).
Como se utiliza en la presente memoria, el término “ cebador” y sus derivados se refieren de forma general a cualquier polinucleótido que pueda hibridar con una secuencia diana de interés. De forma típica, el cebador funciona como un sustrato sobre el cual los nucleótidos una polimerasa polimeriza los nucleótidos; el cebador puede incorporarse a la cadena de ácido nucleico sintetizado y proporcionar un sitio al que pueda hibridarse otro cebador para iniciar la síntesis de una nueva cadena que es complementaria a la molécula de ácido nucleico sintetizado. El cebador puede estar compuesto por cualquier combinación de nucleótidos o análogos de los mismos. En algunos casos, el cebador es un polinucleótido o oligonucleótido monocatenario. Los términos “ polinucleótido” y “ oligonucleótido” se utilizan indistintamente en la presente memoria en referencia a una forma polimérica de nucleótidos de cualquier longitud, y pueden comprender ribonucleótidos, desoxirribonucleótidos, análogos de los mismos o mezclas de los mismos. Este término se refiere únicamente a la estructura primaria de la molécula. Por lo tanto, el término incluye ácido desoxirribonucleico de cadena triple, doble y simple (“ADN” ), así como ácido ribonucleico de cadena triple, doble y simple (“ARN” ). Como se utiliza en la presente memoria, “ secuencias diana amplificadas” y sus derivados se refiere de forma general a una secuencia de polinucleótidos producida mediante la amplificación de las secuencias diana utilizando cebadores específicos de diana y los métodos proporcionados en la presente memoria. Las secuencias diana amplificadas pueden ser del mismo sentido (es decir, la cadena positiva) o antisentido (es decir, la cadena negativa) con respecto a las secuencias diana.
Como se utiliza en la presente memoria, los términos “ ligar” , “ ligación” y sus derivados se refieren de forma general al proceso para unir covalentemente dos o más moléculas entre sí, por ejemplo, unir covalentemente dos o más polinucleótidos entre sí. En algunos casos, la ligación incluye unir mellas (nicks) entre nucleótidos adyacentes de polinucleótidos. En otros, la ligación incluye formar un enlace covalente entre un extremo de un primer y un extremo de un segundo polinucleótido. La ligación puede incluir formar un enlace covalente entre un grupo fosfato 5' de un ácido nucleico y un grupo hidroxilo 3' de un segundo ácido nucleico formando de este modo un polinucleótido ligado. De forma general, a los efectos de la presente descripción, una secuencia diana amplificada puede ligarse a un adaptador para generar una secuencia diana amplificada ligada al adaptador.
Como se utiliza en la presente memoria, “ ligasa” y sus derivados, se refiere de forma general a cualquier agente capaz de catalizar la ligación de dos moléculas de sustrato. En algunos casos, la ligasa incluye una enzima capaz de catalizar la unión de mellas entre nucleótidos adyacentes de un ácido nucleico. En otros, la ligasa incluye una enzima capaz de catalizar la formación de un enlace covalente entre un fosfato 5' de una molécula de ácido nucleico y un hidroxilo 3' de otra molécula de ácido nucleico, formando de este modo una molécula de ácido nucleico ligada. Ligasas adecuadas pueden incluir ligasa de ADN de T4, ligasa de ARN de T4 y ligasa de ADN de E. coli.
Como se utiliza en la presente memoria, “ condiciones de ligación” y sus derivados, se refiere de forma general a condiciones adecuadas para ligar dos moléculas entre sí. Las condiciones de ligación son adecuadas para sellar mellas o huecos entre ácidos nucleicos. Como se utiliza en la presente memoria, el término mella o hueco es consistente con el uso del término en la técnica. De forma típica, una mella o hueco pueden ligarse en presencia de una enzima, tal como ligasa, a una temperatura y pH adecuados. Por ejemplo, la ligasa de ADN de T4 puede unirse a una mella entre ácidos nucleicos a una temperatura de aproximadamente 70-72 °C.
Como se utiliza en la presente memoria, el término “ secuencia universal” se refiere a una región de secuencia que es común a dos o más moléculas de ácido nucleico donde las moléculas también tienen regiones de secuencia que difieren entre sí. Una secuencia universal que está presente en diferentes elementos de una colección de moléculas puede permitir la captura de múltiples ácidos nucleicos distintos utilizando una población de ácidos nucleicos de captura universal que sean complementarios a la secuencia universal. De forma similar, una secuencia universal presente en distintos elementos de una colección de moléculas puede permitir la replicación o amplificación de múltiples ácidos nucleicos distintos utilizando una población de cebadores universales que sean complementarios a la secuencia universal. Por lo tanto, un polinucleótido de captura universal o un cebador universal incluye una secuencia que puede hibridar específicamente con una secuencia universal. Los polinucleótidos pueden modificarse para unir adaptadores universales, por ejemplo, en uno o ambos extremos de las distintas secuencias.
Salto de índice
La presente descripción se refiere, entre otras cosas, a la secuenciación de ácidos nucleicos de múltiples bibliotecas indexadas; y, más especialmente, a aumentar la probabilidad de que la secuenciación identifique adecuadamente la biblioteca de la que se originaron los ácidos nucleicos.
Cuando los polinucleótidos de diferentes bibliotecas se agrupan o multiplexan para la secuenciación, los polinucleótidos de cada biblioteca pueden modificarse para incluir una secuencia de etiqueta de índice específica de biblioteca. Durante la secuenciación, la etiqueta de índice se secuencia junto con secuencias de polinucleótidos diana de las bibliotecas. Por lo tanto, la secuencia de etiqueta de índice puede asociarse a la secuencia de polinucleótidos diana de modo que pueda identificarse la biblioteca de la que se originó la secuencia diana.
Sin embargo, puede producirse un fenómeno denominado salto de índice en un pequeño porcentaje de resultados de secuencia (de forma típica 0,5 % a 2 %). El salto de índice se refiere a una secuencia de etiqueta de índice de una biblioteca que se asocia al polinucleótido diana de otra biblioteca (véanse las Figuras 7A y 7B). Si bien los mecanismos mediante los cuales se puede producir el salto de índice no se comprenden completamente, la tasa de salto de índice puede reducirse de forma efectiva al bloquear el extremo 3' de adaptadores no incorporados después de la unión de los adaptadores a los polinucleótidos diana de una biblioteca para, entre otras cosas, unir la secuencia de etiqueta de índice al polinucleótido.
Preparación inicial de muestra de biblioteca
Las bibliotecas que comprenden polinucleótidos pueden prepararse de cualquier forma adecuada para unir adaptadores de oligonucleótidos a polinucleótidos diana. Como se utiliza en la presente memoria, una “ biblioteca” es una población de polinucleótidos de una fuente o muestra dada. Una biblioteca comprende múltiples polinucleótidos diana. Como se utiliza en la presente memoria, un “ polinucleótido diana” es un polinucleótido que se desea secuenciar. El polinucleótido diana puede ser esencialmente cualquier polinucleótido de secuencia conocida o desconocida. Puede ser, por ejemplo, un fragmento de ADN genómico o ADNc. La secuenciación puede dar lugar a la determinación de la secuencia de la totalidad o parte de los polinucleótidos diana. Los polinucleótidos diana pueden derivarse de una muestra de polinucleótido primario que se ha fragmentado aleatoriamente. Los polinucleótidos diana pueden procesarse en patrones adecuados para la amplificación situando secuencias cebadoras universales en los extremos de cada fragmento diana. Los polinucleótidos diana también pueden obtenerse a partir de una muestra de ARN primario mediante transcripción inversa a ADNc.
Los términos “ polinucleótido” y “ oligonucleótido” se utilizan indistintamente en la presente memoria en referencia a una forma polimérica de nucleótidos de cualquier longitud, y pueden comprender ribonucleótidos, desoxirribonucleótidos, análogos de los mismos o mezclas de los mismos. Este término se refiere únicamente a la estructura primaria de la molécula. Por lo tanto, el término incluye ácido desoxirribonucleico de cadena triple, doble y simple (“ADN” ), así como ácido ribonucleico de cadena triple, doble y simple (“ARN” ). Los términos polinucleótido y oligonucleótido utilizados en la presente memoria también comprenden ADNc, que es ADN complementario o de copia producido a partir de un patrón de ARN, por ejemplo, mediante la acción de la transcriptasa inversa.
Las moléculas de polinucleótidos primarios pueden originarse en forma de ADN de cadena doble (ADNcd) (por ejemplo, fragmentos de ADN genómico, PCR y productos de amplificación y similares) o pueden haberse originado en forma de cadena simple, como ADN o ARN, y haberse convertido a ADNcd. A modo de ejemplo, las moléculas de ARNm pueden copiarse a ADNc de cadena doble utilizando técnicas estándar bien conocidas en la técnica. La secuencia precisa de polinucleótidos primarios generalmente no es decisiva para la descripción presentada en la presente memoria y puede ser conocida o desconocida.
En algunas realizaciones, los polinucleótidos diana primarios son moléculas de ARN. En un aspecto de dichas realizaciones, el ARN aislado de muestras específicas se convierte primero en ADN de cadena doble utilizando técnicas conocidas en la técnica. El ADN de cadena doble puede marcarse con una etiqueta de índice a continuación con un marcador específico de la biblioteca. Pueden generarse diferentes preparaciones de dicho ADN de cadena doble que comprenden etiquetas de índice específicos de biblioteca, en paralelo, de ARN aislado de diferentes fuentes o muestras. Posteriormente, pueden mezclarse distintas preparaciones de ADN de cadena doble que comprendan distintas etiquetas de índice específicas de la biblioteca, secuenciarse en masa y determinarse la identidad de cada fragmento secuenciado con respecto a la biblioteca de la que se aisló gracias a la presencia de una secuencia de etiqueta de índice específica de la biblioteca.
En algunas realizaciones, los polinucleótidos diana primarios son moléculas de ADN. Por ejemplo, los polinucleótidos primarios pueden representar el complemento genético completo de un organismo, y son moléculas de ADN genómico, tales como moléculas de ADN humano, que incluyen secuencias de intrones y exones (secuencia codificante), así como secuencias reguladoras no codificantes tales como secuencias promotoras y potenciadoras. No obstante podría contemplarse también el uso de subconjuntos particulares de secuencias de polinucleótidos o ADN genómico, tales como, por ejemplo, cromosomas particulares o una parte de estos. En muchas realizaciones, la secuencia de los polinucleótidos primarios no es conocida. Los polinucleótidos diana de ADN pueden tratarse química o enzimáticamente ya sea antes o después de un proceso de fragmentación, tal como un proceso de fragmentación aleatorio, y antes, durante o después de la ligación de los oligonucleótidos adaptadores.
Preferiblemente, los polinucleótidos diana primarios se fragmentan a longitudes apropiadas adecuadas para la secuenciación. Los polinucleótidos diana pueden fragmentarse de cualquier forma adecuada. Preferiblemente, los polinucleótidos diana son fragmentados aleatoriamente. La fragmentación aleatoria se refiere a la fragmentación de un polinucleótido de una forma no ordenada mediante, por ejemplo, medios enzimáticos, químicos o mecánicos. Dichos métodos de fragmentación se conocen en la técnica y utilizan métodos estándar (Sambrook y Russell, Molecular Cloning, A Laboratory Manual, tercera edición). Para mayor claridad, generar fragmentos más pequeños de una pieza más grande de polinucleótido mediante amplificación por PCR específica de dichos fragmentos más pequeños no es equivalente a fragmentar la parte más grande de polinucleótido porque la parte más grande de polinucleótido permanece intacta (es decir, no está fragmentada por la amplificación de PCR). Además, la fragmentación aleatoria está diseñada para producir fragmentos independientemente de la identidad de secuencia o posición de los nucleótidos que comprenden y/o rodean la ruptura.
La fragmentación aleatoria es por medios mecánicos tales como nebulización o sonicación para producir fragmentos de aproximadamente 50 pares de bases de longitud a aproximadamente 1500 pares de bases de longitud, tal como de 50-700 pares de bases de longitud o de 50-500 pares de bases de longitud.
La fragmentación de moléculas de polinucleótidos por medios mecánicos (nebulización, sonicación y cizallamiento hidráulico, por ejemplo) puede dar lugar a fragmentos con una mezcla heterogénea de extremos romos y de extremos protuberantes 3' y 5'. Los extremos del fragmento pueden repararse utilizando métodos o kits (tales como el kit de reparación de extremos del terminador de ADN de Lucigen) conocidos en la técnica para generar extremos que sean óptimos para la inserción, por ejemplo, en sitios romos de vectores de clonación. En algunas realizaciones, los extremos de fragmento de la población de ácidos nucleicos son extremos romos. Los extremos del fragmento pueden ser romos y fosforilados. El resto fosfato puede introducirse mediante tratamiento enzimático, por ejemplo, utilizando polinucleótido quinasa.
Las secuencias de polinucleótidos diana se preparan con nucleótidos protuberantes individuales mediante, por ejemplo, la actividad de determinados tipos de polimerasa de ADN tal como la polimerasa Taq o la polimerasa Klenow exo que tiene una actividad transferasa terminal no dependiente de patrón que añade un único deoxinucleótido, por ejemplo, deoxiadenosina (A) a los extremos 3' de, por ejemplo, productos de PCR. Dichas enzimas pueden utilizarse para añadir un único nucleótido «A» al extremo romo 3' terminal de cada cadena de los dúplex de polinucleótidos diana. Por lo tanto, podría añadirse una «A» al extremo 3' de cada cadena dúplex reparada de extremo del dúplex de polinucleótido diana mediante reacción con Taq o polimerasa Klenow exo, mientras que la construcción de polinucleótido adaptador podría ser una construcción T con un saliente «T» compatible presente en el extremo 3' de cada región dúplex de la construcción adaptadora. Esta modificación final también evita la auto-ligación de los polinucleótidos diana de modo que hay una tendencia a la formación de los polinucleótidos diana-adaptador ligados combinados.
La fragmentación se logra a través de la tagmentación como se describe, por ejemplo, en la publicación de solicitud de patente internacional WO 2016/130704. En dichos métodos, se emplean transposasas para fragmentar un polinucleótido de cadena doble y unir una secuencia cebadora universal en una cadena del polinucleótido de cadena doble. La molécula resultante puede tener las mellas rellenadas y sujeta a extensión, por ejemplo, mediante amplificación por PCR, utilizando cebadores que comprenden un extremo 3' que hibrida con la secuencia cebadora universal unida y un extremo 5' que contiene otras secuencias de un adaptador, o utilizando cebadores que comprenden un extremo 3' que hibrida con un complemento de la secuencia cebadora universal unida y un extremo 5' que contiene otras secuencias de un adaptador.
Los adaptadores o partes de los adaptadores pueden estar unidos al polinucleótido diana de cualquier otra forma adecuada. Los adaptadores se introducen en un proceso multietapa, tal como un proceso de dos etapas, que implica la ligación de una parte del adaptador al polinucleótido diana que tiene una secuencia cebadora universal. La segunda etapa comprende la extensión, por ejemplo, mediante amplificación de PCR, utilizando cebadores que comprenden un extremo 3' que hibrida con la secuencia cebadora universal unida (o que hibrida con un complemento de la secuencia cebadora universal) y un extremo 5' que contiene otras secuencias de un adaptador. A modo de ejemplo, dicha extensión puede hacerse como se describe en la patente US 8.053.192. Pueden llevarse a cabo extensiones adicionales para proporcionar secuencias adicionales al extremo 5' del polinucleótido resultante previamente extendido.
En algunos casos, todo el adaptador está ligado al polinucleótido diana fragmentado. El adaptador ligado comprende una región bicatenaria que está ligada a un polinucleótido diana bicatenario. Preferiblemente, la región bicatenaria es lo más corta posible sin pérdida de función. En este contexto, “ función” se refiere a la capacidad de la región bicatenaria para formar un dúplex estable en condiciones normales de reacción. Las condiciones normales de las reacciones se refieren a las condiciones de reacción para una reacción de ligación de polinucleótidos catalizada por enzimas, que será bien conocida por el lector experto (por ejemplo, incubación a una temperatura en el intervalo de 4 °C a 25 °C en un tampón de ligación apropiado para la enzima), de modo que las dos cadenas que forman el adaptador permanezcan parcialmente apareadas durante la ligación del adaptador a una molécula diana. Los métodos de ligación son conocidos en la técnica y pueden utilizar métodos estándar (Sambrook y Russell, Molecular Cloning, A Laboratory Manual, tercera edición). Dichos métodos utilizan enzimas ligasa tales como ligasa de ADN para efectuar o catalizar la unión de los extremos de las dos cadenas de polinucleótidos de, en este caso, el oligonucleótido dúplex adaptador y los dúplex de polinucleótidos diana, de modo que se formen enlaces covalentes. El oligonucleótido dúplex adaptador puede contener un resto fosfato en el extremo 5' para facilitar la ligación a un grupo OH 3' de un polinucleótido diana. El polinucleótido diana puede contener un resto fosfato 5', ya sea residual del proceso de cizallamiento, o añadido utilizando una etapa de tratamiento enzimático, y que ha experimentado reparación de extremo, y opcionalmente ampliarse mediante una base o bases sobresalientes, para dar un grupo OH 3' adecuado para la ligación. En este contexto, la unión significa una unión covalente de cadenas de polinucleótidos que no estaban previamente unidas covalentemente. Dicha unión se lleva a cabo mediante la formación de un enlace fosfodiéster entre las dos cadenas de polinucleótidos, pero pueden utilizarse otros medios de enlace covalente (por ejemplo, enlaces de estructura principal no fosfodiéster). La unión de adaptadores a polinucleótidos diana se describe con más detalle, por ejemplo, en US 8.053.192.
Tanto si la totalidad del adaptador como si una parte del adaptador están unidos al fragmento diana bicatenario, el adaptador o su parte comprende una región bicatenaria y una región que comprende dos cadenas individuales no complementarias. La región bicatenaria del adaptador puede ser de cualquier número adecuado de pares de bases. Preferiblemente, la región bicatenaria es una región bicatenaria corta, que de forma típica comprende 5 o más pares de bases consecutivos, formados por el apareamiento de dos cadenas de polinucleótidos parcialmente complementarias. Esta “ región bicatenaria” del adaptador se refiere a una región en la que las dos cadenas se aparean y no implican ninguna conformación estructural particular. En algunos casos, la región bicatenaria comprende 20 o menos pares de bases consecutivos, tal como 10 o menos o 5 o menos pares de bases consecutivos.
La estabilidad de la región bicatenaria puede aumentarse y, por lo tanto, su longitud verse potencialmente reducida, por la inclusión de nucleótidos no naturales que muestran apareamiento de bases más fuerte que los pares de bases estándar de Watson-Crick. Preferiblemente, las dos cadenas del adaptador son 100 % complementarias en la región bicatenaria.
Cuando el adaptador está unido al polinucleótido diana, la región monocatenaria no complementaria puede formar los extremos 5' y 3' del polinucleótido a secuenciar. El término “ región monocatenaria no complementaria” se refiere a una región del adaptador donde las secuencias de las dos cadenas de polinucleótidos que forman el adaptador presentan un grado de no complementariedad tal que las dos cadenas no son capaces de un apareamiento completo entre sí en condiciones de apareamiento estándar para una reacción de PCR.
La región monocatenaria no complementaria es proporcionada por diferentes partes de las mismas dos cadenas de polinucleótidos que forman la región bicatenaria. El límite inferior de la longitud de la parte monocatenaria se determinará de forma típica en función de, por ejemplo, proporcionar una secuencia adecuada para la unión de un cebador para la extensión del cebador, PCR y/o secuenciación. Teóricamente, no hay ningún límite superior en la longitud de la región no coincidente, excepto que, en general, es ventajoso minimizar la longitud total del adaptador, por ejemplo, para facilitar la separación de los adaptadores no unidos de las construcciones adaptador-diana después de la etapa o etapas de unión. Por lo tanto, de forma general se prefiere que la región monocatenaria no complementaria del adaptador tenga una longitud de 50 o menos nucleótidos consecutivos, tal como una longitud de 40 o menos, 30 o menos, o 25 o menos nucleótidos consecutivos.
Después de la unión de los adaptadores o partes de los adaptadores a los polinucleótidos diana, los polinucleótidos resultantes pueden someterse a un proceso de limpieza para mejorar la pureza de los polinucleótidos adaptadordiana-adaptador eliminando al menos una parte de los adaptadores no incorporados. Puede utilizarse cualquier proceso de limpieza adecuado, tal como electroforesis o cromatografía de exclusión por tamaño. Pueden emplearse perlas paramagnéticas de inmovilización inversa de fase sólida (SPRI) para separar los polinucleótidos adaptadordiana-adaptador de los adaptadores no unidos. Si bien dichos procesos permiten mejorar la pureza de los polinucleótidos adaptador-diana-adaptador resultantes, es probable que sigan quedando algunos oligonucleótidos adaptadores no unidos.
Como se utiliza en la presente memoria, “ unido” o “ ligado” se utilizan indistintamente en el contexto de un adaptador con respecto a una secuencia diana. Como se ha descrito anteriormente, puede utilizarse cualquier proceso adecuado para unir un adaptador a un polinucleótido diana. Por ejemplo, el adaptador puede unirse a la diana mediante ligación con una ligasa; mediante una combinación de ligación de una parte de un adaptador y adición de partes adicionales o restantes del adaptador mediante extensión, tal como PCR, con cebadores que contienen las partes adicionales o restantes de los adaptadores; mediante transposición para incorporar una parte de un adaptador y adición de partes adicionales o restantes del adaptador a través de extensión, tal como PCR, o con cebadores que contienen las partes adicionales o restantes de los adaptadores. Preferiblemente, el oligonucleótido adaptador unido se une de forma covalente al polinucleótido diana.
Amplificación
El polinucleótido resultante de la unión del adaptador o parte del adaptador a la diana de doble cadena se somete a continuación a amplificación con cebadores que tienen extremos 5' modificados para impedir la digestión por una enzima que tiene actividad de exonucleasa 5'.
Los extremos 5' de los cebadores pueden modificarse de cualquier forma adecuada para impedir la digestión por una enzima que tenga actividad exonucleasa 5'. A los efectos de la presente descripción, una modificación que “ impide” la digestión por una exonucleasa inhibe la actividad de la exonucleasa con respecto a su acción en un extremo no modificado. Preferiblemente, una modificación que impide la digestión de la exonucleasa elimina la capacidad de la exonucleasa de digerir la cadena de polinucleótidos. En algunos casos, los extremos 5' de los cebadores comprenden un enlace fosforotioato. Preferiblemente, los enlaces entre los tres nucleótidos terminales de los extremos 5' de los cebadores comprenden enlaces fosforotioato. A los efectos de la presente descripción, un extremo de un polinucleótido cuyos enlaces entre los tres nucleótidos terminales comprenden enlaces fosforotioato puede denominarse extremo que comprende tres enlaces fosforotioato. Los enlaces de fosforotioato pueden introducirse en un extremo 5' de un polinucleótido de cualquier forma adecuada, como es bien conocido en la técnica. Pueden adquirirse oligonucleótidos que comprenden enlaces fosforotioato terminales de varios proveedores comerciales que incluyen, por ejemplo, Integrated DNA Technologies y Sigma-Aldrich.
Si el adaptador unido a la diana antes de la amplificación es solo una parte del adaptador, el resto del adaptador puede ser proporcionado por los extremos 5' de los cebadores.
En cualquier caso, un primer oligonucleótido cebador para amplificación que tiene un extremo 5' modificado está configurado para hibridar con una parte del adaptador o parte del adaptador cercana a un extremo 3' de una cadena del adaptador o parte. Un segundo oligonucleótido cebador para amplificación que tiene un extremo 5' modificado está configurado para hibridar con un complemento de una parte del adaptador o parte del adaptador cerca de un extremo 3' de una cadena del complemento del adaptador o parte. Un complemento del adaptador puede ser el resultado de la extensión del primer cebador utilizando el adaptador-diana-adaptador como patrón. Una vez formado el complemento, el segundo adaptador puede hibridar con el complemento.
El primer y segundo cebadores pueden incubarse con el polinucleótido que resulta de unir el adaptador o parte del adaptador a la diana bicatenaria (un polinucleótido “ adaptador-diana-adaptador” ) en condiciones adecuadas para amplificar los polinucleótidos adaptador-diana-adaptador para producir polinucleótidos que tengan una secuencia adaptador amplificado-diana-adaptador amplificado con extremos 5' modificados. Si los polinucleótidos adaptadordiana-adaptador comprenden todo el adaptador, los polinucleótidos adaptador-diana-adaptador pueden tener la misma secuencia que la secuencia adaptador amplificado-diana-adaptador amplificado. Si los polinucleótidos adaptador-diana-adaptador contienen solo una parte del adaptador, la secuencia de adaptador amplificado-dianaadaptador amplificado tendrá nucleótidos adicionales en los extremos de cadena simple de la secuencia de adaptador amplificado debido a la adición de la parte restante de la secuencia de adaptador de los cebadores.
Como se utiliza en la presente memoria, “ condiciones adecuadas para la amplificación” y sus derivados, se refiere de forma general a condiciones adecuadas para amplificar una o más secuencias de polinucleótidos. Dicha amplificación puede ser lineal o exponencial. Las condiciones de amplificación pueden incluir condiciones isotérmicas o de forma alternativa pueden incluir condiciones de termociclado, o una combinación de condiciones isotérmicas y de termociclado. Las condiciones adecuadas para amplificar una o más secuencias de polinucleótidos incluyen condiciones de reacción en cadena de la polimerasa (PCR). De forma típica, las condiciones de amplificación se refieren a una mezcla de reacción que es suficiente para amplificar polinucleótidos tales como una o más secuencias diana, o para amplificar una secuencia diana amplificada ligada a uno o más adaptadores, por ejemplo, una secuencia diana amplificada ligada a adaptador. De forma general, las condiciones de amplificación incluyen un catalizador para la amplificación o para la síntesis de polinucleótidos, por ejemplo, una polimerasa; un cebador que posea cierto grado de complementariedad con el ácido nucleico a amplificar; y nucleótidos, tales como desoxirribonucleótido trifosfatos (dNTP) para promover la extensión del cebador una vez hibridado con el ácido nucleico. Las condiciones de amplificación pueden requerir apareamiento o hibridación de un cebador con un ácido nucleico, extensión del cebador y una etapa desnaturalizante en la que el cebador extendido se separa de la secuencia polinucleotídica sujeta a amplificación. De forma típica, pero no necesariamente, las condiciones de amplificación pueden incluir termociclado; en algunos casos, las condiciones de amplificación incluyen una pluralidad de ciclos donde se repiten las etapas de apareamiento, extensión y separación. De forma típica, las condiciones de amplificación incluyen cationes tales como Mg++ o Mn++ y también pueden incluir varios modificadores de la fuerza iónica.
Como se utiliza en la presente memoria, el término “ reacción en cadena de la polimerasa” (“ PCR” ) se refiere al método de las patentes de K. B. Mullis US 4.683.195 y US 4.683.202, que describen un método para aumentar la concentración de un segmento de un polinucleótido de interés en una mezcla de ADN genómico sin clonación o purificación. Este proceso para amplificar el polinucleótido de interés consiste en introducir un gran exceso de dos cebadores de oligonucleótidos a la mezcla de ADN que contiene el polinucleótido de interés deseado, seguido de una serie de ciclos térmicos en presencia de una polimerasa de ADN. Los dos cebadores son complementarios a sus respectivas cadenas del polinucleótido de doble cadena de interés. La mezcla se desnaturaliza a una temperatura más alta primero y los cebadores se aparean a continuación con secuencias complementarias dentro de la molécula de polinucleótido de interés. Después del apareamiento, los cebadores se extienden con una polimerasa para formar un nuevo par de cadenas complementarias. Las etapas de desnaturalización, apareamiento de cebadores y extensión de polimerasa pueden repetirse muchas veces (en un proceso denominado termociclado) para obtener una alta concentración de un segmento amplificado del polinucleótido deseado de interés. La longitud del segmento amplificado del polinucleótido de interés deseado (amplicón) viene determinada por las posiciones relativas de los cebadores entre sí y, por lo tanto, esta longitud es un parámetro controlable. Debido a que el proceso se repite, el método se denomina “ reacción en cadena de la polimerasa” (a continuación en la memoria “ PCR” ). Debido a que los segmentos amplificados deseados del polinucleótido de interés se convierten en las secuencias de ácido nucleico predominantes (en términos de concentración) en la mezcla, se dice que son “ amplificadas por PCR” . En una modificación del método descrito anteriormente, los polinucleótidos pueden amplificarse por PCR utilizando múltiples pares de cebadores diferentes, en algunos casos, uno o más pares de cebadores por polinucleótido de interés, formando de este modo una reacción de PCR múltiple.
La amplificación de los polinucleótidos adaptador-diana-adaptador con los cebadores modificados en 5' da lugar a un polinucleótido que tiene secuencias adaptador amplificado-diana-adaptador amplificado con extremos 5' modificados.
El adaptador amplificado resultante incluye una secuencia de etiquetas de índice específica de la biblioteca. Por lo tanto, la etiqueta de índice no está formada en sí misma por parte del polinucleótido diana, sino que se convierte en parte del patrón para la amplificación sobre una superficie sólida para la secuenciación.
Preferiblemente, la secuencia de etiqueta de índice tiene una longitud de 20 nucleótidos o menos. Por ejemplo, la secuencia de etiqueta de índice puede tener una longitud de 1-10 nucleótidos o 4-6 nucleótidos. Una etiqueta de índice de cuatro nucleótidos brinda la posibilidad de multiplexar 256 muestras en la misma matriz, una etiqueta de índice de seis bases permite procesar 4096 muestras en la misma matriz.
Los adaptadores amplificados pueden contener más de una etiqueta de índice para poder aumentar las posibilidades de multiplexación.
La secuencia de etiqueta de índice específica de biblioteca puede estar situada en una región monocatenaria, de cadena doble, o abarcar las regiones monocatenarias y de cadena doble del adaptador. Preferiblemente, la secuencia de etiqueta de índice se encuentra en una región monocatenaria del adaptador.
La secuencia de etiqueta de índice específico de biblioteca puede incluirse en uno o ambos de los cebadores modificados en 5' o puede incluirse en una parte del adaptador que se une al fragmento de patrón. Si la secuencia de etiqueta de índice específica de la biblioteca no está incluida en los cebadores, sino que está incluida en la parte del adaptador que está unida al fragmento de patrón (y los cebadores añaden la parte restante del adaptador), los polinucleótidos adaptador-diana-adaptador de diferentes bibliotecas pueden agruparse para realizar la amplificación a los polinucleótidos adaptador amplificado-diana-adaptador amplificado. Si los cebadores incluyen la secuencia de etiqueta de índice específico de biblioteca, cada biblioteca debe amplificarse por separado antes de la agrupación.
En cualquier caso, los adaptadores amplificados pueden incluir cualquier otra secuencia adecuada además de la secuencia de etiqueta de índice. Por ejemplo, los adaptadores amplificados pueden comprender secuencias cebadoras de extensión universal situadas de forma típica en el extremo 5' o 3' del adaptador amplificado y el polinucleótido patrón resultante para la secuenciación. Las secuencias cebadoras de extensión universal pueden hibridar con cebadores complementarios unidos a una superficie de un sustrato sólido. Los cebadores complementarios comprenden un extremo 3' libre desde el cual una polimerasa u otra enzima adecuada puede añadir nucleótidos para extender la secuencia utilizando el polinucleótido de biblioteca hibridado como patrón, dando lugar a una cadena inversa del polinucleótido de biblioteca que se acopla a la superficie sólida. Dicha extensión puede ser parte de una tanda de secuenciación o amplificación de clústeres.
En algunos casos, los adaptadores amplificados comprenden una o más secuencias cebadoras de secuenciación universales. Las secuencias cebadoras de secuenciación universal pueden unirse a cebadores de secuenciación para permitir la secuenciación de una secuencia de etiqueta de índice, una secuencia diana o una secuencia de etiqueta de índice y una secuencia diana.
La secuencia precisa de nucleótidos de los adaptadores amplificados no es de forma general determinante para la invención y puede ser seleccionada por el usuario de modo que los elementos de secuencia deseados se incluyan en última instancia en las secuencias comunes de la biblioteca de patrones derivadas de los adaptadores amplificados para, por ejemplo, proporcionar sitios de unión para conjuntos particulares de cebadores de extensión universal y/o cebadores de secuenciación.
Se entenderá que una “ secuencia adaptador-diana-adaptador” o sus equivalentes se refiere a la orientación de los adaptadores entre sí y con respecto a la diana, y no significa necesariamente que la secuencia pueda no incluir secuencias adicionales, tales como secuencias de unión, por ejemplo.
Otras bibliotecas pueden prepararse de forma similar, incluyendo cada una al menos una secuencia de etiqueta de índice específica de la biblioteca o combinaciones de secuencias de etiqueta de índice distintas a una secuencia de etiqueta de índice o combinación de secuencias de etiqueta de índice de las otras bibliotecas.
Puede hacerse un proceso de limpieza, como se ha descrito anteriormente, en los polinucleótidos de patrón resultantes que tengan las secuencias de adaptador amplificado-patrón-adaptador amplificado.
Los polinucleótidos adaptador-diana-adaptador resultantes, estén o no sometidos primero a una limpieza, junto con los oligonucleótidos cebadores no incorporados o especies de polinucleótidos restantes que pueda haber, están sujetos a bloqueo de 3'.
Bloqueo de 3'
El bloqueo de 3' puede hacerse en cada biblioteca por separado o en bibliotecas combinadas. Preferiblemente, el bloqueo de 3' se lleva a cabo en bibliotecas combinadas.
Con bloqueo de 3' quiere decirse que los polinucleótidos se modifican para impedir la incorporación de nucleótidos en el extremo 3' para extender el polinucleótido desde el extremo 3' o para impedir la digestión por una enzima que tenga actividad exonucleasa 3'. Preferiblemente, los extremos 3' se bloquean para impedir la incorporación de nucleótidos en el extremo 3' para extender el polinucleótido desde el extremo 3'. Más preferiblemente, los extremos 3' se bloquean para impedir la incorporación de nucleótidos en el extremo 3' para extender el polinucleótido desde el extremo 3' y para impedir la digestión por una enzima que tiene actividad exonucleasa 3'.
En algunas realizaciones, el grupo de bloqueo en 3'-OH puede ser eliminable, de modo que el átomo de carbono 3' lleva unido un grupo de la estructura -O -Z , donde Z es cualquiera de -C(R')2-O - R” , -C(R ')2-N (R ” )2, -C(R')2-N(H)R” , -C(R ')2-S -R ” y -C(R')2-F, donde cada R” es, o forma parte de, un grupo protector eliminable; cada R' es independientemente un átomo de hidrógeno, un grupo alquilo, alquilo sustituido, arilalquilo, alquenilo, alquinilo, arilo, heteroarilo, heterocíclico, acilo, ciano, alcoxi, ariloxi, heteroariloxi o amido, o un marcador detectable unido a través de un grupo de unión; o (R')2 representa un grupo alquilideno de fórmula =C(R''')2 donde cada R'“ puede ser igual o distinto y se selecciona del grupo que comprende átomos de hidrógeno y halógeno y grupos alquilo; y donde dicha molécula puede hacerse reaccionar para proporcionar un producto intermedio en el que cada R” es intercambiado por H o, donde Z es-C(R')2-F, el F es intercambiado por OH, SH o NH2 , preferiblemente OH, que se disocia en condiciones acuosas proporcionando una molécula con un extremo 3'OH libre; con la condición de que si Z es -C(R')2-S -R ” , ambos grupos R' no sean H. Si el grupo de bloqueo es cualquiera de -C(R ')2-O -R ” , -C(R')2-N(R” )2, -C(R')2-N(H)R” ,-C(R')2-S -R ” y -C(R')2-F, es decir, de fórmula Z, cada R' puede ser independientemente H o un alquilo. Preferiblemente, Z es de la fórmula -C(R')2-O -R ” , -C(R')2-N (R ” )2, -C(R')2-N(H)R” y -C(R')2-SR ” . De forma especialmente preferible, Z es de la fórmula -C(R')2-O -R ” , -C(R ')2-N(R” )2, y -C(R')2-SR ” . R” puede ser un grupo bencilo o un grupo bencilo sustituido. Un ejemplo de grupos de estructura -O -Z donde Z es-C(R')2-N(R” )2 son aquellos en los que -N(R” )2 es azido (-N 3). Un ejemplo de este tipo es el azidometilo, donde cada R' es H. De forma alternativa, R' en grupos Z de fórmula -C(R ')2-N 3 y otros grupos Z pueden ser cualquiera de los otros grupos descritos en la presente memoria. Ejemplos de grupos R' típicos incluyen alquilo C1-6, especialmente metilo y etilo. Otros ejemplos no limitativos de grupos de bloqueo 3' adecuados se proporcionan en Greene y col., “ Protective Groups in Organic Synthesis” , John Wiley & Sons, Nueva York (1991), en las patentes US 5.990.300, US 5.872.244, US 6.232.465, US 6.214.987, US 5.808.045, US 5.763.594, US 7.057.026, US 7.566.537, US 7.785.796, US 8.148.064, US 8.394.586, US 9.388.463, US 9.410.200, US 7.427.673, US 7.772.384, US 8.158.346, US 9.121.062, US 7.541.444, US 7.771.973, US 8.071.639, US 8.597.881, US 9.121.060, US 9.388.464, US 8.399.188, US 8.808.988, US 9.051.612, US 9.469.873, y las publicaciones de patentes US 2016/0002721 y US 2016/0060692.
El bloqueo en extremo 3' puede lograrse de cualquier forma adecuada. Por ejemplo, un resto de bloqueo puede unirse covalentemente a un grupo hidroxilo 3' en el extremo 3' para impedir la extensión del extremo 3'. Preferiblemente, el grupo de bloqueo permanece unido de forma covalente durante los procesos posteriores asociados a la inmovilización de polinucleótidos adaptador-diana-adaptador a una superficie sólida y a la secuenciación.
En algunas realizaciones, se incorpora un dideoxinucleótido (ddNTP) en el extremo 3' de un polinucleótido para bloquear el extremo 3'. El ddNTP puede incorporarse de cualquier forma adecuada. En algunas realizaciones, se incorpora un ddNTP mediante una desoxinucleotidiltransferasa terminal (TdT). Las TdT pueden incorporar nucleótidos en un extremo 3' de ADN monocatenario o bicatenario sin un patrón. En algunas realizaciones, se incorpora un ddNTP en un extremo 3' mediante una TdT en presencia de una polimerasa de ADN, tal como, por ejemplo, polimerasa Pol19, Pol812 o Pol963. Se proporcionan ejemplos de otras polimerasas adecuadas en las patentes US 8.460.910, US 8.852.910, US 8.623.628, US 9.273.352, US 9.447.389, y los documentos publicación de patente de Estados Unidos 2015/0376582, 2016/0032377, 2016/0090579, 2016/0115461.
En algunas realizaciones, se agrega dideoxiuridina trifosfato marcada con digoxigenina al extremo 3' utilizando transferasa terminal para bloquear el extremo 3'. Por ejemplo, Sigma-Aldrich comercializa kits para añadir dideoxiuridina trifosfato marcada con digoxigenina a un extremo 3' de un polinucleótido.
También puede emplearse cualquier otro proceso adecuado para modificar los extremos 3' de los polinucleótidos.
Durante o después del bloqueo en 3' pueden obtenerse varios compuestos y composiciones. Por ejemplo, puede obtenerse un polinucleótido que tenga una secuencia nucleotídica primer adaptador-diana-segundo adaptador en la que se bloquean los extremos 5' de los polinucleótidos y se bloquean los extremos 3' del polinucleótido. Pueden producirse composiciones o bibliotecas que comprendan los polinucleótidos modificados en 5' y bloqueados en 3'. Pueden generarse bibliotecas agrupadas y composición que comprende bibliotecas agrupadas de dichos polinucleótidos.
A modo de ejemplo adicional, puede obtenerse una composición que comprenda dichos polinucleótidos y una enzima y reactivo para bloquear los extremos 3' del polinucleótido. De forma similar, puede obtenerse una composición que comprende una biblioteca de polinucleótidos y la enzima y reactivo. Pueden obtenerse composiciones que comprenden bibliotecas agrupadas de dichos polinucleótidos y la enzima y el reactivo. En algunas realizaciones, las composiciones comprenden un ddNTP. Las composiciones pueden comprender además una TdT. Las composiciones pueden comprender además una ADN polimerasa, tal como, por ejemplo, una polimerasa Pol19, Pol812 o Pol963.
Puede hacerse un proceso de limpieza, como se ha descrito anteriormente, después del bloqueo.
Tratamiento con exonucleasa
Después del (o durante el) bloqueo, las soluciones o composiciones resultantes que comprenden los polinucleótidos resultantes, sometidas o no primero a limpieza, pueden someterse, opcionalmente, a tratamiento con una exonucleasa. Preferiblemente, el tratamiento de exonucleasa tiene actividad de exonucleasa 3' para degradar cualquier polinucleótido que permanezca que no esté bloqueado en 3'. Debido a que los extremos 5' son resistentes a la exonucleasa, la exonucleasa puede tener tanto actividad exonucleasa 5' como actividad exonucleasa 3'.
Una exonucleasa que tiene “ actividad de exonucleasa 5'” es una exonucleasa que digiere ADN en una dirección 5' a 3'. Una exonucleasa que tiene “ actividad de exonucleasa 3'” es una exonucleasa que digiere el ADN en una dirección 3' a 5'.
Un ejemplo de una exonucleasa adecuada que tiene actividad de exonucleasa 5' y 3' es la exonucleasa V, que es un complejo RecBCD de E. coli y es comercializada, por ejemplo, por New England Biolabs. La exonucleasa V también tiene actividad para ADN de doble cadena sin mellado.
El tratamiento con exonucleasa puede hacerse en cada biblioteca por separado o en bibliotecas agrupadas. Después del tratamiento con exonucleasa, puede llevarse a cabo una etapa de limpieza, como se ha descrito anteriormente, antes de inmovilizar los polinucleótidos en una superficie sólida para su secuenciación.
Si las bibliotecas no se han agrupado, pueden agruparse antes de la inmovilización en una superficie de secuenciación.
Preparación de muestras inmovilizadas para secuenciación
Las preparaciones de bibliotecas modificadas en 5' y bloqueadas en 3' agrupadas pueden entonces inmovilizarse en una superficie sólida como preparación para la secuenciación. La secuenciación puede llevarse a cabo como una matriz de moléculas individuales, o puede amplificarse antes de la secuenciación. La amplificación puede llevarse a cabo utilizando uno o más cebadores inmovilizados. El o los cebadores inmovilizados pueden ser un césped sobre una superficie plana, clústeres sobre una superficie plana, en pocillos de una estructura multipocillo, sobre un grupo de perlas, o similares. El conjunto de perlas puede aislarse en una emulsión con una sola perla en cada “ compartimiento” de la emulsión. A una concentración de solo un patrón por “ compartimento” , solo se amplifica un único patrón en cada perla.
El término “ amplificación de fase sólida” , como se utiliza en la presente memoria, se refiere a cualquier reacción de amplificación de polinucleótidos llevada a cabo en o en asociación con un soporte sólido de modo que todos o una parte de los productos amplificados se inmovilicen sobre el soporte sólido a medida que se forman. En particular, el término abarca la reacción en cadena de la polimerasa en fase sólida (PCR en fase sólida) y la amplificación isotérmica en fase sólida, que son reacciones análogas a la amplificación en fase de solución estándar, salvo que uno o ambos de los cebadores de amplificación directo e inverso se inmovilizan en el soporte sólido. La PCR de fase sólida cubre sistemas tales como emulsiones, donde un cebador está anclado a una perla y el otro está en solución libre, y la formación de colonias en matrices de gel de fase sólida donde un cebador está anclado a la superficie, y uno está en solución libre.
Aunque la descripción comprende métodos de amplificación de “ fase sólida” en los que solo se inmoviliza un cebador de amplificación (el otro cebador generalmente está presente en solución libre), se prefiere que el soporte sólido se proporcione tanto con los cebadores directos como con los cebadores inversos inmovilizados. En la práctica, habrá una “ pluralidad” de cebadores directos idénticos y/o una “ pluralidad” de cebadores inversos idénticos inmovilizados sobre el soporte sólido, ya que el proceso de amplificación requiere un exceso de cebadores para mantener la amplificación. Las referencias en la presente memoria a cebadores directos e inversos deben interpretarse en consecuencia abarcando una “ pluralidad” de dichos cebadores salvo que el contexto indique lo contrario.
Como apreciará el lector experto, cualquier reacción de amplificación dada requiere al menos un tipo de cebador directo y al menos un tipo de cebador inverso específico para el patrón a amplificar. Sin embargo, en determinadas realizaciones, los cebadores directo e inverso pueden comprender partes específicas de patrón de secuencia idéntica y pueden tener una secuencia y estructura nuucleotídica completamente idéntica (incluida cualquier modificación no nucleotídica). En otras palabras, es posible llevar a cabo la amplificación en fase sólida utilizando un solo tipo de cebador, y dichos métodos de cebador único están comprendidos dentro del ámbito de la invención. Otras realizaciones pueden utilizar cebadores directos e inversos que contienen secuencias específicas de patrón idénticas pero que difieren en algunas otras características estructurales. Por ejemplo, un tipo de cebador puede contener una modificación no nucleotídica que no esté presente en el otro.
A lo largo de la presente descripción, los términos “ P5” y “ P7” se utilizan cuando se refieren a adaptadores y/o cebadores de amplificación. Se entenderá que puede utilizarse cualquier cebador de amplificación adecuado en los métodos presentados en la presente memoria y que el uso de P5 y P7 constituyen únicamente realizaciones ilustrativas. Los usos de cebadores de amplificación tales como P5 y P7 en células de flujo son conocidos en la técnica, como se ejemplifica mediante las descripciones de WO 2007/010251, WO 2006/064199, WO 2005/065814, WO 2015/106941, WO 1998/044151 y WO 2000/018957. Por ejemplo, cualquier cebador de amplificación directo adecuado, ya sea inmovilizado o en solución, puede ser útil en los métodos presentados en la presente memoria para la hibridación a una secuencia complementaria y para la amplificación de una secuencia. De forma similar, cualquier cebador de amplificación inverso adecuado, sea inmovilizado o en solución, puede ser útil en los métodos presentados en la presente memoria para la hibridación a una secuencia complementaria y para la amplificación de una secuencia. Un experto en la técnica comprenderá cómo diseñar y utilizar secuencias cebadoras adecuadas para la captura y amplificación de ácidos nucleicos tal como se presentan en la presente memoria.
Los cebadores para la amplificación en fase sólida se inmovilizan preferiblemente mediante unión covalente de punto único al soporte sólido en o cerca del extremo 5' del cebador, dejando la parte específica del patrón del cebador libre para aparearse con su patrón análogo y el grupo hidroxilo 3' libre para la extensión del cebador. Para ello puede utilizarse cualquier medio de unión covalente adecuado conocido en la técnica. La química de unión elegida dependerá de la naturaleza del soporte sólido y de cualquier derivatización o funcionalización que se le aplique. El propio cebador puede incluir un resto, que puede ser una modificación química no nucleotídica, para facilitar la unión. En algunos ejemplos, el cebador incluye un nucleófilo que contiene azufre, tal como fosforotioato o tiofosfato, en el extremo 5'. La superficie del soporte sólido puede incluir, o modificarse para incluir, un resto al que pueda unirse el nucleófilo que contiene azufre. Por ejemplo, un nucleófilo que contiene azufre puede unirse a un grupo bromoacetamida. En algunos ejemplos, un hidrogel de poliacrilamida con soporte sólido comprende un grupo bromoacetamida para unirse a un nucleófilo que contiene azufre. Un medio más particular para unir cebadores y patrones a un soporte sólido es mediante la unión de fosforotioato 5' a un hidrogel que comprende acrilamida polimerizada y N-(5-bromoacetamidilpentil)acrilamida (BRAPA), como se describe completamente en WO 2005/065814.
Los soportes sólidos que comprenden un sustrato o matriz inerte (por ejemplo, portaobjetos de vidrio, perlas de polímero, etc.) pueden “ funcionalizarse” , por ejemplo, mediante la aplicación de una capa o recubrimiento de un material intermedio que comprende grupos reactivos que permiten la unión covalente a biomoléculas, tales como polinucleótidos. Los ejemplos de dichos soportes incluyen hidrogeles de poliacrilamida soportados sobre un sustrato inerte tal como vidrio. Las biomoléculas (por ejemplo, polinucleótidos) pueden estar unidas directamente de forma covalente al material intermedio (por ejemplo, el hidrogel), pero el material intermedio puede estar unido de forma no covalente al sustrato o matriz (por ejemplo, el sustrato de vidrio). El término “ unión covalente a un soporte sólido” debe interpretarse en consecuencia que abarca este tipo de disposición.
Las muestras de biblioteca agrupadas pueden amplificarse en una superficie sólida que contiene un cebador de amplificación directo e inverso. En algunos ejemplos, las bibliotecas agrupadas de polinucleótidos se utilizan para preparar matrices agrupadas de colonias de ácido polinucleico, análogas a las descritas en el documento de publicación de la patente US- 2005/0100900, la patente US 7.115.400, en los documentos WO 00/18957 y WO 98/44151, mediante amplificación en fase sólida y, más especialmente, amplificación isotérmica en fase sólida. Los términos “ clúster” y “ colonia” se utilizan indistintamente en la presente memoria en referencia a un sitio discreto en un soporte sólido que comprende una pluralidad de cadenas de ácido nucleico inmovilizadas idénticas y una pluralidad de cadenas de ácido nucleico complementarias inmovilizadas idénticas. El término “ matriz agrupada” se refiere a una matriz formada a partir de tales clústeres o colonias. En este contexto, no debe entenderse que el término “ matriz” exija una disposición ordenada de clústeres.
El término fase sólida o superficie, se utiliza en referencia a una matriz plana en donde los cebadores están unidos a una superficie plana, por ejemplo, portaobjetos de microscopio de vidrio, sílice o plástico o dispositivos de celda de flujo similares; perlas, donde uno o dos cebadores están unidos a las perlas y las perlas se amplifican; o una matriz de perlas en una superficie después de haber amplificado las perlas.
Los términos “ superficie sólida” , “ soporte sólido” y otros equivalentes gramaticales en la presente memoria se refieren a cualquier material que es apropiado o puede modificarse de modo que sea apropiado para la unión de los polinucleótidos patrón. Como apreciarán los expertos en la técnica, la cantidad de sustratos posibles es muy grande. Posibles sustratos incluyen vidrio y vidrio modificado o funcionalizado, plásticos (incluidos acrílicos, poliestireno y copolímeros de estireno y otros materiales, polipropileno, polietileno, polibutileno, poliuretanos, Teflon®, etc.), polisacáridos, nailon o nitrocelulosa, cerámicas, resinas, sílice o materiales basados en sílice que incluyen silicio y silicio modificado, carbono, metales, vidrios inorgánicos, plásticos, haces de fibras ópticas y una variedad de otros polímeros. Los soportes sólidos y superficies sólidas especialmente útiles para algunas realizaciones están situados dentro de un aparato de celda de flujo. A continuación se exponen celdas de flujo ilustrativas con mayor detalle.
El soporte sólido comprende una superficie con patrones. Una “ superficie con patrones” se refiere a una disposición de diferentes regiones en o sobre una capa expuesta de un soporte sólido. Por ejemplo, una o más de las regiones pueden ser características donde están presentes uno o más cebadores de amplificación. Las características pueden estar separadas por regiones intersticiales donde los cebadores de amplificación no están presentes. El patrón puede ser un formato x-y de características que están en filas y columnas. El patrón puede ser una disposición repetitiva de características y/o regiones intersticiales. El patrón puede ser una disposición aleatoria de características y/o regiones intersticiales. En las patentes US 8.778.848, US 8.778.849, US 9.0799.148 y en la publicación de patente de Estados Unidos n.° 2014/0243224 se describen ejemplos de superficies con patrones ordenadas que pueden utilizarse en los métodos y composiciones expuestos en la presente memoria.
En algunos ejemplos, el soporte sólido comprende una matriz de pocillos o depresiones en una superficie. Este puede fabricarse como se conoce generalmente en la técnica utilizando una variedad de técnicas, que incluyen fotolitografía, técnicas de estampado, técnicas de moldeo y técnicas de micrograbado. Como apreciarán los expertos en la técnica, la técnica utilizada dependerá de la composición y forma del sustrato de la matriz.
Las características en una superficie en disposición ordenada pueden ser pocillos en una matriz de pocillos (por ejemplo, micropocillos o nanopocillos) sobre vidrio, silicio, plástico u otros soportes sólidos adecuados con gel unido covalentemente en disposición ordenada, tal como poli(N-(5-azidoacetamidilpentil) acrilamida-co-acrilamida) (PAZAM, ver, por ejemplo, la publicación de Estados Unidos n.° 2013/184796, WO 2016/066586 y WO 2015/002813). El proceso crea almohadillas de gel utilizadas para la secuenciación que pueden ser estables durante las tandas de secuenciación con una gran número de ciclos. La unión covalente del polímero a los pocillos es útil para mantener el gel en las características estructuradas a lo largo de la vida útil del sustrato estructurado durante una variedad de usos. Sin embargo, el gel no tiene por qué estar unido covalentemente a los pocillos. Por ejemplo, en algunas condiciones, como material de gel puede utilizarse acrilamida libre de silano (SFA, véase, por ejemplo, la patente US 8.563.477), que no está unida covalentemente a ninguna parte del sustrato estructurado.
Puede fabricarse un sustrato estructurado estableciendo en un material de soporte sólido una disposición o patrón con pocillos (por ejemplo, micropocillos o nanopocillos), que recubren el soporte en disposición ordenada con un material de gel [por ejemplo, PAZAm , SFA o variantes modificadas químicamente de los mismos, tal como la versión azidolizada de SFA (azido-SFA)] y puliendo el soporte recubierto con gel, por ejemplo, mediante pulido químico o mecánico, reteniendo de este modo el gel en los pocillos pero eliminando o inactivando sustancialmente todo el gel de las regiones intersticiales en la superficie del sustrato estructurado entre los pocillos. Los ácidos nucleicos cebadores pueden unirse al material de gel. A continuación puede ponerse en contacto una solución de ácidos nucleicos diana (por ejemplo, un genoma humano fragmentado) con el sustrato pulido de modo que los ácidos nucleicos diana individuales siembren pocillos individuales mediante interacciones con cebadores unidos al material de gel; sin embargo, los ácidos nucleicos diana no ocuparán las regiones intersticiales debido a la ausencia o inactividad del material de gel. La amplificación de los ácidos nucleicos diana se limitará a los pocillos, ya que la ausencia o inactividad del gel en las regiones intersticiales impide la migración hacia el exterior de la colonia de ácido nucleico en crecimiento. El proceso permite de forma conveniente la fabricación, al ser escalable y utilizar métodos convencionales de micro o nanofabricación.
El término “ celda de flujo” , como se utiliza en la presente memoria, se refiere a una cámara que comprende una superficie sólida a través de la cual puede hacerse fluir uno o más reactivos fluidos. Se describen ejemplos de celdas de flujo y sistemas fluídicos relacionados y plataformas de detección que pueden utilizarse fácilmente en los métodos de la presente descripción, por ejemplo, en Bentley y col., Nature 456:53-59 (2008), WO 04/018497; US 7.057.026; WO 91/06678; WO 07/123744; US 7.329.492; US 7.211.414; US 7.315.019; US 7.405.281, y US 2008/0108082.
En algunos ejemplos, el soporte sólido o su superficie no es plana, tal como la superficie interna o externa de un tubo o recipiente. En algunos ejemplos, el soporte sólido comprende microesferas o perlas. Por “ microesferas” o “ perlas” o “ partículas” o equivalentes gramaticales se entiende en la presente memoria partículas discretas pequeñas. Composiciones de perlas adecuadas incluyen plásticos, cerámica, vidrio, poliestireno, metilestireno, polímeros acrílicos, materiales paramagnéticos, sol de toria, grafito de carbono, dióxido de titanio, látex o dextranos reticulados tales como sefarosa, celulosa, nailon, micelas reticuladas y Teflon®, así como cualquier otro material descrito en la presente memoria para soportes sólidos. La “ Microsphere Detection Guide” de Bangs Laboratories, Fishers Ind. es una guía útil. En determinados ejemplos, las microesferas son microesferas magnéticas o perlas.
Las perlas no tienen por qué ser esféricas; pueden utilizarse partículas irregulares. De forma alternativa o adicional, las perlas pueden ser porosas. Los tamaños de perlas varían de nanómetros, por ejemplo, 100 nm, a milímetros, por ejemplo, 1 mm, siendo preferidas las perlas de aproximadamente 0,2 micrómetros a aproximadamente 200 micrómetros, y siendo especialmente preferidas las perlas de aproximadamente 0,5 a aproximadamente 5 micrómetros, aunque en algunos casos pueden utilizarse perlas más pequeñas o más grandes.
Las matrices agrupadas pueden prepararse utilizando un proceso de termociclado, como se describe en WO/9844151, o un proceso mediante el cual la temperatura se mantiene constante, y los ciclos de extensión y desnaturalización se llevan a cabo utilizando cambios de reactivos. Dichos métodos de amplificación isotérmica se describen en las solicitudes de patente WO/0246456 y US 2008/0009420. Debido a las temperaturas más bajas requeridas en el proceso isotérmico, esto es especialmente preferido.
Se apreciará que cualquiera de las metodologías de amplificación descritas en la presente memoria o generalmente conocidas en la técnica pueden utilizarse con cebadores universales o específicos de la diana para amplificar fragmentos de ADN inmovilizados. Métodos adecuados para la amplificación incluyen la reacción en cadena de la polimerasa (PCR), la amplificación por desplazamiento de cadena (SDA), la amplificación mediada por transcripción (TMA) y la amplificación basada en secuencia de ácido nucleico (NASBA), como se describe en la patente US 8.003.354. Los métodos de amplificación anteriores pueden emplearse para amplificar uno o más ácidos nucleicos de interés. Por ejemplo, la PCR, que incluye PCR múltiple, SDA, TMA, NASBA y similares, puede utilizarse para amplificar fragmentos de ADN inmovilizados. En algunos ejemplos, en la reacción de amplificación se incluyen cebadores dirigidos específicamente al polinucleótido de interés.
Otros métodos adecuados para la amplificación de polinucleótidos pueden incluir tecnologías de extensión de oligonucleótidos y ligación, amplificación por círculo rodante (Lizardi y col., Nat. Genet. 19:225-232 (1998)] y ensayo de ligación de oligonucleótidos (OLA) (Véase de forma general US 7.582.420, US 5.185.243, u S 5.67.524 y Us 5.573.907; EP 0320308 B1; EP 0336731 B1; EP 0439 182 B1; WO 90/01069; WO 89/12696; y WO 89/09835). Se apreciará que estas metodologías de amplificación se pueden diseñar para amplificar fragmentos de ADN inmovilizados. Por ejemplo, el método de amplificación puede incluir amplificación de sonda de ligación o reacciones de ensayo de ligación de oligonucleótidos (OLA) que contienen cebadores dirigidos específicamente al ácido nucleico de interés. En algunos ejemplos, el método de amplificación puede incluir una reacción de extensión-ligación del cebador que contiene cebadores dirigidos específicamente al ácido nucleico de interés. Como ejemplo de cebadores de extensión y ligación de cebadores que pueden diseñarse específicamente para amplificar un ácido nucleico de interés, la amplificación puede incluir cebadores utilizados para el ensayo GoldenGate (Illumina, Inc., San Diego, CA) como se muestra en las patentes US 7.582.420 y US 7.611.869.
Ejemplos de métodos de amplificación isotérmica que pueden utilizarse en un método de la presente descripción incluyen amplificación de desplazamiento múltiple (MDA) como se muestra, por ejemplo, en Dean y col., Proc. Natl. Acad. Sci. USA 99:5261-66 (2002) o la amplificación de ácido nucleico de desplazamiento de cadena isotérmica ilustrada, por ejemplo, por la patente US 6.214.587. Otros métodos no basados en PCR que pueden utilizarse en la presente descripción incluyen, por ejemplo, la amplificación de desplazamiento de cadena (SDA) que se describe, por ejemplo, en Walker y col., Molecular Methods for Virus Detection, Academic Press, Inc., 1995; patente US 5.455.166, y US 5.130.238, y en Walker y col., Nucl. Acids Res. 20:1691-96 (1992) o amplificación de desplazamiento de cadena hiperramificada que se describe, por ejemplo, en la Lage y col., Genome Res. 13:294-307 (2003). Pueden utilizarse métodos de amplificación isotérmica con la polimerasa Phi 29 de desplazamiento de cadena o el fragmento grande de polimerasa de ADN Bst, exo- 5'->3' para la amplificación aleatoria de cebador de ADN genómico. El uso de estas polimerasas aprovecha su alta procesividad y actividad de desplazamiento de cadenas. La alta procesividad permite que las polimerasas produzcan fragmentos que tienen una longitud de 10-20 kb. Como se ha expuesto anteriormente, pueden producirse fragmentos más pequeños en condiciones isotérmicas utilizando polimerasas que tienen baja procesividad y actividad de desplazamiento de cadena tal como la polimerasa Klenow. La descripción adicional de las reacciones, condiciones y componentes de amplificación se expone en detalle en la descripción de la patente US 7.670.810.
Otro método de amplificación de polinucleótidos que es útil en la presente descripción es la PCR marcada que utiliza una población de cebadores de dos dominios que tienen una región 5' constante seguida por una región 3' aleatoria como se describe, por ejemplo, en Grothues y col. Nucleic Acids Res. 21(5): 1321-2 (1993). Las primeras rondas de amplificación se llevan a cabo para permitir una multitud de iniciaciones en ADN desnaturalizado por calor basadas en hibridación individual de la región 3' sintetizada al azar. Debido a la naturaleza de la región 3', se contempla que los sitios de iniciación sean aleatorios en todo el genoma. Posteriormente, los cebadores no unidos pueden retirarse y puede producirse una replicación adicional utilizando cebadores complementarios a la región 5' constante.
La amplificación isotérmica puede hacerse utilizando amplificación de exclusión cinética (KEA), también denominada amplificación de exclusión (ExAmp). Puede obtenerse una biblioteca de ácidos nucleicos de la presente descripción utilizando un método que incluye una etapa de reacción de un reactivo de amplificación para producir una pluralidad de sitios de amplificación que incluyen cada uno una población sustancialmente clonal de amplicones de un ácido nucleico diana individual sembrado en el sitio. En algunos ejemplos, la reacción de amplificación continúa hasta que se genera una cantidad suficiente de amplicones para llenar la capacidad del sitio de amplificación respectivo. El llenado de un sitio ya sembrado a capacidad de esta forma inhibe la llegada de los ácidos nucleicos diana y su amplificación en el sitio produciendo de este modo una población clonal de amplicones en el sitio. La clonalidad aparente puede conseguirse incluso si un sitio de amplificación no se llena a capacidad antes de que un segundo ácido nucleico diana llegue al sitio. Bajo ciertas condiciones, la amplificación de un primer ácido nucleico diana puede proceder hasta un punto en el que se produce una cantidad suficiente de copias para superar o saturar eficazmente la producción de copias de un segundo ácido nucleico diana que se transporta al sitio. Por ejemplo, en un ejemplo que utiliza un proceso de amplificación de puente en una característica circular de un diámetro menor que 500 nm, se ha determinado que después de 14 ciclos de amplificación exponencial para un primer ácido nucleico diana, la contaminación de un segundo ácido nucleico diana en el mismo sitio producirá una cantidad insuficiente de amplicones contaminantes que puedan afectar negativamente el análisis de secuencia por síntesis en una plataforma de secuenciación Illumina.
Como se ha demostrado mediante el ejemplo anterior, los sitios de amplificación en una matriz pueden ser, pero no necesariamente, completamente clonales en realizaciones particulares. En cambio, para algunas aplicaciones, un sitio de amplificación individual puede estar predominantemente poblado con amplicones de un primer ácido nucleico diana y también puede tener un nivel bajo de amplicones contaminantes de un segundo ácido nucleico diana. Una matriz puede tener uno o más sitios de amplificación que tengan un nivel bajo de amplicones contaminantes siempre que el nivel de contaminación no tenga un impacto inaceptable en un uso posterior de la matriz. Por ejemplo, cuando la matriz va a utilizarse en una aplicación de detección, un nivel aceptable de contaminación sería un nivel que no altere la relación señal a ruido o la resolución de la técnica de detección de una forma inaceptable. Por lo tanto, la clonalidad aparente será relevante de forma general para un uso o aplicación particular de una matriz producida mediante los métodos establecidos en la presente memoria. Niveles de contaminación ilustrativos que pueden ser aceptables en un sitio de amplificación individual para aplicaciones particulares incluyen, aunque no de forma limitativa, como máximo 0,1 %, 0,5 %, 1 %, 5 %, 10 % o 25 % de amplicones contaminantes. Una matriz puede incluir uno o más sitios de amplificación que tengan estos niveles ilustrativos de amplicones contaminantes. Por ejemplo, hasta un 5 %, 10 %, 25%, 50%, 75% o incluso 100% de los sitios de amplificación en una matriz pueden tener algunos amplicones contaminantes. Se entenderá que en una matriz u otro conjunto de sitios, al menos 50 %, 75 %, 80 %, 85 %, 90 %, 95 % o 99 % o más de los sitios pueden ser clonales o aparentemente clonales.
Puede producirse exclusión cinética cuando un proceso se produce a una velocidad lo suficientemente rápida como para excluir de forma efectiva que se produzca otro evento o proceso. Tomemos por ejemplo la elaboración de una matriz de ácido nucleico donde los sitios de la matriz se siembran aleatoriamente con ácidos nucleicos diana a partir de una solución y se generan copias del ácido nucleico diana en un proceso de amplificación para llenar cada uno de los sitios sembrados hasta su capacidad. Según los métodos de exclusión cinética descritos en la presente memoria, los procesos de siembra y amplificación pueden llevarse a cabo simultáneamente en condiciones en las que la velocidad de amplificación supere la velocidad de siembra. Como tal, la velocidad relativamente rápida a la que se hacen copias en un sitio que ha sido sembrado por un primer ácido nucleico diana excluirá efectivamente la siembra de un segundo ácido nucleico en el sitio para la amplificación. Pueden llevarse a cabo métodos de amplificación de exclusión cinética como se describe en detalle en la descripción de la publicación de la patente US- 2013/0338042.
La exclusión cinética puede explotar una velocidad relativamente lenta para iniciar la amplificación (por ejemplo, una velocidad lenta para hacer una primera copia de un ácido nucleico diana) frente a una velocidad relativamente rápida para hacer copias posteriores del ácido nucleico diana (o de la primera copia del ácido nucleico diana). En el ejemplo del párrafo anterior, la exclusión cinética se produce debido a la velocidad relativamente lenta de siembra de ácido nucleico diana (por ejemplo, difusión o transporte relativamente lento) frente a la velocidad relativamente rápida a la que se produce la amplificación para llenar el sitio con copias de la semilla de ácido nucleico. En otro ejemplo, la exclusión cinética puede producirse debido a un retraso en la formación de una primera copia de un ácido nucleico diana que ha sembrado un sitio (por ejemplo, activación retardada o lenta) frente a la velocidad relativamente rápida a la que se hacen copias posteriores para llenar el sitio. En este ejemplo, puede haberse sembrado un sitio individual con varios ácidos nucleicos diana distintos (por ejemplo, puede haber presentes varios ácidos nucleicos diana en cada sitio antes de la amplificación). Sin embargo, la primera formación de copias para cualquier ácido nucleico diana dado puede activarse de forma aleatoria, de modo que la velocidad promedio de la primera formación de copias sea relativamente lenta en comparación con la velocidad a la que se generan copias posteriores. En este caso, aunque un sitio individual pueda haberse sembrado con varios ácidos nucleicos diana distintos, la exclusión cinética permitirá que solo se amplifique uno de esos ácidos nucleicos diana. Más específicamente, una vez activado un primer ácido nucleico diana para la amplificación, el sitio se llenará rápidamente a capacidad con sus copias, impidiendo de este modo que se hagan copias de un segundo ácido nucleico diana en el sitio.
Un reactivo de amplificación puede incluir componentes adicionales que faciliten la formación de amplicones y, en algunos casos, aumenten la velocidad de formación de amplicones. Un ejemplo es una recombinasa. La recombinasa puede facilitar la formación de amplicones al permitir la invasión/extensión repetida. Más específicamente, la recombinasa puede facilitar la invasión de un ácido nucleico diana por la polimerasa y la extensión de un cebador por la polimerasa utilizando el ácido nucleico diana como patrón para la formación de amplicones. Este proceso puede repetirse como una reacción en cadena donde los amplicones producidos a partir de cada ronda de invasión/extensión sirven como patrones en una ronda posterior. El proceso puede producirse más rápidamente que la PCR estándar, ya que no se requiere un ciclo de desnaturalización (por ejemplo, mediante calentamiento o desnaturalización química).
Como tal, la amplificación facilitada por recombinasa puede llevarse a cabo isotérmicamente. De forma general, es deseable incluir ATP u otros nucleótidos (o, en algunos casos, análogos no hidrolizables de los mismos) en un reactivo de amplificación facilitada por recombinasa para facilitar la amplificación. Una mezcla de recombinasa y proteína ligante de ADN de cadena sencilla (SSB) es especialmente útil ya que la SSB puede facilitar aún más la amplificación. Formulaciones ilustrativas para la amplificación facilitada por recombinasa incluyen las vendidas comercialmente como kits TwistAmp por TwistDx (Cambridge, Reino Unido). Los componentes útiles del reactivo de amplificación facilitado por recombinasa y las condiciones de reacción se establecen en las patentes US 5.223.414 y US 7.399.590.
Otro ejemplo de un componente que puede incluirse en un reactivo de amplificación para facilitar la formación de amplicones y en algunos casos para aumentar la velocidad de formación de amplicones es una helicasa. La helicasa puede facilitar la formación de amplicones al permitir una reacción en cadena de la formación de amplicones. El proceso puede producirse más rápidamente que la PCR estándar, ya que no se requiere un ciclo de desnaturalización (por ejemplo, mediante calentamiento o desnaturalización química). Como tal, la amplificación facilitada por helicasa puede llevarse a cabo isotérmicamente. Es especialmente útil una mezcla de helicasa y proteína de unión a ADN monocatenario (SSB) ya que la SSB puede facilitar aún más la amplificación. Formulaciones ilustrativas para la amplificación facilitada por helicasa incluyen las comercializadas como kits de IsoAmp de Biohelix (Beverly, MA). Además, se describen ejemplos de formulaciones útiles que incluyen una proteína helicasa en Us 7.399.590 y en US 7.829.284.
Otro ejemplo de un componente que puede incluirse en un reactivo de amplificación para facilitar la formación de amplicones y en algunos casos aumentar la velocidad de formación de amplicones es una proteína de unión de origen.
Uso en secuenciación/métodos de secuenciación
Los polinucleótidos inmovilizados de las bibliotecas agrupadas se pueden secuenciar de cualquier forma adecuada. Preferiblemente, la secuenciación se lleva a cabo mediante secuenciación por síntesis en la que los nucleótidos se agregan sucesivamente a un grupo hidroxilo 3' libre de un cebador de secuenciación utilizando los polinucleótidos inmovilizados como un patrón, dando lugar a la síntesis de una cadena de polinucleótidos en dirección 5' a 3'. La naturaleza del nucleótido añadido se determina preferiblemente después de cada adición de nucleótidos. Las técnicas de secuenciación en las que se utiliza la secuenciación mediante ligación, en donde no se secuencian todas las bases contiguas, y las técnicas tales como la secuenciación masiva de firmas en paralelo (MPSS), de donde se eliminan las bases en lugar de añadirse a las cadenas en la superficie, también están dentro del ámbito de la descripción, al igual que las técnicas que utilizan la detección de liberación de pirofosfato (pirosecuenciación). Dichas técnicas basadas en pirosecuenciación son especialmente aplicables a matrices de secuenciación de perlas donde las perlas se han amplificado en una emulsión de modo que un único patrón de la molécula de biblioteca se amplifica en cada perla.
El punto de inicio para la reacción de secuenciación puede proporcionarse mediante el apareamiento de un cebador de secuenciación a un producto de la reacción de amplificación de fase sólida. En este sentido, uno o ambos adaptadores añadidos durante la formación de la biblioteca de patrones pueden incluir una secuencia de nucleótidos que permita el apareamiento de un cebador de secuenciación a polinucleótidos inmovilizados, tales como los polinucleótidos adaptador-diana-adaptador.
La secuencia de etiqueta de índice y la secuencia diana pueden determinarse en una sola lectura a partir de un solo cebador de secuenciación simple, o en múltiples lecturas de más de un cebador de secuenciación. En el caso de dos lecturas de dos cebadores de secuenciación, la “ lectura de etiqueta de índice” y la “ lectura de diana” pueden hacerse en cualquier orden, con una etapa de desnaturalización adecuada para retirar el cebador apareado después de completar la primera lectura de secuenciación. Etapas de desnaturalización adecuadas pueden incluir formamida, hidróxido o calor como se conoce generalmente en la técnica.
Los productos de reacciones de amplificación en fase sólida donde tanto los cebadores de amplificación directa como inversa se inmovilizan covalentemente en la superficie sólida pueden ser las llamadas estructuras “ puente” formadas por el apareamiento de pares de cadenas de polinucleótidos inmovilizadas y cadenas complementarias inmovilizadas, estando ambas cadenas unidas al soporte sólido en el extremo 5'. Los conjuntos que comprenden dichas estructuras unidas proporcionan patrones ineficientes para la secuenciación de ácido nucleico, ya que la hibridación de un cebador de secuenciación convencional con una de las cadenas inmovilizadas no se ve favorecida en comparación con el apareamiento de esta cadena con su cadena complementaria inmovilizada en condiciones estándar para hibridación. Ejemplos de amplificación puente o en clúster se describen, por ejemplo, en las patentes US 7.985.565 y US 7.115.400.
Para proporcionar patrones más adecuados para la secuenciación de ácido nucleico, se prefiere eliminar sustancialmente todo o eliminar o desplazar al menos una parte de una de las cadenas inmovilizadas en la estructura “ puente” para generar un patrón que sea al menos parcialmente monocatenario. Por lo tanto, la parte del patrón que es monocatenaria estará disponible para la hibridación con un cebador de secuenciación. El proceso de eliminación de la totalidad o de una parte de una cadena inmovilizada en una estructura de ácido nucleico de cadena doble “ puente” puede denominarse en la presente memoria “ linealización” y se describe con más detalle en WO 2007/010251, WO 2006/064199, WO 2005/065814, WO 2015/106941, WO 1998/044151 y WO 2000/018957.
Las estructuras de patrón puenteadas pueden linealizarse mediante escisión de una o ambas cadenas con una endonucleasa de restricción o mediante escisión de una cadena con una endonucleasa de formación de mellas. Pueden utilizarse otros métodos de escisión como alternativa a las enzimas de restricción o enzimas de formación de mellas, que incluyen, entre otros, escisión química (por ejemplo, escisión de un enlace diol con periodato), escisión de sitios abásicos mediante escisión con endonucleasa (por ejemplo, 'USER', suministrada por NEB, n.° de cat. M5505S), o mediante exposición al calor o a álcali, escisión de ribonucleótidos incorporados en productos de amplificación que de otro modo comprenden desoxirribonucleótidos, escisión fotoquímica o escisión de un ligando peptídico.
Se apreciará que una etapa de linealización puede no ser esencial si la reacción de amplificación de fase sólida se lleva a cabo con solo un cebador inmovilizado covalentemente y el otro en solución libre.
Después de la etapa de escisión, independientemente del método utilizado para la escisión, el producto de la reacción de escisión puede someterse a condiciones de desnaturalización para eliminar la o las partes de la o las cadenas escindidas que no están unidas al soporte sólido. Las condiciones de desnaturalización adecuadas, por ejemplo, solución de hidróxido sódico, solución de formamida o calor, serán evidentes para el lector experto con referencia a los protocolos de biología molecular estándar (Sambrook y col., 2001, Molecular Cloning, A Laboratory Manual, 3a ed, Cold Spring Harbor Laboratory Press, Cold Spring Harbor Laboratory Press, NY; Current Protocols, eds. Ausubel y col.). La desnaturalización da lugar a la producción de un patrón de secuenciación que es parcialmente o sustancialmente monocatenario. A continuación puede iniciarse una reacción de secuenciación mediante hibridación de un cebador de secuenciación con la parte monocatenaria del patrón.
Por lo tanto, en algunas realizaciones, una reacción de secuenciación comprende hibridar un cebador de secuenciación a una región monocatenaria de un producto de amplificación linearizado, incorporar secuencialmente uno o más nucleótidos en una cadena de polinucleótidos complementaria a la región de la cadena de patrón amplificada a secuenciar, identificar la base presente en uno o más de los nucleótidos incorporados y determinar de este modo la secuencia de una región de la cadena de patrón.
Un método de secuenciación preferido que puede utilizarse se basa en el uso de nucleótidos modificados que tienen bloqueos en 3' retrables, por ejemplo, como se describe en WO 2004/018497 y en la patente US-7.057.026. Una vez que el nucleótido modificado se ha incorporado a la cadena de polinucleótidos en crecimiento complementaria a la región del patrón que se está secuenciando, no hay ningún grupo 3'-OH libre disponible para dirigir la extensión de secuencia adicional y, por lo tanto, la polimerasa no puede añadir nucleótidos adicionales. Una vez que se ha determinado la naturaleza de la base incorporada en la cadena en crecimiento, puede retirarse el bloqueo del extremo 3' para permitir la adición del siguiente nucleótido sucesivo. Ordenando los productos derivados utilizando estos nucleótidos modificados, es posible deducir la secuencia de ADN del patrón de ADN. Dichas reacciones pueden llevarse a cabo en un único experimento si cada uno de los nucleótidos modificados tiene una etiqueta distinta unida al mismo, que se sabe corresponde a la base particular, para facilitar la discriminación entre las bases añadidas durante cada etapa de incorporación. De forma alternativa, se puede llevar a cabo una reacción separada que contenga cada uno de los nucleótidos modificados por separado.
Los nucleótidos modificados pueden llevar una marca para facilitar su detección. Para la detección de nucleótidos modificados puede utilizarse, por ejemplo, un marcador fluorescente. Por lo tanto, cada tipo de nucleótido puede llevar una marca fluorescente distinta, por ejemplo, como se describe en WO 2007/135368. Sin embargo, no es necesario que la marca detectable sea una marca fluorescente. Puede utilizarse cualquier marca que permita la detección de un nucleótido incorporado.
Un método para detectar nucleótidos marcados fluorescentemente comprende el uso de luz láser de una longitud de onda específica para los nucleótidos marcados, o el uso de otras fuentes adecuadas de iluminación. La fluorescencia de la marca en el nucleótido puede ser detectada por una cámara CCD u otro medio de detección adecuado. La instrumentación adecuada para registrar imágenes de matrices agrupadas se describe en WO 2007/123744.
Por supuesto, puede emplearse cualquier otro método de secuenciación adecuado. Preferiblemente, el método de secuenciación se basa en la incorporación sucesiva de nucleótidos a una cadena de polinucleótidos. Técnicas alternativas adecuadas incluyen, por ejemplo, pirosecuenciación, FISSEQ (secuenciación fluorescente in situ), MPSS y secuenciación mediante métodos basados en ligación, por ejemplo como se describe en la patente US 6.306.597.
La muestra de ácido nucleico puede analizarse adicionalmente para obtener una segunda lectura del extremo opuesto del fragmento. La metodología para secuenciar ambos extremos de un clúster se describe en WO 2007/010252 y WO 2008/041002. En un ejemplo, la serie de etapas puede hacerse de la siguiente forma; generar clústers, linealizar, hibridar el primer cebador de secuenciación y obtener la primera lectura de secuenciación. Puede retirarse el primer cebador de secuenciación, puede hibridarse un segundo cebador y secuenciar la etiqueta de índice. La cadena de polipolucleótidos puede entonces “ invertirse” en la superficie mediante la síntesis de una copia complementaria de los cebadores inmovilizados restantes utilizados en la amplificación de clústers. Este proceso de resintetización de cadenas regenera el clúster de doble cadena. La cadena de patrón original puede eliminarse, para linealizar la cadena resintetizada que a continuación puede aparearse con un cebador de secuenciación y secuenciarse en una tercera tanda de secuenciación.
En los casos donde se emplea resíntesis de cadenas, ambas cadenas pueden inmovilizarse en la superficie de una forma que permita la liberación posterior de una parte de la cadena inmovilizada. Esto puede lograrse a través de una serie de mecanismos como se describe en WO 2007/010251. Por ejemplo, un cebador puede contener un nucleótido deuracilo, lo que significa que la cadena puede escindirse en la base de uracilo utilizando las enzimas uracilo glicosilasa (UDG) que elimina la base de nucleósido, y la endonucleasa VIII que escinde el nucleótido abásico. Esta combinación de enzimas está disponible como enzima USER™ de New England Biolabs (n.° de cat. M5505). El segundo cebador puede comprender un nucleótido de 8-oxoguanina, que luego puede escindirse mediante la enzima FPG (NEB n.° de cat. M0240). Este diseño de cebadores proporciona un control de qué cebador se escinde en qué punto del proceso, y también en qué parte del clúster se produce la escisión. Los cebadores también pueden modificarse químicamente, por ejemplo, con una modificación disulfuro o diol que permita la escisión química en lugares específicos.
Con referencia ahora a la Figura 1, se muestra un dibujo esquemático que ilustra un proceso para producir polinucleótidos de patrón modificados en 5' y bloqueados en 3' para la inmovilización sobre una superficie sólida para la secuenciación. En la Figura 1A, se muestra un fragmento de polinucleótido diana bicatenario. Las partes iniciales de los adaptadores pueden unirse a los extremos de la diana mediante ligación (véase la Figura 1B) o etiquetado. Las partes de los adaptadores (ab) comprenden una parte de doble cadena unida a la diana bicatenaria y partes monocatenarias que se extienden desde la diana hasta los extremos 5' y 3'. Un cebador modificado en 5' (B') está configurado para hibridar con una única parte de cadena del adaptador (b) en proximidad del extremo 3' (Figura 1C). Puede utilizarse una polimerasa para extender el cebador B' utilizando las partes del adaptador y la diana como patrón para producir un complemento de las partes del adaptador (a') y la diana (Figura 1D, cadenas de la Figura 1C eliminadas para mayor conveniencia y claridad). Un cebador modificado en 5' (A ) está configurado para hibridar con una única parte trenzada del complemento de la parte de adaptador (a') cerca del extremo 3' (Figura 1E). Puede utilizarse una polimerasa para extender el cebador A utilizando las partes del complemento de los adaptadores y la diana como patrón para producir partes del adaptador (b) y de la diana (Figura 1F, cadenas de la Figura 1E eliminadas para mayor conveniencia y claridad).
Si la parte de adaptador que se añade, por ejemplo, mediante ligación o etiquetado incluye la secuencia de etiqueta de índice específica de la biblioteca en un lugar entre la secuencia para la hibridación de los cebadores (A, B') y la diana (cuando la parte del adaptador está unida a la diana), la amplificación (Figuras 1C-F) con cebadores (A, B') puede hacerse en fragmentos diana agrupados de distintas bibliotecas, siempre que cada fragmento de cada biblioteca incluya una parte de un adaptador que tiene una secuencia de etiqueta de índice específica de la biblioteca en un lugar similar y cada parte del adaptador de cada biblioteca tenga una secuencia (o complemento) con la que puedan hibridar los cebadores (A, B'). De lo contrario, cada biblioteca debería ampliarse por separado.
El patrón protegido en el extremo 5' resultante (adaptador amplificado-diana-adaptador amplificado) puede someterse a bloqueo en el extremo 3' para producir un polinucleótido patrón protegido en 5' y en 3' (Figura 1G) (no según la presente invención) para la inmovilización en una superficie sólida para la secuenciación. El bloqueo en 3' puede afectar a cualquier polinucleótido presente en solución con el patrón protegido en 5', incluido cualquier otro fragmento de amplificación o polinucleótido residual (no mostrado). Por lo tanto, si las partes del adaptador (ab) se amplifican con cebadores (A, B), los adaptadores amplificados que no están unidos al patrón (no mostrados) también deben bloquearse en 3'.
Puede aplicarse opcionalmente un tratamiento con exonucleasa a la mezcla resultante. Los polinucleótidos desbloqueados o desprotegidos restantes pueden degradarse antes de inmovilizar los polinucleótidos patrón sobre una superficie sólida.
Con referencia ahora a la Figura 2, se muestra un dibujo esquemático de un adaptador (adaptador amplificado) 100 que puede utilizarse en una secuencia de adaptador-diana-adaptador de la Figura 3 u obtenerse durante la amplificación de las bibliotecas en preparación para la secuenciación. El adaptador 100 ilustrado comprende una región bicatenaria 110 y una región monocatenaria no complementaria 120. Los extremos 5' se modifican (indicados por el “ *” ) para impedir la degradación por una exonucleasa, y los extremos 3' se bloquean (indicados por la “ X” ). Una cadena ilustrada del adaptador 100 comprende una secuencia cebadora 130 de extensión universal, una secuencia 132 de etiqueta de índice y una secuencia cebadora 134 de secuenciación. La otra cadena ilustrada del adaptador 100 comprende una secuencia cebadora 140 de extensión universal, una secuencia 142 de etiqueta de índice y una secuencia cebadora 144 de secuenciación.
Las secuencias cebadoras 130, 140 de extensión universal pueden hibridar con oligonucleótidos cebadores de extensión unidos a una superficie sólida con fines de amplificación o secuenciación (si el adaptador 100 se ha unido a un polinucleótido diana). La secuencia cebadora 140 de extensión universal, o una parte de la misma, también puede hibridar con un cebador de secuenciación para secuenciar la secuencia 142 de etiqueta de índice. De forma alternativa, la cadena puede comprender una secuencia cebadora de secuenciación adicional (no mostrada).
La secuencia cebadora 134 de secuenciación puede hibridar con un cebador de secuenciación para permitir la secuenciación de la secuencia 132 de etiqueta de índice. La secuencia 142 de etiqueta de índice y la secuencia 132 de etiqueta de índice pueden ser iguales o diferentes.
La secuencia cebadora 144 de secuenciación puede hibridar con un cebador de secuenciación para permitir la secuenciación de una secuencia de polinucleótidos diana (si está unida al adaptador 100).
Las secuencias cebadoras 134, 144 de secuenciación pueden hibridar con, por ejemplo, cebadores de PCR si los adaptadores se unen a una diana en un proceso de múltiples etapas como se ha descrito anteriormente.
Se entenderá que un adaptador adecuado para su uso en la presente invención puede tener más o menos características de secuencia, u otras características de secuencia, que las descritas con respecto a la Figura 2.
Con referencia ahora a la Figura 3 , se muestra un dibujo esquemático según la presente invención de un polinucleótido patrón 200 de una biblioteca que tiene una secuencia adaptador 100 - patrón 210 - adaptador 100 (que puede incluir un adaptador de forma general como se muestra en la Figura 2). El polinucleótido patrón 210 es bicatenario y está unido a una parte bicatenaria del primer adaptador 100 y del segundo adaptador 101. Los extremos 3' del polinucleótido patrón 200 se bloquean y los extremos 5' se modifican, por ejemplo, como se ha descrito anteriormente.
Con referencia ahora a la Figura 4, se muestra una ilustración esquemática de un proceso para la amplificación de clústeres de un polinucleótido patrón 200 de una biblioteca a una superficie sólida 300 para su preparación para la secuenciación. En el primer panel, el polinucleótido patrón 200 que tiene un extremo 5' modificado y un extremo 3' bloqueado hibrida con un primer cebador 310 de extensión unido a la superficie sólida 300. Por ejemplo, la secuencia cebadora 140 de extensión universal representada en la Figura 2 de la parte de adaptador puede hibridar con el primer cebador 310 de extensión.
El primer cebador 310 de extensión comprende un extremo 3' libre, y por lo tanto los nucleótidos pueden añadirse al extremo 3' utilizando el polinucleótido patrón 200 como patrón para producir una cadena 201 de patrón de copia (ver segundo panel) unida a la superficie sólida 300 en presencia de una polimerasa adecuada. La cadena 200 de patrón puede retirarse y la cadena 201 de copia puede hibridar con un segundo cebador 320 de extensión unido a la superficie sólida 300 (véase el tercer panel). Por ejemplo, la secuencia cebadora 130 de extensión universal representada en la Figura 2 de la parte de adaptador puede hibridar con el segundo cebador 320 de extensión.
El segundo cebador 320 de extensión comprende un extremo 3' libre y, por lo tanto, los nucleótidos se pueden agregar al extremo 3' utilizando el polinucleótido patrón 201 de copia como patrón para producir una cadena 202 de patrón amplificada (ver cuarto panel) unida a la superficie sólida 300 en presencia de una polimerasa adecuada. Pueden hacerse rondas adicionales de amplificación para producir un clúster de cadenas 201 patrón de copia y cadenas 202 de patrón amplificadas.
A efectos ilustrativos, el quinto panel de la Figura 4 representa la copia 201 y las cadenas 202 patrón amplificadas en forma lineal.
Con referencia ahora a la Figura 5 , se muestra un dibujo esquemático que ilustra cómo el bloqueo de los extremos 3' (para impedir la extensión desde el extremo 3' bloqueado) puede mitigar el salto de índice. Los dos primeros paneles de la Figura 5 son los mismos que los dos primeros paneles de la Figura 4. Como se muestra en el tercer panel de la Figura 5, una cadena 104 de adaptador no incorporada residual (no unida a un polinucleótido diana) puede hibridar con una parte de adaptador de la cadena 201 patrón de copia (por ejemplo, la hibridación puede producirse en la región bicatenaria del adaptador y en la parte de adaptador del polinucleótido patrón). La cadena 104 de adaptador puede ser de una biblioteca distinta a la biblioteca de la cual se deriva la cadena 201 patrón de copia. Por lo tanto, el adaptador 104 puede tener una secuencia de etiqueta de índice que sea distinta de la secuencia de etiqueta de índice asociada a la cadena 201 patrón de copia. Debido a que el extremo 3' del adaptador está bloqueado (indicado por la “ X” ), el adaptador 104 no puede servir como cebador eficaz para extender y copiar la cadena 201 patrón de copia. Sin embargo, si se permitiera la extensión (y el extremo 3' del adaptador 104 no incorporado no se bloqueara), se produciría una copia en la que una etiqueta de índice incorrecta (etiqueta de índice del adaptador 104 de una segunda biblioteca) se asociaría a un polinucleótido diana de otra biblioteca (polinucleótido diana del polinucleótido patrón 201 de una primera biblioteca). En una ronda posterior de amplificación, podría unirse un polinucleótido indexado incorrectamente a la superficie 300.
Con referencia ahora a la Figura 6 , se muestra un dibujo esquemático que ilustra cómo el tratamiento con exonucleasa para eliminar los adaptadores o cadenas de adaptadores desbloqueados y no incorporados puede mitigar el salto de índice. Los dos primeros paneles de la Figura 6 son los mismos que los dos primeros paneles de la Figura 4. Como se muestra en el panel inferior izquierdo de la Figura 6 , una cadena de adaptador 104 que puede resultar de la amplificación (por ejemplo, como se describe con respecto a las Figuras 1B-F) que no se ha bloqueado durante una etapa de bloqueo en el extremo 3' (por ejemplo, como se describe con respecto a la Figura 1G) puede hibridar con una parte de adaptador de la cadena 201 patrón de copia (por ejemplo, la hibridación puede ocurrir en la región bicatenaria del adaptador y la parte de adaptador del polinucleótido patrón). La cadena 104 de adaptador puede ser de una biblioteca distinta a la biblioteca de la cual se deriva la cadena 201 patrón de copia. Por lo tanto, la cadena 104 de adaptador puede tener una secuencia de etiqueta de índice que sea distinta de la secuencia de etiqueta de índice asociada a la cadena 201 patrón de copia. La cadena 104 de adaptador puede servir como cebador eficaz para extender y copiar la cadena 201 patrón de copia. Se produciría una cadena amplificada en la que una etiqueta de índice incorrecta (etiqueta de índice de la cadena 104 de adaptador de una segunda biblioteca) se asociaría a un polinucleótido diana de otra biblioteca (polinucleótido diana del polinucleótido patrón 201 de una primera biblioteca). En una ronda posterior de amplificación, se podría unir un polinucleótido indexado incorrectamente a la superficie 300. Sin embargo, y como se ilustra en el panel inferior derecho de la Figura 6, si los adaptadores desbloqueados o las cadenas de adaptador que pueden aparecer se digieren mediante tratamiento con exonucleasa, la cadena de adaptador no está disponible para servir como cebador de extensión, y se mitiga el salto de índice.
Con referencia ahora a las Figs. 7A y 7B, se ilustra la naturaleza del fenómeno del salto de índice. La Figura 7A muestra cómo las lecturas de una muestra dada se desmultiplexan incorrectamente y se mezclan con una muestra distinta después de la desmultiplexación. La Figura 7B muestra el salto de índice en un sistema de índice dual, donde da lugar a combinaciones inesperadas de secuencias de etiqueta de índice.
Con referencia ahora a las Figuras 8A y 8B, se ilustra el enfoque general para medir la tasa de salto de índice en un sistema dado. La Figura 8A muestra una disposición ilustrativa de una placa adaptadora dual, en la que cada pocillo individual de una placa de 96 pocillos contiene un par único de secuencias de etiquetas de índice (12 índices P7 distintos combinados con 8 índices P5 distintos). La Figura 8B muestra una configuración experimental que pretende medir la tasa de salto de índice, donde se utilizan 8 combinaciones únicas de etiquetas de índice doble (es decir, no se espera que el índice P5 se empareje con más de un índice P7 y viceversa). Las combinaciones inesperadas de etiquetas de índice (por ejemplo, D505-D703) se identifican fácilmente como casos de salto de índice.
Haciendo referencia ahora a las Figuras 9A y 9B, se ilustra el efecto de los adaptadores no ligados en la tasa de salto de índice. La Figura 9A muestra un aumento de 6 veces en el salto de índice asociado a una adición de 50 % de adaptadores libres. La Figura 9B muestra un efecto aproximadamente lineal del adaptador ahorquillado libre sobre la tasa de salto de índice dentro del intervalo analizado. Los inventores también observaron un efecto más pronunciado de los adaptadores P7 monocatenarios libres sobre la tasa de salto de índice en comparación con los adaptadores P5 monocatenarios libres (datos no mostrados).
Ejemplos
Ejemplo 1: Protocolo de muestra para bloqueo en 3' de bibliotecas indexadas protegidas en 5'
Este protocolo explica cómo realizar un tratamiento de bloqueo en 3' de las bibliotecas de ADN protegidas en5', para reducir el salto de índice. Este método está diseñado para llevarse a cabo en grupos de bibliotecas de ADN antes de la etapa de desnaturalización y posterior generación de clústers utilizando Illumina HiSeq® 4000 y plataformas de secuenciación similares que utilizan células de flujo en disposición ordenada y formación de clústeres basada en ExAmp (por ejemplo, HiSeq® X y NovaSeq®).
Se ha visto que el salto de índice se produce cuando se asignan secuencias de índice incorrectas a la secuencia de inserción, dando lugar a una asignación incorrecta de la muestra. La realización de este tratamiento en grupos de muestras de ADN antes de ejecutar HiSeq® 4000 debería reducir los niveles de salto de índice a un nivel que en esta etapa no puede predecirse de forma fiable.
Puede considerarse que el flujo de trabajo del tratamiento implica cuatro pasos: (i) producir grupos de muestras de ADN; (ii) realizar el tratamiento, (iii) limpiar la muestra y cuantificar; y (iv) conjunto de muestras de clústers y secuencias.
Consumibles/Equipos: Los consumibles y los equipos pueden ser suministrados por un usuario o fabricante de secuenciación. Los consumibles suministrados por el usuario pueden incluir un grupo de muestras de la biblioteca de ADN - 30 |jl a la concentración a utilizar para la desnaturalización durante la formación de clústeres. El usuario también puede suministrar etanol al 80 % (EtOH) recién preparado.
En la Tabla 1 se ilustran a continuación algunos consumibles y equipos que pueden utilizarse.
Tabla 1: Consumibles y equipos
Figure imgf000022_0001
Figure imgf000023_0002
Un fabricante de secuenciación puede suministrar BMX (mezcla de bloqueo), EMX (mezcla de exonucleasa), RSB (tampón de resuspensión) y SPB (perlas de purificación de muestras).
El EMX puede incluir un tampón de exonucleasa (67 mM de glicina-KOH, MgCh 2,5 mM, 50 pg/ml de BSA) y exonucleasa Lambda (New England Biolabs, n.° de cat. M0262S/L).
El BMX puede incluir una premezcla de secuenciación (tampón Tris, cloruro de sodio, sacarosa, sulfato de magnesio, EDTA y Tween 20), una mezcla ddNTP, polimerasa de ADN Pol19 y transferasa terminal TDT.
El RSB puede incluir un tampón Tris, de pH 8,5.
El SPB puede incluir perlas AgenCourt ® AMPure® XP (Beckman Coulter, n.° de cat. A63880). El SPB debe agitarse en vortex antes de cada uso. El SPB debe agitarse en vortex con frecuencia para garantizar que las perlas queden distribuidas uniformemente. El SPB debe aspirarse y dispensarse lentamente debido a la viscosidad de la solución.
Algunos de los consumibles deben guardarse y prepararse como se indica a continuación en la Tabla 2.
Tabla 2: Almacenamiento y preparación de consumibles
Elemento Almacenamiento Instrucciones
Figure imgf000023_0001
El siguiente programa EMX puede guardarse en el termociclador: (i) elegir la opción de tapa de precalentamiento y poner a 100 °C; (ii) 37 °C durante 30 minutos; (iii) 75 °C durante 10 minutos; y (iv) mantener a 4 °C.
El siguiente programa BMX puede guardarse en el termociclador: (i) elegir la opción de tapa de precalentamiento y configurarla a 100 °C; (ii) 38 °C durante 20 minutos; (iii) 60 °C durante 20 minutos; y (iv) mantener a 4 °C.
Para el tratamiento de bloqueo en 3', las muestras pueden tratarse de la siguiente forma: (i) centrífuga BMX a 600 x g durante 5 segundos; (ii) añadir 30 pl del grupo de muestras de la biblioteca de ADN protegidas en 5' al tubo de PCR; (iii) añadir 30 pl de BMX a cada muestra en cada tubo de PCR y mezclar a continuación a fondo pipeteando arriba y abajo; (iv) incubar poniéndolo en el termociclador y ejecutando el programa BMX. Cada tubo contiene 60 pl.
Para el tratamiento de bloqueo en 3' más exonucleasa, las muestras pueden tratarse de la siguiente forma: (i) centrifugar EMX a 600 x g durante 5 segundos; (ii) añadir 27 pl del grupo de muestras de la biblioteca de ADN protegidas en 5' al tubo de PCR; (iii) añadir 5 pl de EMX a cada muestra en cada tubo de PCR y mezclar a continuación a fondo pipeteando arriba y abajo; (iv) incubar poniéndolo en el termociclador y ejecutando el programa EMX; (v) centrifugar BMX a 600 x g durante 5 segundos; (vi) añadir 32 pl de BMX directamente a cada reacción de exonucleasa en cada tubo de PCR y luego mezclar completamente pipeteando arriba y abajo; e (vii) incubar poniéndolo en el termociclador y ejecutando el programa BMX. Cada tubo contiene 64 pl.
La muestra agrupada tratada puede limpiarse de la siguiente forma: (1) agitar el SPB en vortex hasta que esté bien disperso; (2) añadir 60 pl de SPB a cada tubo de tratamiento de muestra y mezclar bien pipeteando arriba y abajo; (3) incubar a temperatura ambiente durante 5 minutos; (4) poner en un soporte magnético y esperar hasta que el líquido sea transparente (2-5 minutos); (5) retirar y desechar todo el sobrenadante de cada tubo; (6) lavar 2 veces como sigue: (a) añadir 200 pl de EtOH al 80 % recién preparado a cada tubo, (b) incubar en el soporte magnético durante 30 segundos y (c) retirar y desechar todo el sobrenadante de cada tubo; (7) utilizar una pipeta de 20 pl para quitar el EtOH residual de cada tubo; (8) secar al aire en el soporte magnético durante 5 minutos; (9) añadir 22,5 pl de RSB a cada tubo; (10) retirar del soporte magnético y a continuación mezclar bien pipeteando arriba y abajo; (11) incubar a temperatura ambiente durante 2 minutos; (12) poner en un soporte magnético y esperar hasta que el líquido se vuelva transparente (2-5 minutos); (13) transferir 20 pl de sobrenadante a un nuevo tubo; (14) cuantificar las bibliotecas si es necesario y proceder a la formación estándar de clústeres para la plataforma HiSeq® 4000 comenzando con la etapa de desnaturalización con NaOH; y (15) guardar a entre -25 °C y -15 °C si no se lleva a cabo inmediatamente la formación de clústeres.
Ejemplo 2: Reducción del salto de índice mediante bloqueo en 3' de bibliotecas indexadas protegidas en 5' El protocolo de tratamiento establecido anteriormente en el Ejemplo 1 se aplicó en combinación con los siguientes materiales, equipos y métodos para formación de clústeres y secuenciación en la plataforma Illumina.
Condiciones experimentales: (1) Biblioteca TrueSeq ® Nano NA12878 de 450 pb humana (Instituto Coriell) generada utilizando cebadores P5 y P7 protegidos en 5' cargados a una concentración de 300 pM; (2) Instrumento HiSeq® X y química Illumina SBS según las instrucciones del fabricante; (3) celda de flujo ILS v3 de 550 nm; (4) amplificación ExAmp como se ha descrito anteriormente; y (5) adición de adaptador al 50 %: adaptador de horquilla libre de la placa adaptadora dual Illumina (DAP) añadido a la biblioteca de patrones antes de la desnaturalización, neutralización, adición de mezcla ExAmp y formación de clústeres.
Los resultados de este experimento se resumen a continuación en la Tabla 3 y en la Figura 10.
Tabla 3: Reducción del salto de índice mediante protección PCR con bloqueo del extremo 3'
Figure imgf000024_0001
Como se ilustra arriba, el salto de índice disminuyó significativamente con respecto a los adaptadores estándar mediante el empleo de adaptadores protegidos en 5' y bloqueados en 3' como se describe en la presente memoria. El tratamiento opcional con exonucleasa puede reducir el salto de índice aún más.
Además de los documentos ya citados en esta solicitud, se hace referencia a tres solicitudes de patente provisionales idénticamente tituladas “ Compositions and methods for improving sample identification in indexed nucleic acid libraries” presentadas el mismo día que la solicitud provisional para la que la presente solicitud reivindica prioridad (solicitud provisional US-62/488.824, 62/488.825 y 62/488.830), presentadas el 23 de abril de 2017).

Claims (14)

  1. REIVINDICACIONES
    i. Un polinucleótido preparado para secuenciación, que comprende:
    una secuencia adaptador-diana-adaptador,
    en donde la secuencia de adaptador comprende una secuencia específica de la biblioteca,
    en donde el polinucleótido es bicatenario en una región que comprende la diana y al menos una parte del adaptador en ambos extremos de la diana, y
    en donde los extremos 5' y 3' del polinucleótido en una región de la secuencia del adaptador son monocatenarios,
    en donde los extremos 5' se modifican para impedir la digestión por una enzima que tiene actividad exonucleasa 5', y
    en donde los extremos 3' se modifican para inhibir la digestión por una enzima que tiene actividad exonucleasa 3', para inhibir la adición de nucleótidos al extremo 3' por una enzima que tiene actividad polimerasa, o para inhibir la digestión por una enzima que tiene actividad exonucleasa 3' y para inhibir la adición de nucleótidos al extremo 3' por una enzima que tiene actividad polimerasa.
  2. 2. El polinucleótido según la reivindicación 1, en donde los extremos 3' comprenden un didesoxinucleótido.
  3. 3. El polinucleótido según la reivindicación 1, en donde los extremos 5' comprenden un enlace fosforotioato.
  4. 4. El polinucleótido según la reivindicación 1, en donde los extremos 5' comprenden tres enlaces fosforotioato.
  5. 5. Un método que comprende:
    secuenciar al menos una parte del polinucleótido de la reivindicación 1.
  6. 6. Un método que comprende:
    hibridar una parte de una de las regiones monocatenarias de la secuencia de adaptador del polinucleótido según la reivindicación 1 con un oligonucleótido unido a una superficie, teniendo el oligonucleótido un extremo
    3' libre.
  7. 7. El método según la reivindicación 6, que comprende extender el oligonucleótido unido a la superficie del sustrato desde el extremo 3' libre incorporando nucleótidos complementarios a una secuencia del polinucleótido de la reivindicación 1 para producir una copia del polinucleótido de la reivindicación 1 de modo que la copia se una a la superficie del sustrato.
  8. 8. El método según la reivindicación 7, que comprende amplificar la copia unida a la superficie del sustrato.
  9. 9. Una composición que comprende el polinucleótido según la reivindicación 1.
  10. 10. La composición según la reivindicación 9, que comprende una exonucleasa; o una o más enzimas que tienen actividad exonucleasa 5' y actividad exonucleasa 3'; en donde cuando la composición comprende una exonucleasa, la exonucleasa preferiblemente tiene actividad exonucleasa 3' y más preferiblemente la exonucleasa comprende Exonucleasa V.
  11. 11. La composición según la reivindicación 9, que comprende reactivos de amplificación.
  12. 12. La composición según la reivindicación 9, que comprende reactivos de secuenciación.
  13. 13. Un método que comprende:
    incubar una exonucleasa con una composición según la reivindicación 9.
  14. 14. El método según la reivindicación 13, en donde la exonucleasa tiene actividad exonucleasa 3' y actividad exonucleasa 5'.
ES21157377T 2017-04-23 2018-04-23 Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácido nucleico indexadas Active ES2937929T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US201762488833P 2017-04-23 2017-04-23

Publications (1)

Publication Number Publication Date
ES2937929T3 true ES2937929T3 (es) 2023-04-03

Family

ID=62117118

Family Applications (2)

Application Number Title Priority Date Filing Date
ES18723275T Active ES2882608T3 (es) 2017-04-23 2018-04-23 Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácidos nucleicos indexados
ES21157377T Active ES2937929T3 (es) 2017-04-23 2018-04-23 Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácido nucleico indexadas

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES18723275T Active ES2882608T3 (es) 2017-04-23 2018-04-23 Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácidos nucleicos indexados

Country Status (10)

Country Link
US (2) US10934584B2 (es)
EP (2) EP3615691B1 (es)
CN (1) CN110770353A (es)
AU (3) AU2018260633B2 (es)
CA (1) CA3059952C (es)
DK (1) DK3615691T3 (es)
ES (2) ES2882608T3 (es)
FI (1) FI3842545T3 (es)
SG (1) SG11201909394PA (es)
WO (1) WO2018200386A1 (es)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110785492B (zh) 2017-04-23 2024-04-30 伊鲁米纳剑桥有限公司 用于改进编索引的核酸文库中的样品鉴定的组合物和方法
US10995369B2 (en) 2017-04-23 2021-05-04 Illumina, Inc. Compositions and methods for improving sample identification in indexed nucleic acid libraries
CA3059840C (en) 2017-04-23 2022-04-26 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
CA3059952C (en) 2017-04-23 2023-04-18 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
US11142788B2 (en) * 2017-06-13 2021-10-12 Genetics Research, Llc Isolation of target nucleic acids
US10081829B1 (en) 2017-06-13 2018-09-25 Genetics Research, Llc Detection of targeted sequence regions
AU2019391274A1 (en) 2018-12-05 2021-01-07 Illumina Cambridge Limited Methods and compositions for cluster generation by bridge amplification
JP2022513546A (ja) 2018-12-18 2022-02-09 イルミナ ケンブリッジ リミテッド 単一表面プライマーを使用したペアエンドシーケンシングのための方法および組成物
KR20210148122A (ko) * 2019-02-25 2021-12-07 트위스트 바이오사이언스 코포레이션 차세대 시퀀싱을 위한 조성물 및 방법
CN111961711A (zh) * 2020-08-31 2020-11-20 伯科生物科技有限公司 用于靶向测序的通用杂交增强剂及方法
WO2022125939A1 (en) * 2020-12-10 2022-06-16 The United States Government Methods for detecting homogenous targets in a population with next generation sequencing
CN113293205A (zh) * 2021-05-24 2021-08-24 深圳市真迈生物科技有限公司 测序方法
CN113981056A (zh) * 2021-11-26 2022-01-28 广州达安基因股份有限公司 基于已知标签的内参进行高通量测序的方法
US20230212667A1 (en) 2021-12-29 2023-07-06 Illumina Cambridge Limited Methods of nucleic acid sequencing using surface-bound primers

Family Cites Families (83)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
CA1323293C (en) 1987-12-11 1993-10-19 Keith C. Backman Assay using template-dependent nucleic acid probe reorganization
CA1341584C (en) 1988-04-06 2008-11-18 Bruce Wallace Method of amplifying and detecting nucleic acid sequences
WO1989009835A1 (en) 1988-04-08 1989-10-19 The Salk Institute For Biological Studies Ligase-based amplification method
DE68927373T2 (de) 1988-06-24 1997-03-20 Amgen Inc Verfahren und mittel zum nachweis von nukleinsäuresequenzen
US5130238A (en) 1988-06-24 1992-07-14 Cangene Corporation Enhanced nucleic acid amplification process
ATE138106T1 (de) 1988-07-20 1996-06-15 David Segev Verfahren zur amplifizierung und zum nachweis von nukleinsäuresequenzen
US5185243A (en) 1988-08-25 1993-02-09 Syntex (U.S.A.) Inc. Method for detection of specific nucleic acid sequences
CA2044616A1 (en) 1989-10-26 1991-04-27 Roger Y. Tsien Dna sequencing
US5573907A (en) 1990-01-26 1996-11-12 Abbott Laboratories Detecting and amplifying target nucleic acids using exonucleolytic activity
CA2035010C (en) 1990-01-26 1996-12-10 Keith C. Backman Method of amplifying target nucleic acids applicable to both polymerase and ligase chain reactions
US5223414A (en) 1990-05-07 1993-06-29 Sri International Process for nucleic acid hybridization and amplification
US5455166A (en) 1991-01-31 1995-10-03 Becton, Dickinson And Company Strand displacement amplification
EP0754240B1 (en) 1994-02-07 2003-08-20 Beckman Coulter, Inc. Ligase/polymerase-mediated genetic bit analysis of single nucleotide polymorphisms and its use in genetic analysis
CA2185239C (en) 1994-03-16 2002-12-17 Nanibhushan Dattagupta Isothermal strand displacement nucleic acid amplification
US5763594A (en) 1994-09-02 1998-06-09 Andrew C. Hiatt 3' protected nucleotides for enzyme catalyzed template-independent creation of phosphodiester bonds
US6214987B1 (en) 1994-09-02 2001-04-10 Andrew C. Hiatt Compositions for enzyme catalyzed template-independent formation of phosphodiester bonds using protected nucleotides
US5872244A (en) 1994-09-02 1999-02-16 Andrew C. Hiatt 3' protected nucleotides for enzyme catalyzed template-independent creation of phosphodiester bonds
US6232465B1 (en) 1994-09-02 2001-05-15 Andrew C. Hiatt Compositions for enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides
US5808045A (en) 1994-09-02 1998-09-15 Andrew C. Hiatt Compositions for enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides
US5990300A (en) 1994-09-02 1999-11-23 Andrew C. Hiatt Enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
AU6846698A (en) 1997-04-01 1998-10-22 Glaxo Group Limited Method of nucleic acid amplification
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US7611869B2 (en) 2000-02-07 2009-11-03 Illumina, Inc. Multiplexed methylation detection methods
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
US7582420B2 (en) * 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
EP1368460B1 (en) 2000-07-07 2007-10-31 Visigen Biotechnologies, Inc. Real-time sequence determination
EP1354064A2 (en) 2000-12-01 2003-10-22 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
AR031640A1 (es) 2000-12-08 2003-09-24 Applied Research Systems Amplificacion isotermica de acidos nucleicos en un soporte solido
US6849404B2 (en) 2001-05-07 2005-02-01 Bioneer Corporation Polymerase chain reaction of DNA of which base sequence is completely unidentified
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
GB0129012D0 (en) 2001-12-04 2002-01-23 Solexa Ltd Labelled nucleotides
US7399590B2 (en) 2002-02-21 2008-07-15 Asm Scientific, Inc. Recombinase polymerase amplification
SI3002289T1 (en) 2002-08-23 2018-07-31 Illumina Cambridge Limited MODIFIED NUCLEOTES FOR POLYUCULOTIDE SEQUENCING
CA2498764C (en) 2002-09-20 2015-11-10 New England Biolabs, Inc. Helicase dependent amplification of nucleic acids
WO2004081183A2 (en) 2003-03-07 2004-09-23 Rubicon Genomics, Inc. In vitro dna immortalization and whole genome amplification using libraries generated from randomly fragmented dna
US9045796B2 (en) 2003-06-20 2015-06-02 Illumina, Inc. Methods and compositions for whole genome amplification and genotyping
GB0321306D0 (en) 2003-09-11 2003-10-15 Solexa Ltd Modified polymerases for improved incorporation of nucleotide analogues
JP2007525571A (ja) 2004-01-07 2007-09-06 ソレクサ リミテッド 修飾分子アレイ
EP3415641B1 (en) 2004-09-17 2023-11-01 Pacific Biosciences Of California, Inc. Method for analysis of molecules
WO2006064199A1 (en) 2004-12-13 2006-06-22 Solexa Limited Improved method of nucleotide detection
EP1888743B1 (en) 2005-05-10 2011-08-03 Illumina Cambridge Limited Improved polymerases
WO2007145612A1 (en) 2005-06-06 2007-12-21 454 Life Sciences Corporation Paired end sequencing
GB0514936D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Preparation of templates for nucleic acid sequencing
GB0514910D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Method for sequencing a polynucleotide template
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
EP2021503A1 (en) 2006-03-17 2009-02-11 Solexa Ltd. Isothermal methods for creating clonal single molecule arrays
SG170802A1 (en) 2006-03-31 2011-05-30 Solexa Inc Systems and devices for sequence by synthesis analysis
US8178360B2 (en) 2006-05-18 2012-05-15 Illumina Cambridge Limited Dye compounds and the use of their labelled conjugates
US7833716B2 (en) 2006-06-06 2010-11-16 Gen-Probe Incorporated Tagged oligonucleotides and their use in nucleic acid amplification methods
WO2008042067A2 (en) 2006-09-28 2008-04-10 Illumina, Inc. Compositions and methods for nucleotide sequencing
US7754429B2 (en) 2006-10-06 2010-07-13 Illumina Cambridge Limited Method for pair-wise sequencing a plurity of target polynucleotides
US8343746B2 (en) 2006-10-23 2013-01-01 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
WO2008093098A2 (en) 2007-02-02 2008-08-07 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
WO2010003132A1 (en) 2008-07-02 2010-01-07 Illumina Cambridge Ltd. Using populations of beads for the fabrication of arrays on surfaces
US20100062494A1 (en) 2008-08-08 2010-03-11 President And Fellows Of Harvard College Enzymatic oligonucleotide pre-adenylation
CA2792433C (en) 2010-03-08 2016-10-11 Gerassimos Makrigiorgos Full cold-pcr enrichment with reference blocking sequence
US8778848B2 (en) 2011-06-09 2014-07-15 Illumina, Inc. Patterned flow-cells useful for nucleic acid analysis
US8778849B2 (en) 2011-10-28 2014-07-15 Illumina, Inc. Microarray fabrication system and method
US8938309B2 (en) 2012-01-16 2015-01-20 Greatbatch Ltd. Elevated hermetic feedthrough insulator adapted for side attachment of electrical conductors on the body fluid side of an active implantable medical device
CA2862552A1 (en) 2012-01-26 2013-08-01 Nugen Technologies, Inc. Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
WO2013177220A1 (en) 2012-05-21 2013-11-28 The Scripps Research Institute Methods of sample preparation
US8895249B2 (en) 2012-06-15 2014-11-25 Illumina, Inc. Kinetic exclusion amplification of nucleic acid libraries
US9512422B2 (en) 2013-02-26 2016-12-06 Illumina, Inc. Gel patterned surfaces
CA2898459C (en) 2013-03-14 2021-02-02 Illumina, Inc. Modified polymerases for improved incorporation of nucleotide analogues
CA2905144C (en) 2013-03-14 2023-08-22 Lyle J. Arnold Methods for amplification of nucleic acids on solid support
JP6333297B2 (ja) 2013-03-15 2018-05-30 イルミナ ケンブリッジ リミテッド 修飾ヌクレオシドまたは修飾ヌクレオチド
EP3919624A3 (en) 2013-07-01 2021-12-29 Illumina, Inc. Catalyst-free surface functionalization and polymer grafting
ES2764096T3 (es) 2013-08-19 2020-06-02 Abbott Molecular Inc Bibliotecas de secuenciación de próxima generación
WO2015069374A1 (en) 2013-11-07 2015-05-14 Agilent Technologies, Inc. Plurality of transposase adapters for dna manipulations
US9677132B2 (en) 2014-01-16 2017-06-13 Illumina, Inc. Polynucleotide modification on solid support
PT3161154T (pt) 2014-06-27 2020-06-08 Illumina Inc Polimerases modificadas para incorporação melhorada de análogos de nucleotídeos
EP3201355B1 (en) 2014-09-30 2019-07-31 Illumina, Inc. Modified polymerases for improved incorporation of nucleotide analogues
CN114805710B (zh) 2014-10-31 2023-11-17 伊鲁米纳剑桥有限公司 聚合物以及dna共聚物涂层
AU2016219328B2 (en) 2015-02-10 2022-04-21 Illumina, Inc. Methods and compositions for analyzing cellular components
US9850484B2 (en) 2015-09-30 2017-12-26 The General Hospital Corporation Comprehensive in vitro reporting of cleavage events by sequencing (Circle-seq)
CN110785492B (zh) 2017-04-23 2024-04-30 伊鲁米纳剑桥有限公司 用于改进编索引的核酸文库中的样品鉴定的组合物和方法
CA3059840C (en) 2017-04-23 2022-04-26 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
CA3059952C (en) 2017-04-23 2023-04-18 Illumina Cambridge Limited Compositions and methods for improving sample identification in indexed nucleic acid libraries
US10995369B2 (en) 2017-04-23 2021-05-04 Illumina, Inc. Compositions and methods for improving sample identification in indexed nucleic acid libraries

Also Published As

Publication number Publication date
US20180305752A1 (en) 2018-10-25
FI3842545T3 (fi) 2023-01-31
CA3059952C (en) 2023-04-18
CA3059952A1 (en) 2018-11-01
SG11201909394PA (en) 2019-11-28
EP3842545B1 (en) 2022-11-30
CN110770353A (zh) 2020-02-07
EP3615691B1 (en) 2021-05-26
AU2021203361B2 (en) 2024-05-16
US10934584B2 (en) 2021-03-02
DK3615691T3 (da) 2021-07-26
US20210172014A1 (en) 2021-06-10
AU2018260633A1 (en) 2019-10-31
WO2018200386A8 (en) 2019-02-14
EP3615691A1 (en) 2020-03-04
AU2021203361A1 (en) 2021-06-24
AU2024202607A1 (en) 2024-05-09
ES2882608T3 (es) 2021-12-02
WO2018200386A1 (en) 2018-11-01
AU2018260633B2 (en) 2021-04-15
EP3842545A1 (en) 2021-06-30

Similar Documents

Publication Publication Date Title
ES2937929T3 (es) Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácido nucleico indexadas
ES2929837T3 (es) Composiciones y métodos para mejorar la identificación de muestras en bibliotecas de ácidos nucleicos indexados
US10975430B2 (en) Compositions and methods for improving sample identification in indexed nucleic acid libraries
US10428363B2 (en) Amplification methods to minimise sequence specific bias
US20210230689A1 (en) Compositions and methods for improving sample identification in indexed nucleic acid libraries
JP2021518147A (ja) エンドヌクレアーゼ媒介移動平衡(EM−SEq)による核酸の増幅のための方法