ES2965266T3 - Métodos para la secuenciación de polinucleótidos - Google Patents

Métodos para la secuenciación de polinucleótidos Download PDF

Info

Publication number
ES2965266T3
ES2965266T3 ES21712731T ES21712731T ES2965266T3 ES 2965266 T3 ES2965266 T3 ES 2965266T3 ES 21712731 T ES21712731 T ES 21712731T ES 21712731 T ES21712731 T ES 21712731T ES 2965266 T3 ES2965266 T3 ES 2965266T3
Authority
ES
Spain
Prior art keywords
sequencing
template
resynthesis
strand
extension reaction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES21712731T
Other languages
English (en)
Inventor
Jared Peace
Machado Klara Bojanovic
Peter Mcinerney
Jonathan Boutell
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Illumina Inc
Original Assignee
Illumina Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina Inc filed Critical Illumina Inc
Application granted granted Critical
Publication of ES2965266T3 publication Critical patent/ES2965266T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6832Enhancement of hybridisation reaction
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/10Nucleotidyl transfering
    • C12Q2521/101DNA polymerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2527/00Reactions demanding special reaction conditions
    • C12Q2527/101Temperature
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2531/00Reactions of nucleic acids characterised by
    • C12Q2531/10Reactions of nucleic acids characterised by the purpose being amplify/increase the copy number of target nucleic acid
    • C12Q2531/101Linear amplification, i.e. non exponential
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2533/00Reactions characterised by the enzymatic reaction principle used
    • C12Q2533/10Reactions characterised by the enzymatic reaction principle used the purpose being to increase the length of an oligonucleotide strand
    • C12Q2533/101Primer extension
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/137Reactions characterised by the reaction format or use of a specific feature the purpose or use of a displacement step
    • C12Q2537/1376Displacement by an enzyme
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2565/00Nucleic acid analysis characterised by mode or means of detection
    • C12Q2565/50Detection characterised by immobilisation to a surface

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

La presente invención se refiere a mejoras en métodos de secuenciación de ácidos nucleicos de alto rendimiento y, en particular, a mejoras en métodos para llevar a cabo reacciones de extensión durante la secuenciación por pares. La presente invención se refiere a un método para llevar a cabo una reacción de extensión de resíntesis de hebras durante la secuenciación por pares, en donde dicha reacción de extensión de resíntesis de hebras se lleva a cabo entre una primera lectura de secuenciación y una segunda lectura de secuenciación, y en donde dicha reacción de extensión de resíntesis de hebras extiende una o más cebadores inmovilizados para copiar una primera hebra modelo para generar una segunda hebra modelo inmovilizada; caracterizado porque la reacción de extensión de resíntesis de hebras se lleva a cabo utilizando una polimerasa de desplazamiento de hebras no termoestable a una temperatura inferior a 55 °C, preferiblemente a 38 °C. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Métodos para la secuenciación de polinucleótidos
Campo
La presente invención se refiere a mejoras en los métodos de secuenciación de ácidos nucleicos de alto rendimiento y, en particular, a mejoras en los métodos para llevar a cabo reacciones de extensión durante la secuenciación por pares.
Antecedentes
Los métodos de secuenciación de ácidos nucleicos se conocen en la técnica desde hace muchos años. Algunos de estos métodos se basan en ciclos sucesivos de incorporación de análogos de ácidos nucleicos marcados de forma fluorescente. En dichos métodos de “ secuenciación por síntesis” o “ secuenciación cíclica” , la identidad de la base añadida se determina después de cada adición de nucleótido mediante la detección de la etiqueta fluorescente.
En particular, el documento US-5.302.509 describe un método para secuenciar un molde de polinucleótido que implica realizar múltiples reacciones de extensión usando una ADN-polimerasa o ADN-ligasa para incorporar sucesivamente polinucleótidos marcados complementarios de una cadena molde. En dicha reacción de “ secuenciación por síntesis” , una nueva cadena de polinucleótidos de bases emparejadas con la cadena molde se construye en la dirección 5' a 3' mediante la incorporación sucesiva de nucleótidos individuales complementarios de la cadena molde. Los nucleósidos trifosfato del sustrato usados en la reacción de secuenciación se etiquetan en la posición 3' con diferentes etiquetas 3', permitiendo la determinación de la identidad del nucleótido incorporado a medida que se añaden los siguientes nucleótidos.
Para llevar a cabo una secuenciación precisa, puede añadirse una modificación estructural reversible de terminación de cadena o “ grupo de bloqueo” a los nucleótidos sustrato para garantizar que los nucleótidos se incorporen de uno en uno de forma controlada. A medida que se incorpora cada nucleótido individual, el grupo de bloqueo impide cualquier incorporación adicional de nucleótidos a la cadena del polinucleótido. Una vez que se ha determinado la identidad del último nucleótido etiquetado incorporado, el resto etiqueta y el grupo de bloqueo se retiran, lo que permite que el siguiente nucleótido bloqueado y etiquetado se incorpore en una ronda posterior de secuenciación.
La técnica de secuenciación “ por parejas” o “ por pares” (dichos términos se usan indistintamente en el presente documento) se conoce generalmente en la técnica de la biología molecular, particularmente en el contexto de la secuenciación aleatoria genómica completa. La secuenciación por parejas permite determinar dos “ lecturas” de secuencia a partir de dos lugares de un único duplete de polinucleótidos. La ventaja del enfoque por parejas es que se obtiene mucha más información secuenciando dos tramos de “ n” bases cada uno a partir de un único molde que secuenciando “ n” bases de cada uno de dos moldes independientes de forma aleatoria. Con el uso de herramientas de software apropiadas para el ensamblaje de información de la secuencia, es posible utilizar el conocimiento de que las secuencias “ emparejadas” no son completamente aleatorias, sino que se sabe que se producen en un único duplete y, por lo tanto, están unidas o emparejadas en el genoma. Se ha demostrado que esta información ayuda en gran medida al ensamblaje de secuencias del genoma completo en una secuencia de consenso.
La secuenciación por parejas se ha realizado típicamente usando vectores de clonación aleatoria circulares especializados. Tras cortar el vector en un sitio único específico, el ADN molde que se va a secuenciar (típicamente a Dn genómico) se inserta en el vector y los extremos se vuelven a sellar para formar una nueva construcción. Las secuencias de vectores que flanquean el ADN insertado incluyen sitios de unión para cebadores de secuenciación que permiten la secuenciación del ADN insertado en cadenas opuestas. Sin embargo, la necesidad de cebadores de secuenciación en ambos extremos del fragmento del molde hace que sea extremadamente difícil el uso de técnicas de secuenciación basadas en matriz. Con técnicas basadas en matriz, que generalmente se basan en un molde monocatenario, generalmente solo es posible secuenciar desde un extremo de un molde de nucleótidos, ya que la cadena complementaria no está unida a la superficie.
Para maximizar el rendimiento de las reacciones de secuenciación de ácidos nucleicos, es ventajoso poder secuenciar múltiples moléculas molde en paralelo. Se puede lograr el procesamiento en paralelo de múltiples moldes con el uso de tecnología de matriz de ácidos nucleicos. Estas matrices consisten típicamente en una matriz de alta densidad de polinucleótidos inmovilizados sobre un material de soporte sólido y, generalmente, se basan de un molde monocatenario.
Se han notificado diversos métodos para la secuenciación de doble extremo de un polinucleótido molde que pueden llevarse a cabo en un soporte sólido. Por ejemplo, se conocen métodos de amplificación de ácidos nucleicos que permiten que los productos de la amplificación queden inmovilizados sobre un soporte sólido para formar matrices que comprenden agrupaciones o “ colonias” formadas a partir de una pluralidad de cadenas de polinucleótidos inmovilizadas idénticas y una pluralidad de cadenas complementarias inmovilizadas idénticas. Las moléculas de ácidos nucleicos presentes en las colonias de ADN de las matrices agrupadas preparadas según estos métodos pueden proporcionar moldes para reacciones de secuenciación.
En el documento WO 2008/041002 se describe un método de secuenciación por pares que comprende: (a) proporcionar un soporte sólido que tiene inmovilizado sobre el mismo una pluralidad de polinucleótidos molde bicatenarios cada uno formado a partir de primeras y segundas cadenas molde complementarias unidas al soporte sólido por sus extremos 5', y múltiples copias de uno o más cebadores inmovilizados en el extremo 5' que se pueden hibridar con el extremo 3' de la primera cadena molde; (b) tratar la pluralidad de polinucleótidos molde bicatenarios de manera que las primeras cadenas molde se hibriden con cebadores inmovilizados en el extremo 5'; (c) llevar a cabo una primera lectura de secuenciación para determinar la secuencia de una primera región del polinucleótido molde; (d) llevar a cabo una reacción de extensión para extender uno o más de los cebadores inmovilizados para copiar la primera cadena molde con el objetivo de generar una segunda cadena molde inmovilizada; (e) tratar la pluralidad de primeras y segundas cadenas molde inmovilizadas para eliminar la primera cadena molde del soporte sólido; y (f) llevar a cabo una segunda lectura de secuenciación para determinar la secuencia de una segunda región del polinucleótido molde, en donde la determinación de las secuencias de la primera y segunda regiones del polinucleótido diana se consigue secuenciando por pares dichas primera y segunda regiones de dicho polinucleótido bicatenario diana.
El documento US-2014/329698 se refiere a métodos para indexar muestras y secuenciar múltiples moldes de polinucleótidos.
Sigue existiendo una necesidad continua de mejorar las plataformas de secuenciación, lo que incluye aumentar la velocidad de ciclado, mejorar la eficiencia, aumentar la precisión y/o simplificar procesos.
Resumen
Según un aspecto de la presente invención, se proporciona un método para llevar a cabo una reacción de extensión con resíntesis de cadena durante la secuenciación por pares, en donde dicha reacción de extensión con resíntesis de cadena se lleva a cabo entre una primera lectura de secuenciación y una segunda lectura de secuenciación, y en donde dicha reacción de extensión con resíntesis de cadena extiende uno o más cebadores inmovilizados para copiar una primera cadena molde y generar una segunda cadena molde inmovilizada; caracterizado por que la reacción de extensión con resíntesis de cadena se lleva a cabo usando una polimerasa de desplazamiento de cadena no termoestable a una temperatura de menos de 55 °C, en donde dichas primeras cadenas molde son una agrupación, y en donde la misma polimerasa de desplazamiento de cadena no termoestable se usa durante la generación inicial de las agrupaciones y la reacción de extensión con resíntesis de cadena.
Según un aspecto de la presente invención, se proporciona un método para llevar a cabo una reacción de extensión durante la secuenciación por pares de la primera y segunda regiones de un polinucleótido diana, en donde dichas primera y segunda regiones están en el mismo polinucleótido diana, incluyendo dicha secuenciación por pares las siguientes etapas:
(a) proporcionar un soporte sólido que tenga inmovilizado sobre el mismo una pluralidad de primeros y segundos polinucleótidos molde bicatenarios, cada uno formado a partir de una primera cadena molde y su complemento o una segunda cadena molde y su complemento, en donde la primera y segunda cadenas molde están unidas al soporte sólido por el extremo 5' y en donde la primera o segunda cadena molde unida al soporte sólido comprende además un cebador de extensión inmovilizado en 5';
(b) eliminar selectivamente los complementos de la primera y la segunda cadena molde y eliminar selectivamente las segundas cadenas molde para permitir la hibridación de un primer cebador de secuenciación con la primera cadena molde;
(c) llevar a cabo una primera lectura de secuenciación para determinar la secuencia de una primera región del polinucleótido molde mediante una técnica de secuenciación por síntesis o mediante una técnica de secuenciación por ligadura;
(d) llevar a cabo una reacción de extensión para extender uno o más de los cebadores inmovilizados para copiar la primera cadena molde con el objetivo de generar una segunda cadena molde inmovilizada;
(e) eliminar selectivamente las primeras cadenas molde para permitir la hibridación de un segundo cebador de secuenciación con las segundas cadenas molde generadas en la etapa (d);
(f) llevar a cabo una segunda lectura de secuenciación para determinar la secuencia de una segunda región del polinucleótido molde mediante una técnica de secuenciación por síntesis o mediante una técnica de secuenciación por ligadura, en donde la determinación de las secuencias de la primera y segunda regiones del polinucleótido diana se consigue mediante la secuenciación por pares de dichas primera y segunda regiones de dicho polinucleótido diana; en donde la reacción de extensión de la etapa (d) se lleva a cabo usando una polimerasa de desplazamiento de cadena no termoestable a una temperatura de menos de 55 °C, en donde dichas primeras cadenas molde son una agrupación, y en donde la misma polimerasa de desplazamiento de cadena no termoestable se usa durante la generación inicial de las agrupaciones y la reacción de extensión con resíntesis de cadena.
Se ha descubierto sorprendentemente que la reacción de extensión llevada a cabo tras la primera lectura de secuencia se puede llevar a cabo a temperaturas más bajas con polimerasas de desplazamiento de cadena no termoestables y retener aún además altos niveles de resíntesis de cadena. El uso de polimerasas de desplazamiento de cadena no termoestables también puede llevar a otras ventajas, que incluyen: tiempos de regeneración más rápidos; protocolos simplificados con reducciones en las etapas del proceso; reducción en el número de reactivos diferentes utilizados y/o en la cantidad de reactivos usados; reducir la complejidad de la química; y/o reducir la complejidad del cartucho utilizado para llevar a cabo los métodos.
Según un aspecto adicional, se proporciona un método para la secuenciación por pares de las regiones primera y segunda de un polinucleótido diana, en donde dichas primera y segunda regiones están en el mismo polinucleótido diana, incluyendo dicha secuenciación por pares la reacción de extensión como se describe en el presente documento.
Según un aspecto adicional, se proporciona un método para mejorar la calidad de datos de una reacción de secuenciación, que comprende llevar a cabo una reacción de extensión como se describe en el presente documento.
Breve descripción de los dibujos
Las Figuras 1 a 4 muestran flujos de trabajo de reacciones de extensión ilustrativas según la presente invención.
La Figura 5 muestra la eficiencia de regeneración de los protocolos según la presente invención.
Las Figuras 6A y 6B muestran un análisis de optimización de los protocolos según la presente invención.
La Figura 7 muestra un esquema de amplificación por puente para la resíntesis por parejas.
Descripción detallada
Las siguientes características se aplican a todos los aspectos de la invención.
La secuenciación comprende generalmente cuatro etapas centrales: 1) preparación de la biblioteca para formar una pluralidad de polinucleótidos molde disponibles para la secuenciación; 2) generar agrupaciones para formar una matriz de polinucleótidos molde individuales amplificados sobre un soporte sólido; 3) secuenciar la matriz de agrupaciones; y 4) análisis de datos para determinar la secuencia diana.
La presente invención como se define en las reivindicaciones adjuntas se dirige a la etapa de regeneración (también denominada en el presente documento como reacción de extensión con resíntesis de cadena o regeneración de agrupaciones) que se lleva a cabo entre la primera y segunda etapas de secuenciación durante un proceso de secuenciación por pares. La presente invención se refiere al uso de polimerasas de desplazamiento de cadena no termoestables durante dicha reacción de extensión.
Las etapas típicas de secuenciación por pares son conocidas y se han descrito en el documento WO 2008/041002. Sin embargo, las etapas clave se describirán brevemente. La metodología aplicable a la presente invención se ha descrito en los documentos WO 08/041002, WO 07/052006, WO 98/44151, WO 00/18957, WO 02/06456, WO 07/107710, WO05/068656 y US-2012/0316086. Se puede encontrar información adicional en los documentos US-20060024681, US-200602926U, WO 06110855, WO 06135342, WO 03074734, WO07010252, WO 07091077, WO 00179553 y WO 98/44152.
Los moldes adecuados para la secuenciación pueden prepararse mediante la amplificación de ácidos nucleicos en fase sólida para producir colonias de ácidos nucleicos. Los moldes que se van a amplificar (y luego secuenciar) generalmente comprenderán regiones desconocidas flanqueadas por extremos conocidos que comprenden cebadores universales, por ejemplo preparados según los métodos descritos en la solicitud WO07052006. Por ejemplo, los moldes pueden derivar de una muestra de ADN genómico o de una biblioteca de ADNc. La amplificación se puede realizar usando procedimientos análogos a los descritos en los documentos WO 98/44151, WO 00/18957, WO0206456 o WO07107710. Si se forma el ácido nucleico molde por amplificación del ácido nucleico en fase sólida, estas secuencias no diana pueden derivarse de los cebadores usados para la reacción de amplificación. Alternativamente, las secuencias no diana pueden ligarse a secuencias diana fragmentadas para incorporarlas en la molécula de ácido nucleico.
Por ejemplo, los ácidos nucleicos adecuados a amplificar con cebadores universales pueden prepararse modificando los polinucleótidos que comprenden la región diana a amplificar (y secuenciar) mediante la adición de secuencias adaptadoras conocidas a los extremos 5' y 3' de los polinucleótidos diana a amplificar.
Los adaptadores son típicamente oligonucleótidos cortos que pueden sintetizarse por medios convencionales. Los adaptadores pueden unirse a los extremos 5' y 3' de los fragmentos del ácido nucleico diana mediante una variedad de medios (por ejemplo, subclonación, ligadura. etc.). Más específicamente, dos secuencias adaptadoras diferentes se unen a una molécula de ácido nucleico diana a amplificar de manera que un adaptador se une en un extremo (es decir, el extremo 5' o 3') de la molécula de ácido nucleico diana y otro adaptador se une en el otro extremo (es decir, el extremo 3' o 5' respectivamente) de la molécula de ácido nucleico diana. La construcción resultante que comprende una secuencia de ácido nucleico diana flanqueada por adaptadores puede denominarse en el presente documento como una “ construcción de ácido nucleico sustrato” o como un “ polinucleótido molde” o “ construcción de molde” . Los polinucleótidos molde pueden fraccionarse ventajosamente por tamaño antes de la modificación con las secuencias adaptadoras.
Las secuencias adaptadoras contienen secuencias que permiten la amplificación de estas moléculas sobre un soporte sólido para formar agrupaciones usando cebadores directos e inversos (por ejemplo, S1 y S2) inmovilizados en el soporte sólido (la estructura general de estos se describe con más detalle a continuación). Estas secuencias de los adaptadores pueden denominarse en el presente documento “ secuencias de unión al cebador” . Para actuar como molde para la amplificación del ácido nucleico, una sola cadena de la construcción del molde debe contener una secuencia que es complementaria a los cebadores de amplificación directos (por ejemplo, S1) de manera que la molécula del cebador directo pueda unirse y cebar la síntesis de una cadena complementaria copiando el molde y una secuencia que es complementaria al cebador de amplificación inversa (por ejemplo, S2) de manera que nuevamente la molécula del cebador inverso pueda unirse y cebar la síntesis de una segunda cadena complementaria. Las secuencias de los adaptadores que permiten la hibridación con las moléculas de cebador inmovilizadas tendrán típicamente aproximadamente 20-40 nucleótidos de longitud, aunque la invención no se limita a las secuencias de esta longitud.
La identidad precisa de las secuencias S1 y S2 en los cebadores de amplificación y, por lo tanto, las secuencias afines en los adaptadores, generalmente no son significativas para la invención, siempre que las moléculas del cebador puedan interactuar con las secuencias adaptadoras para dirigir la amplificación mediante la PCR. Los criterios para el diseño de los cebadores de la PCR son generalmente bien conocidos por los expertos en la técnica.
Los polinucleótidos molde pueden prepararse también para contener además una etiqueta o secuencia de índice. El uso de una secuencia de etiquetas, por ejemplo, como se describe en la solicitud WO05068656, permite analizar múltiples muestras diferentes en la misma ejecución de secuenciación mientras se conserva la identidad de cada muestra. La etiqueta se puede leer al final de la primera lectura y/o al inicio (o final) de la segunda lectura. La invención no se limita a dos lecturas por agrupamiento, tres o más lecturas por agrupamiento se pueden obtener simplemente deshibridando un primer cebador de secuenciación extendido y rehibridando un segundo cebador antes o después de la reacción de extensión con resíntesis de cadena. Los métodos para preparar muestras adecuadas para indexar se describen en la técnica anterior.
En un ejemplo, un polinucleótido molde comprende en la dirección 5' a 3', una primera secuencia de unión a cebador (por ejemplo, P5), una secuencia de índice (por ejemplo, i5), un primer sitio de unión de secuenciación (por ejemplo, SBS3), una inserción, un segundo sitio de unión de secuenciación (por ejemplo, SBS12'), una segunda secuencia de índice (por ejemplo, i7') y una segunda secuencia de unión a cebador (por ejemplo, P7'). En otra realización, el molde comprende, en la dirección 3' a 5', un primer sitio de unión a cebador (por ejemplo, P5', que es complementario a P5), una secuencia de índice (por ejemplo, i5', que es complementaria a I5), un primer sitio de unión de secuenciación (por ejemplo, SBS3' que es complementario a SBS3), una inserción, un segundo sitio de unión de secuenciación (por ejemplo, SBS12, que es complementario a SBS12), una segunda secuencia de índice (por ejemplo, i7, que es complementaria a I7) y una segunda secuencia de unión a cebador (por ejemplo, P7, que es complementaria a P7'). Cualquiera de los moldes se denomina en el presente documento como una “ cadena molde” o “ un polinucleótido molde” . La combinación de una secuencia de unión a cebador, una secuencia de índice y un sitio de unión de secuenciación puede denominarse en el presente documento una secuencia adaptadora, y una única inserción está flanqueada por una secuencia adaptadora 5' y una secuencia adaptadora 3'.
La secuencia de la secuencia de unión al cebador P5 puede comprender la Id. de sec. n.°: 1 o una variante de la misma, la secuencia del adaptador P5' puede comprender la Id. de sec. n.°: 3 o una variante de la misma, la secuencia del adaptador P7 puede comprender la Id. de sec. n.°: 2 o una variante de la misma y la secuencia del adaptador P7' puede comprender la Id. de sec. n.°: 4 o una variante de la misma. En las realizaciones, la variante tiene al menos un 80 % de identidad de secuencia con la Id. de sec. n.°: 1, 2, 3 o 4. Más preferiblemente, la variante tiene al menos 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o al menos 99 % de identidad de secuencia global con la Id. de sec. n.°: 1, 2, 3 o 4.
Id. de sec. n.°: 1: secuencia P5
AAT GAT ACGGCGAC CACC GAGAT CTACAC
Id. de sec. n.°: 2: secuencia P7
CAAGCAGAAGACGGCATACGAGAT
Id. de sec. n.°: 3 secuencia P5' (complementaria a P5)
GTGTAGATCTCGGTGGTCGCCGTATCATT
Id. de sec. n.°: 4 secuencia P7' (complementaria a P7)
ATCTCGTATGCCGTCTTCTGCTTG
La siguiente etapa principal tras la preparación de la biblioteca, es la generación de agrupaciones para formar una matriz de polinucleótidos molde individuales amplificados sobre un soporte sólido. Como se ha explicado anteriormente, para producir la amplificación de los polinucleótidos molde, una mezcla de al menos dos cebadores de amplificación se inmoviliza o “ injerta” sobre la superficie de un soporte sólido adecuado.
Como se usa en el presente documento, el término “ soporte sólido” se refiere a un sustrato rígido que es insoluble en líquido acuoso (o al menos suficientemente rígido como para que el sustrato no se hinche sustancialmente cuando se absorbe el líquido y no se contraiga sustancialmente cuando el líquido se elimina por secado). La invención puede utilizar soportes sólidos compuestos por un sustrato o matriz (por ejemplo, portaobjetos de vidrio, perlas de polímero, etc.) que se han “ funcionalizado” , por ejemplo, mediante la aplicación de una capa o recubrimiento de un material intermedio que comprende grupos reactivos que permiten la unión covalente a biomoléculas, tales como polinucleótidos. El soporte sólido puede ser un sustrato plano. El soporte sólido puede ser un sustrato laminar. El soporte sólido pueden ser perlas. Otros ejemplos de materiales que pueden utilizarse en los sustratos o métodos estructurados de la presente descripción se describen en la publicación de solicitud de patente US-2012/0316086 A1.
Como primera etapa en la generación de colonias por amplificación en fase sólida, una mezcla de cebadores de amplificación directos e inversos puede inmovilizarse o “ injertarse” sobre la superficie de un soporte sólido adecuado.
Cuando se hace referencia a la inmovilización o unión de moléculas (por ejemplo, ácidos nucleicos) a un soporte sólido, los términos “ inmovilizado” y “ unido” se usan indistintamente en el presente documento y se pretende que ambos términos abarquen la unión directa o indirecta, covalente o no covalente, salvo que se indique lo contrario, ya sea de forma explícita o por el contexto. En determinadas realizaciones de la invención, se puede preferir una unión covalente, pero generalmente todo lo que se requiere es que las moléculas (por ejemplo, ácidos nucleicos) permanezcan inmovilizadas o unidas al soporte en las condiciones en las que se pretende usar el soporte, por ejemplo, en aplicaciones que requieren la amplificación y/o secuenciación de ácidos nucleicos. Cuando se refiere a la unión de ácidos nucleicos a otros ácidos nucleicos, entonces se usan en el presente documento los términos “ inmovilizado” e “ hibridado” , y generalmente se refieren a enlaces de hidrógeno entre ácidos nucleicos complementarios.
En un ejemplo, la etapa de injerto implicará generalmente la unión covalente de los cebadores al soporte en o cerca del extremo 5', dejando el extremo 3' libre para la extensión del cebador. Los cebadores de amplificación son típicamente moléculas de oligonucleótidos que tienen las siguientes estructuras:
Cebador directo: A-L-S1
Cebador inverso: A-L-S2
En donde A representa un resto opcional que permite la unión a un soporte sólido, L representa un resto opcional del enlazador y S1 y S2 son secuencias polinucleotídicas que permiten la amplificación de una molécula de ácido nucleico sustrato que comprende una región diana que se desea secuenciar (total o parcialmente). Las secuencias S1 y S2 de los cebadores de amplificación pueden ser específicas para un ácido nucleico diana concreto que se desea amplificar, pero en otras realizaciones las secuencias S1 y S2 pueden ser secuencias cebadoras “ universales” que permiten la amplificación de cualquier ácido nucleico diana de secuencia conocida o desconocida que se ha modificado (por ejemplo, con adaptadores como se ha descrito anteriormente) para permitir la amplificación con los cebadores universales.
La mezcla de cebadores injertados sobre el soporte sólido comprenderá generalmente cantidades sustancialmente iguales de los cebadores directos e inversos.
El grupo A puede ser cualquier resto (que incluye una modificación química no nucleotídica) que permita la unión (preferiblemente covalente) a un soporte sólido. El grupo A puede comprender un nucleófilo que contiene azufre, tal como fosforotioato, presente en el extremo 5' de una cadena polinucleotídica. Alternativamente, el grupo A puede omitirse donde se use la química adecuada para unir directamente el enlazador o el ácido nucleico directamente al soporte sólido.
L representa un enlazador o espaciador que puede incluirse pero no es estrictamente necesario. El enlazador puede incluirse para asegurar que un sitio de escisión presente en las moléculas de polinucleótidos inmovilizadas generadas como resultado de la reacción de amplificación se coloca a una distancia óptima del soporte sólido, o el enlazador por sí mismo puede contener un sitio de escisión.
El enlazador puede ser una cadena que contiene carbono con una fórmula (CH<2>)n en donde “ n” es de 1 a aproximadamente 1500, por ejemplo, menos de aproximadamente 1000, preferiblemente menos de 100, por ejemplo, de 2-50, particularmente 5-25. Sin embargo, puede emplearse una variedad de diferentes enlazadores con la única restricción colocada en sus estructuras que hacen que los enlazadores sean estables en condiciones en las que los polinucleótidos están destinados a usarse posteriormente, por ejemplo, condiciones usadas en la amplificación y secuenciación del ADN.
Se pueden usar también enlazadores que no consistan en solo átomos de carbono. Dichos enlazadores pueden incluir polietilenglicol (PEG)
Los enlazadores formados principalmente a partir de cadenas de átomos de carbono y de PEG pueden modificarse para contener grupos funcionales que interrumpen las cadenas. Los ejemplos de dichos grupos incluyen cetonas, ésteres, aminas, amidas, éteres, tioéteres, sulfóxidos, sulfonas. Por separado o en combinación con la presencia de dichos grupos funcionales puede emplearse alqueno, alquino, restos aromáticos o heteroaromáticos o restos alifáticos cíclicos (por ejemplo ciclohexilo). Los anillos de ciclohexilo o fenilo pueden, por ejemplo, conectarse a una cadena de PEG o (CH<2>)n a través de sus posiciones 1 y 4.
Como alternativa a los enlazadores descritos anteriormente, que se basan principalmente en cadenas lineales de átomos de carbono saturados, opcionalmente interrumpidos con átomos de carbono insaturados o heteroátomos, se pueden contemplar otros enlazadores que se basan en ácidos nucleicos o unidades de monosacáridos (por ejemplo, dextrosa). Está también dentro del alcance de la presente invención utilizar péptidos como enlazadores.
En una realización adicional, el enlazador puede comprender uno o más nucleótidos. Dichos nucleótidos también se pueden denominar en el presente documento nucleótidos “espaciadores” . Típicamente, pueden incluirse de 1 a 20, más preferiblemente de 1 a 15 o de 1 a 10, y más particularmente 2, 3, 4, 5, 6, 7, 8, 9 o 10 nucleótidos espaciadores. Lo más preferible, el cebador incluirá 10 nucleótidos espaciadores. Se prefiere usar espaciadores de poliT, aunque pueden usarse otros nucleótidos y combinaciones de los mismos. En una realización preferida, el cebador puede incluir nucleótidos espaciadores 10<t>.
Para que se produzca la reacción de injerto del cebador, se aplica una mezcla de los cebadores de amplificación a un soporte sólido en condiciones que permitan la reacción entre el resto A (si está presente) y el soporte, o entre el ácido nucleico y el soporte. El soporte sólido puede funcionalizarse adecuadamente para permitir la unión covalente mediante el resto A. El resultado de la reacción de injerto es una distribución sustancialmente uniforme de los cebadores sobre al menos una porción del soporte sólido. Cuando el soporte sólido incluye nanopocillos, entonces en realizaciones preferidas los cebadores están restringidos a la ubicación de los nanopocillos, y no están presentes en las regiones intersticiales del soporte sólido.
Tras la unión de los cebadores de amplificación, el soporte sólido se pone en contacto con los polinucleótidos molde a amplificar en condiciones que permiten la hibridación entre el molde y los cebadores inmovilizados. En el ejemplo dado anteriormente, las secuencias de unión al cebador P5' y P7' en los polinucleótidos molde son complementarias a los cebadores inmovilizados (P5 y P7 respectivamente) presentes en la superficie del soporte sólido. Como se usa en el presente documento “ '” indica la cadena complementaria.
El molde se añade generalmente en solución libre en las condiciones de hibridación adecuadas, que resultarán evidentes para el lector experto. Típicamente, las condiciones de hibridación son, por ejemplo, 5 x s Sc a 40 °C. A continuación, puede proceder la amplificación en fase sólida (por ejemplo, mediante el método análogo al del documento WO 98/44151), siendo la primera etapa de la amplificación una etapa de extensión del cebador en la que se añaden nucleótidos al extremo 3' del cebador inmovilizado hibridado con el molde para producir una cadena complementaria inmovilizada completamente extendida (o duplete polinucleotídico). Esta cadena complementaria incluirá, por lo tanto, en su extremo 3' una secuencia que es capaz de unirse o “ formar un puente” con una segunda molécula de cebador inmovilizada en el soporte sólido, lo que conduce a una nueva ronda de amplificación comenzando desde la extensión del segundo cebador inmovilizado usando la cadena complementaria como molde.
Las reacciones de amplificación posteriores pueden proceder sustancialmente a continuación como se describe en el documento WO 98/44151 o la del documento WO 00/18957, que dará como resultado la producción de una matriz agrupada compuesta por colonias de productos de amplificación “ formando puentes” . Aquí, ambas cadenas de los productos de amplificación se inmovilizarán en el soporte sólido en o cerca del extremo 5', derivándose esta unión de la unión original de los cebadores de amplificación. Típicamente, los productos de amplificación dentro de cada colonia se derivarán de la amplificación de una sola molécula molde (diana). Alternativamente, cuando se generan agrupaciones, pueden usarse otros procedimientos de amplificación y serán conocidos por los expertos. Por ejemplo, la amplificación puede ser una amplificación isotérmica usando una polimerasa de desplazamiento de cadena; o puede ser la amplificación por exclusión como se describe en el documento WO 2013/188582.
Las modificaciones necesarias para permitir la posterior escisión de los productos de amplificación con puente pueden incluirse ventajosamente en uno o ambos cebadores de amplificación. Dichas modificaciones pueden colocarse en cualquier lugar del cebador de amplificación, siempre que esto no afecte en gran medida a la eficiencia de la reacción de amplificación. Por lo tanto, las modificaciones que permiten la escisión pueden formar parte de la región enlazadora L o una o ambas secuencias S1 o S2. A modo de ejemplo, los cebadores de la amplificación pueden modificarse para incluir entre otros enlaces de diol, nucleótidos de uracilo, ribonucleótidos, nucleótidos metilados, enlazadores peptídicos, tapones de PCR o secuencias de reconocimiento para una endonucleasa de restricción. Debido a que todas las moléculas de ácido nucleico preparadas mediante amplificación en fase sólida contendrán finalmente secuencias derivadas de los cebadores de amplificación, se llevará a cabo cualquier modificación en los cebadores en los productos amplificados.
En este contexto, la expresión “ amplificación en fase sólida” se refiere a una reacción de amplificación que es análoga a la PCR estándar, excepto que los cebadores de amplificación directos y/o inversos están inmovilizados (por ejemplo, unidos covalentemente) a un soporte sólido en o cerca del extremo 5'. Los productos de reacción de la PCR son, por lo tanto, cadenas extendidas derivadas por extensión de los cebadores de amplificación que están inmovilizados en el soporte sólido en o cerca del extremo 5'. La propia amplificación en fase sólida puede llevarse a cabo, por ejemplo, usando procedimientos análogos a los descritos en los documentos WO 98/44151 y WO 00/18957.
Un duplete polinucleotídico típicamente estará formado a partir de dos cadenas de polinucleótidos complementarias compuestas por desoxirribonucleótidos unidos por enlaces fosfodiéster, pero puede incluir adicionalmente uno o más ribonucleótidos y/o restos químicos no nucleotídicos y/o nucleótidos no naturales y/o enlaces principales no naturales. En particular, el ácido nucleico bicatenario puede incluir restos químicos no nucleotídicos, por ejemplo, enlazadores o espaciadores, en el extremo 5' de una o ambas cadenas. A modo de ejemplo no limitante, el ácido nucleico bicatenario puede incluir nucleótidos metilados, bases de uracilo, grupos fosforotioato, ribonucleótidos, enlaces de diol, enlaces disulfuro, péptidos, etc. Dichas modificaciones no de ADN o no naturales pueden incluirse para permitir la escisión, o conferir alguna otra propiedad deseable, por ejemplo, para permitir la unión covalente a un soporte sólido, o para actuar como espaciadores para colocar un sitio de escisión una distancia óptima del soporte sólido.
Cuando una cadena polinucleotídica se hibrida solo parcialmente con una cadena complementaria, por ejemplo, una cadena polinucleotídica larga hibridada con un cebador de nucleótidos corto, puede denominarse en el presente documento como un ácido nucleico monocatenario.
La siguiente etapa principal es secuenciar la matriz de agrupamientos.
Para facilitar la secuenciación, es preferible que una de las cadenas se elimine de la superficie para permitir la hibridación eficiente de un cebador de secuenciación a la cadena inmovilizada restante, por ejemplo, la segunda cadena se elimina dejando la primera cadena restante o viceversa. A continuación se describen los métodos adecuados para la linealización, y se describen con más detalle en la solicitud con número WO07010251.
La desnaturalización (y posterior rehibridación de las cadenas escindidas) da como resultado la producción de un molde de secuenciación que es parcial o sustancialmente monocatenario. A continuación, puede iniciarse una reacción de secuenciación por hibridación de un cebador de secuenciación con la parte monocatenaria del molde. En realizaciones de la invención, la secuenciación se lleva a cabo usando una enzima polimerasa de desplazamiento de cadena como se describe a continuación. Los métodos pueden requerir que se realicen dos reacciones de secuenciación. La primera reacción de secuenciación se inicia mediante un primer cebador de secuenciación añadido a partir de la solución y conduce a la secuenciación de una primera cadena molde o puede iniciarse por el grupo 3'-hidroxilo del cebador inmovilizado que se libera dentro del duplete inmovilizado. La segunda reacción de secuenciación se inicia por un segundo cebador de secuenciación que puede estar inmovilizado o bien aplicado en solución. La hibridación del cebador de secuenciación en solución a la (primera) cadena molde se logra poniendo en contacto el cebador y la cadena molde en condiciones que promueven el apareamiento del cebador con el molde. Dichas condiciones serán bien conocidas generalmente por los expertos en la técnica de biología molecular. No obstante, este método permite obtener datos de secuencia de ambos extremos de un polinucleótido molde obteniendo una lectura de secuencia de una cadena molde, copiando la cadena usando cebadores inmovilizados (como se explica a continuación), liberando la primera cadena y secuenciando la segunda cadena copiada. Esto da una lectura de secuencia desde ambos extremos del fragmento original.
Como tal, en un ejemplo, la invención se refiere a métodos para secuenciar regiones de un polinucleótido molde, denominadas en el presente documento primera y segunda regiones para determinación de la secuencia. Las regiones primera y segunda para la determinación de la secuencia están en ambos extremos de un polinucleótido molde, (el molde y su complemento se denominan en el presente documento respectivamente cadenas molde primera y segunda). Una vez que se conoce la secuencia de una cadena, también se conoce la secuencia de su cadena complementaria, por lo tanto, el término dos regiones puede aplicarse igualmente a ambos extremos de un molde monocatenario, o ambos extremos de un molde bicatenario, en donde se conocen una primera región y su complemento, y se conocen una segunda región y su complemento.
En un ejemplo, la primera lectura de secuenciación puede comprender la unión de un primer cebador de secuenciación (cebador de secuenciación de lectura 1) al primer sitio de unión de secuenciación (por ejemplo, SBS3') seguido por la síntesis y secuenciación de la cadena complementaria. Esto conduce a la secuenciación de la inserción. En una segunda etapa, un cebador de secuenciación índice (por ejemplo, cebador de secuenciación i7) se une a un segundo sitio de unión de secuenciación (por ejemplo, SBS12) que conduce a la síntesis y secuenciación de la secuencia índice (por ejemplo, secuenciación del cebador i7). Tras la regeneración de agrupaciones (como se describe en el presente documento) se lleva a cabo la segunda lectura de secuencia. La segunda lectura de secuenciación puede comprender la unión de un cebador de secuenciación índice (por ejemplo, cebador de secuenciación i5) al complemento del primer sitio de unión de secuenciación en el molde (por ejemplo, SBS3) y la síntesis y secuenciación de la secuencia índice (por ejemplo, i5). En una segunda etapa, un segundo cebador de secuenciación (cebador de secuenciación de lectura 2) se une al complemento del cebador (por ejemplo, cebador de secuenciación i7) se une a un segundo sitio de unión de secuenciación (por ejemplo, SBS12') que conduce a la síntesis y secuenciación de la inserción en la dirección inversa. En otras palabras, SBS3 es el cebador de secuenciación para Read1, SBS12 para Read2, SBS3' para i5, SBS12' para i7.
La secuenciación se puede realizar utilizando cualquier técnica de “ secuenciación por síntesis” adecuada, en donde los nucleótidos u oligonucleótidos se añaden sucesivamente al grupo hidroxilo 3' libre, típicamente proporcionado mediante el apareamiento de un cebador de secuenciación, dando como resultado la síntesis de una cadena de polinucleótidos en la dirección 5' a 3'. En una realización concreta, la naturaleza del nucleótido u oligonucleótido añadido se determina después de cada adición.
Un método de secuenciación en particular se basa en el uso de nucleótidos modificados que pueden actuar como terminadores de cadena reversibles. Los nucleótidos adecuados se describen en el documento WO04018497. Una vez que el nucleótido modificado se ha incorporado en la cadena de polinucleótidos en crecimiento complementaria a la región del molde que se está secuenciando, no hay ningún grupo 3'-OH libre disponible para dirigir la extensión de secuencia adicional y, por lo tanto, la polimerasa no puede añadir nucleótidos adicionales. Una vez que se ha determinado la naturaleza de la base incorporada en la cadena en crecimiento, puede retirarse el bloqueo del extremo 3' para permitir la adición del siguiente nucleótido sucesivo. Ordenando los productos derivados utilizando estos nucleótidos modificados es posible deducir la secuencia de ADN del molde de ADN. Dichas reacciones pueden realizarse en un solo experimento si cada uno de los nucleótidos modificados tiene adherida al mismo una etiqueta diferente, que se sabe corresponde a la base concreta, lo que facilita la discriminación entre las bases añadidas en cada paso de incorporación. Las etiquetas adecuadas se describen en el documento WO2007/135368. Como alternativa, se puede llevar a cabo una reacción separada que contenga cada uno de los nucleótidos modificados, que se añaden por separado. Los nucleótidos modificados pueden también llevar una etiqueta para facilitar su detección. En una realización concreta, la etiqueta es una etiqueta fluorescente. Cada tipo de nucleótido puede llevar una etiqueta fluorescente diferente. Sin embargo la etiqueta detectable no tiene que ser una etiqueta fluorescente. Se puede usar cualquier etiqueta que permita detectar la incorporación del nucleótido a la secuencia de ADN.
Un método para detectar los nucleótidos etiquetados por fluorescencia comprende el uso de luz láser de una longitud de onda específica para los nucleótidos etiquetados, o el uso de otras fuentes adecuadas de iluminación. La fluorescencia de la etiqueta en el nucleótido incorporado puede detectarse mediante una cámara CCD u otro medio de detección adecuado. En la técnica anterior, se describen los medios de detección adecuados. Una vez que se completa la primera lectura de secuenciación, y se ha determinado una longitud de lectura suficiente, se puede copiar el resto de la cadena. Si el grupo 3'-hidroxilo se creó originalmente con una enzima de corte, entonces será posible volver a crear un grupo 3'-hidroxilo nuevo en la misma posición, y extenderse desde esta posición, sin embargo, es igualmente posible continuar copiando la primera cadena molde del grupo 3'-hidroxilo de los nucleótidos incorporados como parte de la reacción de secuenciación. Esta reacción de extensión con los cuatro nucleótidos no etiquetados y una polimerasa copiará todas las bases del primer molde. Los cebadores inmovilizados pueden contener un sitio de restricción para una enzima de corte, y el tratamiento con la enzima de restricción puede acortar los cebadores inmovilizados, o los dupletes molde inmovilizados para liberar un grupo 3' hidroxilo no bloqueado. Los métodos para generar un 3'-hidroxilo libre solamente en una cadena de un duplete incluyen el tratamiento con una enzima de corte o el tratamiento químico para eliminar un nucleótido específico. Las enzimas de corte adecuadas son bien conocidas en la técnica, y podrían preferiblemente cortar en un sitio que está 3'-alejado de su sitio de unión para evitar tener bases de secuencia que derivan del sitio cortado conocido. La enzima de corte debería cortar solo una de las cadenas, en el extremo más cercano a la superficie. Los ejemplos de enzimas de restricción adecuadas incluirían Nt.BstNBI y Nt.Alwl, que no tienen bases de secuencia definidas más allá del 3'-hidroxilo liberado.
Tras la primera ejecución de secuenciación, los nucleótidos se someten a una etapa de regeneración (como se describe adicionalmente en el presente documento) para permitir la segunda ejecución de secuenciación. Por lo tanto, los nucleótidos pueden desprotegerse para permitir ciclos de copia adicionales de la cadena molde. Si los nucleótidos llevan una modificación didesoxi, esto puede eliminarse usando una exonucleasa, o una polimerasa con actividad exonucleasa. Por lo tanto, las agrupaciones podrían prepararse como se describe con dos cebadores injertados, los cebadores no utilizados se bloquean durante la primera reacción de secuenciación, a continuación se desbloquean para permitir la copia adicional de las cadenas molde. Una parte de los cebadores de amplificación se puede unir a la superficie con una modificación que bloquea el 3' hidroxilo de la extensión en los ciclos de amplificación. Esto, en efecto, significa que la superficie se trata con tres o más cebadores de amplificación en lugar de dos. Al menos dos de los cebadores de amplificación deben comprender regiones de secuencia idéntica, pero al menos un cebador no será susceptible a las condiciones usadas para eliminar el segundo cebador durante el proceso de linealización y contendrá un resto bloqueante en 3'. El resto bloqueante puede tomar la forma de un bloque químico, tal como un grupo azidometilo que puede eliminarse con un reactivo de fosfina, un grupo enzimáticamente extraíble tal como un grupo fosfato que puede eliminarse con una fosfatasa, o puede estar en forma de un grupo de nucleósidos que puede eliminarse usando la exonucleolisis 3'-5'. Dichas modificaciones de nucleósidos incluyen sitios abásicos, que pueden eliminarse como se describe, o nucleótidos 2', 3' didesoxi que pueden eliminarse mediante una polimerasa con actividad exonucleasa. Las modificaciones adicionales incluyen el uso de una secuencia de oligonucleótidos que puede formar una región autocomplementaria con una secuencia de reconocimiento para una enzima de restricción. El tratamiento con la enzima de restricción debe cortar la cadena en horquilla y liberar una secuencia más corta con un grupo 3' hidroxilo libre. El tratamiento de la superficie tras completar la primera ejecución de secuenciación para desbloquear los cebadores permitirá que la primera cadena restante se hibride con los cebadores desprotegidos y vuelva a copiar las cadenas ya secuenciadas.
Una vez que se ha retirado el producto de secuenciación de la primera lectura de secuenciación, la primera cadena molde permanecerá inmovilizada en el soporte sólido. Como la primera cadena molde incluye en su extremo 3' una secuencia complementaria a un segundo cebador inmovilizado en el soporte sólido, es capaz de unirse o “ formar un puente” con esa segunda molécula del cebador. A continuación se puede llevar a cabo una reacción de extensión como se ha descrito adicionalmente en el presente documento a fin de extender uno o más de los cebadores inmovilizados para copiar la primera cadena molde y generar una segunda cadena molde inmovilizada, que posteriormente se secuencia en la segunda lectura de secuencia. Por lo tanto, la agrupación se puede regenerar para permitir la lectura de la segunda secuencia. Esta etapa puede repetirse varias veces para obtener la resíntesis por parejas final. La Figura 7 muestra un ejemplo de este ciclo. Aquí, la amplificación por puente requiere la recirculación de tres reactivos para realizar las rondas de multiplicación. En primer lugar, se usa un agente de desnaturalización (LDR) para desnaturalizar las agrupaciones a 55 °C. A continuación, se empuja H<2>O a través del soporte sólido (por ejemplo, una celda de flujo) para facilitar la eliminación del agente de desnaturalización. A continuación se utiliza una enzima polimerasa de desplazamiento de cadena para extender los cebadores superficiales 3' disponibles. Este ciclo puede repetirse como se describe a continuación para la resíntesis por parejas.
Nuevamente, esto vuelve a generar los dupletes molde donde ambas cadenas están inmovilizadas. En relación con la reacción de extensión durante la secuenciación por pares (es decir, entre la primera y segunda lecturas de secuenciación), la extensión se lleva a cabo usando una enzima polimerasa de desplazamiento de cadena.
En una etapa adicional, puede ser ventajoso extender los cebadores 3'-hidroxilo libres con una pluralidad de bases complementarias al molde antes de iniciar la secuenciación. Esto eleva la temperatura de fusión del duplete inmovilizado, y ayuda a prevenir que la cadena molde se vuelva a hibridar con otros cebadores inmovilizados durante la secuenciación, lo que da lugar a problemas de ajuste de fase dentro de la agrupación. La etapa de ligadura se lleva a cabo después de que la etapa de fosfatasa haya retirado el grupo fosfato del cebador inmovilizado. La adición de 20-30 bases de secuencia puede realizarse mediante una reacción de ligadura con un cebador modificado con 5'-fosfato hibridado adyacente al 3'-hidroxilo libre. Se puede usar una ligasa, tal como ligasa de ADN T4 para sellar el hueco. En el caso del tratamiento USER que elimina el nucleótido U, la base 5' del cebador será T que reemplaza la U extirpada. Para que la etapa de hibridación se lleve a cabo de manera eficiente, la cadena 5' no inmovilizada debe eliminarse mediante tratamiento de exonucleólisis 5'-3' como se ha descrito anteriormente. Dichos cebadores extendidos, inmovilizados con un 3'-hidroxilo libre se describen como cebadores extendidos anclados en 5' o extendidos inmovilizados, y la generación de dichos cebadores extendidos es solo una de las etapas involucradas en el tratamiento de la pluralidad de polinucleótidos molde de manera que la primera cadena molde se hibrida con un cebador que está inmovilizado en el soporte sólido en su extremo 5'.
En un ejemplo, antes de iniciar la reacción de extensión descrita anteriormente, puede ser ventajoso extender el cebador inmovilizado. La extensión se puede realizar usando un oligonucleótido hibridado con una secuencia que se extiende más allá del extremo 3' del cebador inmovilizado, cuya secuencia también es la misma secuencia que la región correspondiente en el extremo del molde. Esta porción extendida puede servir como base para la extensión del cebador inmovilizado y, por lo tanto, el cebador extendido es complementario a la cadena molde inmovilizada. Los cebadores extendidos pueden mejorar la eficiencia de la etapa de resíntesis de cadena debido a su mayor longitud. Una vez que se ha generado una secuencia complementaria de la primera cadena, la primera cadena se puede retirar de la superficie.
La eliminación del primer molde de la superficie permite secuenciar el segundo molde monocatenario, de nuevo desde el extremo 3'. Por lo tanto, ambos extremos del molde inmovilizado original pueden secuenciarse. La primera cadena puede eliminarse mediante una etapa de tratamiento de linealización ortogonal adecuada, tal como la escisión de diol o la eliminación de un resto de 8-oxo-G y tras la desnaturalización de la primera cadena molde, se puede hibridar un segundo cebador de secuenciación con la segunda cadena molde y secuenciar la segunda cadena molde. Esta estrategia de linealización ortogonal también permite las lecturas de ambos extremos del molde.
La eliminación selectiva o linealización de la primera cadena molde también se puede lograr de otras numerosas formas. La linealización para permitir la hibridación de un cebador de secuenciación en solución no tiene que dejar un 3'-hidroxilo funcional en la cadena molde, y puede escindir una cadena o ambas cadenas. Por lo tanto, como se usa en el presente documento, el término “ linealización” se refiere a la eliminación selectiva de una cadena complementaria. Si uno de los cebadores de amplificación se inmoviliza de manera que pueda escindirse de la superficie, el ADN bicatenario resultante puede prepararse monocatenario usando calor o condiciones de desnaturalización química para dar una molécula monocatenaria que contiene un sitio de hibridación del cebador. La molécula monocatenaria puede hibridarse con un cebador de secuenciación en solución para permitir una lectura de secuenciación de la cadena molde inmovilizada. Dicho sitio de escisión es un sitio que permite la escisión controlada de la primera cadena molde por medios químicos, enzimáticos o fotoquímicos. Puede usarse cualquier reacción de escisión enzimática, química o fotoquímica adecuada para la escisión. En el documento WO07010251 se describen varios métodos adecuados. La reacción de escisión puede dar como resultado la eliminación de una parte o la totalidad de la cadena que se está escindiendo. Los medios de escisión adecuados incluyen, por ejemplo, digestión con enzimas de restricción, en cuyo caso el sitio de escisión es un sitio de restricción adecuado para la enzima que dirige la escisión de una o ambas cadenas de un molde duplete; digestión con ARNasa o escisión química de un enlace entre un desoxirribonucleótido y un ribonucleótido, en cuyo caso el sitio de escisión puede incluir uno o más ribonucleótidos; reducción química de un enlace disulfuro con un agente reductor (por ejemplo TCEP), en cuyo caso el sitio de escisión debe incluir un enlace disulfuro apropiado; escisión química de un enlace diol con peryodato, en cuyo caso el sitio de escisión debe incluir un enlace diol; generación de un sitio abásico e hidrólisis posterior, etc.
En una realización, la escisión puede producirse en un sitio de escisión en una o ambas cadenas de un duplete de polinucleótido molde que comprende una o más o cualquier combinación de nucleótidos no naturales, ribonucleótidos o una modificación química no nucleotídica.
Las técnicas de escisión adecuadas para su uso en el método de la invención incluyen, entre otras, las siguientes, que se describen en detalle en el documento WO2008041002: i) escisión química, ii) escisión de sitios abásicos, iii) escisión de ribonucleótidos, iv) escisión fotoquímica, v) tapones de PCR, vi) escisión del enlazador peptídico, vii) digestión enzimática.
A continuación se hibrida un segundo cebador de secuenciación con la cadena copiada del molde y una reacción de secuenciación transcurre mediante la adición sucesiva de nucleótidos al segundo cebador de secuenciación como se ha descrito anteriormente, lo que da como resultado la determinación de la secuencia de una segunda región del polinucleótido diana.
Los dupletes de polinucleótidos descritos en el presente documento forman parte de una sola agrupación o colonia compuesta por muchos de dichos primeros y segundos dupletes, y la agrupación o colonia en sí misma formará típicamente parte de una matriz de muchas de dichas agrupaciones o colonias. Los términos “ agrupación” y “ colonia” se utilizan indistintamente en el presente documento y se refieren a un sitio diferenciado sobre un soporte sólido compuesto por una pluralidad de cadenas de ácido nucleico inmovilizadas idénticas y una pluralidad de cadenas de ácido nucleico complementarias inmovilizadas idénticas. La expresión “ matriz agrupada” se refiere a una matriz formada a partir de tales agrupaciones o colonias. Cada duplete de polinucleótidos en la matriz contiene las mismas regiones de reconocimiento de cebadores universales para permitir que se usen los mismos cebadores para secuenciar cada agrupación. Como se ha explicado anteriormente, se hibrida a continuación un primer cebador de secuenciación con la primera cadena molde y se produce una reacción de secuenciación mediante la incorporación sucesiva de nucleótidos u oligonucleótidos al primer cebador de secuenciación, lo que da como resultado la determinación de la secuencia de una primera región del polinucleótido diana.
Una característica clave es que ambas rondas de secuenciación pueden suceder en la misma agrupación o colonia en una matriz agrupada. En dicha matriz, cada duplete dentro de cada colonia comprenderá el mismo polinucleótido diana bicatenario, mientras que pueden formarse diferentes colonias a partir de dupletes que comprenden diferentes polinucleótidos diana bicatenarios. En una realización concreta, al menos el 90 %, más particularmente al menos el 95 % de las colonias de una matriz agrupada dada se formará a partir de dupletes molde que comprenden diferentes polinucleótidos diana bicatenarios, aunque dentro de cada colonia individual de la matriz, todos los dupletes molde comprenderán el mismo polinucleótido diana bicatenario.
El método de secuenciación descrito anteriormente no es limitante y esencialmente puede usarse cualquier metodología de secuenciación que se base en la incorporación sucesiva de nucleótidos en una cadena de polinucleótidos. Entre las técnicas adecuadas se incluyen, por ejemplo, Pyrosequencing(TM), FISSEQ (secuenciación fluorescente in situ), MPSS (secuenciación de firmas masivamente paralela) y secuenciación por métodos basados en la ligadura. El polinucleótido bicatenario diana que se va a secuenciar puede ser cualquier polinucleótido que se desee secuenciar. El polinucleótido diana puede ser de secuencia conocida, desconocida o parcialmente conocida, tal como, por ejemplo, en aplicaciones de resecuenciación. Utilizando el método de preparación de moldes descrito con detalle a continuación es posible preparar matrices de moldes a partir de esencialmente cualquier polinucleótido diana bicatenario de secuencia conocida, desconocida o parcialmente conocida. Con el uso de matrices, es posible secuenciar múltiples dianas de la misma o diferente secuencia en paralelo. Una aplicación concreta del método por pares es la secuenciación de fragmentos de ADN genómico. El método ofrece ventajas particulares en la identificación de reordenamientos genómicos, ya que se sabrá que las dos regiones de secuencia obtenidas para cada molécula diana utilizando el método están unidas a una cierta distancia una de otra en el genoma, dependiendo del tamaño de la molécula diana de partida.
La presente invención ha identificado que las polimerasas de desplazamiento de cadena no termoestables pueden usarse ventajosamente durante la etapa de regeneración tras la primera lectura de secuenciación y antes de la segunda lectura de secuenciación. En otras palabras, puede usarse una polimerasa de desplazamiento de cadena no termoestable para resintetizar una cadena complementaria de una primera cadena molde tras la secuenciación de esa cadena. Como se ha explicado anteriormente, esto se denomina resíntesis por parejas.
La “ polimerasa no termoestable” pretende abarcar polimerasas que se optimizan para funcionar a una temperatura más baja y contrastar con polimerasas termoestables como BST.
“ La polimerasa de desplazamiento de cadena” describe la capacidad de desplazar el ADN en la dirección 3' que se encuentra durante la síntesis. Las polimerasas no termoestables según la presente invención tienen una temperatura de incubación óptima por debajo de 55 °C. En una realización adicional, las polimerasas no termoestables según la presente invención tienen una temperatura de incubación óptima por debajo de 50 °C, por debajo de 45 °C, por debajo de 40 °C, por debajo de 39 °C, a o por debajo de 38 °C, alrededor de 38 °C o alrededor de 37 °C. Las polimerasas no termoestables particularmente preferidas tienen una temperatura de incubación óptima de aproximadamente 38 °C.
En una realización adicional, las polimerasas no termoestables según la presente invención tienen una temperatura de actividad óptima por debajo de 55 °C. En una realización adicional, las polimerasas no termoestables según la presente invención tienen una temperatura de actividad óptima por debajo de 50 °C, por debajo de 45 °C, por debajo de 40 °C, por debajo de 39 °C, a o por debajo de 38 °C, alrededor de 38 °C o alrededor de 37 °C. Las polimerasas no termoestables particularmente preferidas tienen una temperatura de actividad óptima de aproximadamente 38 °C.
Las polimerasas de desplazamiento de cadena no termoestables adecuadas según la presente invención pueden encontrarse, por ejemplo, a través de New England BioLabs, Inc., e incluyen phi29, Bsu, Klenow y ADN-polimerasa I (E. coli) y fragmentos funcionales de las mismas. Una polimerasa particularmente preferida es Bsu. En una realización alternativa, la polimerasa es el fragmento de Bsu grande.
Usando polimerasas no termoestables, la reacción de extensión se puede llevar a cabo a una temperatura de menos de 55 °C, preferiblemente menos de 50 °C, preferiblemente menos de 40 °C, preferiblemente 38 °C /- 2 °C, preferiblemente 38 °C /- 1 °C, preferiblemente 38 °C.
El uso de polimerasas de desplazamiento de cadena también conlleva ventajas y puede superar los retos que plantea la reasociación de las cadenas molde entre sí. El uso de polimerasas de desplazamiento de cadena ayuda a asegurar que las cadenas molde se hibriden con los cebadores relevantes para permitir una extensión eficiente.
El uso de polimerasas no termoestables durante la etapa de regeneración tras la primera lectura de secuenciación conduce a una serie de ventajas. A modo de ejemplo, se ha utilizado anteriormente la BST termoestable durante esta etapa de regeneración que requiere 12 ciclos de regeneración para conseguir un % óptimo de resíntesis. Por el contrario, se ha demostrado que las polimerasas no termoestables consiguen una resíntesis aceptable después de sólo tres ciclos. Véase, por ejemplo, el protocolo PETv23 x 5 m en los Ejemplos, que consiguió un 79,4 % de resíntesis después de sólo 3 ciclos.
El uso de polimerasas no termoestables durante la resíntesis por parejas es contraintuitivo porque este paso está comprendido entre dos etapas de secuenciación, las cuales se llevan a cabo a alta temperatura usando polimerasas SBS adecuadas que pueden funcionar a 60 o 65 °C.
El uso de polimerasas no termoestables durante la resíntesis por parejas también puede conducir a otras ventajas si se usan las mismas polimerasas durante la amplificación del agrupamiento inicial para generar la matriz de agrupaciones que se secuencia posteriormente. A modo de ejemplo, si ExAmp (una mezcla de amplificación que comprende la polimerasa BSU de desplazamiento de cadena no termoestable) se usa tanto para la etapa inicial de generación de agrupaciones como para la etapa de resíntesis por parejas, entonces se reduce el número total de reactivos utilizados dentro de la máquina y se reduce también la complejidad del cartucho. Dichas ventajas pueden conducir a la optimización de COGS y la simplificación del protocolo.
En una realización, la etapa (d) se repite mediante múltiples ciclos de extensión y desnaturalización. Esto puede comprender 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 o más ciclos; preferiblemente 2-5 ciclos, 2-4 ciclos, 3-5 ciclos, 3 ciclos o 4 ciclos; con máxima preferencia 3 ciclos. A diferencia de una polimerasa que requiere un mayor número de ciclos, la presente invención puede completar la etapa de regeneración de manera eficiente.
En una realización, cada ciclo puede durar 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20 o 30 minutos. Los tipos de ciclos particularmente preferidos son 5 minutos. En realizaciones concretas, la etapa (d) puede comprender los siguientes ciclos de extensión y desnaturalización: 3 x 5 min; 3 x 30 min; 12 x 2 min; 6 x 4 min; 2 x 12 min o 3 x 5 min. En una realización concreta, se prefieren 3 x 5 min.
En una realización preferida, la reacción de extensión durante la secuenciación por pares comprende ciclos de extensión y desnaturalización.
La presente invención abarca cualquier agente de desnaturalización adecuado. Los agentes de desnaturalización adecuados incluyen: desnaturalizantes ácidos de ácidos nucleicos tales como ácido acético, HCl o ácido nítrico; desnaturalizantes básicos de ácidos nucleicos tales como NaOH; u otros desnaturalizantes de ácidos nucleicos tales como DMSO, formamida, betaína, guanidina, salicilato de sodio, propilenglicol o urea. Los agentes de desnaturalización preferidos son formamida y NaOH, preferiblemente formamida.
En una realización, la desnaturalización se lleva a cabo sustancialmente a la temperatura de la reacción de extensión.
En una realización particularmente preferida, el ciclo de extensión/desnaturalización comprende tres ciclos de extensión con dos ciclos de desnaturalización entre ellos. En una realización preferida adicional, se lleva a cabo un ciclo de desnaturalización antes del primer ciclo de extensión. Dicha realización comprende tres ciclos alternos de desnaturalización y extensión. Formamida es el desnaturalizante más preferido.
En una realización, la reacción de extensión (d) se lleva a cabo a una temperatura más baja que las etapas de lectura de secuenciación. Las etapas de secuenciación generalmente usarán una polimerasa diferente (por ejemplo, polimerasas SBS) que se optimizan a temperaturas más altas.
En una realización, la pluralidad de los polinucleótidos molde bicatenarios se genera mediante una reacción de amplificación usando la misma polimerasa que la polimerasa usada en la etapa de reacción de extensión (d).
La pluralidad de polinucleótidos molde bicatenarios inmovilizados en dicho soporte sólido en la etapa (a) puede ser preferiblemente una agrupación. La presente invención abarca cualquier método para generar dicha agrupación, pero una metodología preferida usa amplificación por puente. En una realización preferida, dicha amplificación por puente para generar la agrupación usa la misma polimerasa de desplazamiento de cadena no termoestable usada para la reacción de extensión de etapa (d). Este enfoque permite racionalizar aún más la metodología, ya que puede minimizar las mezclas de amplificación utilizadas en todo el proceso.
Por lo tanto, se puede usar una única polimerasa de desplazamiento de cadena no termoestable para todas las etapas de amplificación para generar o regenerar los polinucleótidos molde inmovilizados. Se puede usar una segunda polimerasa durante la etapa de secuenciación, lo que significa que en general todo el proceso puede completarse con dos polimerasas. Dicho enfoque racionalizado ofrece diversas ventajas de proceso, reducción de la complejidad y ahorro de costs of good sold (costes de productos vendidos - COGS).
Los términos “ agrupación” y “ colonia” se utilizan indistintamente en el presente documento y se refieren a un sitio diferenciado sobre un soporte sólido compuesto por una pluralidad de cadenas de ácido nucleico inmovilizadas idénticas y una pluralidad de cadenas de ácido nucleico complementarias inmovilizadas idénticas. La expresión “ matriz agrupada” se refiere a una matriz formada a partir de tales agrupaciones o colonias.
La presente invención proporciona un método para secuenciar por pares las regiones primera y segunda de un polinucleótido bicatenario diana, en donde dichas primera y segunda regiones están en el mismo polinucleótido bicatenario diana, incluyendo dicha secuenciación por pares las etapas (a) a (f) según se describe en el presente documento.
El método puede utilizarse para obtener dos lecturas vinculadas o emparejadas de información de secuenciación de cada uno de los moldes bicatenarios en una matriz agrupada.
La presente invención proporciona un método para mejorar la calidad de datos de una reacción de secuenciación, que comprende llevar a cabo una reacción de extensión según se describe en el presente documento.
La presente invención se describirá ahora mediante los siguientes ejemplos no limitativos.
Ejemplos
La secuenciación por parejas puede llevarse a cabo siguiendo la metodología descrita en el documento WO 2008/041002 (véase, por ejemplo, el ejemplo 13), con las siguientes modificaciones descritas a continuación siguiendo la primera etapa de secuenciación del fragmento diana. T ras completar satisfactoriamente la secuencia de lectura 1:
1. La desprotección de los cebadores i5 unidos a la superficie de la celda de flujo se lleva a cabo enzimáticamente usando una mezcla de resíntesis que comprende tampón y polinucleótido quinasa T4, tal como JRM, que está disponible de Illumina, Inc.
2. La celda de flujo se lava a continuación con tampón iónico, por ejemplo, tampón BB6, que está disponible en Illumina Inc.
3. Las agrupaciones se desnaturalizan con reactivo de desnaturalización de bajo sesgo (LDR -formamida 100 %) para eliminar el cebador de secuenciación extendido de la lectura 1.
4. La temperatura de la celda de flujo se lleva a 38 °C.
5. Para regenerar agrupaciones bicatenarias (Resíntesis), tres ciclos posteriores de LDR (formamida 100 %) y ExAmp (mezcla de amplificación que comprende la polimerasa BSU de desplazamiento de cadena no termoestable) se ciclan isotérmicamente a 38 °C de la siguiente manera. LDR y ExAmp están disponibles de Illumina, Inc.
5a. LDR se descarga a través de la celda de flujo con un gran factor de descarga destinado a desplazar completamente los contenidos de la celda de flujo.
5b. A continuación, el ExAmp se lava en la celda de flujo manteniendo un elevado factor de descarga y se incuba durante 5 minutos.
5c. Las etapas 5a y 5b se repiten para un total de tres ciclos de amplificación.
6. A continuación, se linealizan las nuevas agrupaciones bicatenarias para la lectura 2 y se lleva a cabo la hibridación de cebadores como en el documento WO 2008/041002.
En la FIG. 1 se muestra una representación gráfica de un flujo de trabajo según la presente invención. El flujo de trabajo PETv2 muestra la desprotección con JRM seguida por un lavado con tampón. A continuación, la agrupación se desnaturaliza con LDR seguido de un ciclo térmico hasta 38 °C. Posteriormente siguen tres ciclos de regeneración y desnaturalización usando ExAmp (que contiene BSU) y LDR (formamida 100 %).
En la FIG. 2 se muestra un flujo de trabajo alternativo PETv1 que es similar al flujo de trabajo de la FIG. 1 pero que no incluye la desnaturalización con LDR entre la regeneración y, en cambio, continúa con x 3 ciclos consecutivos de regeneración. Las FIG. 3 y 4 reflejan las FIG.1 y 2, pero incluyen además la linealización.
En las realizaciones, el SSC puede usarse también en los protocolos según la presente invención. Por ejemplo, las agrupaciones pueden lavarse antes y/o después de la resíntesis con SSC.
La eficiencia de regeneración de estos flujos de trabajo se evaluó frente a otros flujos de trabajo potenciales y los resultados se muestran en la FIG. 5 que muestran el % de resíntesis calculada a partir de los ciclos de secuenciación de HSX con protocolos de giro por parejas según la presente invención como se describe en la Tabla 1 siguiente. Tabla 1
El protocolo inicial probado fue PETv1 tras un ciclo de 3 x 5 min. Se consiguió una resíntesis del 64 % que se considera aceptable pero no está optimizada. El aumento del tiempo de incubación a 3 x 30 min mejoró el % de resíntesis al 84 %, aumentar tanto el tiempo de incubación como el número de ciclos de química también condujo a un impacto positivo en el % de resíntesis ('PETv2 12 ciclos - 2 min, sin LDR' mejoró el % de resíntesis al 71 %).
El uso de ciclos consecutivos de regeneración/desnaturalización, en el ejemplo con LDR, mejoró además el % de resíntesis del 76,5 al 101,2 % dependiendo de las condiciones.
Puede observarse que aumentar el tiempo de incubación de ExAmp, el número de ciclos de química y/o la frecuencia de uso de LDR conduce a un impacto positivo en el % de resíntesis. Típicamente, el protocolo seleccionado alcanzará -80 % de resíntesis o más, pero el protocolo preferente será un intercambio del % de resíntesis frente al tiempo frente a la complejidad del protocolo y uso de reactivos.
Se consideró también la optimización del protocolo mediante el uso de un DOE basado en el iCbot y los resultados se muestran en las FIG. 6A y 6B.
La FIG. 6A muestra que: i) incluir la recirculación de LDR tiene un efecto significativo en el % de resíntesis; i) aumentar el número de etapas de recirculación también mejora el % de resíntesis. Esto se observa particularmente cuando se usa la recirculación de LDR; iii) aumentar el tiempo de incubación tiene un efecto positivo pero menos pronunciado en el % de resíntesis, lo que sugiere que son aceptables tiempos de ejecución más cortos.
La FIG. 6B muestra un ajuste del modelo experimental que identifica los parámetros optimizados que son: LDR = sí; 4 impulsos; y un tiempo de incubación de 8,7 minutos. Según se describe en el presente documento, el protocolo optimizado final no solo tendrá en cuenta el % de resíntesis, sino también la optimización general en términos de velocidad, uso de reactivos y eficiencia.
En conclusión, la presente invención ha identificado que la reacción de extensión durante la secuenciación por pares para regenerar el molde durante los ciclos de secuenciación se puede llevar a cabo usando una polimerasa de desplazamiento de cadena no termoestable a una temperatura de menos de 55 °C. Esto lleva a ventajas en el proceso. Además, si se usa la misma polimerasa tanto para la reacción de extensión como también para la generación inicial de agrupaciones, entonces puede simplificarse el proceso general y se reduce el número de reactivos y etapas del protocolo.

Claims (15)

  1. REIVINDICACIONES
    i. Un método para llevar a cabo una reacción de extensión con resíntesis de cadena durante la secuenciación por pares, en donde una reacción de extensión con resíntesis de cadena se lleva a cabo entre una primera lectura de secuenciación y una segunda lectura de secuenciación, y en donde dicha reacción de extensión con resíntesis de cadena extiende uno o más cebadores inmovilizados para copiar una primera cadena molde y generar una segunda cadena molde inmovilizada; caracterizado por que la reacción de extensión con resíntesis de cadena se lleva a cabo usando una polimerasa de desplazamiento de cadena no termoestable a una temperatura de menos de 55 °C, en donde dichas primeras cadenas molde son una agrupación, y en donde la misma polimerasa de desplazamiento de cadena no termoestable se usa durante la generación inicial de las agrupaciones y la reacción de extensión con resíntesis de cadena.
  2. 2. El método de la reivindicación 1, en donde la polimerasa no termoestable tiene una temperatura de incubación óptima y/o una temperatura de actividad óptima por debajo de 55 °C, preferiblemente por debajo de 50 °C, por debajo de 45 °C, por debajo de 40 °C, por debajo de 39 °C, a o por debajo de 38 °C, alrededor de 38 °C o alrededor de 37 °C; particularmente preferible alrededor de 38 °C.
  3. 3. El método de cualquiera de las reivindicaciones anteriores, en donde la reacción de extensión se lleva a cabo a una temperatura de menos de 55 °C, preferiblemente menos de 50 °C, preferiblemente menos de 40 °C, preferiblemente 38 °C /- 2 °C, preferiblemente 38 °C /- 1 °C, preferiblemente 38 °C.
  4. 4. El método de cualquiera de las reivindicaciones anteriores, en donde la polimerasa no termoestable es Bsu, phi29, Klenow o ADN-polimerasa I (E. coli), preferiblemente Bsu o un fragmento funcional de la misma.
  5. 5. El método de cualquiera de las reivindicaciones anteriores, en donde la reacción de extensión con resíntesis de cadena se repite a través de múltiples ciclos de extensión y desnaturalización, en donde preferiblemente, el método comprende 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 o más ciclos; preferiblemente 2-5 ciclos, 2-4 ciclos, 3-5 ciclos, 3 ciclos o 4 ciclos; con máxima preferencia 3 ciclos.
  6. 6. El método de cualquiera de las reivindicaciones anteriores, en donde cada ciclo puede durar 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20 o 30 minutos, en donde preferiblemente el método comprende los siguientes ciclos de extensión y desnaturalización: 3 x 5 min; 3 x 30 min; 12 x 2 min; 6 x 4 min; 2 x 12 min o 3 x 5 minutos; preferiblemente 12 x 2 min.
  7. 7. El método de cualquiera de las reivindicaciones anteriores, en donde la desnaturalización se lleva a cabo sustancialmente a la temperatura de la reacción de extensión, en donde preferiblemente la desnaturalización se lleva a cabo usando desnaturalizantes ácidos de ácidos nucleicos tales como ácido acético, HCl o ácido nítrico; desnaturalizantes básicos de ácidos nucleicos tales como NaOH; u otros desnaturalizantes de ácidos nucleicos tales como DMSO, formamida, betaína, guanidina, salicilato de sodio, propilenglicol o urea; preferiblemente formamida y NaOH, de forma particularmente preferible formamida.
  8. 8. El método según cualquiera de las reivindicaciones anteriores, en donde la reacción de extensión con resíntesis de cadena se lleva a cabo a una temperatura más baja que las etapas de lectura de la secuenciación.
  9. 9. El método según cualquiera de las reivindicaciones anteriores, en donde dicho agrupamiento se generó inicialmente mediante amplificación por puente.
  10. 10. El método según cualquiera de las reivindicaciones anteriores, en donde al menos uno de los cebadores inmovilizados se bloquea en el extremo 3', y el bloque se elimina antes de la reacción de extensión con resíntesis de cadena, en donde preferiblemente el bloque es un grupo fosfato y se trata con una fosfatasa para eliminar el bloque.
  11. 11. El método según cualquiera de las reivindicaciones anteriores, que comprende además una etapa de tratamiento con una enzima de restricción antes de la reacción de extensión con resíntesis de cadena para acortar el cebador inmovilizado y liberar un 3' hidroxilo libre para la extensión.
  12. 12. El método según cualquiera de las reivindicaciones anteriores, en donde el cebador inmovilizado se extiende antes de la reacción de extensión con resíntesis de cadena, en donde preferiblemente el cebador inmovilizado se extiende por hibridación de una secuencia complementaria no inmovilizada con un saliente 5', y el cebador inmovilizado se extiende para copiar el saliente.
  13. 13. Un método para secuenciar por pares la primera y segunda regiones de un polinucleótido bicatenario diana, en donde dichas primera y segunda regiones están en el mismo polinucleótido bicatenario diana, incluyendo dicha secuenciación por pares las etapas descritas en una cualquiera de las reivindicaciones 1 a 12.
  14. 14. Uso del método de la reivindicación 13 para obtener dos lecturas vinculadas o emparejadas de información de secuenciación de cada uno de los moldes bicatenarios en una matriz agrupada.
  15. 15. Un método para mejorar la calidad de datos de una reacción de secuenciación, que comprende llevar a cabo una reacción de extensión según una cualquiera de las reivindicaciones 1 a 12.
ES21712731T 2020-03-09 2021-03-09 Métodos para la secuenciación de polinucleótidos Active ES2965266T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US202062987035P 2020-03-09 2020-03-09
PCT/EP2021/055939 WO2021180733A1 (en) 2020-03-09 2021-03-09 Methods for sequencing polynucleotides

Publications (1)

Publication Number Publication Date
ES2965266T3 true ES2965266T3 (es) 2024-04-11

Family

ID=74947346

Family Applications (1)

Application Number Title Priority Date Filing Date
ES21712731T Active ES2965266T3 (es) 2020-03-09 2021-03-09 Métodos para la secuenciación de polinucleótidos

Country Status (13)

Country Link
US (1) US20220316003A1 (es)
EP (1) EP3969618B1 (es)
JP (1) JP2023517157A (es)
KR (1) KR20220151101A (es)
CN (1) CN114040985A (es)
AU (1) AU2021234084A1 (es)
CA (1) CA3145445A1 (es)
DK (1) DK3969618T3 (es)
ES (1) ES2965266T3 (es)
FI (1) FI3969618T3 (es)
PL (1) PL3969618T3 (es)
PT (1) PT3969618T (es)
WO (1) WO2021180733A1 (es)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023126457A1 (en) * 2021-12-29 2023-07-06 Illumina Cambridge Ltd. Methods of nucleic acid sequencing using surface-bound primers
WO2023187061A1 (en) * 2022-03-31 2023-10-05 Illumina Cambridge Limited Paired-end re-synthesis using blocked p5 primers

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5302509A (en) 1989-08-14 1994-04-12 Beckman Instruments, Inc. Method for sequencing polynucleotides
US6537764B1 (en) 1995-01-19 2003-03-25 Children's Medical Center Corporation Method of identifying inhibitors of C—C chemokine receptor 3
ES2563643T3 (es) 1997-04-01 2016-03-15 Illumina Cambridge Limited Método de secuenciación de ácido nucleico
JP2001517948A (ja) 1997-04-01 2001-10-09 グラクソ、グループ、リミテッド 核酸配列決定法
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
AU2001251582A1 (en) 2000-04-14 2001-10-30 Lynx Therapeutics, Inc. Method and compositions for ordering restriction fragments
NZ523831A (en) 2000-07-13 2005-10-28 Invitrogen Corp Methods and compositions for rapid protein and peptide extraction and isolation using a lysis matrix
WO2003074734A2 (en) 2002-03-05 2003-09-12 Solexa Ltd. Methods for detecting genome-wide sequence variations associated with a phenotype
JP2006509040A (ja) 2002-08-23 2006-03-16 ソレックサ リミテッド 修飾されたヌクレオチド
WO2005042781A2 (en) 2003-10-31 2005-05-12 Agencourt Personal Genomics Corporation Methods for producing a paired tag from a nucleic acid sequence and methods of use thereof
GB0400584D0 (en) 2004-01-12 2004-02-11 Solexa Ltd Nucleic acid chacterisation
CA2604095A1 (en) 2005-04-12 2006-10-19 454 Life Sciences Corporation Methods for determining sequence variants using ultra-deep sequencing
US8428882B2 (en) 2005-06-14 2013-04-23 Agency For Science, Technology And Research Method of processing and/or genome mapping of diTag sequences
GB0514936D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Preparation of templates for nucleic acid sequencing
GB0514910D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Method for sequencing a polynucleotide template
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
CN101415839B (zh) * 2006-02-08 2012-06-27 亿明达剑桥有限公司 对多核苷酸模板进行测序的方法
WO2007107710A1 (en) 2006-03-17 2007-09-27 Solexa Limited Isothermal methods for creating clonal single molecule arrays
US7754429B2 (en) * 2006-10-06 2010-07-13 Illumina Cambridge Limited Method for pair-wise sequencing a plurity of target polynucleotides
EP2121983A2 (en) * 2007-02-02 2009-11-25 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
EP2470669B1 (en) * 2009-08-25 2014-06-18 Illumina, Inc. Methods for selecting and amplifying polynucleotides
US9587343B2 (en) * 2009-08-27 2017-03-07 Lg Electronics Inc. Control method of laundry machine
EP2718465B1 (en) 2011-06-09 2022-04-13 Illumina, Inc. Method of making an analyte array
CN102344967B (zh) * 2011-11-02 2014-10-08 东南大学 一种缩短dna模板的dna测序方法及其应用
US8895249B2 (en) 2012-06-15 2014-11-25 Illumina, Inc. Kinetic exclusion amplification of nucleic acid libraries
GB201410420D0 (en) * 2014-06-11 2014-07-23 Illumina Cambridge Ltd Methods for estimating cluster numbers
CN107532219B (zh) * 2015-03-25 2023-05-02 安戈欧洲有限公司 使用链置换聚合酶的固相靶核酸捕获和复制
GB201611469D0 (en) * 2016-06-30 2016-08-17 Lumiradx Tech Ltd Improvements in or relating to nucleic acid amplification processes

Also Published As

Publication number Publication date
EP3969618A1 (en) 2022-03-23
FI3969618T3 (fi) 2023-10-18
US20220316003A1 (en) 2022-10-06
PL3969618T3 (pl) 2024-01-03
JP2023517157A (ja) 2023-04-24
PT3969618T (pt) 2023-11-15
DK3969618T3 (da) 2023-10-16
CA3145445A1 (en) 2021-09-16
CN114040985A (zh) 2022-02-11
WO2021180733A1 (en) 2021-09-16
KR20220151101A (ko) 2022-11-14
AU2021234084A1 (en) 2022-01-06
EP3969618B1 (en) 2023-09-13

Similar Documents

Publication Publication Date Title
US20220259651A1 (en) Methods for sequencing polynucleotides
US10563256B2 (en) Method for sequencing a polynucleotide template
US9267173B2 (en) Method for pairwise sequencing of target polynucleotides
ES2763386T3 (es) Métodos para seleccionar y amplificar polinucleótidos
ES2965266T3 (es) Métodos para la secuenciación de polinucleótidos
EP1910559A2 (en) Preparation of templates for nucleic acid sequencing
CA3099909A1 (en) Chemical compositions and methods of using same
ES2789349T3 (es) Utilización mejorada de cebadores de superficie en grupos
US10036063B2 (en) Method for sequencing a polynucleotide template
US20230313294A1 (en) Methods for chemical cleavage of surface-bound polynucleotides
CN107937389B (zh) 阵列上连接组装
CA3223274A1 (en) Periodate compositions and methods for chemical cleavage of surface-bound polynucleotides
AU2022421156A1 (en) Periodate compositions and methods for chemical cleavage of surface-bound polynucleotides