ES2868328T3 - Cuantificación precisa y masivamente paralela de ácido nucleico - Google Patents

Cuantificación precisa y masivamente paralela de ácido nucleico Download PDF

Info

Publication number
ES2868328T3
ES2868328T3 ES18756250T ES18756250T ES2868328T3 ES 2868328 T3 ES2868328 T3 ES 2868328T3 ES 18756250 T ES18756250 T ES 18756250T ES 18756250 T ES18756250 T ES 18756250T ES 2868328 T3 ES2868328 T3 ES 2868328T3
Authority
ES
Spain
Prior art keywords
probe
sequence
target
barcode
specific
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18756250T
Other languages
English (en)
Inventor
Manu Tamminen
Timothy Julian
Jenny Spaak
Lea Caduff
Hanna Schiff
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Eawag Swiss Federal Institute Of Aquatic Science And Tech
Original Assignee
Eawag Swiss Federal Institute Of Aquatic Science And Tech
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Eawag Swiss Federal Institute Of Aquatic Science And Tech filed Critical Eawag Swiss Federal Institute Of Aquatic Science And Tech
Application granted granted Critical
Publication of ES2868328T3 publication Critical patent/ES2868328T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6865Promoter-based amplification, e.g. nucleic acid sequence amplification [NASBA], self-sustained sequence replication [3SR] or transcription-based amplification system [TAS]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Un método para la detección de alto rendimiento de una o más secuencia de nucleótidos diana en una pluralidad de muestras, comprendiendo el método las etapas de: (i) proporcionar para cada secuencia de nucleótidos diana en cada una de las muestras: una primera sonda, una segunda sonda y un oligo de puente, en donde la primera sonda comprende, empezando desde el extremo 5' de la molécula, una primera secuencia específica de oligo de puente, opcionalmente una primera secuencia de código de barras, y una primera porción específica de diana en el extremo 3' de la primera sonda; y en donde la segunda sonda comprende, empezando desde el extremo 5' de la molécula, una segunda porción específica de diana, opcionalmente una segunda secuencia de código de barras, y una segunda secuencia específica de oligo de puente en el extremo 3' de la segunda sonda; y en donde el oligo de puente contiene secuencias complementarias a la primera secuencia específica de oligo de puente y la segunda secuencia específica de oligo de puente en la primera sonda y en la segunda sonda, respectivamente, y opcionalmente un tercer código de barras; en donde al menos una de la primera secuencia de código de barras o la segunda secuencia de código de barras o el tercer código de barras está presente en la primera sonda o la segunda sonda o el oligo de puente, respectivamente; y en donde una secuencia promotora para una ARN polimerasa T7 está presente en la primera sonda, la segunda sonda o el oligo de puente, (ii) poner en contacto, para cada una de la una o más secuencia de nucleótidos diana, la primera sonda y la segunda sonda con, preferentemente para cada una de las muestras en un tubo separado, el oligo de puente y permitir auto-hibridar en una pluralidad de complejos de ligación; (iii) poner en contacto los ácidos nucleicos presentes en la pluralidad de muestras a probar para las secuencias de nucleótidos diana con la pluralidad de complejos de ligación; (iv) permitir que la primera porción específica de diana y la segunda porción específica de diana de la respectiva primera sonda y segunda sonda hibriden con secciones esencialmente adyacentes en la secuencia diana, formando de esta manera un complejo de hibridación; (v) ligar la primera sonda y la segunda sonda en los complejos de hibridación para proporcionar complejos de ligación ligados, (vi) poner en conjunto los complejos de ligación ligados de la pluralidad de muestras, (viii) amplificar el ARN del uno o más complejos ligados usando ARN polimerasa T7 que inicia la síntesis de ARN desde el promotor de ARN polimerasa T7 embebido en los complejos de ligación ligados; (xi) opcionalmente, preparar el ADNc a partir de las moléculas de ARN usando una molécula de oligonucleótido de ADN que es complementaria inversa a un sitio universal 2; (xii) someter las moléculas de ARN o ADNc a tecnología de secuenciación de alto rendimiento para determinar la secuencia o secuencias identificadoras; e (xiii) identificar la presencia y/o el número de la secuencia de nucleótidos diana en la pluralidad de muestras mediante determinación de al menos parte de la primera porción específica diana y/o la segunda porción específica diana, y/o al menos parte del primer código de barras, y/o el segundo código de barras y/o al menos parte del tercer código de barras.

Description

DESCRIPCIÓN
Cuantificación precisa y masivamente paralela de ácido nucleico
Campo técnico
La presente invención y descripción se refiere a un método de secuenciación de ADN de última generación y a su uso para la cuantificación precisa y masivamente paralela de una o más dianas de ácido nucleico. Más particularmente, la descripción se refiere al método y un kit que comprende sondas para detectar y cuantificar dianas genéticas en conjuntos de ADN complejos usadas principalmente para la detección de dianas y variantes genéticas en poblaciones humanas y animales y muestras ambientales. Adicionalmente, la invención encuentra una aplicación particular en el campo de detección de alteraciones genéticas que provocan enfermedades en muestras obtenidas del cuerpo humano, incluidas sin limitación biopsias, saliva y otras secreciones, extractos de humedad exhalada, tejido, plasma sanguíneo (biopsias líquidas) o similares. La invención usa una o más sondas de ácido nucleico específicas de diana por diana genética (sonda izquierda y sonda derecha) y un oligo de puente.
Antecedentes
Con el avance en la tecnología del estudio de la variación genética, la detección de la misma en plantas y animales no es engorrosa. Se requiere el avance en la tecnología, sin embargo, para proporcionar un estudio inmensamente valioso de las secuencias de nucleótidos para las alteraciones genéticas tales como mutaciones y otras variaciones genéticas, para proporcionar información necesaria para facilitar las medidas profilácticas y terapéuticas. La secuenciación de nucleótidos es el proceso para determinar el orden de nucleótidos en la diana genética de interés. La detección de mutaciones en la secuencia de nucleótidos de la diana genética de interés se lleva a cabo usando métodos de secuenciación de ácido nucleico. Los métodos de secuenciación más comúnmente conocidos tales como, pero no limitados a, Maxam-Gilbert y Sanger se usan para la detección de secuencias de nucleótidos. La tecnología de secuenciación de ácido nucleico juega un papel vital en numerosos campos tales como biología molecular, biología evolutiva, metagenómica, medicina y medicina forense. De forma ideal, detectar y cuantificar dianas genéticas, por ejemplo, cuantificar ADN en la sangre materna es la base de la detección de trisomía prenatal no invasiva; cuantificar mutaciones raras en el ADN circulante es la base de las biopsias líquidas de cáncer; cuantificar los genes de resistencia a antibióticos es la base para estimados de riesgo de extensión de genes de resistencia a antibióticos.
Típicamente, los diagnósticos de cáncer implican detectar y cuantificar mutaciones oncológicamente relevantes en el ADN circulante. De forma similar, las anormalidades en los fetos implican detectar y cuantificar ADN presente en concentración pequeña en la sangre materna. Detectar y cuantificar de forma precisa tales señales débiles todavía es actualmente laborioso y caro, a pesar de los costes de secuenciación disminuidos. Diversos problemas pueden expresarse de forma más precisa tales como la especificidad para detectar señales genéticas contra un fondo consenso, sensibilidad para detectar señales genéticas débiles, precisión para la cuantificación precisa de las señales detectadas, número de rendimiento de dianas genéticas dirigidas por ensayo, coste por ensayo, escalado para determinar la escala del coste del ensayo cuando se ensayan múltiples muestras en paralelo y rotación para determinar cuánto es el tiempo desde el muestreo a los resultados.
Actualmente, los métodos de cuantificación típicos para biopsias líquidas y ensayos conceptualmente similares (tales como detección de gen de resistencia a antibióticos) incluyen PCR cuantitativa (qPCR), qPCR de matrices, PCR digital, multiplex ligation-dependent probe Amplification (amplificación de sonda dependiente de ligación múltiplex - MPLA) o cuantificación a partir de datos de secuenciación de ADN de última generación. Aunque los métodos de cuantificación son métodos robustos y bien establecidos, cada uno de los métodos está asociado a problemas específicos analizados con mayor detalle a continuación:
PCR cuantitativa: La PCR cuantitativa (qPCR), es una técnica basada en biología molecular que incluye la amplificación de una molécula de ADN marcada como diana durante la PCR, es decir, en tiempo real. La PCR en tiempo real puede usarse cuantitativamente (PCR en tiempo real cuantitativa) y semi-cuantitativamente, es decir, por encima/por debajo de una determinada cantidad de moléculas de ADN (PCR en tiempo real semi cuantitativa).
La PCR cuantitativa (qPCR) es un método de referencia de la cuantificación de dianas genéticas. Actualmente, el coste de laboratorio de una reacción de qPCR es aproximadamente $2. Sin embargo, teniendo en cuenta la mano de obra considerable en tiempo (coste laboral) para configurar la reacción, la necesidad de curvas patrón, junto con réplicas para cada diana cuantificada, el coste real es de hecho mucho más alto. La cantidad de mano de obra en el tiempo escala abruptamente con un número en aumento de muestras ya que se requiere un experimento de cuantificación separado para cada diana genética. Un estimado de al menos 40 reacciones por diana cuantificada por muestra establece el precio unitario en aproximadamente $80, excluyendo el coste del trabajo manual, estableciendo un límite definido para cuántas de las reacciones pueden cuantificarse.
PCR de matriz: Las Matrices de PCR son las herramientas más fiables para analizar la expresión de un panel enfocado de genes relevantes, de rutas o de enfermedades. Cada placa de 96 pocillos, placa de 384 pocillos o disco de 100 pocillos de Matriz de PCR incluye ensayos de cebador optimizados SYBR Green para un panel exhaustivamente investigado de paneles enfocados de genes. Una nueva iteración de la tecnología qPCR es una qPCR de matriz que miniaturiza las reacciones de qPCR individuales. La PCR de matriz disminuye el coste de una reacción de qPCR individual y mejora la escalabilidad del método a múltiples dianas y muestras. Sin embargo, el método está actualmente limitado a perfilar 384 dianas de 12 muestras (o a la inversa 12 dianas de 384 muestras) a un coste de miles de dólares por chip más un gran coste de capital de la infraestructura de lectura. Perfilar miles de muestras usando el ajuste anteriormente mencionado, por lo tanto, se mantiene prohibitivamente caro.
PCR digital: La reacción en cadena de la polimerasa digital (PCR digital, PCRDigital, dPCR o dePCR) es un método para proporcionar la cuantificación absoluta de dianas a través de microfluidos de gotitas y detección de fluorescencia. La metodología es relativamente rentable (una diana por muestra cuesta alrededor de $3) pero la mano de obra para preparar, ajustar y ejecutar experimentos individuales para cada diana en cada muestra escala mal a miles de muestras.
Amplificación de sonda dependiente de ligación múltiplex (MLPA)
La MLPA proporciona un enfoque para simplificar la detección de múltiples dianas genéticas en muestras individuales. Sin embargo, la MLPA proporciona solo la cuantificación relativa de dianas y requiere un experimento de detección separado para cada muestra. Más recientemente, una variante de MLPA introduce conceptos de códigos de barras de a Dn . El concepto permite una mejor resolución cuantitativa y multiplexación de muestras que el flujo de trabajo de MLPA tradicional. Enfoques basados en secuenciación de última generación: La Next-generation sequencing (secuenciación de última generación - NGS), también conocida como secuenciación de alto rendimiento que hace al análisis de expresión génica basada en secuencia una alternativa “digital” a técnicas analógicas. La diana a tener en cuenta de los datos de secuenciación de ADN de última generación se está volviendo cada vez más atractiva ya que los costes de secuenciación de ADN se mantienen disminuyendo y se usa actualmente por ejemplo en detección NIPT. Sin embargo, el enfoque actual padece altos costes de preparación de bibliotecas de secuenciación y esfuerzos de secuenciación que se malgastan en dianas genéticas no relevantes. Por ejemplo, en biopsias líquidas relacionadas con cáncer, los enfoques no dirigidos dan como resultado el malgasto de esfuerzo de secuenciación en loci oncológicamente no relevantes. En diagnósticos fetales, el muestreo no dirigido de loci limita considerablemente las opciones estadísticas para interpretar los datos. Guardant Health Inc proporciona enfoques de secuenciación más dirigidos, donde una matriz de sondas de captura de ARN enriquece dianas para la secuenciación de ADN de última generación.
Akhras y col. (2007) PLoS ONE 2(2):e223 desvelan un ensayo de detección de patógenos en múltiplex que implica sondas específicas de diana de código de barras, circularización y secuenciación de dianas. El uso de un oligonucleótido de puenteo para ligar las sondas específicas de diana también se desvela.
Por lo tanto, a la luz del análisis anterior, existe una necesidad de superar las desventajas anteriormente mencionadas tales como, pero no limitadas a, especificidad, sensibilidad, precisión, rendimiento, coste, escalado y tiempo a través de una cuantificación precisa y masivamente paralela de dianas de ácido nucleico.
Resumen de la invención
La presente descripción busca proporcionar un método para determinar el Multiplexed Ligation Assay (Ensayo de Ligación Multiplexado - MLA). El Ensayo de Ligación Multiplexado es un ensayo basado en ligación molecular que busca combinar la simplicidad y el potencial paralelo de MLPA de código de barras con la precisión y sensibilidad de qPCR.
La descripción se refiere más particularmente a un método para la detección de alto rendimiento de detección de secuencias de nucleótidos diana en un número muy grande de muestras aprovechando los ensayos dependientes de ligación. En una realización la secuencia de nucleótidos diana puede ser ADN o ARN, preferentemente ADN. En una realización, los métodos incluyen las etapas de analizar la diana usando secuenciación de alto rendimiento en la determinación de la presencia o ausencia y/o cuantificación de al menos una secuencia diana en una pluralidad de muestras.
En un aspecto, la realización de la presente descripción proporciona el método, que incluye además un conjunto de sondas específicas de diana para cada secuencia de nucleótidos diana en cada una de las muestras. El diseño del ensamblaje de sonda específica de diana incluye dos sondas de ácido nucleico específicas de diana por diana genética (sonda izquierda y sonda derecha) o alternativamente el diseño del ensamblaje de sonda específica de diana con tres sondas de ácido nucleico específicas de diana de las cuales dos son específicas para una diana genética (sonda izquierda y sonda derecha) y una universal (oligo de puente). La universal (oligo de puente) se usa para unir la sonda izquierda y la sonda derecha.
En una realización, la primera sonda incluye, empezando desde el extremo 5' de la molécula, opcionalmente un fosfato 5', una primera secuencia específica de oligo de puente, opcionalmente una primera secuencia universal, opcionalmente una primera secuencia de código de barras y una primera porción específica de diana en el extremo 3' de la primera sonda. La segunda sonda incluye, empezando desde el extremo 5' de la molécula, opcionalmente un fosfato 5', una segunda porción específica de diana, opcionalmente una segunda secuencia de código de barras, opcionalmente segunda secuencia universal y una segunda secuencia específica de oligo de puente en el extremo 3' de la segunda sonda. Preferentemente, al menos una de la primera secuencia de código de barras o la segunda secuencia de código de barras está presente en la primera sonda o la segunda sonda, respectivamente, en donde la primera secuencia de código de barras o la segunda secuencia de código de barras o ambas, pueden ser secuencias aleatorias o pueden contener secuencias identificadoras de secuencias de nucleótidos diana, una secuencias identificadoras de muestra y/o códigos de barras moleculares para la enumeración de dianas.
Preferentemente, la sonda oligo de puente universal contiene una secuencia promotora para la ARN polimerasa T7, secuencias complementarias a la primera secuencia específica de oligo de puente y segunda secuencias específica de oligo de puente, respectivamente, y opcionalmente un tercer código de barras que puede ser una secuencia aleatoria o puede contener una secuencia identificadora de muestras o una secuencia identificadora de dianas. Se prefiere que la secuencia promotora de la ARN polimerasa T7 esté presente en el oligo de puente, pero en lugar de que esté presente el promotor en el oligo de puente, también puede estar presente en la primera o la segunda sonda. Sin embargo, en tal caso, el diseño de las sondas y el oligo debe ser de tal manera que una ARN polimerasa T7 sea capaz de transcribir todas las secuencias que son necesarias para la identificación de la muestra y la diana, y la enumeración de las secuencias diana.
La primera sonda y la segunda sonda incluyen la primera porción específica de diana, la segunda porción específica de diana, las primeras secuencias específicas de oligo de puente y/o las segundas secuencias específicas de oligo de puente. La primera sonda y la segunda sonda contienen secuencias independientemente entre sí. La primera sonda y la segunda sonda preferentemente están químicamente modificadas con una o más secuencias de nucleótidos químicamente modificadas.
La primera sonda y la segunda sonda se ponen en contacto, preferentemente para cada una de las muestras en un tubo separado, con el oligo de puente. La pluralidad de la primera y la segunda sondas auto-hibridan a la pluralidad de oligos puente en una pluralidad de complejos de ligación. Preferentemente cada complejo de ligación es único para la combinación de la primera secuencia específica de diana, la segunda secuencia específica de diana y una o más secuencias de código de barras. Esto permite la enumeración de las secuencias diana después de la amplificación y el análisis de los resultados.
Posteriormente, la una o más secuencia o secuencias de nucleótidos diana en cada muestra se pone en contacto con los complejos de ligación permitiendo que auto-hibriden en una pluralidad de complejos de ligación hibridados. La primera porción específica de diana y la segunda porción específica de diana de la respectiva primera sonda y segunda sonda hibridan con secciones esencialmente adyacentes en la secuencia diana, formando de esta manera un complejo de hibridación. La ligación de la primera sonda y la segunda sonda en los complejos hibridados formados se lleva a cabo bien enzimática o químicamente para proporcionar complejos de ligación ligados. Los complejos de ligación ligados en la una o más muestras se ponen juntos posteriormente.
Opcionalmente, y si está presente, una brecha entre la primera sonda y la segunda sonda se llena introduciendo una polimerasa y uno o más nucleótidos. La polimerasa añade nucleótidos (a) complementarios a la secuencia oligo de puente universal y (b) complementarios a la secuencia diana y por lo tanto llena las dos brechas entre la primera sonda y la segunda sonda dando como resultado ligar la sonda de la izquierda y de la derecha. El oligo de puente se extiende desde el sitio 5' o el sitio 3' complementario a las sondas ligadas de tal manera que la secuencia identificadora de secuencia diana se integra en el oligo de puente, formando de esta manera uno o más complejos de ligación ligados.
Para evitar que la polimerasa extienda el oligo de puente en las secuencias diana respectivas en la primera y la segunda sonda antes de que la primera y la segunda sonda se liguen en la porción de secuencia diana, preferentemente se usa una polimerasa adecuada, más preferentemente una polimerasa que no extienda en una secuencia de ADN bicatenaria. Un ejemplo típico de una polimerasa tal es una polimerasa Taq.
A continuación, la ARN polimerasa T7 que se une en el sitio promotor de ARN polimerasa T7 bicatenario en la secuencia oligo de puente del complejo de ligación ligado y transcribe el ARN en dirección descendente. La amplificación del ARN sintetizado a partir del uno o más complejos de ligación ligados se lleva a cabo, por ejemplo, usando PCR de emulsión de transcriptasa inversa (RT)-PCR o ARN polimerasa T7. La retirada de muestra libre y ácido nucleico sonda se lleva a cabo añadiendo opcionalmente exonucleasas y endonucleasas específicas de ADN a la reacción de amplificación conjunta después de la síntesis de ARN por ARN polimerasa T7 pero antes de la síntesis de ADNc o RT-PCR.
Preferentemente, el proceso de purificación de los fragmentos ligados se lleva a cabo retirando constituyentes de la mezcla de reacción de ligación usando una columna de purificación o purificación con perlas. Opcionalmente, el ADNc se prepara a partir de las moléculas de ARN usando una molécula de oligonucleótido de ADN que es complementaria inversa a un sitio universal 2. Después de que se prepare el ADNc, puede usarse una PCR convencional o, preferentemente, en emulsión para aumentar la señal. Alternativamente puede usarse RT-PCR o RT-PCR en emulsión.
La presencia/ausencia de la secuencia de nucleótidos diana se determina sometiendo las moléculas de ARN o ADNc amplificadas a tecnología de secuenciación de alto rendimiento para determinar la secuencia o secuencias identificadoras.
En otro aspecto, una realización de la presente descripción proporciona un kit para su uso en los métodos de la invención. El kit incluye una pluralidad de recipientes, en donde al menos un recipiente incluye un conjunto de una primera sonda y una segunda sonda y en donde al menos un recipiente comprende un oligo de puente. En una realización particular, el al menos un recipiente que comprende el conjunto de la primera y la segunda sonda y el al menos un recipiente que comprende el oligo de puente son uno y el mismo recipiente. En tal caso, las tres sondas pueden pre-hibridarse y haber formado un complejo ligado.
Una ventaja particular de la invención es permitir la detección y la amplificación de la secuencia diana de interés usando diseños de sonda únicos, es decir, el triplete de sonda. Las sondas se diseñan con propiedades de unión mejoradas y dan lugar a una especificidad, sensibilidad y precisión de ensayo más altas. La presente invención encuentra aplicación en el área de la biología molecular, la biología evolutiva, la metagenómica, el genotipado y más específicamente pero no limitado a diagnósticos de cáncer y trastornos cromosómicos fetales.
Se deducirán otros aspectos, ventajas, características y objetos de la presente descripción a partir de los dibujos y la descripción detallada de las realizaciones ilustrativas interpretadas junto con las reivindicaciones anexas que siguen.
Se apreciará que las características de la presente descripción son susceptibles de combinarse en diversas combinaciones.
Breve descripción de las figuras
El sumario anterior, así como la siguiente descripción detallada de realizaciones ilustrativas, se comprende mejor al leerlo junto con los dibujos anexos. Para ilustrar la presente descripción, se muestran estructuras ilustrativas de la descripción en los dibujos. Los expertos en la materia entenderán que los dibujos no están a escala. En la medida de lo posible, los elementos similares se han indicado con números idénticos.
A continuación se describirán realizaciones de la presente descripción, a modo de ejemplo únicamente, con referencia a los siguientes diagramas, en donde:
La Fig. 1 ilustra un diagrama de flujo del Multiplexed Ligation Assay (Ensayo de Ligación Multiplexado - MLA) según una realización en la presente memoria;
la Fig. 2A ilustra una estructura principal de triplete de sondas que tiene una pluralidad de entidades de sonda según una realización en la presente memoria;
la Fig. 2B ilustra el relleno de la brecha entre la primera sonda y la segunda sonda según una realización en la presente memoria;
la Fig. 3 muestra posibles modificaciones químicas que aumentan la eficiencia de unión a sonda y mejoran la eficiencia de ligación;
la Fig. 4 proporciona una visión general del análisis de datos de recuentos cromosómicos replicados según una realización en la presente memoria;
la Fig. 5 proporciona una visión general para identificar cuantitativamente la proporción de variantes mutadas de múltiples genes según una realización en la presente memoria; y
la Fig. 6 ilustra un diagrama de flujo de amplificación de sonda dependiente de ligación múltiplex según una realización en la presente memoria.
Descripción detallada de las realizaciones
La siguiente descripción detallada ilustra realizaciones de la presente descripción y formas en las que pueden implementarse. Aunque se han descrito algunos modos de realización de la presente descripción, los expertos en la técnica reconocerán que también son posibles otras realizaciones para llevar a cabo o poner en práctica la presente descripción.
En un primer aspecto, la invención proporciona un método para la detección de alto rendimiento de una o más secuencia de nucleótidos diana en una pluralidad de muestras, comprendiendo el método las etapas de:
(i) proporcionar para cada secuencia de nucleótidos diana en cada una de las muestras:
una primera sonda, una segunda sonda y un oligo de puente,
en donde la primera sonda comprende, empezando desde el extremo 5' de la molécula, una primera secuencia específica de oligo de puente, opcionalmente una primera secuencia de código de barras y una primera porción específica de diana en el extremo 3' de la primera sonda;
y en donde la segunda sonda comprende, empezando desde el extremo 5' de la molécula, una segunda porción específica de diana, opcionalmente una segunda secuencia de código de barras y una segunda secuencia específica de oligo de puente en el extremo 3' de la segunda sonda;
y en donde el oligo de puente contiene secuencias complementarias a la primera secuencia específica de oligo de puente y la segunda secuencia específica de oligo de puente en la primera sonda y en la segunda sonda, respectivamente, y opcionalmente un tercer código de barras;
en donde al menos una de la primera secuencia de código de barras o la segunda secuencia de código de barras o el tercer código de barras está presente en la primera sonda o la segunda sonda o el oligo de puente, respectivamente; y en donde una secuencia promotora para una ARN polimerasa T7 está presente en la primera sonda, la segunda sonda o el oligo de puente,
(ii) poner en contacto, para cada una de la una o más secuencia de nucleótidos diana, la primera sonda y la segunda sonda con, preferentemente para cada una de las muestras en un tubo separado, el oligo de puente y permitir auto-hibridar en una pluralidad de complejos de ligación;
(iii) poner en contacto los ácidos nucleicos presentes en la pluralidad de muestras a probar para las secuencias de nucleótidos diana con la pluralidad de complejos de ligación;
(iv) permitir que la primera porción específica de diana y la segunda porción específica de diana de la respectiva primera sonda y segunda sonda hibriden con secciones esencialmente adyacentes en la secuencia diana, formando de esta manera un complejo de hibridación;
(v) ligar la primera sonda y la segunda sonda en los complejos de hibridación para proporcionar complejos de ligación ligados;
(vi) poner en conjunto los complejos de ligación ligados de la pluralidad de muestras;
(viii) amplificar el ARN del uno o más complejos ligados usando ARN polimerasa T7 que inicia la síntesis de ARN desde el promotor de ARN polimerasa T7 embebido en los complejos de ligación ligados;
(xi) opcionalmente, preparar el ADNc a partir de las moléculas de ARN usando una molécula de oligonucleótido de ADN que es complementaria inversa a un sitio universal 2;
(xii) someter las moléculas de ARN o ADNc a tecnología de secuenciación de alto rendimiento para determinar la secuencia o secuencias identificadoras; e
(xiii) identificar la presencia y/o el número de la secuencia de nucleótidos diana en la pluralidad de muestras mediante determinación de al menos parte de la primera porción específica diana y/o la segunda porción específica diana, y/o al menos parte del primer código de barras y/o el segundo código de barras y/o al menos parte del tercer código de barras.
En una primera realización, el método comprende las etapas de:
(i) proporcionar para cada secuencia de nucleótidos diana en cada una de las muestras: una primera sonda, una segunda sonda y un oligo de puente, en donde
la primera sonda comprende, empezando desde el extremo 5' de la molécula, opcionalmente un fosfato 5', una primera secuencia específica de oligo de puente, opcionalmente una primera secuencia universal, opcionalmente una primera secuencia de código de barras y una primera porción específica de diana en el extremo 3' de la primera sonda; y en donde la segunda sonda comprende, empezando desde el extremo 5' de la molécula, opcionalmente un fosfato 5', una segunda porción específica de diana, opcionalmente una segunda secuencia de código de barras, opcionalmente una segunda secuencia universal y una segunda secuencia específica de oligo de puente en el extremo 3' de la segunda sonda; y en donde
el oligo de puente incluye secuencias complementarias a la primera secuencia específica de oligo de puente y la segunda secuencia específica de oligo de puente en la primera sonda y en la segunda sonda, respectivamente, y opcionalmente un tercer código de barras, que puede ser una secuencia aleatoria o puede contener una secuencia identificadora de muestras o una secuencia identificadora de dianas; y en donde
al menos una de la primera secuencia de código de barras o la segunda secuencia de código de barras o el tercer código de barras está presente en la primera sonda o la segunda sonda o el oligo de puente, respectivamente, en donde la primera secuencia de código de barras o la segunda secuencia de código de barras o ambas, pueden ser secuencias aleatorias o pueden contener secuencias identificadoras de secuencias de nucleótidos diana, una secuencias identificadoras de muestra y/o códigos de barras moleculares para la enumeración de dianas; y en donde
una secuencia promotora para una ARN polimerasa T7 está presente en la primera sonda, la segunda sonda o el oligo de puente y en donde preferentemente la primera porción específica de diana, la segunda porción específica de diana, las primeras secuencias específicas de oligo de puente y/o las segundas secuencias específicas de oligo de puente incluyen, independientemente entre sí, uno o más nucleótidos químicamente modificados;
(ii) poner en contacto para cada una de la una o más secuencias de nucleótidos diana, la primera sonda y la segunda sonda con, preferentemente para cada una de las muestras en un tubo separado, el oligo de puente y permitir auto-hibridar en una pluralidad de complejos de ligación;
(iii) poner en contacto los ácidos nucleicos presentes en la pluralidad de muestras a probar para las secuencias de nucleótidos diana con la pluralidad de complejos de ligación;
(iv) permitir que la primera porción específica de diana y la segunda porción específica de diana de la respectiva primera sonda y segunda sonda hibriden con secciones esencialmente adyacentes en la secuencia diana, formando de esta manera un complejo de hibridación;
(v) ligar la primera sonda y la segunda sonda en los complejos de hibridación para proporcionar complejos de ligación ligados;
(vi) poner en conjunto los complejos de ligación ligados de la pluralidad de muestras;
(vii) opcionalmente, proporcionar a los complejos de hibridación una polimerasa y uno o más nucleótidos, de tal manera que se rellene una brecha presente entre la primera sonda y la segunda sonda en el oligo de puente, de tal manera que las sondas ligadas se extiendan desde el sitio 5' o el sitio 3' de tal manera que una secuencia de código de barras presente en el oligo de puente se integre en la sonda ligada, o de tal manera que el oligo de puente se extienda desde el sitio 5' o el sitio 3' de tal manera que una secuencia de código de barras presente en la primera sonda o la segunda sonda se integre en el oligo de puente, o ambos, formando de esta manera uno o más complejos de ligación ligados;
(viii) amplificar el ARN del uno o más complejos de ligación ligados, usando la ARN polimerasa T7 que inicia la síntesis de ARN desde el promotor de ARN polimerasa T7 embebido en los complejos ligados;
(ix) opcionalmente, añadir exonucleasas y endonucleasas específicas de ADN a la reacción de amplificación puesta en conjunto para retirar el ADN de muestra y de sonda;
(x) opcionalmente, purificar el ARN restante usando limpieza con perlas o en columna;
(xi) opcionalmente, preparar el ADNc a partir de las moléculas de ARN usando una molécula de oligonucleótido de ADN que es complementaria inversa al segundo sitio universal;
(xii) someter las moléculas de ARN o ADNc amplificadas a tecnología de secuenciación de alto rendimiento para determinar la secuencia o secuencias identificadoras; e
(xiii) identificar la presencia y/o el número de la secuencia de nucleótidos diana en la pluralidad de muestras mediante determinación de al menos parte de la primera porción específica diana y/o la segunda porción específica diana, al menos parte de la primera secuencia de código de barras y/o la segunda secuencia de código de barras y/o al menos parte de la tercera secuencia de código de barras.
Definiciones:
Secuencia de nucleótidos diana: La expresión secuencia de nucleótidos diana puede ser cualquier secuencia de nucleótidos de interés de la cual se requiere su detección. Se entenderá que la expresión dada se refiere a una secuencia de nucleótidos contiguos así como a moléculas de ácido nucleico con la secuencia complementaria. La secuencia diana preferentemente es una secuencia de nucleótidos que representa o está asociada a un polimorfismo.
Polimorfismo: El término polimorfismo se refiere a una aparición de dos o más secuencias o alelos alternativos determinados genéticamente en una población. Un marcador o sitio polimórfico es el locus en el cual se produce la divergencia de secuencia. Un locus polimórfico puede ser tan pequeño como un par de bases.
Muestras: El término muestras se usa en la presente memoria para dos o más muestras que contienen dos o más secuencias diana. Las muestras como se proporcionan en un método según la invención se han preparado preferentemente para extraer al menos los ácidos nucleicos diana y hacer estos accesibles a las sondas como se usan en la invención. En particular, las muestras comprenden cada una al menos dos secuencias diana diferentes, preferentemente al menos 100, más preferentemente al menos 250, más preferentemente al menos 500, con máxima preferencia al menos 2000, o más. El término muestras puede referirse a pero no se limita a dos o más muestras obtenidas de un cuerpo humano, incluidas biopsias, saliva y otras secreciones, extractos de humedad exhalada, tejido, plasma sanguíneo (biopsias líquidas), dos o más muestras obtenidas del ambiente, incluidos agua, agua residual, suelo o similares.
Sonda: El término sonda es un fragmento de ADN o ARN de longitud variable (habitualmente 50-1000 bases de longitud, preferentemente 50 - 200 bases de longitud) que puede usarse en muestras de ADN o ARN para detectar la presencia de secuencias de nucleótidos (la diana de ADN o ARN) que son complementarias a la secuencia en la sonda. Las secciones de las sondas de oligonucleótidos que son complementarias a la secuencia diana se diseñan de tal manera que para cada secuencia diana en una muestra, se proporciona un par de una sonda izquierda y una derecha, por lo que las sondas contienen cada una sección en su extremo final que es complementaria a una parte de la secuencia diana. Adicionalmente, la presente descripción describe un oligo de puente que se usa para unir la sonda izquierda y la sonda derecha.
Universal: El término universal cuando se usa para describir un procedimiento de amplificación se refiere a una secuencia que permite el uso de un único cebador o un conjunto de cebadores para una pluralidad de reacciones de amplificación. El uso de tales cebadores simplifica enormemente la multiplexación en que solo son necesarios dos cebadores para amplificar una pluralidad de secuencias de ácido nucleico seleccionadas. El término universal cuando se usa para describir un sitio de cebado es un sitio al cual hibridará un cebador universal. También debe indicarse que pueden usarse “conjuntos” de secuencias cebadoras/cebadores universales.
Hibridación: El término hibridación describe el proceso de que las moléculas de ácido desoxirribonucleico (ADN) o ácido ribonucleico (ARN) hibriden a ADN o ARN complementario. La replicación de ADN o ARN y la transcripción de ADN en ARN dependen ambas de la hibridación de nucleótidos.
Ligación: El término ligación es la unión de dos fragmentos de ácido nucleico a través de la acción de una enzima. Las ADN ligasas son enzimas capaces de catalizar la formación de un enlace fosfodiéster entre (los extremos de) dos hebras polinucleotídicas unidas en sitios adyacentes en una hebra complementaria. La ligación también puede realizarse químicamente, en particular, si ambos extremos adyacentes de los polinucleótidos se modifican para permitir la ligación química.
Amplificación: El término amplificación como se usa en la presente memoria denota el uso de la polymerase chain reaction (reacción en cadena de la polimerasa - PCR) para aumentar la concentración de una secuencia de nucleótido particular en una mezcla de secuencias de nucleótidos. La “ PCR” o “ Reacción en Cadena de la Polimerasa” es un procedimiento rápido para la amplificación enzimática in vitro de un segmento de ADN/ARN específico. El ADN/ARN a amplificar se desnaturaliza calentando la muestra. El término cebador es una hebra corta de ARN o ADN (generalmente de aproximadamente 18-22 bases) que sirve como un punto de partida para la síntesis de ADN. Se requiere para la replicación de ADN porque las enzimas que catalizan este proceso, ADN polimerasas, solo pueden añadir nuevos nucleótidos a una hebra existente de ADN. Una ARN polimerasa T7 es capaz tanto de transcribir como amplificar una única molécula de ADN en múltiples copias de ARN que pueden convertirse de nuevo en ADNc.
Polimerasa: Una polimerasa es una enzima que sintetiza cadenas largas o polímeros de ácidos nucleicos. La ADN polimerasa y la ARN polimerasa se usan para ensamblar moléculas de ADN y ARN, respectivamente, copiando una hebra molde de ADN o ARN usando interacciones de apareamiento de bases. Una polimerasa específica usada en la presente memoria, ARN polimerasa T7, es una ARN polimerasa del bacteriófago T7 que cataliza la formación de ARN en la dirección 5 '^ 3'. La ARN polimerasa T7 requiere un molde de ADN parcialmente bicatenario e ion Mg2+ como cofactor para la síntesis de ARN. Una ARN polimerasa T7 es capaz tanto de transcribir como amplificar una única molécula de ADN en múltiples copias de a Rn .
Alto rendimiento: La expresión alto rendimiento denota la capacidad de procesar y cribar simultáneamente un gran número de muestras de ADN; así como cribar simultáneamente grandes números de diferentes loci genéticos dentro de una única muestra de ADN. La secuenciación o el cribado de High-throughput sequencing - alto rendimiento, a menudo abreviado HTS es un método para la experimentación científica específicamente relevante para cribar eficazmente grandes cantidades de muestras simultáneamente.
Reactivo de Escisión Específico de Uracilo (USER): El Uracil Specific Excision Reagent - Reactivo de Escisión Específico de Uracilo también conocido como USER permite la linealización de una molécula de ADN circular mediante escisión donde está presente un nucleótido desoxiuridina.
La descripción proporciona un método para determinar las secuencias de dianas genéticas en conjuntos de ácido nucleico complejos usando técnicas permitidas por la secuenciación de última generación. La descripción proporciona un método para perfilar múltiples dianas genéticas en varias muestras, preferentemente un número muy grande de muestras, aprovechando los ensayos dependientes de ligación. La descripción proporciona un método para la amplificación de sonda dependiente de ligación múltiplex que permite consultar diferentes ácidos nucleicos diana en una pluralidad de muestras. La presente descripción proporciona un método para la secuenciación de ácido nucleico diana para aquellos expertos en la materia con cuantificación precisa y masivamente paralela de dianas de ácido nucleico de interés que están presentes en una muestra, para la detección de la presencia y la ausencia de variantes genéticas. Adicionalmente, los identificadores de secuencia única se usan para la identificación de las dianas genéticas y la cuantificación absoluta de muestras individuales a partir del conjunto de muestras cuando se procesan los datos de secuenciación.
En una realización preferida, el método de la presente invención se refiere a la identificación de la pluralidad de muestras de ácido nucleico usando tecnologías de secuenciación de alto rendimiento. Los métodos de la presente invención permiten la secuenciación de una o más secuencia de nucleótidos diana en una pluralidad de muestras proporcionando una pluralidad de diferentes conjuntos de sondas para diferentes ácidos nucleicos diana. Los métodos de la presente invención utilizan tres sondas de ácido nucleico, de las cuales dos sondas de ácido nucleico específicas de diana (sonda izquierda y sonda derecha) son específicas para una diana genética y una sonda de ácido nucleico es universal (oligo de puente). La sonda izquierda y derecha hibridan con la sonda de puente, formando un complejo de ligación. El complejo de ligación (que contiene una o más secuencias de códigos de barra) que tiene sitios de identificación diana en la muestra de ADN/ARN se permite hibridar contra la secuencia diana complementaria de la muestra de consulta en condiciones ambientales. Después de la hibridación la sonda izquierda y derecha se ligan química o enzimáticamente mediante una ADN ligasa para formar el complejo de ligación ligado. En la presente invención, se formará una pluralidad de dichos complejos de ligación ligados durante el análisis de muestras en la pluralidad de muestras a analizar.
Una ARN polimerasa T7 amplifica las sondas unidas para usarse para la secuenciación usando una plataforma de secuenciación de última generación incluidas, sin limitación, Illumina MiSeq, HiSeq o NextSeq. Las muestras se separan (desconvolucionan) de los datos de secuencia y las dianas de secuencia se cuantifican in silico después de la secuenciación de ADN. En una realización preferida, la secuenciación se lleva a cabo por medio de secuenciación de ADN o ARN de última generación.
En una realización, “pluralidad de muestras” puede referirse a, pero no limitado a, dos o más muestras obtenidas de un cuerpo humano, incluidas biopsias, saliva y otras secreciones, extractos de humedad exhalada, tejido, plasma sanguíneo (biopsias líquidas), dos o más muestras obtenidas del ambiente, incluidos agua, agua residual, suelo o similares. La muestra usada puede ser ADN o ARN extraído usando cualquiera de las tecnologías de extracción actualmente disponibles tales como precipitación de etanol, extracción de fenol-cloroformo, columna de sílice o similares.
En una realización los métodos incluyen las etapas de analizar la diana usando secuenciación de alto rendimiento en la detección y/o cuantificación de al menos una secuencia diana en la pluralidad de muestras. La secuencia de nucleótidos diana incluye cualquier secuencia de nucleótidos de interés de la cual se requiere la detección. La secuencia de nucleótidos diana de la descripción se obtiene a partir de, pero no se limita a, una fracción de ADN en la sangre del paciente o una fracción de ADN en sangre materna. Una fracción del ADN en la sangre del paciente se obtiene a partir de células de cáncer apoptóticas/necróticas o una fracción de ADN en sangre materna de origen fetal. Además, los resultados del análisis se usan para, por ejemplo, evaluar el riesgo de un individuo a un tipo dado de cáncer, determinar la eficacia de un tratamiento dado contra un cáncer dado, el desarrollo de una mutación relacionada con resistencia a fármacos en un tumor o el riesgo de que un feto lleve trastornos genéticos tales como trisomías habituales de síndromes de Down, Patau y Edwards.
En una realización se proporciona un método para la detección de alto rendimiento de una o más secuencias de nucleótidos diana que pueden derivar de una o más muestras. En determinadas realizaciones, el método comprende proporcionar, para cada secuencia de nucleótidos diana, una pluralidad de diferentes conjuntos de sonda. Como se usa en la presente memoria, la expresión conjuntos de sonda incluye una primera sonda, una segunda sonda y un oligo de puente.
En determinadas realizaciones, la primera sonda incluye, empezando desde el extremo 5' de la molécula, opcionalmente un fosfato 5', una primera secuencia específica de oligo de puente, opcionalmente una primera secuencia universal, opcionalmente una primera secuencia de código de barras y una primera porción específica de diana en su extremo 3'. En determinadas realizaciones, la segunda sonda incluye, empezando desde el extremo 5' de la molécula, opcionalmente un fosfato 5', una segunda porción específica de diana, opcionalmente una segunda secuencia de código de barras, opcionalmente una segunda secuencia universal y una segunda secuencia específica de oligo de puente en su extremo 3'.
En una realización preferida, bien la primera sonda o la segunda sonda contiene al menos una de la primera secuencia de código de barras o la segunda secuencia de código de barras. La primera secuencia de código de barras o la segunda secuencia de código de barras o ambas, pueden ser secuencias aleatorias o pueden contener secuencias identificadoras de secuencia de nucleótidos diana, secuencias identificadoras de muestras y/o códigos de barra moleculares para la enumeración de dianas.
En realizaciones preferidas el oligo de puente contiene una secuencia promotora para la ARN polimerasa T7, secuencias complementarias a la primera y la segunda secuencias específicas de oligo de puente en la primera y la segunda sonda, respectivamente, una secuencia universal, y/o puede contener un tercer código de barras que puede ser una secuencia aleatoria o puede contener una secuencia identificadora de muestras o de secuencia. Con respecto a esto, el tercer código de barras no necesariamente significa que ya haya un primer y un segundo códigos de barras presentes. Como se describe antes, al menos un código de barras debe estar presente en el complejo de ligación ligado, que permita definir de forma única el complejo dentro de todos los complejos de ligación en todas las muestras probadas.
La primera porción específica de diana, la segunda porción específica de diana, las primeras secuencias específicas de oligo de puente y/o las segundas secuencias específicas de oligo de puente, preferentemente contienen independientemente entre sí al menos un nucleótido químicamente modificado. Las modificaciones químicas que aumentan la unión de sondas incluyen, pero no se limitan a, ácidos ribonucleicos, ácidos péptido nucleicos y ácidos nucleicos bloqueados. En determinadas realizaciones, las modificaciones químicas permiten la ligación química de sondas adyacentes. Las sondas anteriormente mencionadas se unen a loci genéticos completamente adyacentes o hasta 50 pares de bases de separación, preferentemente hasta 40 pares de bases de separación, más preferentemente hasta 30 pares de bases de separación, más preferentemente hasta 20 pares de bases de separación, más preferentemente hasta 10 pares de bases de separación, con máxima preferencia hasta 5 pares de bases de separación.
Antes de poner en contacto las sondas con la muestra que comprende las secuencias diana, la primera sonda y la segunda sonda se ponen en contacto con el oligo de puente, preferentemente para cada una de las muestras en un tubo separado y se permite la auto-hibridación en complejos de ligación. En lo sucesivo, la una o más secuencias de nucleótidos diana en la pluralidad de muestras se pone en contacto con la pluralidad de complejos de ligación. La primera porción específica de diana y la segunda porción específica de diana de la respectiva primera sonda y segunda sonda hibridan con secciones esencialmente adyacentes en la secuencia diana, formando de esta manera un complejo de hibridación. La ligación de la primera sonda y la segunda sonda en los complejos hibridados formados se lleva a cabo bien enzimática o químicamente para proporcionar complejos de ligación ligados. Los complejos de ligación ligados se ponen en conjunto posteriormente de una o más muestras diana.
La brecha entre la primera sonda y la segunda sonda, si está presente, puede rellenarse introduciendo una polimerasa y uno o más nucleótidos. La polimerasa añade nucleótidos (a) complementarios a la secuencia oligo de puente universal y/o (b) complementarios a la secuencia de código de barras y por lo tanto llena las dos brechas entre la primera sonda y la segunda sonda dando como resultado ligar la sonda de la izquierda y de la derecha y la inclusión de la secuencia universal y/o la tercera secuencia de código de barras en la hebra complementaria de puente. El oligo de puente se extiende desde el sitio 5' o el sitio 3' complementario a las sondas ligadas de tal manera que la secuencia identificadora de secuencia diana presente en la primera sonda o la segunda sonda se integra en el oligo de puente. Preferentemente, se usa una polimerasa que no rompe el ADN bicatenario, tal como por ejemplo una polimerasa Taq, para no interferir con la ligación de la primera a la segunda sonda cuando están ambas hibridadas a la secuencia diana.
Preferentemente, cualquiera de las sondas o el oligo de puente contiene un resto desoxiuridina que permite la linealización por escisión usando reactivo de escisión específico de uracilo. Esto permite transcribir ARN a partir de los complejos de ligación ligados linealizados usando ARN polimerasa T7 que inicia la síntesis de ARN desde el promotor de ARN polimerasa T7 embebido en el oligo de puente o la primera o la segunda sonda. Después de la amplificación, la retirada de ácido nucleico de muestra y de sonda libre se lleva a cabo añadiendo opcionalmente exo-nucleasas y endo-nucleasas específicas de ADN a la reacción de amplificación conjunta. Como se ha dicho anteriormente, la secuencia promotora de a Rn polimerasa T7 puede situarse en el oligo de puente, la primera sonda o en la segunda sonda. Lo mismo es cierto para el resto de desoxiuridina. Sin embargo, como está claro para una persona experta, la secuencia promotora de ARN polimerasa T7 y el resto desoxiuridina deben estar situados de tal manera que la ARN polimerasa T7 sea capaz de transcribir toda la información que sea necesaria para la enumeración de las diferentes dianas en las diferentes muestras. Entre la ARN polimerasa T7 y el resto desoxiuridina deberían producirse las siguientes secuencias: al menos una secuencia que permita identificar la diana, al menos una secuencia que permita identificar la muestra y al menos una secuencia identificadora única que permita determinar el número de copias de la secuencia diana en la muestra.
Un proceso de purificación de los fragmentos ligados puede llevarse a cabo retirando constituyentes de la mezcla de reacción de ligación usando una columna de purificación o purificación con perlas. Opcionalmente, el ADNc se prepara a partir de las moléculas de ARN usando una molécula de oligonucleótido de ADN que es complementaria inversa a un sitio universal 2. Las moléculas de ARN se convierten opcionalmente en ADNc y se amplifican opcionalmente por PCR o PCR en emulsión usando cebadores que se unen a las partes universales de las sondas.
La identificación de la presencia y/o el número de la secuencia de nucleótidos diana en la pluralidad de muestras mediante determinación de al menos parte de la primera y/o segunda porción específica diana, al menos parte de la primera y/o segunda secuencia de código de barras y/o al menos parte del tercer código de barras mediante tecnología de secuenciación de alto rendimiento. Preferentemente, la enumeración de diana genética se permite contando el número de códigos de barra moleculares por diana y por muestra.
La presencia/ausencia de la secuencia de nucleótidos diana se determina sometiendo las moléculas de ARN o ADNc amplificadas a tecnología de secuenciación de alto rendimiento para determinar la secuencia o secuencias identificadoras. En una realización preferida, las moléculas de ARN o las moléculas de ADNc se amplifican con un primer cebador y un segundo cebador para proporcionar un producto de amplificación. Preferentemente se usan un primer cebador universal y un segundo cebador universal, complementarios a una primera y segunda secuencia universal presente en los complejos ligados.
Los métodos de la invención implican diversos aspectos que son ventajosos cuando se comparan con los métodos usados en la técnica anterior para la secuenciación y la amplificación de nucleótidos. Los métodos como se desvelan en la invención pretenden proporcionar un ensayo que sea mejor que cualquiera de las dianas existentes, sin limitación PCR cuantitativa (qPCR), PCR de matriz, PCR digital, Amplificación de sonda dependiente de ligación múltiplex o similares.
Las ventajas de la presente invención incluyen, pero no se limitan a ensayos de cuantificación con bajo coste, alta simplicidad, alta especificidad, alta sensibilidad, alta precisión, alto rendimiento, alta escalabilidad y alta rotación en comparación con tecnologías de secuenciación de ácido nucleico tradicional. Otro aspecto de la presente invención es que los métodos de la presente invención permitan la cuantificación precisa y masivamente paralela de una pluralidad de dianas de ácido nucleico en múltiples muestras incluidas poblaciones humanas y animales. Una ventaja particular de la invención es permitir la detección y la amplificación de la secuencia diana de interés usando diseños de sonda únicos, es decir, el triplete de sonda. Las sondas se diseñan con nucleótidos modificados especialmente situados que mejoran la hibridación y la eficiencia de unión. La mejora en las propiedades de unión da lugar a una especificidad, sensibilidad y precisión del ensayo más altas. Los métodos de la presente invención son igualmente aplicables para estudiar variantes genéticas y encuentran aplicación en diagnóstico y pronóstico, incluidas pero no limitadas a genotipar la muestra o muestras para una o más secuencias y/o polimorfismos, tales como SNP y/o mutaciones por indel, diagnósticos de cáncer o trastornos cromosómicos fetales a partir de la sangre materna. En una realización preferida, para dos o más muestras o para dos o más combinaciones de locus/alelo, se usan secuencias de código de barras para genotipar las muestras para una o más secuencias y/o polimorfismos, tales como SNP y/o mutaciones por indel.
En otro aspecto, la invención proporciona un kit de partes que comprende una pluralidad de recipientes, en donde al menos un recipiente comprende uno o más conjuntos de primera sonda y segunda sonda y al menos un recipiente comprende uno o más oligos de puente,
en donde la primera sonda comprende, empezando desde el extremo 5' de la molécula, una primera secuencia específica de oligo de puente, opcionalmente una primera secuencia de código de barras y una primera porción específica de diana en el extremo 3' de la primera sonda;
en donde la segunda sonda comprende, empezando desde el extremo 5' de la molécula, una segunda porción específica de diana, opcionalmente una segunda secuencia de código de barras y una segunda secuencia específica de oligo de puente en el extremo 3' de la segunda sonda;
en donde el oligo de puente comprende secuencias complementarias a la primera y la segunda secuencia específica de oligo de puente en la primera y la segunda sonda, respectivamente, y opcionalmente un tercer código de barras; y en donde al menos una de la primera secuencia de código de barras o la segunda secuencia de código de barras o el tercer código de barras está presente en la primera sonda o la segunda sonda o el oligo de puente, respectivamente;
y en donde una secuencia promotora para una ARN polimerasa T7 está presente en la primera sonda, la segunda sonda o el oligo de puente.
En otra realización, el kit de partes incluye una pluralidad de recipientes, en donde al menos un recipiente comprende uno o más conjuntos de primera sonda segunda sonda y al menos un recipiente comprende uno o más oligos de puente,
en donde la primera sonda comprende, empezando desde el extremo 5' de la molécula, opcionalmente un fosfato 5', una primera secuencia específica de oligo de puente, opcionalmente una primera secuencia universal, opcionalmente una primera secuencia de código de barras y una primera porción específica de diana en el extremo 3' de la primera sonda; en donde la segunda sonda comprende, empezando desde el extremo 5' de la molécula, opcionalmente un fosfato 5', una segunda porción específica de diana, opcionalmente una segunda secuencia de código de barras, opcionalmente una segunda secuencia universal y una segunda secuencia específica de oligo de puente en el extremo 3' de la segunda sonda;
en donde el oligo de puente comprende secuencias complementarias a la primera secuencia específica de oligo de puente y la segunda secuencia específica de oligo de puente en la primera sonda y en la segunda sonda, respectivamente, y opcionalmente un tercer código de barras, que puede ser una secuencia aleatoria o puede contener una secuencia identificadora de nucleótidos diana o una secuencias identificadoras de muestras; y en donde al menos una de la primera secuencia de código de barras o la segunda secuencia de código de barras o el tercer código de barras está presente en la primera sonda o la segunda sonda o el oligo de puente, respectivamente, en donde la primera secuencia de código de barras o la segunda secuencia de código de barras o ambos, pueden ser secuencias aleatorias o pueden contener secuencias identificadoras de secuencias de nucleótidos diana, una secuencias identificadoras de muestra y/o códigos de barras moleculares para la enumeración de dianas; y en donde una secuencia promotora para una ARN polimerasa T7 está presente en la primera sonda, la segunda sonda o el oligo de puente,
en donde preferentemente la primera porción específica de diana, la segunda porción específica de diana, la primera secuencia específica de oligo de puente y/o la segunda secuencia específica de oligo puede incluir, independientemente entre sí, uno o más nucleótidos químicamente modificados.
Preferentemente, el extremo 3' de las primeras sondas o el extremo 5' de las segundas sondas, o ambos, se modifican para permitir la ligación química de las primeras sondas a las segundas sondas.
Preferentemente, el oligo de puente comprende uno o más nucleótidos químicamente modificados en la secuencia complementaria a una secuencia de la primera sonda o en la secuencia complementaria a una secuencia de la segunda sonda o ambas.
Preferentemente, la primera sonda, la segunda sonda o el oligo de puente comprende un resto desoxiuridina que permite la linealización por escisión usando reactivo de escisión específico de uracilo.
Preferentemente, el extremo 3' de la primera sonda o el extremo 5' de la segunda sonda, o ambos, se modifican para permitir la ligación química de la primera sonda a la segunda sonda.
Preferentemente, la porción de puente de la primera sonda o la segunda sonda, o ambas, comprende o comprenden bases químicamente modificadas para permitir la unión mejorada al oligo de puente.
En otro aspecto, la invención proporciona un uso de una primera sonda, una segunda sonda y un oligo de puente para la secuenciación de alto rendimiento en la determinación de la presencia o ausencia y/o cuantificación de una o más secuencias diana en una pluralidad de muestras,
en donde la primera sonda comprende, empezando desde el extremo 5' de la molécula, una primera secuencia específica de oligo de puente, opcionalmente una primera secuencia de código de barras y una primera porción específica de diana en el extremo 3' de la primera sonda;
y en donde la segunda sonda comprende, empezando desde el extremo 5' de la molécula, una segunda porción específica de diana, opcionalmente una segunda secuencia de código de barras y una segunda secuencia específica de oligo de puente en el extremo 3' de la segunda sonda;
y en donde el oligo de puente comprende secuencias complementarias a las primeras secuencias específicas de oligo de puente y las segundas secuencias específicas de oligo de puente en la primera sonda y en la segunda sonda, respectivamente, y opcionalmente un tercer código de barras;
en donde al menos una de la primera secuencia de código de barras o la segunda secuencia de código de barras o el tercer código de barras está presente en la primera sonda o la segunda sonda o el oligo de puente, respectivamente; y en donde una secuencia promotora para una ARN polimerasa T7 está presente en la primera sonda, la segunda sonda o el oligo de puente; y en donde la primera sonda y la segunda sonda se ligan cuando las secciones específicas de diana respectivas de las sondas se hibridan a secciones esencialmente adyacentes sobre la secuencia diana para proporcionar sondas ligadas; y las sondas ligadas de la pluralidad de muestras se ponen en conjunto y se amplifican usando ARN polimerasa t 7; y los productos de amplificación se someten a tecnología de secuenciación de alto rendimiento para determinar la secuencia o secuencias identificadoras.
La primera sonda comprende, empezando desde el extremo 5' de la molécula, opcionalmente un fosfato 5', una primera secuencia específica de oligo de puente, opcionalmente una primera secuencia universal, opcionalmente una primera secuencia de código de barras y una primera porción específica de diana en el extremo 3' de la primera sonda.
La segunda sonda comprende, empezando desde el extremo 5' de la molécula, opcionalmente un fosfato 5', una segunda porción específica de diana, opcionalmente una segunda secuencia de código de barras, opcionalmente una segunda secuencia universal y una segunda secuencia específica de oligo de puente en el extremo 3' de la segunda sonda.
El oligo de puente incluye secuencias complementarias a la primera secuencia específica de oligo de puente y la segunda secuencia específica de oligo de puente en la primera sonda y en la segunda sonda, respectivamente, y opcionalmente un tercer código de barras que puede ser una secuencia aleatoria o puede contener una secuencia identificadora de muestras.
Al menos una de la primera secuencia de código de barras o la segunda secuencia de código de barras o el tercer código de barras está presente en la primera sonda o la segunda sonda o el oligo de puente, respectivamente, en donde la primera secuencia de código de barras o la segunda secuencia de código de barras o ambas, pueden ser secuencias aleatorias o pueden contener secuencias identificadoras de secuencias de nucleótidos diana, una secuencias identificadoras de muestra y/o códigos de barras moleculares para la enumeración de dianas; y en donde una secuencia promotora para una ARN polimerasa T7 está presente en la primera sonda, la segunda sonda o el oligo de puente.
La primera porción específica de diana, la segunda porción específica de diana, la primera secuencia específica de oligo de puente y/o la segunda secuencia específica de oligo de puente, preferentemente contienen independientemente entre sí, uno o más nucleótidos químicamente modificados.
La primera sonda y la segunda sonda se ligan cuando las secciones específicas de diana respectivas de las sondas se hibridan a secciones esencialmente adyacentes sobre la secuencia diana para proporcionar sondas ligadas. La ARN polimerasa T7 se usa para la amplificación de sondas ligadas de la pluralidad de muestras, preferentemente después de poner en conjunto la pluralidad de muestras. Los productos de amplificación se someten además a tecnología de secuenciación de alto rendimiento para determinar la secuencia o secuencias identificadoras.
Preferentemente, el extremo 3' de las primeras sondas o el extremo 5' de las segundas sondas, o ambos, se modifican para permitir la ligación química de las primeras sondas a las segundas sondas.
Preferentemente, el oligo de puente comprende uno o más nucleótidos químicamente modificados en la secuencia complementaria a una secuencia de la primera sonda o en la secuencia complementaria a una secuencia de la segunda sonda o ambas.
Preferentemente, la primera sonda, la segunda sonda o el oligo de puente comprende un resto desoxiuridina que permite la linealización por escisión usando reactivo de escisión específico de uracilo.
Preferentemente, el extremo 3' de la primera sonda o el extremo 5' de la segunda sonda, o ambos, se modifican para permitir la ligación química de la primera sonda a la segunda sonda.
Preferentemente, la porción de puente de la primera sonda o la segunda sonda, o ambas, comprende o comprenden bases químicamente modificadas para permitir la unión mejorada al oligo de puente.
Una ventaja particular de la invención es permitir la detección y la amplificación de la secuencia diana de interés usando diseños de sonda únicos, es decir, el triplete de sonda. Las sondas se diseñan con propiedades de unión mejoradas que dan lugar a una especificidad, sensibilidad y precisión de ensayo más altas. La presente invención encuentra aplicación en diagnósticos de cáncer o trastornos cromosómicos fetales pero no se limita al genotipado de la muestra o muestras para una o más secuencias y/o polimorfismos, tales como SNP y/o mutaciones por indel.
En una realización preferida particular, el oligo de puente comprende información para identificar la muestra e incluye un identificador único. En tal caso, la primera y la segunda sonda es universalmente aplicable a todas las muestras (y solo comprende información para identificar la diana). En una realización preferida, por lo tanto, se proporciona un método, un kit o un uso según la invención, en donde el oligo de puente comprende un código de barras que comprende una secuencia única que permite la enumeración de las secuencias diana de cada muestra.
Sección experimental
Los siguientes experimentos proporcionan ejemplificaciones de las diversas realizaciones de la invención.
Caso 1: Una persona de edad que padece un cáncer de pulmón avanzado se pretrata con quimioterapia como la primera línea de tratamiento. El análisis del tumor por biopsia de tejido no es aplicable debido a la quimioterapia y la condición del paciente. De esta manera, no hay posibilidades para obtener el ADN de tejido del tumor del paciente. Para la segunda línea de tratamiento, se realiza una biopsia líquida Guardant360 y, basándose en los resultados, el paciente tiene un tratamiento dirigido para el cáncer. Para el seguimiento, la mutación dirigida y las mutaciones de resistencia relacionadas deberían seguirse. El coste del tratamiento es 7000 €/mes y las muestras semanales serían óptimas para la detección de la posible resistencia para el fármaco usado. Si pudiera realizarse un análisis de mutación dirigido individualizado (con tiempo TA rápido) de forma no invasiva justo en el momento de la resistencia desarrollada, podría considerarse la nueva biopsia líquida de amplio intervalo y podría considerarse un nuevo fármaco dirigido.
Los ahorros de omitir la resistencia desarrollada al fármaco ya sin efecto es 7 €-21000 € a 1-3 meses del tratamiento. Además, los beneficios de las opciones de tratamiento de última generación se logran más rápido y pueden mejorar el resultado de la enfermedad.
Caso 2: Ensayo de ligación multiplexado para detectar trisomías cromosómicas fetales en sangre materna.
Cada gen relevante se marca como diana por múltiples sondas que pueden detectar mutaciones típicas. El uso de múltiples sondas permite identificar cuantitativamente la proporción de variantes mutadas de múltiples genes. Típicamente, 10 complejos de ligación distintos se dirigen a cada cromosoma para la detección de trastornos cromosómicos fetales de la sangre materna. El uso de 10 sondas distintas da como resultado 10 réplicas independientes para cada cromosoma. El conjunto de complejos de ligación múltiples detecta mutaciones significativas. Los datos del recuento cromosómico replicados se analizan usando herramientas estadísticas para detectar desviaciones significativas del patrón de desviación estándar de las dianas cromosómicas. Las desviaciones del patrón de desviación estándar de las dianas cromosómicas permiten identificar eliminaciones (tales como el síndrome de Williams) y trisomías (tales como el síndrome de Patau, de Edwards o de Down).
Caso 3: Ensayo de ligación multiplexada para detectar mutaciones oncológicamente relevantes en el ADN circulante de un paciente que padece cáncer.
Para la detección de mutaciones génicas oncológicamente relevantes en el ADN circulante de un paciente que padece cáncer, cada gen relevante se dirige por complejos de ligación múltiple que pueden detectar mutaciones típicas del tipo de cáncer. El ensayo de ligación multiplexada permite identificar cuantitativamente la proporción de variantes mutadas de múltiples genes.
Caso 4: Ensayo de ligación multiplexada para detectar y cuantificar genes de resistencia a múltiples antibióticos en muestras fecales o de aguas residuales.
Para la detección de genes de resistencia a antibióticos en el ADN extraído de material fecal o de aguas residuales, cada gen de resistencia a antibióticos se dirige por múltiples complejos de ligación específicos. El uso de varios complejos de ligación distintos por gen diana da como resultado réplicas técnicas independientes para cada gen. Estos datos de recuento replicados se analizan usando herramientas estadísticas para cuantificar el número de copias de múltiples genes de resistencia a antibióticos en múltiples muestras.
Descripción detallada de los dibujos
La Fig. 1 ilustra el flujo de trabajo de una realización de la invención descrita. En la etapa 1, los ácidos nucleicos (ADN o ARN) extraídos de una muestra (102) se ponen en contacto con un conjunto de complejos (104) de ligación. Los complejos de ligación hibridan en los ácidos (106) nucleicos diana. En la etapa 2, los complejos de ligación hibridados se ligan, dando como resultado complejos (108) de ligación ligados. En la etapa 3, los complejos de ligación ligados de múltiples muestras (110) se ponen en conjunto juntos (112). En la etapa 4, se sintetiza ARN (114) a partir de los complejos de ligación ligados usando ARN polimerasa T7. El ADN de sonda y de muestra se retiran opcionalmente usando una mezcla de endo- y exonucleasas. En la etapa 5, el ARN se convierte en ADNc (116) y opcionalmente se amplifica usando PCR o PCR en emulsión. En la etapa 6, el ADN amplificado se secuencia usando secuenciación de ADN de última generación. En la etapa 7, los resultados de secuenciación de ADN se convierten en recuentos diana usando una tubería bioinformática.
La Fig. 2A ilustra una estructura principal de un triplete de sondas que tiene una pluralidad de entidades de sonda según una realización en la presente memoria. La pluralidad de entidades de sonda incluye una sonda izquierda, una sonda derecha y un oligo de puente ensamblados antes de la hibridación de muestras. La primera base de la sonda izquierda incluye opcionalmente un resto fosfato para ligación enzimática o una modificación que permita la ligación química al extremo 5' de la sonda adyacente denominada modificación 1 (200). 15-25 bases de la sonda izquierda incluye una secuencia (202) de unión de puente 1, que incluye además bases químicamente modificadas para la unión eficiente del oligo de puente denominado sitio de puente 1. El segmento anteriormente mencionado también incluye opcionalmente la secuencia complementaria inversa del promotor de la ARN polimerasa T7. Como se ha dicho antes, esta secuencia promotora puede estar presente en la primera sonda o en la segunda sonda, en lugar de en el oligo de puente, pese a la condición de que el oligo y las sondas se diseñen de tal manera que la ARN polimerasa T7 sea capaz de transcribir toda la información necesaria para la enumeración de las secuencias diana en las diferentes muestras. Las siguientes 15-30 bases de la sonda izquierda incluyen opcionalmente un sitio de unión universal para cebadores de PCR denominados en la presente memoria sitio universal 1 (204). La sonda izquierda incluye además opcionalmente las siguientes 10-20 bases desde el extremo 5' incluidos segmentos de nucleótidos aleatorios que forman el código de barras específico de molécula o el código de barras específico de muestra denominado código de barras 1 (206). La sonda izquierda incluye además las siguientes 15-30 bases desde el extremo 5', se une a la diana genética (208). Algunos o todos de los nucleótidos de 202 o 208 pueden incluir modificaciones químicas que aumenten la afinidad de las sondas a la diana o al oligo (226) de puente. La última base de la sonda izquierda incluye opcionalmente un resto fosfato para ligación enzimática o una modificación que permita la ligación química al extremo 5' de la sonda adyacente denominada modificación 1 (210).
La primera base de la sonda derecha incluye opcionalmente un resto fosfato para ligación enzimática o una modificación que permita la ligación química al extremo 5' de la sonda adyacente denominada modificación 2 (212). Las 15-30 bases del extremo 5' de la sonda derecha incluyen una parte de la sonda derecha que se une a la diana genética (214). Las siguientes 10-20 bases desde el extremo 5' de la sonda derecha incluyen opcionalmente segmentos de nucleótidos aleatorios que forman el código de barras específico de molécula o el código de barras específico de muestra denominado código de barras 2 (216). Las siguientes 15-30 bases desde el extremo 5' de la sonda derecha incluyen opcionalmente un sitio de unión universal para cebadores de PCR denominado sitio universal 2 (218). Las últimas 15-25 bases de la sonda derecha incluyen una secuencia de ancla para la unión eficiente del oligo de puente, denominada secuencia de puente 2 (220). El segmento anteriormente mencionado también incluye opcionalmente la secuencia complementaria inversa del promotor de la ARN polimerasa T7. Como se ha dicho antes, esta secuencia promotora puede estar presente en la primera sonda o en la segunda sonda, en lugar de en el oligo de puente, pese a la condición de que el oligo y las sondas se diseñen de tal manera que la ARN polimerasa T7 sea capaz de transcribir toda la información necesaria para la enumeración de las secuencias diana en las diferentes muestras. Algunos o todos de los nucleótidos de 214 o 220 pueden incluir modificaciones químicas que aumenten la afinidad de las sondas a la diana o al oligo (224) de puente. La última base de la sonda derecha incluye opcionalmente un resto fosfato para ligación enzimática o una modificación que permita la ligación química al extremo 5' de la sonda adyacente denominada modificación 2 (222).
Las primeras 15-25 bases desde el extremo 5' del oligo de puente, denominadas secuencia (226) de puente 3, son complementarias inversas a la secuencia de puente 1 de la sonda derecha (202) y opcionalmente incluyen nucleótidos químicamente modificados para una unión aumentada. Las siguientes 15-25 bases del puente, denominadas secuencia (224) de puente 4, son complementarias inversas a la secuencia de puente 2 de la sonda izquierda (220) y opcionalmente incluyen nucleótidos químicamente modificados para una unión aumentada. La secuencia (226) de puente 3 o la secuencia (224) de puente 4, incluyen opcionalmente la secuencia del promotor de la ARN polimerasa T7.
La Fig. 2B ilustra el relleno de la brecha entre la primera sonda y la segunda sonda según una realización en la presente memoria. Aquí, el oligo de puente contiene una secuencia (228) de brecha, entre la secuencia (226) de puente 3 y la secuencia (224) de puente 4. La secuencia (228) de brecha puede incluir opcionalmente la secuencia del promotor de la ARN polimerasa T7. La brecha entre la sonda de la izquierda y la sonda de la derecha se rellena introduciendo una polimerasa y uno o más nucleótidos. Para este proceso puede usarse un fragmento Stoffel, polimerasa Taq o polimerasa Phusion. La polimerasa añade nucleótidos (a) complementarios a la secuencia oligo de puente universal y (b) complementarios a la secuencia diana y por lo tanto llena las dos brechas, es decir, la brecha 1 y la brecha 2 entre la primera sonda y la segunda sonda dando como resultado la ligación de la sonda izquierda y de la sonda derecha complementaria al oligo de puente. De tal manera, un código de barras, si está presente en el oligo de puente en la localización 228, se integra en la secuencia complementaria. Opcionalmente, la sonda 224 de oligo de puente se extiende desde el sitio 5' o el sitio 3' complementario a las sondas ligadas de tal manera que un código de barras, si está presente en la sonda 1 o la sonda 2 y/o las secuencias diana, 208 y 214, se integran en el oligo de puente, formando de esta manera uno o más complejos de ligación ligados. Debe tenerse cuidado, sin embargo, con que la acción de la polimerasa no interfiera con la ligación de la primera sonda y la segunda sonda en el sitio de la secuencia diana. Es, por ejemplo, posible usar una polimerasa que detiene su acción cuando llega a una porción de ADN bicatenario, como por ejemplo presente en la porción de la primera sonda y la segunda sonda que se hibridan a la secuencia diana. Las secuencias promotoras de ARN polimerasa T7 pueden embeberse en el complejo de ligación en las posiciones 226, 228 o 224 del oligo de puente. El resto desoxiuridina puede embeberse entre las posiciones 204 y 206 o dentro de 206 en la sonda izquierda.
La Fig. 3 es una ilustración esquemática de ejemplos de modificación de sonda que mejoran la unión a la diana o permiten la ligación química. Las modificaciones químicas que mejoran la unión de sondas incluyen, pero no se limitan a, ácidos ribonucleicos, ácidos péptido nucleicos y/o ácidos nucleicos bloqueados. Las modificaciones químicas que permiten la ligación química incluyen, pero no se limitan a, modificaciones de 5'-azida 3'-alquino que pueden unirse en una cicloadición catalizada por cobre.
La Fig. 4 proporciona una visión general de datos del recuento cromosómico replicados usando herramientas de análisis estadístico para detectar desviaciones significativas del patrón de desviación estándar de las dianas cromosómicas. El perfilado de las dianas (404) genéticas múltiples en una pluralidad de muestras se lleva a cabo usando mezcla (402) de complejo de ligación específico de diana múltiple. Además, las dianas 404 genéticas múltiples incluyen ácido nucleico extraído de la sangre materna. Múltiples sondas se dirigen a cada gen relevante que puede detectar mutaciones típicas. Típicamente, al menos 10, preferentemente al menos 100, más preferentemente al menos 500, con la máxima preferencia al menos 1000 sondas distintas se dirigen a cada cromosoma para la detección de trastornos cromosómicos fetales a partir de sangre materna. El uso de al menos 10 sondas distintas da como resultado al menos 10 réplicas independientes para cada cromosoma. El conjunto de sondas múltiples detecta mutaciones específicas. Los datos del recuento cromosómico replicados se analizan usando herramientas estadísticas para detectar desviaciones significativas del patrón de desviación estándar de las dianas cromosómicas. Las desviaciones del patrón de desviación estándar de las dianas cromosómicas permiten la identificación de eliminaciones tales como el síndrome de Williams y trisomías tales como el síndrome de Patau, de Edwards o de Down.
La Fig. 5 proporciona una visión general para identificar cuantitativamente la proporción de variantes mutadas de múltiples genes mezclando un conjunto de una mezcla (502) de complejo de ligación específico de diana con dianas (504) genéticas múltiples. Las dianas (504) genéticas múltiples incluyen ácido nucleico (ADN) extraído del plasma sanguíneo de un paciente. El perfilado de las dianas (504) genéticas múltiples en un número muy grande de muestras se lleva a cabo usando mezcla (502) de complejo de ligación específico de diana múltiple. Cada gen relevante se marca como diana por múltiples sondas distintas que pueden detectar mutaciones típicas. Para el perfilado de dianas (504) genéticas múltiples, 20 sondas distintas se dirigen a cada gen para detectar mutaciones oncológicamente relevantes en el ADN circulante del paciente que padece cáncer.
La Fig. 6 ilustra un diagrama de flujo de amplificación de sonda dependiente de ligación múltiplex según una realización en la presente memoria. En la etapa 604, el ácido nucleico ADN/ARN (diana) se extrae de dos o más muestras. Tales muestras pueden obtenerse previamente de un cuerpo humano, incluidas biopsias, saliva y otras secreciones, extractos de humedad exhalada, tejido, plasma sanguíneo (biopsias líquidas), dos o más muestras obtenidas del ambiente, incluidos agua, agua residual, suelo o similares. En la etapa 606, se proporcionan complejos de ligación para cada una de las muestras. Los complejos de ligación incluyen una sonda izquierda, una sonda derecha y una sonda oligo de puente. En la etapa 608, la muestra diana se mezcla con los complejos de ligación para permitir la auto-hibridación. En la etapa 610 opcional, opcionalmente, las brechas se rellenan entre la primera sonda y la segunda sonda y además se lleva a cabo la extensión de sonda oligo de puente usando enzima polimerasa de tal manera que se forme el complejo de ligación ligado circular. Esto puede, por ejemplo, ocurrir cuando el triplete de sonda se ensambla o cuando las partes específicas de diana unidas se extienden y se ligan. En la etapa 612 los complejos de ligación se ligan usando enzima ligasa de tal manera que se forma el complejo de ligación ligado circular. En la etapa 614, la pluralidad de tales complejos de ligación ligados se pone en conjunto a partir de la pluralidad de conjuntos de muestras. En la etapa 616 opcional, el reactivo de escisión específico de uracilo opcional se añade para promover la linealización por escisión del complejo de ligación ligado circular. En la etapa 618, se añade la ARN polimerasa T7 que se une al sitio promotor de la ARN polimerasa T7 sobre la secuencia oligo de puente (o sobre la primera o la segunda sonda) del complejo de ligación ligado para transcribir el ARN. En la etapa 620 opcional, se añaden las exonucleasas y endonucleasas específicas de ADN a la mezcla de reacción para retirar la muestra y las sondas libres. En la etapa 622, el ADNc se sintetiza a partir de ARN por el proceso de transcripción inversa. En una etapa 624 opcional, el ADNc se amplifica por PCR o PCR en emulsión. En la etapa 626, la secuenciación se lleva a cabo por medio de secuenciación de alto rendimiento.

Claims (14)

  1. REIVINDICACIONES
    i. Un método para la detección de alto rendimiento de una o más secuencia de nucleótidos diana en una pluralidad de muestras, comprendiendo el método las etapas de:
    (i) proporcionar para cada secuencia de nucleótidos diana en cada una de las muestras:
    una primera sonda, una segunda sonda y un oligo de puente, en donde la primera sonda comprende, empezando desde el extremo 5' de la molécula, una primera secuencia específica de oligo de puente, opcionalmente una primera secuencia de código de barras, y una primera porción específica de diana en el extremo 3' de la primera sonda;
    y en donde la segunda sonda comprende, empezando desde el extremo 5' de la molécula, una segunda porción específica de diana, opcionalmente una segunda secuencia de código de barras, y una segunda secuencia específica de oligo de puente en el extremo 3' de la segunda sonda;
    y en donde el oligo de puente contiene secuencias complementarias a la primera secuencia específica de oligo de puente y la segunda secuencia específica de oligo de puente en la primera sonda y en la segunda sonda, respectivamente, y opcionalmente un tercer código de barras;
    en donde al menos una de la primera secuencia de código de barras o la segunda secuencia de código de barras o el tercer código de barras está presente en la primera sonda o la segunda sonda o el oligo de puente, respectivamente; y en donde una secuencia promotora para una ARN polimerasa T7 está presente en la primera sonda, la segunda sonda o el oligo de puente,
    (ii) poner en contacto, para cada una de la una o más secuencia de nucleótidos diana, la primera sonda y la segunda sonda con, preferentemente para cada una de las muestras en un tubo separado, el oligo de puente y permitir auto-hibridar en una pluralidad de complejos de ligación; (iii) poner en contacto los ácidos nucleicos presentes en la pluralidad de muestras a probar para las secuencias de nucleótidos diana con la pluralidad de complejos de ligación;
    (iv) permitir que la primera porción específica de diana y la segunda porción específica de diana de la respectiva primera sonda y segunda sonda hibriden con secciones esencialmente adyacentes en la secuencia diana, formando de esta manera un complejo de hibridación;
    (v) ligar la primera sonda y la segunda sonda en los complejos de hibridación para proporcionar complejos de ligación ligados,
    (vi) poner en conjunto los complejos de ligación ligados de la pluralidad de muestras, (viii) amplificar el ARN del uno o más complejos ligados usando ARN polimerasa T7 que inicia la síntesis de ARN desde el promotor de ARN polimerasa T7 embebido en los complejos de ligación ligados;
    (xi) opcionalmente, preparar el ADNc a partir de las moléculas de ARN usando una molécula de oligonucleótido de ADN que es complementaria inversa a un sitio universal 2;
    (xii) someter las moléculas de ARN o ADNc a tecnología de secuenciación de alto rendimiento para determinar la secuencia o secuencias identificadoras; e
    (xiii) identificar la presencia y/o el número de la secuencia de nucleótidos diana en la pluralidad de muestras mediante determinación de al menos parte de la primera porción específica diana y/o la segunda porción específica diana, y/o al menos parte del primer código de barras, y/o el segundo código de barras y/o al menos parte del tercer código de barras.
  2. 2. Método según la reivindicación 1, en donde la primera sonda, la segunda sonda, o el oligo de puente comprende un resto desoxiuridina que permite la linealización por escisión usando reactivo de escisión específico de uracilo.
  3. 3. Método según una cualquiera de las reivindicaciones 1-2, en donde la secuenciación se lleva a cabo por medio de secuenciación de ADN o ARN de última generación.
  4. 4. Método según una cualquiera de las reivindicaciones 1-3, en donde el extremo 3' de la primera sonda o el extremo 5' de la segunda sonda, o ambos, se modifican para permitir la ligación química de la primera sonda a la segunda sonda.
  5. 5. Método según una cualquiera de las reivindicaciones 1-4, en donde la porción de puente de la primera sonda o la segunda sonda, o ambas, comprende o comprenden bases químicamente modificadas para permitir la unión mejorada al oligo de puente.
  6. 6. Método según una cualquiera de las reivindicaciones 1-5, en donde la primera porción específica de diana, la segunda porción específica de diana, las primeras secuencias específicas de oligo de puente, y/o las segundas secuencias específicas de oligo de puente, contienen independientemente entre sí, uno o más nucleótidos químicamente modificados;
  7. 7. Método según una cualquiera de las reivindicaciones 1-6, en donde la enumeración de diana genética se permite contando el número de códigos de barra moleculares por diana y por muestra.
  8. 8. Método según una cualquiera de las reivindicaciones 1-7, en donde las moléculas de ARN o las moléculas de ADNc se amplifican con un primer cebador y un segundo cebador para proporcionar un producto de amplificación.
  9. 9. Método según una cualquiera de las reivindicaciones 1-8, en donde para dos o más muestras o para dos o más combinaciones de locus/alelo, se usan secuencias de código de barras para genotipar la muestra o muestras para una o más secuencias y/o polimorfismos, tales como SNP y/o mutaciones por indel.
  10. 10. Kit de partes que comprende una pluralidad de recipientes, en donde al menos un recipiente comprende uno o más conjuntos de primera sonda y segunda sonda y al menos un recipiente comprende uno o más oligos de puente,
    en donde la primera sonda comprende, empezando desde el extremo 5' de la molécula, una primera secuencia específica de oligo de puente, opcionalmente una primera secuencia de código de barras y una primera porción específica de diana en el extremo 3' de la primera sonda;
    en donde la segunda sonda comprende, empezando desde el extremo 5' de la molécula, una segunda porción específica de diana, opcionalmente una segunda secuencia de código de barras y una segunda secuencia específica de oligo de puente en el extremo 3' de la segunda sonda;
    en donde el oligo de puente comprende secuencias complementarias a las primeras y las segundas secuencias específicas de oligo de puente en la primera y la segunda sonda, respectivamente, y opcionalmente un tercer código de barras; y en donde al menos una de la primera secuencia de código de barras o la segunda secuencia de código de barras o el tercer código de barras está presente en la primera sonda o la segunda sonda o el oligo de puente, respectivamente; y en donde una secuencia promotora para una ARN polimerasa T7 está presente en la primera sonda, la segunda sonda o el oligo de puente,
  11. 11. Kit de partes según la reivindicación 10, en donde el extremo 3' de las primeras sondas o el extremo 5' de las segundas sondas, o ambos, se modifican para permitir la ligación química de las primeras sondas a las segundas sondas.
  12. 12. Kit de partes según la reivindicación 11, en donde el oligo de puente comprende uno o más nucleótidos químicamente modificados en la secuencia complementaria a una secuencia de la primera sonda o en la secuencia complementaria a una secuencia de la segunda sonda o ambas.
  13. 13. Kit de partes según la reivindicación 11 o 12, en donde preferentemente la primera porción específica de diana, la segunda porción específica de diana, la primera secuencia específica de oligo de puente, y/o la segunda secuencia específica de oligo, contienen independientemente entre sí, uno o más nucleótidos químicamente modificados.
  14. 14. Uso de una primera sonda, una segunda sonda y un oligo de puente para la secuenciación de alto rendimiento en la determinación de la presencia o ausencia y/o cuantificación de al menos una secuencias diana en una pluralidad de muestras,
    en donde la primera sonda comprende, empezando desde el extremo 5' de la molécula, una primera secuencia específica de oligo de puente, opcionalmente una primera secuencia de código de barras, y una primera porción específica de diana en el extremo 3' de la primera sonda;
    y en donde la segunda sonda comprende, empezando desde el extremo 5' de la molécula, una segunda porción específica de diana, opcionalmente una segunda secuencia de código de barras y una segunda secuencia específica de oligo de puente en el extremo 3' de la segunda sonda;
    y en donde el oligo de puente comprende secuencias complementarias a las primeras secuencias específicas de oligo de puente y las segundas secuencias específicas de oligo de puente en la primera sonda y en la segunda sonda, respectivamente, y opcionalmente un tercer código de barras; en donde al menos una de la primera secuencia de código de barras o la segunda secuencia de código de barras o el tercer código de barras está presente en la primera sonda o la segunda sonda o el oligo de puente, respectivamente; y
    en donde una secuencia promotora para una ARN polimerasa T7 está presente en la primera sonda, la segunda sonda o el oligo de puente; y en donde la primera sonda y la segunda sonda se ligan cuando las secciones específicas de diana respectivas de las sondas se hibridan a secciones esencialmente adyacentes sobre la secuencia diana para proporcionar sondas ligadas; y las sondas ligadas de la pluralidad de muestras se ponen en conjunto y se amplifican usando ARN polimerasa T7; y los productos de amplificación se someten a tecnología de secuenciación de alto rendimiento para determinar la secuencia o secuencias identificadoras.
ES18756250T 2017-08-25 2018-08-23 Cuantificación precisa y masivamente paralela de ácido nucleico Active ES2868328T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP17188047.9A EP3447152A1 (en) 2017-08-25 2017-08-25 Accurate and massively parallel quantification of nucleic acid
PCT/EP2018/072754 WO2019038372A1 (en) 2017-08-25 2018-08-23 ACCURATE QUANTIFICATION AND MASSIVELY PARALLEL NUCLEIC ACID

Publications (1)

Publication Number Publication Date
ES2868328T3 true ES2868328T3 (es) 2021-10-21

Family

ID=59713905

Family Applications (1)

Application Number Title Priority Date Filing Date
ES18756250T Active ES2868328T3 (es) 2017-08-25 2018-08-23 Cuantificación precisa y masivamente paralela de ácido nucleico

Country Status (9)

Country Link
US (2) US20240158843A1 (es)
EP (2) EP3447152A1 (es)
JP (1) JP7074978B2 (es)
CN (2) CN111032881B (es)
CA (1) CA3072650A1 (es)
DK (1) DK3673081T3 (es)
ES (1) ES2868328T3 (es)
PT (1) PT3673081T (es)
WO (1) WO2019038372A1 (es)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11639928B2 (en) 2018-02-22 2023-05-02 10X Genomics, Inc. Methods and systems for characterizing analytes from individual cells or cell populations
WO2020016590A1 (en) 2018-07-19 2020-01-23 Biofidelity Ltd Improved polynucleotide sequence detection method
CN114901818A (zh) * 2018-11-21 2022-08-12 艾维达生物医学公司 靶向核酸文库形成的方法
GB201919186D0 (en) 2019-12-23 2020-02-05 Biofidelity Ltd Simplified polynucleotide sequence detection method
US20210238662A1 (en) * 2020-02-03 2021-08-05 10X Genomics, Inc. Probes and methods of using same
EP4298244A1 (en) 2021-02-23 2024-01-03 10X Genomics, Inc. Probe-based analysis of nucleic acids and proteins
WO2022194764A1 (en) * 2021-03-15 2022-09-22 F. Hoffmann-La Roche Ag Targeted next-generation sequencing via anchored primer extension
ES2960777T3 (es) 2021-03-18 2024-03-06 Genomill Health Oy Métodos para la cuantificación paralela precisa de ácidos nucleicos en muestras diluidas o no purificadas
EP4060050B1 (en) 2021-03-18 2023-02-15 Genomill Health Oy Highly sensitive methods for accurate parallel quantification of nucleic acids
WO2022242734A1 (zh) * 2021-05-21 2022-11-24 上海绾塍生物科技有限公司 分析来自样品的靶分子的组合物和方法
EP4108783B1 (en) * 2021-06-24 2024-02-21 Miltenyi Biotec B.V. & Co. KG Spatial sequencing with mictag
US20230061542A1 (en) * 2021-08-16 2023-03-02 10X Genomics, Inc. Probes comprising a split barcode region and methods of use
EP4215619A1 (en) 2022-01-21 2023-07-26 Genomill Health Oy Methods for sensitive and accurate parallel quantification of nucleic acids
US20240068010A1 (en) 2022-08-31 2024-02-29 Genomill Health Oy Highly sensitive methods for accurate parallel quantification of variant nucleic acids
US11970736B2 (en) 2022-08-31 2024-04-30 Genomill Health Oy Methods for accurate parallel detection and quantification of nucleic acids

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050214825A1 (en) * 2000-02-07 2005-09-29 John Stuelpnagel Multiplex sample analysis on universal arrays
JP5237126B2 (ja) * 2006-03-01 2013-07-17 キージーン ナムローゼ フェンノートシャップ ライゲーションアッセイを用いてハイスループットシークエンスに基づき遺伝子関連配列を検出する方法
US8759036B2 (en) * 2011-03-21 2014-06-24 Affymetrix, Inc. Methods for synthesizing pools of probes
CA2913236A1 (en) * 2013-06-07 2014-12-11 Keygene N.V. Method for targeted sequencing
EP3234602B1 (en) * 2014-12-19 2021-08-25 F. Hoffmann-La Roche AG Methods for identifying multiple epitopes in selected sub-populations of cells

Also Published As

Publication number Publication date
CN111032881B (zh) 2023-12-26
US20230340564A1 (en) 2023-10-26
CN117778545A (zh) 2024-03-29
EP3673081B1 (en) 2021-02-24
EP3673081A1 (en) 2020-07-01
JP7074978B2 (ja) 2022-05-25
PT3673081T (pt) 2021-04-15
WO2019038372A1 (en) 2019-02-28
CA3072650A1 (en) 2019-02-28
JP2020532970A (ja) 2020-11-19
DK3673081T3 (da) 2021-04-12
CN111032881A (zh) 2020-04-17
EP3447152A1 (en) 2019-02-27
US20240158843A1 (en) 2024-05-16

Similar Documents

Publication Publication Date Title
ES2868328T3 (es) Cuantificación precisa y masivamente paralela de ácido nucleico
US11486003B2 (en) Highly sensitive methods for accurate parallel quantification of nucleic acids
ES2960777T3 (es) Métodos para la cuantificación paralela precisa de ácidos nucleicos en muestras diluidas o no purificadas
US11970736B2 (en) Methods for accurate parallel detection and quantification of nucleic acids
EP4215619A1 (en) Methods for sensitive and accurate parallel quantification of nucleic acids
US20240068010A1 (en) Highly sensitive methods for accurate parallel quantification of variant nucleic acids