ES2924487T3 - Un adaptador de conformación en Y novedoso para secuenciación de ácidos nucleicos y procedimiento de uso - Google Patents

Un adaptador de conformación en Y novedoso para secuenciación de ácidos nucleicos y procedimiento de uso Download PDF

Info

Publication number
ES2924487T3
ES2924487T3 ES17701499T ES17701499T ES2924487T3 ES 2924487 T3 ES2924487 T3 ES 2924487T3 ES 17701499 T ES17701499 T ES 17701499T ES 17701499 T ES17701499 T ES 17701499T ES 2924487 T3 ES2924487 T3 ES 2924487T3
Authority
ES
Spain
Prior art keywords
nucleic acid
barcode
adapter
adapters
barcodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES17701499T
Other languages
English (en)
Inventor
Daniel Klass
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Application granted granted Critical
Publication of ES2924487T3 publication Critical patent/ES2924487T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1065Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Plant Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Heterocyclic Carbon Compounds Containing A Hetero Ring Having Oxygen Or Sulfur (AREA)

Abstract

La invención es un adaptador novedoso en forma de Y (bifurcado) que contiene sitios de unión a cebadores y códigos de barras en cada una de las porciones monocatenarias para secuenciar ácidos nucleicos con una tasa de errores reducida. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Un adaptador de conformación en Y novedoso para secuenciación de ácidos nucleicos y procedimiento de uso
Campo de la invención
La invención se relaciona con el análisis de ácidos nucleicos, más específicamente, con adaptadores que ayudan en la secuenciación de ácidos nucleicos.
Antecedentes de la invención
Los últimos procedimientos de secuenciación de ácidos nucleicos, tales como secuenciación masiva en paralelo (SMP), también conocida como secuenciación de nueva generación (SNG), implican el análisis de moléculas individuales en una muestra. El análisis de cada molécula en la muestra requiere cebadores universales. Además, parte del análisis de molécula única es el marcado molecular o código de barras, con lo que cada molécula lleva información sobre su origen y su identidad. Se pueden añadir sitios de unión a cebador universal y códigos de barras a las moléculas diana en una muestra añadiendo un adaptador. Se pueden añadir adaptadores extendiendo un cebador que contenga la secuencia de adaptador o ligando el adaptador.
Una marca molecular o código de barras es una secuencia corta que contiene información de identificación única. La marca puede ser única para una muestra particular (compartida por todas las moléculas derivadas de la muestra) o usada para identificar una molécula individual (compartida solo por la descendencia de esa molécula). Las marcas de ID de muestra (SID) y marcas de ID molecular único (UID) son conocidas en la técnica. El ID de muestra permite agrupar muestras en una tanda de secuenciación, mientras que los ID moleculares posibilitan realizar un seguimiento de la descendencia de cada molécula en la muestra original.
El documento WO2013/181170 divulga adaptadores de conformación en Y que contienen adaptadores de indexación aleatorios en cada porción monocatenaria del adaptador de conformación en Y. Los índices están diseñados en base a la marca Hamming.
El documento WO2015/100427 divulga adaptadores de conformación en Y en los que las porciones monocatenarias pueden comprender un código de barras de identificación de hebra. Los adaptadores se pueden usar en la determinación de errores durante la secuenciación.
La presente invención emplea un adaptador económico que permite la secuenciación de ácidos nucleicos con errores reducidos con un gasto mínimo de recursos y una sensibilidad máxima.
Sumario de la invención
La invención es un conjunto de adaptadores, comprendiendo cada adaptador una porción bicatenaria en un extremo y una porción monocatenaria que comprende dos hebras no hibridables en el extremo opuesto, y comprendiendo además al menos un sitio de unión a cebador y al menos un código de barras en cada porción monocatenaria, en el que los códigos de barras en cada adaptador en el conjunto están en una relación conocida. Los códigos de barras en una hebra del mismo adaptador pueden estar separados en al menos una distancia de edición. La relación entre los códigos de barras en el mismo adaptador es la complementariedad inversa.
En otro modo de realización, la invención es un artículo de fabricación que comprende el conjunto de adaptadores descrito anteriormente. El conjunto puede estar contenido en un único vial.
Aún en otro modo de realización, la invención es un procedimiento de secuenciación de ácidos nucleicos que comprende: ligar a cada ácido nucleico en una muestra un adaptador que comprende una porción bicatenaria en un extremo y una porción monocatenaria que comprende dos hebras no hibridables en el extremo opuesto, y que comprende además al menos un sitio de unión a cebador y un primer código de barras en la primera hebra y un segundo código de barras en la segunda hebra de la porción monocatenaria, en el que los primer y segundo códigos de barras en cada adaptador en el conjunto están en una relación conocida, en el que la relación conocida es la complementariedad inversa, determinar la secuencia de al menos una porción de las hebras de ácido nucleico y de los primer y segundo códigos de barras, comparar la secuencia de la hebra de ácido nucleico que contiene el primer código de barras y la secuencia de la hebra de ácido nucleico que contiene el segundo código de barras para identificar secuencias no perfectamente complementarias, determinar que las secuencias no perfectamente complementarias contienen al menos un error experimental. El procedimiento puede comprender además amplificar el ácido nucleico ligado antes de la determinación de secuencia para obtener secuencias bicatenarias separadas que contengan el primer y el segundo código de barras. Las secuencias determinadas que contienen al menos un error experimental se pueden omitir de los resultados de secuenciación. El procedimiento puede comprender además agrupar secuencias que contienen el mismo código de barras y las mismas coordenadas genómicas del ácido nucleico, comparar secuencias dentro del grupo para identificar secuencias no idénticas y determinar que las secuencias no idénticas contienen al menos un error experimental. La muestra usada en el procedimiento puede contener ADN libre circulante.
Fuera del alcance de la invención hay un procedimiento de preparación de un conjunto de adaptadores para secuenciación de ácidos nucleicos que comprende hibridar, de una manera por parejas, hebras únicas de ácido nucleico para formar adaptadores que comprenden una porción bicatenaria en un extremo y una porción monocatenaria que comprende dos hebras no hibridables en el extremo opuesto, y que comprenden además al menos un sitio de unión a cebador y al menos un código de barras en cada porción monocatenaria, en el que, antes de la hibridación, las hebras únicas de ácidos nucleicos se combinan de un modo que establezca una relación conocida entre los códigos de barras en el conjunto de adaptadores.
Breve descripción de los dibujos
FIG. 1: un diagrama de los adaptadores ligados a ambos extremos de un ácido nucleico de muestra.
Descripción detallada de la invención
Definiciones
El término "adaptador" se refiere a un polinucleótido que se puede fijar a uno o ambos extremos de una molécula de ácido nucleico. Un adaptador puede comprender solo una región bicatenaria o también una región monocatenaria. La región bicatenaria está formada por porciones hibridables de dos hebras de ácido nucleico mientras que la región monocatenaria está formada por porciones no hibridables de las mismas dos hebras de ácido nucleico. La porción no hibridable se puede abrir (adaptador de conformación en Y) o cerrar de forma covalente enlazando los extremos 5' y 3' libres (adaptador de conformación en mancuerna). En el caso de un adaptador de conformación en Y, la porción monocatenaria del adaptador a veces se denomina "horquilla", mientras que la porción bicatenaria a veces se denomina "tallo".
Los términos "código de barras" e "índice" se usan de manera intercambiable para hacer referencia a una secuencia de nucleótidos dentro de un polinucleótido que se usa para identificar una molécula de ácido nucleico. Por ejemplo, se puede usar un código de barras para identificar una muestra de la que se derive una molécula de ácido nucleico cuando se combinan varias muestras (como es común en algunas técnicas de secuenciación masivamente en paralelo). También se puede usar un código de barras para identificar una molécula de ácido nucleico única y descendencia de la misma que resulte de la amplificación. Un código de barras se puede sintetizar en el momento en que se sintetiza un ácido nucleico (por ejemplo, un cebador o un adaptador). Un código de barras puede comprender secuencias predefinidas o aleatorias o combinaciones de las mismas. El término "predefinida" significa que la secuencia de un código de barras es conocida en el momento en que se sintetiza un ácido nucleico con el código de barras. El término "secuencia aleatoria" o "redundante" significa que se usa una mezcla aleatoria de nucleótidos cuando se sintetiza el código de barras dentro del ácido nucleico. Se puede usar una mezcla no aleatoria, es decir, sesgada, de bases durante la secuenciación de oligonucleótidos que dé como resultado un código de barras que contenga preferentemente determinadas bases. Un código de barras a veces puede comprender una secuencia endógena presente en el genoma inalterado. Se puede formar un código de barras endógeno por una unión del ácido nucleico fragmentado aleatoriamente y un adaptador. Se puede formar una combinación de códigos de barras sintéticos-endógenos por la combinación de las coordenadas genómicas de la posición inicial y final del ácido nucleico fragmentado aleatoriamente y un código de barras sintético en el adaptador.
El término "código de barras monocatenario", por ejemplo, dentro de un adaptador, significa un código de barras no hibridado a su secuencia complementaria. Un "código de barras bicatenario" significa un código de barras hibridado a su secuencia complementaria. Por ejemplo, un código de barras monocatenario se puede situar en la porción monocatenaria de un adaptador, y un código de barras bicatenario se puede situar en la porción bicatenaria de un adaptador.
El término "hibridable" se refiere a dos hebras de polinucleótido que pueden formar un dúplex. El dúplex se puede formar cuando las hebras son perfecta o al menos parcialmente complementarias. La complementariedad se puede definir por enlaces de hidrógeno de Watson-Crick. Las interacciones adicionales (por ejemplo, el emparejamiento de Hoogsteen y las interacciones hidrófobas) pueden soportar la hibridación en ausencia de complementariedad de Watson-Crick perfecta.
El término "no hibridable" se refiere a dos hebras de polinucleótido que no pueden formar un dúplex en condiciones experimentales. El dúplex no se puede formar cuando las hebras no comparten incluso una complementariedad parcial y ninguna interacción adicional (por ejemplo, emparejamiento de Hoogsteen e interacciones hidrófobas) es suficiente para soportar la hibridación específica.
El término "distancia de edición" entre dos secuencias de ácido nucleico, especialmente entre dos códigos de barras, se refiere al número de cambios requeridos para cambiar una secuencia en otra, donde un cambio es la adición, sustracción o sustitución de una base.
El término "emparejado" en referencia a los códigos de barras significa tener una relación conocida entre dos secuencias de código de barras en los dos oligonucleótidos de una molécula de adaptador. El término incluye complementariedad (emparejamiento de bases), complementariedad inversa, así como cualquier otra relación artificial, por ejemplo, una tabla de referencia, que indique qué dos hebras de adaptador con código de barras se han emparejado de forma intencionada durante la etapa de hibridación.
El término "amplificación" se refiere a cualquier procedimiento para incrementar el número de copias de una secuencia de ácido nucleico. Por ejemplo, la amplificación se puede realizar con el uso de una polimerasa, por ejemplo, en una o más reacciones en cadena de la polimerasa (PCR) u otro procedimiento exponencial o lineal de amplificación. El término "amplicones" significa productos de ácido nucleico de una reacción de amplificación.
Los términos "cebador universal" y "sitio de cebador universal" se refieren a un cebador y a una secuencia de unión a cebador no presentes en ninguna secuencia diana, sino añadidos a todas las secuencias diana (por ejemplo, al ser parte de un cebador específico de diana o al ser parte de un adaptador). Después de que se haya añadido el sitio de cebador universal, el cebador universal se puede usar para la amplificación o secuenciación de todas las secuencias diana en una muestra.
El término "desduplicación" se refiere a un procedimiento de agrupación de secuencias de ácido nucleico en grupos que consisten en la descendencia de una molécula única originalmente presente en la muestra. La desduplicación comprende además el análisis de las secuencias de las moléculas de la descendencia para determinar indirectamente la secuencia de la molécula original con una tasa de errores reducida.
El término "error" en el contexto de la secuenciación de ácidos nucleicos se refiere a una lectura de bases incorrecta. El término engloba cualquier error revelado durante la etapa de secuenciación, no solo el error de la propia etapa de secuenciación. El error incluye errores de la ADN polimerasa durante la extensión del cebador o amplificación de diana, errores de la polimerasa de secuenciación y errores del instrumento de secuenciación, por ejemplo, un detector. Cuando se lee una secuencia artificial (por ejemplo, una secuencia de adaptador), los errores también incluyen errores de síntesis de ADN in vitro (síntesis de oligonucleótidos). Los errores incluyen sustitución de base (base incorrecta), falta de incorporación (base delecionada) o adición de una base (base insertada). El término "tasa de errores" se refiere al número de errores por lectura de bases correcta. El término "tasa de errores reducida" de una medida de prevención de errores se refiere a la tasa de errores con la medida en comparación con la tasa de errores sin la medida.
El término "ADN libre circulante (ADNlc)" se refiere al ADN en una muestra que, cuando se obtuvo, no estaba contenido dentro de una célula. El término no se refiere a ADN que se convierte en libre circulante por ruptura in vitro de células o tejidos. Los ADNlc pueden comprender tanto ADN derivado de células normales como de células cancerosas. El ADNlc se obtiene comúnmente de sangre o plasma ("circulación"). Los ADNlc se pueden liberar en la circulación a través de procesos de secreción o muerte celular, por ejemplo, necrosis celular o apoptosis. Algunos ADNlc son ADNtc (véase a continuación).
El término "ADN tumoral circulante (ADNtc)" o "ADN canceroso circulante" se refiere a la fracción de ADN libre circulante (ADNlc) que se origina a partir de un tumor.
El término "muestra" se refiere a cualquier muestra biológica que se aísla de un sujeto. Por ejemplo, una muestra puede incluir tejidos o líquidos corporales. La muestra también puede ser una muestra tumoral. Las muestras se pueden obtener directamente de un sujeto, de una muestra previamente extirpada o extraída o del entorno (por ejemplo, muestras forenses).
El término "muestra de sangre" se refiere a sangre completa o cualquier fracción de la misma, incluyendo glóbulos sanguíneos, suero y plasma.
La invención incluye adaptadores para la secuenciación de molécula única de ácidos nucleicos. En la figura 1, se muestran adaptadores conjugados a una molécula de ácido nucleico. Los procedimientos de secuenciación de ácidos nucleicos actuales, denominados secuenciación de nueva generación (SNG) o secuenciación masivamente en paralelo (SMP), implican capturar, opcionalmente amplificar y secuenciar cada molécula individual en una muestra. La amplificación opcional puede ser antes de la captura, después de la captura o ambas. La SNG implica además cebadores de secuenciación universales y opcionalmente cebadores de preamplificación universales. Para crear sitios de unión para cebadores universales, cada molécula de ácido nucleico diana se conjuga con un adaptador. Los adaptadores típicamente se conjugan a ambos lados de las moléculas de ácido nucleico diana y contienen sitios de unión para cebadores universales y otras secuencias necesarias para la secuenciación. Los adaptadores pueden contener códigos de barras que identifiquen de forma única una muestra a partir de la que se originaron las moléculas diana (ID de muestra o SID). Los adaptadores pueden contener códigos de barras que identifiquen de forma única cada molécula diana (ID molecular único o UID). SID y UID pueden existir por separado o combinarse en un código de barras único.
Un modo conveniente de fijar adaptadores a un ácido nucleico diana bicatenario es por medio de ligación. Para que se produzca una reacción de ligación, el ácido nucleico diana y el adaptador deben tener extremos compatibles. En algunos modos de realización, el ácido nucleico diana se repara en sus extremos para que contenga extremos romos y el adaptador tenga un extremo romo bicatenario. En otros modos de realización, el ácido nucleico diana se repara en sus extremos y tanto el ácido nucleico diana como el adaptador se genomanipulan para que tengan una extensión de una base. Por ejemplo, una extensión que crea un par T-A posibilita una ligación eficaz entre la molécula de adaptador y el ácido nucleico diana. También se podrían usar protuberancias de ADN que resulten de una digestión con restricción para mejorar la eficacia de la ligación.
Son especialmente ventajosos los adaptadores de conformación en Y descritos, por ejemplo, en la patente de EE. UU. n.° 6395887. Estos adaptadores comprenden una porción bicatenaria en un extremo y una porción monocatenaria que comprende dos hebras no hibridables en el extremo opuesto. Solo la porción bicatenaria se puede ligar al ácido nucleico diana, lo que garantiza la orientación correcta de los productos ligados.
En un modo de realización, la invención es un adaptador novedoso para el análisis de ácidos nucleicos. (Figura 1). El adaptador comprende una porción bicatenaria en un extremo y una porción monocatenaria que comprende dos hebras no hibridables en el extremo opuesto. La longitud precisa de cada porción no es esencial siempre que el adaptador posea las siguientes propiedades: 1) tenga suficiente longitud para acomodar todos los elementos descritos a continuación; 2) tenga una temperatura de fusión adecuada; y 3) no forme ninguna estructura secundaria en la porción monocatenaria que pueda impedir el funcionamiento del adaptador. Un experto en la técnica puede diseñar un oligonucleótido con una temperatura de fusión deseada para acomodarse a las necesidades de ensayos particulares. Asimismo, se puede evitar o mitigar al menos la formación de alguna estructura secundaria por un experto en la técnica usando herramientas de diseño de oligonucleótidos del estado de la técnica. En algunos modos de realización, se desea que la longitud de la porción monocatenaria no supere los 20 nucleótidos y que la longitud de la bicatenaria sea suficiente para permanecer hibridada a temperatura ambiente y permitir la unión de la ADN ligasa.
El adaptador comprende sitios de unión para uno o más cebadores. Los cebadores pueden ser cebadores de secuenciación, cebadores de amplificación o ambos. En algunos modos de realización, el mismo cebador puede ser un cebador de secuenciación y un cebador de amplificación. Los adaptadores también pueden comprender secuencias específicas para una tecnología de secuenciación particular, por ejemplo, secuencias que se hibriden al soporte sólido en el instrumento de secuenciación (por ejemplo, secuencias de generación de agrupaciones en instrumentos Illumina).
El adaptador puede contener bases naturales (por ejemplo, adenosina (A), timidina (T), guanosina (G), citosina (C) y uracilo (U)), otras bases naturales, tales como inosina (l) y metilcitosina (mC), versiones modificadas de las bases naturales, así como bases no naturales, por ejemplo, aminoaliluridina, isocitosinas, isoguanina y 2-aminopurina.
Los adaptadores usados en la presente invención comprenden además códigos de barras. El código de barras puede contener nucleótidos naturales o no naturales descritos anteriormente. El código de barras puede tener una secuencia predefinida, una secuencia aleatoria o una secuencia sesgada no aleatoria que contenga preferentemente determinadas bases. En algunos modos de realización, se usa una secuencia sesgada para evitar las bases propensas a error. En otros modos de realización, se usa una secuencia sesgada para modular la temperatura de fusión del ácido nucleico que contiene el código de barras. Como se muestra en la figura 1, cada adaptador comprende dos códigos de barras o índices, uno en cada una de las hebras únicas de la porción monocatenaria. El producto ligado que comprende un fragmento de ADN diana y dos adaptadores comprende cuatro códigos de barras. Los códigos de barras en cada adaptador (por ejemplo, índice 1A y 1B) tienen secuencias en una relación 1:1. La relación es la complementariedad inversa; con lo que la identificación de una secuencia de código de barras (por ejemplo, índice 1A) determina inequívocamente la segunda secuencia de código de barras (índice 1B).
En algunos modos de realización, la invención es un conjunto de adaptadores descritos en la figura 1. En el conjunto, cada adaptador comprende una porción bicatenaria en un extremo y una porción monocatenaria que comprende dos hebras no hibridables en el extremo opuesto. Los adaptadores en el conjunto comprenden además sitios de unión para uno o más cebadores, por ejemplo, cebadores de secuenciación, cebadores de amplificación o ambos. Los adaptadores en el conjunto comprenden además códigos de barras. Específicamente, cada adaptador comprende dos códigos de barras, uno en cada una de las hebras únicas de la porción monocatenaria. Los códigos de barras en los adaptadores están en una relación 1:1, con lo que la identificación de una secuencia de código de barras determina inequívocamente la segunda secuencia de código de barras. Las secuencias son inversamente complementarias.
Los adaptadores dentro del conjunto tienen códigos de barras separados en al menos 1 o al menos 3 distancias de edición.
Un experto en la técnica podría determinar qué distancia de edición es óptima para un experimento particular. En general, una mayor distancia de edición significa que se pueden usar menos códigos de barras en un conjunto. Sin embargo, si un ensayo o un procedimiento de preparación tiene una alta tasa de errores, se requerirá una mayor distancia de edición. Por ejemplo, el procedimiento de preparación de oligonucleótidos usado para preparar adaptadores puede tener una alta tasa de errores. De forma similar, una ácido nucleico polimerasa usada en la amplificación de ADN o extensión del cebador en el flujo de trabajo de secuenciación por síntesis puede tener una alta tasa de errores. Estas tasas de errores requerirían incrementar la distancia de edición entre los códigos de barras en los adaptadores del conjunto. Por el contrario, mejorar la exactitud de cada uno de los procedimientos mencionados anteriormente permitirá disminuir la distancia de edición entre los códigos de barras en los adaptadores del conjunto.
En algunos modos de realización, la invención es un conjunto de N adaptadores distintos, consistiendo cada uno en dos oligonucleótidos hibridados (2N oligonucleótidos en el conjunto). Dependiendo de la longitud de los códigos de barras en los adaptadores, cada muestra requerirá un conjunto que consista en A adaptadores. Por lo tanto, se puede usar el conjunto de N en muestras N/A=S. En algunos modos de realización, un artículo de fabricación puede comprender un único vial que contenga todo el conjunto de adaptadores. De forma alternativa, un artículo de fabricación puede comprender un kit donde uno o más adaptadores del conjunto estén presentes en viales separados.
Fuera del alcance de la invención hay un procedimiento de preparación de adaptadores para el análisis de ácidos nucleicos. El procedimiento comprende combinar e hibridar, de una manera por parejas, dos hebras únicas de ácido nucleico para formar adaptadores, en el que cada adaptador comprende una porción bicatenaria en un extremo y una porción monocatenaria que comprende dos hebras no hibridables en el extremo opuesto. Las hebras únicas que forman los adaptadores comprenden sitios de unión para uno o más cebadores, por ejemplo, cebadores de secuenciación, cebadores de amplificación o ambos. Las hebras únicas que forman los adaptadores comprenden además códigos de barras. Específicamente, cada hebra comprende un código de barras en la región no complementaria de modo que cada adaptador comprenda al menos dos códigos de barras, al menos uno en cada una de las hebras únicas de la porción monocatenaria. Las hebras únicas se combinan e hi bridan de modo que los códigos de barras en los adaptadores estén en una relación 1:1. Las secuencias son inversamente complementarias.
Por tanto, se usan adaptadores en un procedimiento que implica la creación de una referencia, con lo que la identificación de una secuencia (por ejemplo, índice 1A en la fig. 1) determina inequívocamente la segunda secuencia (índice 1B en la fig. 1).
En algunos modos de realización, la invención es un procedimiento de secuenciación de ácidos nucleicos en una muestra usando adaptadores con códigos de barras monocatenarios. El procedimiento comprende fijar a los ácidos nucleicos en la muestra un conjunto de adaptadores para formar un conjunto de moléculas de adaptador-diana. La fijación puede ser por medio de ligación con una ADN ligasa, por ejemplo, una ADN ligasa T4, ADN ligasa de E. coli, ligasa de mamífero o cualquier combinación de las mismas. La ligasa de mamífero puede ser ADN ligasa I, ADN ligasa III o ADN ligasa IV. La ligasa también puede ser una ligasa termoestable. En algunos modos de realización, para incrementar la eficacia de la ligación, el ácido nucleico de muestra se puede someter a reparación de extremos (por ejemplo, con una ADN polimerasa) y adición de A en el extremo, también con una a Dn polimerasa o transferasa terminal.
Cada adaptador comprende una porción bicatenaria en un extremo y una porción monocatenaria que comprende dos hebras no hibridables en el extremo opuesto. El adaptador comprende un primer código de barras en una hebra de la porción monocatenaria y un segundo código de barras en la otra hebra de la porción monocatenaria, y en el que los primer y segundo códigos de barras en cada adaptador están en una relación conocida, con lo que la relación conocida es la complementariedad inversa, de modo que cada primer código de barras se pueda asociar inequívocamente con cada segundo código de barras. En cada muestra, están presentes múltiples adaptadores con múltiples pares de códigos de barras, pero hay menos adaptadores que moléculas de ácido nucleico diana en cada muestra. Aún, el número de adaptadores con pares de códigos de barras únicos es suficiente para identificar todas, prácticamente todas o un porcentaje deseado de las moléculas de ácido nucleico originales en la muestra. La identificación utiliza tanto el código de barras único como las coordenadas genómicas (puntos de ruptura) para cada molécula de ácido nucleico diana, como se describe a continuación. El adaptador comprende además sitios de unión para uno o más cebadores. En algunos modos de realización, el procedimiento comprende además una etapa de amplificación de ambas hebras de las moléculas de adaptador-diana antes de determinar su secuencia. El procedimiento comprende además una etapa de determinación de la secuencia de las moléculas de adaptador-diana. En esta etapa, se determina al menos una porción de la secuencia del ácido nucleico diana y se determina la secuencia de códigos de barras en los adaptadores. El procedimiento comprende además una etapa de corrección de errores en la que la secuencia de adaptador-diana que contiene cada primer código de barras se empareja con la secuencia de adaptador-diana que contiene el segundo código de barras correspondiente en la relación conocida con el primer código de barras. Como se muestra en la figura 1, la secuencia diana fijada al adaptador con el código de barras 1A se empareja con la secuencia diana fijada al adaptador con el código de barras 1B. Las primeras moléculas con el código de barras 1A representan la primera hebra de la molécula original y las segundas moléculas con el código de barras 1B representan la segunda hebra de la molécula original. El emparejamiento de los códigos de barras 1A y 1B permite la coincidencia de las hebras originales para la corrección de errores. Si la secuencia diana de la primera y la segunda moléculas no es idéntica, por ejemplo, está presente una sustitución de base solo en la primera, pero no en la segunda, moléculas, el cambio se considera un error experimental. Las moléculas que contienen errores experimentales se omiten de los resultados. En algunos modos de realización, las moléculas que contienen errores experimentales encontradas en el archivo de datos sin procesar no se incluyen en el archivo de resultados.
Las secuencias del mismo origen también se identifican en virtud de tener los mismos códigos de barras de adaptador y las mismas coordenadas genómicas del ácido nucleico diana. Si la secuencia diana de las moléculas del mismo origen no es idéntica, por ejemplo, está presente una sustitución de base en solo una fracción de las moléculas del mismo origen, el cambio se considera que es un error experimental.
En algunos modos de realización, la muestra comprende ácidos nucleicos libres circulantes, tales como ácidos nucleicos plasmáticos libres circulantes. Dicho ADN se puede fragmentar, por ejemplo, puede tener, en promedio, aproximadamente 170 nucleótidos de longitud, lo que puede coincidir con la longitud del ADN envuelto alrededor de un nucleosoma único. En modos de realización donde el ácido nucleico de muestra no se fragmenta de forma natural, el ácido nucleico se puede fragmentar in vitro usando, por ejemplo, sonicación o digestión con restricción.

Claims (8)

REIVINDICACIONES
1. Un conjunto de adaptadores, comprendiendo cada adaptador una porción bicatenaria en un extremo y una porción monocatenaria que comprende dos hebras no hibridables en el extremo opuesto, y comprendiendo además al menos un sitio de unión a cebador y al menos un código de barras en cada porción monocatenaria, en el que los códigos de barras en cada adaptador en el conjunto están en una relación conocida,
en el que la relación entre los códigos de barras es la complementariedad inversa.
2. Un artículo de fabricación que comprende el conjunto de adaptadores de la reivindicación 1.
3. El artículo de la reivindicación 2, en el que el conjunto está contenido en un único vial.
4. Un procedimiento de secuenciación de ácidos nucleicos que comprende:
a) ligar a cada ácido nucleico en una muestra un adaptador de un conjunto de adaptadores de acuerdo con la reivindicación 1 que comprende una porción bicatenaria en un extremo y una porción monocatenaria que comprende dos hebras no hibridables en el extremo opuesto, y que comprende además al menos un sitio de unión a cebador y un primer código de barras en la primera hebra y un segundo código de barras en la segunda hebra de la porción monocatenaria, en el que los primer y segundo códigos de barras en cada adaptador en el conjunto están en una relación conocida, en el que la relación entre los códigos de barras es la complementariedad inversa, b) determinar la secuencia de al menos una porción de las hebras de ácido nucleico y de los primer y segundo códigos de barras,
c) comparar la secuencia de la hebra de ácido nucleico que contiene el primer código de barras y la secuencia de la hebra de ácido nucleico que contiene el segundo código de barras para identificar secuencias no perfectamente complementarias,
d) determinar que las secuencias no perfectamente complementarias contienen al menos un error experimental.
5. El procedimiento de la reivindicación 4, que comprende además amplificar el ácido nucleico ligado antes de la determinación de secuencia para obtener secuencias bicatenarias separadas que contengan el primer y el segundo código de barras.
6. El procedimiento de la reivindicación 4, en el que las secuencias determinadas que contienen al menos un error experimental se omiten de los resultados de secuenciación.
7. El procedimiento de la reivindicación 4, que comprende además agrupar secuencias que contienen el mismo código de barras y las mismas coordenadas genómicas del ácido nucleico, comparar secuencias dentro del grupo para identificar secuencias no idénticas y determinar que las secuencias no idénticas contienen al menos un error experimental.
8. El procedimiento de la reivindicación 4, en el que la muestra contiene ADN libre circulante.
ES17701499T 2016-01-29 2017-01-26 Un adaptador de conformación en Y novedoso para secuenciación de ácidos nucleicos y procedimiento de uso Active ES2924487T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201662288903P 2016-01-29 2016-01-29
PCT/EP2017/051588 WO2017129647A1 (en) 2016-01-29 2017-01-26 A novel adaptor for nucleic acid sequencing and method of use

Publications (1)

Publication Number Publication Date
ES2924487T3 true ES2924487T3 (es) 2022-10-07

Family

ID=57890833

Family Applications (1)

Application Number Title Priority Date Filing Date
ES17701499T Active ES2924487T3 (es) 2016-01-29 2017-01-26 Un adaptador de conformación en Y novedoso para secuenciación de ácidos nucleicos y procedimiento de uso

Country Status (6)

Country Link
US (2) US20180334709A1 (es)
EP (1) EP3408406B1 (es)
JP (1) JP6714709B2 (es)
CN (1) CN108474026A (es)
ES (1) ES2924487T3 (es)
WO (1) WO2017129647A1 (es)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7030857B2 (ja) * 2017-06-27 2022-03-07 エフ.ホフマン-ラ ロシュ アーゲー モジュラー核酸アダプター
WO2019183640A1 (en) * 2018-03-23 2019-09-26 Board Of Regents, The University Of Texas System Efficient sequencing of dsdna with extremely low level of errors
US11555185B2 (en) 2018-12-19 2023-01-17 New England Biolabs, Inc. Target enrichment
JP2023533271A (ja) 2020-07-08 2023-08-02 エフ. ホフマン-ラ ロシュ アーゲー 次世代シーケンシングライブラリーの標的捕捉中の、ポイズンプライマーを使用した非標的ライブラリー分子の標的化された枯渇
KR20230121076A (ko) 2020-12-15 2023-08-17 제노다이브 파마 가부시키가이샤 Dna 샘플의 시퀀스에 있어서의 어댑터 결합 효율을평가하는 방법
WO2024046992A1 (en) 2022-09-02 2024-03-07 F. Hoffmann-La Roche Ag Improvements to next-generation target enrichment performance

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6395887B1 (en) 1995-08-01 2002-05-28 Yale University Analysis of gene expression by display of 3'-end fragments of CDNAS
JP4708029B2 (ja) * 2002-10-11 2011-06-22 エラスマス・ユニバーシティー・ロッテルダム Pcrベースのクローン性研究のための核酸増幅プライマー
EP1616947B1 (en) * 2003-03-28 2012-05-09 Japan as represented by Director General of National Rehabilitation Center for Persons with Disabilities METHOD OF SYNTHESIZING cDNA
US20060223122A1 (en) * 2005-03-08 2006-10-05 Agnes Fogo Classifying and predicting glomerulosclerosis using a proteomics approach
GB2424946A (en) * 2005-04-05 2006-10-11 Stratec Biomedical Systems Ag A detection system for substance binding using up-converting fluorescent probes
WO2009133466A2 (en) * 2008-04-30 2009-11-05 Population Genetics Technologies Ltd. Asymmetric adapter library construction
US10388403B2 (en) * 2010-01-19 2019-08-20 Verinata Health, Inc. Analyzing copy number variation in the detection of cancer
WO2011091393A1 (en) * 2010-01-25 2011-07-28 Rd Biosciences, Inc. Self-folding amplification of target nucleic acid
WO2011097424A1 (en) * 2010-02-05 2011-08-11 Siemens Healthcare Diagnostics Inc. Methods for increasing multiplex level by externalization of passive reference in polymerase chain reactions
EP2363502B1 (en) * 2010-03-04 2017-02-15 miacom Diagnostics GmbH Enhanced multiplex FISH
AU2012249759A1 (en) * 2011-04-25 2013-11-07 Bio-Rad Laboratories, Inc. Methods and compositions for nucleic acid analysis
WO2012162161A1 (en) * 2011-05-20 2012-11-29 Phthisis Diagnostics Microsporidia detection system and method
ES2867924T3 (es) * 2011-12-09 2021-10-21 Adaptive Biotechnologies Corp Diagnóstico de tumores malignos linfoides y detección de enfermedad residual mínima
EP3305918B1 (en) * 2012-03-05 2020-06-03 President and Fellows of Harvard College Methods for epigenetic sequencing
EP2855707B1 (en) * 2012-05-31 2017-07-12 Board Of Regents, The University Of Texas System Method for accurate sequencing of dna
WO2014142850A1 (en) * 2013-03-13 2014-09-18 Illumina, Inc. Methods and compositions for nucleic acid sequencing
EP3524694B1 (en) * 2013-12-28 2020-07-15 Guardant Health, Inc. Methods and systems for detecting genetic variants
EP3363904B1 (en) * 2014-01-31 2019-10-23 Swift Biosciences, Inc. Improved methods for processing dna substrates
US9745614B2 (en) * 2014-02-28 2017-08-29 Nugen Technologies, Inc. Reduced representation bisulfite sequencing with diversity adaptors
CN106574305B (zh) * 2014-06-13 2021-03-02 生命技术公司 多重核酸扩增
ES2925014T3 (es) * 2014-09-12 2022-10-13 Univ Leland Stanford Junior Identificación y uso de ácidos nucleicos circulantes
US10844428B2 (en) * 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)

Also Published As

Publication number Publication date
WO2017129647A1 (en) 2017-08-03
JP2019504624A (ja) 2019-02-21
EP3408406B1 (en) 2022-06-15
JP6714709B2 (ja) 2020-06-24
CN108474026A (zh) 2018-08-31
US20230124718A1 (en) 2023-04-20
US20180334709A1 (en) 2018-11-22
EP3408406A1 (en) 2018-12-05

Similar Documents

Publication Publication Date Title
ES2924487T3 (es) Un adaptador de conformación en Y novedoso para secuenciación de ácidos nucleicos y procedimiento de uso
US20220154249A1 (en) Improved liquid biopsy using size selection
ES2690753T3 (es) Aumento de la confianza en las identificaciones de alelos con el recuento molecular
ES2662128T3 (es) Determinación de cadenas de receptor inmunitario emparejadas a partir de la frecuencia de subunidades coincidentes
ES2899693T3 (es) Método para la detección de fragmentos genómicos
ES2699653T3 (es) Detección y medición de linfocitos infiltrados en los tejidos
TWI797118B (zh) 用於資料庫建立及序列分析之組合物及方法
ES2828661T3 (es) Métodos para reducir la tasa de error de la secuenciación de ADN masiva en paralelo mediante el uso de la secuenciación de secuencia consenso bicatenaria
ES2866896T3 (es) Procedimiento para incrementar el rendimiento de secuenciación de molécula única concatenando fragmentos de ADN cortos
JP6860662B2 (ja) キメラ生成物の同定のためのバーコードを付けられた環状ライブラリーの構築
ES2868074T3 (es) Métodos para unir adaptadores a ácidos nucleicos de muestra
WO2013188840A1 (en) Compositions and methods for sensitive mutation detection in nucleic acid molecules
JP7332733B2 (ja) 次世代シークエンシングのための高分子量dnaサンプル追跡タグ
ES2788737T3 (es) Conjunto de sondas para analizar una muestra de ADN y método para usar el mismo
TW202012638A (zh) 用於癌症及贅瘤之評估的組合物及方法
CN107614681A (zh) 用于检测靶核酸的高灵敏度方法
WO2019180528A1 (en) Methods of labelling nucleic acids
JP2020532976A (ja) 環状一本鎖dnaライブラリーを生成するための新規な方法
BR102022009653A2 (pt) Conjunto de sondas, sonda, kit, composição, métodos para detecção de um gene de fusão e/ou salto de éxon em uma amostra e para diagnóstico ou monitoramento de um câncer, e, uso de um conjunto de sondas ou de pelo menos uma sonda
ES2971348T3 (es) Métodos de reparación de salientes 3'
JP2022500062A (ja) 塩基配列決定のためのモジュール式およびコンビナトリアル核酸試料調製のためのシステムおよび方法
JP2006238888A (ja) 牛胚の性判別用プライマーおよびそれを用いた牛の性判別方法
CN116685696A (zh) 从两端对多核苷酸片段进行测序的方法
Javanmardi Genomic instability and genetic heterogeneity in neuroblastoma tumours
WO2020012057A1 (es) Preparación de librerías de ácidos nucléicos o genotecas