ES2911421T3 - Adaptadores, métodos y composiciones mejorados para secuenciación dúplex - Google Patents

Adaptadores, métodos y composiciones mejorados para secuenciación dúplex Download PDF

Info

Publication number
ES2911421T3
ES2911421T3 ES16822832T ES16822832T ES2911421T3 ES 2911421 T3 ES2911421 T3 ES 2911421T3 ES 16822832 T ES16822832 T ES 16822832T ES 16822832 T ES16822832 T ES 16822832T ES 2911421 T3 ES2911421 T3 ES 2911421T3
Authority
ES
Spain
Prior art keywords
nucleic acid
adapter
strand
sequence
acid sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16822832T
Other languages
English (en)
Inventor
Lawrence A Loeb
Michael W Schmitt
Jesse J Salk
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Twinstrand Biosciences Inc
Original Assignee
Twinstrand Biosciences Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Twinstrand Biosciences Inc filed Critical Twinstrand Biosciences Inc
Application granted granted Critical
Publication of ES2911421T3 publication Critical patent/ES2911421T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Un método de secuenciación de un ácido nucleico diana de doble hebra que comprende las etapas de: (1) ligar un par de secuencias de ácido nucleico adaptadoras, que comprenden una secuencia de ácido nucleico con un primer adaptador y una secuencia de ácido nucleico con un segundo adaptador, en donde cada secuencia de ácido nucleico adaptadora comprende un dominio de unión al cebador y un dominio identificador de molécula simple (SMI), a al menos un extremo de una molécula de ácido nucleico diana de doble hebra, lo que forma de esta manera una molécula de ácido nucleico de doble hebra que comprende una secuencia de ácido nucleico diana con un primer adaptador en la hebra y una secuencia de ácido nucleico diana con un segundo adaptador en la hebra; (2) amplificar la molécula de ácido nucleico diana con un primer adaptador en la hebra, lo que produce de esta manera un primer conjunto de productos amplificados que comprenden una pluralidad de las moléculas de ácido nucleico diana con un pimer adaptador en la hebra y una pluralidad de sus moléculas complementarias, y amplificar la molécula de ácido nucleico diana con un segundo adaptador en la hebra, lo que produce de esta manera un segundo conjunto de productos amplificados que comprenden una pluralidad de moléculas de ácido nucleico diana con un segundo adaptador en la hebra y una pluralidad de sus moléculas complementarias; (3) secuenciar el primer conjunto de productos amplificados, de esta manera se obtiene una secuencia de consenso para el primer conjunto de productos amplificados; y (4) secuenciar el segundo conjunto de productos amplificados, para obtener de esta manera una secuencia de consenso para el segundo conjunto de productos amplificados en donde la secuencia de consenso para el primer conjunto de productos amplificados se compara con la secuencia de consenso para el segundo conjunto de productos amplificados, en donde una diferencia entre las dos secuencias de consenso puede considerarse un artefacto, caracterizado porque se obtienen productos de amplificación distinguibles de cada una de las dos hebras de moléculas de ácido nucleico individuales mediante la fusión térmica o química de la molécula de ácido nucleico de doble hebra y luego la separación física de la secuencia de ácido nucleico diana con un primer adaptador en la hebra de la secuencia de ácido nucleico diana con un segundo adaptador en la hebra antes de la amplificación de cada hebra en reacciones separadas.

Description

DESCRIPCIÓN
Adaptadores, métodos y composiciones mejorados para secuenciación dúplex
Esta solicitud reivindica la prioridad y el beneficio de la solicitud provisional de los Estados Unidos No. 62/264,822 presentada el 8 de diciembre de 2015 y a la solicitud provisional de los Estados Unidos No. 62/281,917 presentada el 22 de enero de 2016.
Listado de secuencias
La presente solicitud contiene un listado de secuencias que se presentó en formato ASCII a través de EFS-Web y se incorpora por la presente como referencia en su totalidad. Dicha copia ASCII, creada el 8 de diciembre de 2016, se llama TWIN-001_ST25.txt y tiene un tamaño de 11778 bytes.
Antecedentes de la invención
La secuenciación dúplex permite mejoras extremas en la precisión de la secuenciación de ADN de alto rendimiento al amplificar y secuenciar por separado las dos hebras de ADN dúplex; por lo tanto, los errores de amplificación y secuenciación se pueden eliminar, ya que típicamente ocurrirán en solo una de las dos hebras. La secuenciación dúplex se describió inicialmente con sitios de unión de cebadores de PCR asimétricos (es decir, no complementarios) introducidos en adaptadores en forma de Y o de "lazo" ligados a los extremos de los fragmentos de ADN. Los sitios de unión de cebadores asimétricos presentes dentro de los propios adaptadores dan como resultado productos separados de las dos hebras de ADN, lo que permite la corrección de errores de cada una de las dos hebras de ADN. El uso de sitios de unión de cebadores asimétricos puede no ser óptimo en algunas circunstancias; por ejemplo, los extremos libres de los adaptadores en Y pueden ser propensos a la degradación por exonucleasas, y estos extremos libres también se pueden hibridar con otras moléculas, lo que da como resultado una "conexión en cadena" de moléculas. Además, la secuenciación dúplex con adaptadores en forma de Y o adaptadores de "lazo" se aplica más fácilmente con enfoques de secuenciación de extremos pareados; los enfoques alternativos aplicables a la secuenciación de un solo extremo simplificarían una aplicación más amplia de la secuenciación dúplex en una variedad de plataformas de secuenciación.
El documento WO2015/100427 A1describe métodos y sistemas para detectar variantes genéticas. El documento WO2013/142389 A1describe métodos para reducir la tasa de error de la secuenciación de ADN masivamente paralela mediante el uso de la secuenciación consenso dúplex. El documento WO2014/142850 A1describe métodos y composiciones para la secuenciación de ácidos nucleicos.
En consecuencia, existe una necesidad insatisfecha de enfoques para la secuenciación dúplex que no impliquen usar sitios de unión de cebadores asimétricos.
Breve resumen de la invención
En la presente descripción se describen enfoques alternativos y superiores a la secuenciación dúplex que no requieren usar sitios de unión de cebadores asimétricos. En su lugar, se puede introducir asimetría entre las dos hebras de acuerdo con las reivindicaciones.
La invención se define por las reivindicaciones que proporcionan un método de secuenciación de un ácido nucleico diana de doble hebra que comprende las etapas de:
(1) ligar un par de secuencias de ácido nucleico adaptadoras, que comprenden una secuencia de ácido nucleico con un primer adaptador y una secuencia de ácido nucleico con un segundo adaptador, en donde cada secuencia de ácido nucleico adaptadora comprende un dominio de unión al cebador y un dominio identificador de molécula simple (SMI), a al menos un extremo de una molécula de ácido nucleico diana de doble hebra, lo que forma de esta manera una molécula de ácido nucleico de doble hebra que comprende una secuencia de ácido nucleico diana con un primer adaptador en la hebra y una secuencia de ácido nucleico diana con un segundo adaptador en la hebra;
(2) amplificar la molécula de ácido nucleico diana con un primer adaptador en la hebra, lo que produce de esta manera un primer conjunto de productos amplificados que comprenden una pluralidad de las moléculas de ácido nucleico diana con un pimer adaptador en la hebra y una pluralidad de sus moléculas complementarias, y amplificar la molécula de ácido nucleico diana con un segundo adaptador en la hebra, lo que produce de esta manera un segundo conjunto de productos amplificados que comprenden una pluralidad de moléculas de ácido nucleico diana con un segundo adaptador en la hebra y una pluralidad de sus moléculas complementarias;
(3) secuenciar el primer conjunto de productos amplificados, de esta manera se obtiene una secuencia de consenso para el primer conjunto de productos amplificados; y
(4) secuenciar el segundo conjunto de productos amplificados, de esta manera se obtiene una secuencia de consenso para el segundo conjunto de productos amplificados en donde la secuencia de consenso para el primer conjunto de productos amplificados se compara con la secuencia de consenso para el segundo conjunto de productos amplificados, en donde una diferencia entre las dos secuencias de consenso se puede considerar un artefacto, caracterizado porque se obtienen productos de amplificación distinguibles de cada una de las dos hebras de moléculas de ácido nucleico individuales al fundir térmica o químicamente la molécula de ácido nucleico de doble hebra y luego separar físicamente la secuencia de ácido nucleico diana con un primer adaptador en la hebra de la secuencia de ácido nucleico diana con un segundo adaptador en la hebra antes de la amplificación de cada hebra en reacciones separadas.
Los siguientes ejemplos de composición en el resumen de la invención más abajo se proporcionan solo con fines ilustrativos, sin embargo, pueden usarse en el método de acuerdo con las reivindicaciones.
En un primer ejemplo, se describe un par de secuencias de ácido nucleico adaptadoras para usar en la secuenciación de una molécula de ácido nucleico diana de doble hebra que incluye una secuencia de ácido nucleico con un primer adaptador y una secuencia de ácido nucleico con un segundo adaptador, en el que cada secuencia de ácido nucleico adaptadora incluye un dominio de unión al cebador, un elemento definidor de hebra (SDE), un dominio identificador de molécula simple (SMI) y un dominio de ligación. El SDE de la secuencia de ácido nucleico con un primer adaptador puede ser al menos parcialmente no complementario al SDE de la secuencia de ácido nucleico con un segundo adaptador.
Las dos secuencias adaptadoras pueden incluir dos moléculas de ADN separadas que están al menos parcialmente hibridadas entre sí. La secuencia de ácido nucleico con un primer adaptador y la secuencia de ácido nucleico con un segundo adaptador pueden estar unidas a través de un dominio enlazador. El dominio enlazador puede estar comprendido por nucleótidos. El dominio enlazador puede incluir una o más moléculas nucleotídicas o no nucleotídicas modificadas. La una o más moléculas nucleotídicas o no nucleotídicas modificadas pueden ser un sitio abásico, un uracilo, tetrahidrofurano, 8-oxo-7,8-dihidro-2'-desoxiadenosina (8-oxo-A), 8-oxo-7,8-dihidro-2'-desoxiguanosina (8-oxo-G), desoxinosina, 5'-nitroindol, 5-hidroximetil-2'-desoxicitidina, iso-citosina, 5'-metilisocitosina o iso-guanosina. El dominio enlazador puede formar un lazo. El SDE de la secuencia de ácido nucleico con un primer adaptador puede no ser complementaria al SDE de la secuencia de ácido nucleico con un segundo adaptador. El dominio de unión al cebador de la secuencia de ácido nucleico con un primer adaptador puede ser al menos parcialmente complementario al dominio de unión al cebador de la secuencia de ácido nucleico con un segundo adaptador. El dominio de unión al cebador de la secuencia de ácido nucleico con un primer adaptador puede ser complementario al dominio de unión al cebador de la secuencia de ácido nucleico con un segundo adaptador. El dominio de unión al cebador de la secuencia de ácido nucleico con un primer adaptador puede ser al menos parcialmente no complementario al dominio de unión al cebador de la secuencia de ácido nucleico con un segundo adaptador. Al menos un dominio SMI puede ser un SMI endógeno, por ejemplo, está relacionado con un punto de cizallamiento (por ejemplo, mediante el uso del propio punto de cizallamiento, mediante el uso de la posición de mapeo real del punto de cizallamiento (por ejemplo, cromosoma 3, posición 1,234,567), mediante el uso de un definido número de nucleótidos en el ADN inmediatamente adyacente al punto de cizallamiento (por ejemplo, diez nucleótidos desde el punto de cizallamiento, ocho nucleótidos que comienzan a siete nucleótidos del punto de cizallamiento y seis nucleótidos que comienzan después de la primera incidencia de "C" después del punto de cizallamiento). El dominio SMI puede incluir al menos un ácido nucleico degenerado o semidegenerado. El dominio SMI puede ser no degenerado. La secuencia del dominio SMI se puede considerar junto con la secuencia correspondiente a los extremos cizallados aleatoria o semialeatoriamente del ADN ligado para obtener una secuencia SMI capaz de distinguir moléculas de ADN individuales entre sí. El dominio SMI de la secuencia de ácido nucleico con un primer adaptador puede ser al menos parcialmente complementario al dominio SMI de la secuencia de ácido nucleico con un segundo adaptador. El dominio SMI de la secuencia de ácido nucleico con un primer adaptador puede ser complementario al dominio SMI de la secuencia de ácido nucleico con un segundo adaptador. El dominio SMI de la secuencia de ácido nucleico con un primer adaptador puede ser al menos parcialmente no complementario al dominio SMI de la secuencia de ácido nucleico con un segundo adaptador. Cada dominio SMI puede incluir un sitio de unión al cebador. Cada dominio SMI se puede ubicar distal a su dominio de ligación. El dominio SMI de la secuencia de ácido nucleico con un primer adaptador puede no ser complementario al dominio SMI de la secuencia de ácido nucleico con un segundo adaptador. Cada dominio SMI puede incluir entre aproximadamente 1 a aproximadamente 30 ácidos nucleicos degenerados o semidegenerados. El dominio de ligación de la secuencia de ácido nucleico con un primer adaptador puede ser al menos parcialmente complementario al dominio de ligación de la secuencia de ácido nucleico con un segundo adaptador. Cada dominio de ligación puede ser capaz de ligarse a una hebra de una secuencia de ácido nucleico diana de doble hebra. Uno de los dominios de ligación puede incluir un saliente en T, un saliente en A, un saliente en CG, un extremo romo u otra secuencia de ácido nucleico ligable. Ambos dominios de ligación pueden comprender un extremo romo. Al menos uno de los dominios de ligación puede incluir un ácido nucleico modificado. El nucleótido modificado puede ser un sitio abásico, un uracilo, tetrahidrofurano, 8-oxo-7,8-dihidro-2'-desoxiadenosina (8-oxo-A), 8-oxo-7,8-dihidro-2'-desoxiguanosina (8-oxo-G), desoxiinosina, 5'-nitroindol, 5-hidroximetil-2'-desoxicitidina, iso-citosina, 5'-metilisocitosina o iso-guanosina. Al menos uno de los dominios de ligación puede incluir una base desfosforilada. Al menos uno de los dominios de ligación puede incluir una base deshidroxilada. Al menos uno de los dominios de ligación se puede modificar químicamente para que no se pueda ligar. El SDE de la secuencia de ácido nucleico con un primer adaptador difiere y/o puede no ser complementaria en al menos un nucleótido de la SDE de la secuencia de ácido nucleico con un segundo adaptador. Se puede omitir al menos un nucleótido de la SDE de la secuencia de ácido nucleico con un primer adaptador o de la SDE del segundo ácido nucleico adaptador mediante una reacción enzimática. La reacción enzimática incluye una polimerasa, una endonucleasa, una glicosilasa o una liasa. El al menos un nucleótido puede ser un nucleótido modificado o un nucleótido que incluye un marcador. El nucleótido modificado o un nucleótido que incluye un marcador puede ser un sitio abásico, un uracilo, tetrahidrofurano, 8-oxo-7,8-dihidro-2'-desoxiadenosina (8-oxo-A), 8-oxo-7,8- dihidro-2'-desoxiguanosina (8-oxo-G), desoxiinosina, 5'-nitroindol, 5-hidroximetil-2'-desoxicitidina, iso-citosina, 5'-metil-isocitosina o iso-guanosina. El SDE de la secuencia de ácido nucleico con un primer adaptador incluye un dominio autocomplementario que puede ser capaz de formar un lazo en horquilla. El extremo de la secuencia de ácido nucleico con un primer adaptador distal a su dominio de ligación se puede ligar al extremo de la secuencia de ácido nucleico con un segundo adaptador que puede estar distal a su dominio de ligación, de esta manera forma un lazo. El lazo incluye un sitio de reconocimiento de enzimas de restricción. Al menos la secuencia de ácido nucleico con un primer adaptador puede incluir además una segunda SDE. La segunda SDE puede estar ubicada en un extremo de la secuencia de ácido nucleico con un primer adaptador. La secuencia de ácido nucleico con un segundo adaptador incluye además una segunda SDE. La segunda SDE puede estar ubicada en un extremo de la secuencia de ácido nucleico con un segundo adaptador. La segunda SDE de la secuencia de ácido nucleico con un primer adaptador puede ser al menos parcialmente no complementaria a la segunda SDE de la secuencia de ácido nucleico con un segundo adaptador. La segunda SDE de la secuencia de ácido nucleico con un primer adaptador difiere y/o puede no ser complementaria en al menos un nucleótido de la segunda SDE de la secuencia de ácido nucleico con un segundo adaptador. Se puede omitir al menos un nucleótido de la segunda SDE de la secuencia de ácido nucleico con un primer adaptador o de la segunda SDE del segundo ácido nucleico adaptador mediante una reacción enzimática. La reacción enzimática incluye una polimerasa, una endonucleasa, una glicosilasa o una liasa. La segunda SDE de la secuencia de ácido nucleico con un primer adaptador puede no ser complementaria a la segunda SDE de la secuencia de ácido nucleico con un segundo adaptador. El SDE de la secuencia de ácido nucleico con un primer adaptador puede estar directamente unida a la segunda SDE de la secuencia de ácido nucleico con un segundo adaptador. El dominio de unión al cebador de la secuencia de ácido nucleico con un primer adaptador se puede ubicar en 5' con respecto a una primera SDE. La primera SDE de la secuencia de ácido nucleico con un primer adaptador se puede ubicar en 5' con respecto al dominio SMI. La primera SDE de la secuencia de ácido nucleico con un primer adaptador se puede ubicar en 3' con respecto al dominio SMI. La primera SDE de la secuencia de ácido nucleico con un primer adaptador puede estar ubicada en 5' con respecto al dominio SMI y puede estar ubicada en 3' con respecto al dominio de unión al cebador. La primera SDE de la secuencia de ácido nucleico con un primer adaptador puede estar ubicada en 3' con respecto al dominio SMI que puede estar ubicada en 3' con respecto al dominio de unión al cebador. El dominio SMI de la secuencia de ácido nucleico con un primer adaptador puede estar ubicado en 5' con respecto al dominio de ligación. El extremo 3' de la secuencia de ácido nucleico con un primer adaptador incluye el dominio de ligación. La secuencia de ácido nucleico con un primer adaptador incluye, de 5' a 3', el dominio de unión al cebador, la primera SDE, el dominio SMI y el dominio de ligación. La secuencia de ácido nucleico con un primer adaptador incluye, de 5' a 3', el dominio de unión al cebador, el dominio SMI, la primera SDE y el dominio de ligación. La secuencia de ácido nucleico con un primer adaptador o la secuencia de ácido nucleico con un segundo adaptador pueden incluir un nucleótido modificado o una molécula no nucleotídica. La molécula nucleotídica o no nucleotídica modificada puede ser Colicina E2, Im2, Glutatión, Glutatión-s-transferasa (GST), Níquel, polihistidina, etiqueta FLAG, etiqueta myc o biotina. La biotina puede ser Biotina-16-Aminoalil-2'-desoxiuridina-5'-Trifosfato, Biotina-16-Aminoalil-2'-desoxicitidina-5'-Trifosfato, Biotina-16-Aminoalilcitidina-5'-Trifosfato, N4-Biotina-OBEA-2'-desoxicitidina-5'-Trifosfato, Biotina-16-Aminoaliluridina-5'-Trifosfato, Biotina-16-7-Deaza-7-Aminoalil-2'-desoxiguanosina-5'-Trifosfato, Destiobiotina-6-Aminoalil-2'-desoxicitidina-5'-Trifosfato, 5'-Biotina-G-Monofosfato, 5'-Biotina-A-Monofosfato, 5'-Biotina-dG-Monofosfato o 5'-Biotina-dA-Monofosfato. La biotina puede ser capaz de unirse a una estreptavidina unida a un sustrato. Cuando la biotina se une a una estreptavidina unida a un sustrato, la secuencia de ácido nucleico con un primer adaptador puede ser capaz de separarse de la secuencia de ácido nucleico con un segundo adaptador. La secuencia de ácido nucleico con un primer adaptador o la secuencia de ácido nucleico con un segundo adaptador pueden incluir un marcador de afinidad seleccionado de una molécula pequeña, un ácido nucleico, un péptido y un resto unible de forma única que puede estar unido por una pareja de afinidad. La pareja de afinidad se une a un sustrato sólido y se une al marcador de afinidad. La secuencia de ácido nucleico adaptadora que incluye el marcador de afinidad se puede separar de la secuencia de ácido nucleico adaptadora que no incluye el marcador de afinidad. El sustrato sólido puede ser una superficie sólida, una perla u otra estructura fija. El ácido nucleico puede ser ADN, ARN o sus combinaciones y, opcionalmente, incluir un ácido nucleico peptídico o un ácido nucleico bloqueado. El marcador de afinidad se puede ubicar en un extremo de un adaptador o dentro de un dominio en la secuencia de ácido nucleico con un primer adaptador que puede no ser completamente complementario a un dominio opuesto en la secuencia de ácido nucleico con un segundo adaptador. La secuencia de ácido nucleico con un primer adaptador o la secuencia de ácido nucleico con un segundo adaptador pueden incluir un grupo físico que tenga una propiedad magnética, una propiedad de carga o una propiedad de insolubilidad. Cuando el grupo físico tiene una propiedad magnética y se aplica un campo magnético, la secuencia de ácido nucleico adaptadora que incluye el grupo físico se puede separar de la secuencia de ácido nucleico adaptadora que no incluye el grupo físico. Cuando el grupo físico tiene una propiedad de carga y se aplica un campo eléctrico, la secuencia de ácido nucleico adaptadora que incluye el grupo físico se separa de la secuencia de ácido nucleico adaptadora que no incluye el grupo físico. Cuando el grupo físico tiene una propiedad de insolubilidad y el par de secuencias de ácido nucleico adaptadoras están contenidas en una solución para la cual el grupo físico es insoluble, la secuencia de ácido nucleico adaptadora, que incluye el grupo físico, se puede precipitar lejos de la secuencia de ácido nucleico adaptadora sin incluir el grupo físico que permanece en solución. El grupo físico puede estar ubicado en un extremo de un adaptador o dentro de un dominio en la secuencia de ácido nucleico con un primer adaptador que puede no ser completamente complementario a un dominio opuesto en la secuencia de ácido nucleico con un segundo adaptador. La secuencia de ácido nucleico con un segundo adaptador incluye al menos un enlace fosforotioato. La secuencia de ácido nucleico diana de doble hebra puede ser ADN o ARN. Cada secuencia de ácido nucleico adaptadora puede incluir un dominio de ligación en cada uno de sus extremos. La secuencia de ácido nucleico con un primer adaptador o la secuencia de ácido nucleico con un segundo adaptador pueden ser al menos parcialmente monocatenarias. La secuencia de ácido nucleico con un primer adaptador o la secuencia de ácido nucleico con un segundo adaptador pueden ser monocatenarias. La secuencia de ácido nucleico con un primer adaptador y la secuencia de ácido nucleico con un segundo adaptador pueden ser monocatenarias.
También se describe en un segundo ejemplo una composición que incluye al menos un par de secuencias de ácido nucleico adaptadoras del primer ejemplo y un segundo par de secuencias de ácido nucleico adaptadoras en el que cada hebra del segundo par de secuencias de ácido nucleico adaptadoras incluye al menos un sitio de unión al cebador y un dominio de ligación.
También se describe una composición que incluye al menos dos pares de secuencias de ácido nucleico adaptadoras. El primer ejemplo, en el que la SDE de una secuencia de ácido nucleico con un primer adaptador de un primer par de secuencias de ácido nucleico adaptadoras difiere de la SDE de una secuencia de ácido nucleico con un primer adaptador de al menos un segundo par de secuencias de ácido nucleico adaptadoras.
También se describe una composición que incluye al menos dos pares de moléculas de ácido nucleico adaptadoras del primer ejemplo, en la que el dominio SMI de una primera molécula de ácido nucleico adaptadora de un primer par de moléculas de ácido nucleico adaptadoras difiere del dominio SMI de una primera molécula de ácido nucleico adaptadora de al menos un segundo par de moléculas de ácido nucleico adaptadoras.
La composición puede incluir además un dominio SMI en cada hebra del segundo par de secuencias de ácido nucleico adaptadoras. La composición puede incluir además un sitio de unión al cebador en cada hebra del segundo par de secuencias de ácido nucleico adaptadoras. El dominio SMI de la primera molécula de ácido nucleico adaptadora del primer par de moléculas de ácido nucleico adaptadoras monocatenarias puede tener la misma longitud que el dominio SMI de la primera molécula de ácido nucleico adaptadora monocatenaria de al menos el segundo par de moléculas de ácido nucleico adaptadoras monocatenarias. El dominio SMI de la primera molécula de ácido nucleico adaptadora del primer par de moléculas de ácido nucleico adaptadoras monocatenarias puede tener una longitud diferente que el dominio SMI de la primera molécula de ácido nucleico adaptadora monocatenaria de al menos el segundo par de moléculas de ácido nucleico adaptadoras monocatenarias. Cada dominio SMI incluye una o más bases fijas en un sitio dentro de o que flanquea el SMI. Al menos un primer ácido nucleico acomplejado de doble hebra que incluye un primer par de moléculas de ácido nucleico adaptadoras del primer ejemplo se puede ligar a un primer extremo de una molécula de ácido nucleico diana de doble hebra y un segundo par de moléculas de ácido nucleico adaptadoras del primer ejemplo se puede ligar a un segundo extremo de la molécula de ácido nucleico diana de doble hebra. El primer par de moléculas de ácido nucleico adaptadoras puede ser diferente del segundo par de moléculas de ácido nucleico adaptadoras. La molécula de ácido nucleico diana con un primer adaptador en la hebra del primer par de moléculas de ácido nucleico adaptadoras incluye un primer dominio SMI y la molécula de ácido nucleico diana con un primer adaptador en la hebra del segundo par de moléculas de ácido nucleico adaptadoras incluye un segundo dominio SMI. La composición puede incluir al menos un segundo ácido nucleico acomplejado de doble hebra.
También se describe en un tercer ejemplo un par de secuencias de ácido nucleico adaptadoras para usar en la secuenciación de una molécula de ácido nucleico diana de doble hebra que incluye una secuencia de ácido nucleico con un primer adaptador y una secuencia de ácido nucleico con un segundo adaptador. Cada secuencia de ácido nucleico adaptadora incluye un dominio de unión al cebador y un dominio identificador de molécula simple (SMI).
Al menos una de la secuencia de ácido nucleico con un primer adaptador o la secuencia de ácido nucleico con un segundo adaptador puede incluir además un dominio que incluye al menos un nucleótido modificado. La secuencia de ácido nucleico con un primer adaptador y la secuencia de ácido nucleico con un segundo adaptador comprenden además un dominio que incluye al menos un nucleótido modificado. Al menos una de la secuencia de ácido nucleico con un primer adaptador o la secuencia de ácido nucleico con un segundo adaptador puede incluir además un dominio de ligación. La secuencia de ácido nucleico con un primer adaptador y la secuencia de ácido nucleico con un segundo adaptador pueden incluir un dominio de ligación. El al menos un nucleótido modificado puede ser un sitio abásico, un uracilo, tetrahidrofurano, 8-oxo-7,8-dihidro-2'-desoxiadenosina (8-oxo-A), 8-oxo-7,8-dihidro-2'-desoxiguanosina (8-oxo-G), desoxiinosina, 5'-nitroindol, 5-hidroximetil-2'-desoxicitidina, iso-citosina, 5'-metilisocitosina o iso-guanosina. Las dos secuencias adaptadoras pueden incluir dos moléculas de ADN separadas que están al menos parcialmente hibridadas entre sí. La secuencia de ácido nucleico con un primer adaptador y la secuencia de ácido nucleico con un segundo adaptador pueden estar unidas a través de un dominio enlazador. El dominio enlazador puede estar comprendido por nucleótidos. El dominio enlazador puede incluir una o más moléculas nucleotídicas o no nucleotídicas modificadas. Al menos una molécula nucleotídica o no nucleotídica modificada puede ser un sitio abásico, un uracilo, tetrahidrofurano, 8-oxo-7,8-dihidro-2'-desoxiadenosina (8-oxo-A), 8-oxo-7,8-dihidro-2'-desoxiguanosina (8-oxo-G), desoxiinosina, 5'-nitroindol, 5-hidroximetil-2'-desoxicitidina, isocitosina, 5'-metil-isocitosina o iso-guanosina. El dominio enlazador puede formar un lazo. El dominio de unión al cebador de la secuencia de ácido nucleico con un primer adaptador puede ser al menos parcialmente complementario al dominio de unión al cebador de la secuencia de ácido nucleico con un segundo adaptador. El dominio de unión al cebador de la secuencia de ácido nucleico con un primer adaptador puede ser complementario al dominio de unión al cebador de la secuencia de ácido nucleico con un segundo adaptador. El dominio de unión al cebador de la secuencia de ácido nucleico con un primer adaptador puede no ser complementario al dominio de unión al cebador de la secuencia de ácido nucleico con un segundo adaptador. Al menos un dominio SMI puede ser un SMI endógeno, por ejemplo, está relacionado con un punto de cizallamiento (por ejemplo, mediante el uso del propio punto de cizallamiento, mediante el uso de la posición de mapeo real del punto de cizallamiento (por ejemplo, cromosoma 3, posición 1,234,567), mediante el uso de un definido número de nucleótidos en el ADN inmediatamente adyacente al punto de cizallamiento (por ejemplo, diez nucleótidos desde el punto de cizallamiento, ocho nucleótidos que comienzan a siete nucleótidos del punto de cizallamiento y seis nucleótidos que comienzan después de la primera incidencia de "C" después del punto de cizallamiento)). El dominio SMI incluye al menos un ácido nucleico degenerado o semidegenerado. El dominio SMI puede ser no degenerado. La secuencia del dominio SMI se puede considerar junto con la secuencia correspondiente a los extremos cizallados aleatoriamente o semialeatoriamente del ADN ligado para obtener una secuencia SMI capaz de distinguir moléculas de ADN simples entre sí. El dominio SMI de la secuencia de ácido nucleico con un primer adaptador puede ser al menos parcialmente complementario al dominio SMI de la secuencia de ácido nucleico con un segundo adaptador. El dominio SMI de la secuencia de ácido nucleico con un primer adaptador puede ser complementario al dominio SMI de la secuencia de ácido nucleico con un segundo adaptador. El dominio SMI de la secuencia de ácido nucleico con un primer adaptador puede ser al menos parcialmente no complementario al dominio SMI de la secuencia de ácido nucleico con un segundo adaptador. El dominio SMI de la secuencia de ácido nucleico con un primer adaptador puede no ser complementario al dominio SMI de la secuencia de ácido nucleico con un segundo adaptador. Cada dominio SMI puede incluir entre aproximadamente 1 a aproximadamente 30 ácidos nucleicos degenerados o semidegenerados. El dominio de ligación de la secuencia de ácido nucleico con un primer adaptador puede ser al menos parcialmente complementario al dominio de ligación de la secuencia de ácido nucleico con un segundo adaptador. Cada dominio de ligación puede ser capaz de ligarse a una hebra de una secuencia de ácido nucleico diana de doble hebra. Uno de los dominios de ligación puede incluir un saliente en T, un saliente en A, un saliente en CG, un extremo romo u otra secuencia de ácido nucleico ligable. Ambos dominios de ligación pueden comprender un extremo romo. Cada dominio SMI incluye un sitio de unión al cebador. Al menos la secuencia de ácido nucleico con un primer adaptador puede incluir además un SDE. El SDE puede estar ubicada en un extremo de la secuencia de ácido nucleico con un primer adaptador. La secuencia de ácido nucleico con un segundo adaptador incluye además un SDE. El SDE puede estar ubicada en un extremo de la secuencia de ácido nucleico con un segundo adaptador. El SDE de la secuencia de ácido nucleico con un primer adaptador puede ser al menos parcialmente no complementario al SDE de la secuencia de ácido nucleico con un segundo adaptador. El SDE de la secuencia de ácido nucleico con un primer adaptador puede no ser complementaria al SDE de la secuencia de ácido nucleico con un segundo adaptador. El SDE de la secuencia de ácido nucleico con un primer adaptador puede estar directamente unida al SDE de la secuencia de ácido nucleico con un segundo adaptador. El SDE de la secuencia de ácido nucleico con un primer adaptador difiere y/o puede no ser complementaria en al menos un nucleótido de la SDE de la secuencia de ácido nucleico con un segundo adaptador. El menos un nucleótido se puede omitir de la SDE de la secuencia de ácido nucleico con un primer adaptador o de la SDE del segundo ácido nucleico adaptador mediante una reacción enzimática. La reacción enzimática puede incluir una polimerasa o una endonucleasa. El al menos un nucleótido puede ser un nucleótido modificado o un nucleótido que incluye un marcador. El nucleótido modificado o un nucleótido que incluye un marcador puede ser un sitio abásico, un uracilo, tetrahidrofurano, 8-oxo-7,8-dihidro-2'-desoxiadenosina (8-oxo-A), 8-oxo-7,8- dihidro-2'-desoxiguanosina (8-oxo-G), desoxiinosina, 5'-nitroindol, 5-hidroximetil-2'-desoxicitidina, iso-citosina, 5'-metil-isocitosina o iso-guanosina. El SDE de la secuencia de ácido nucleico con un primer adaptador puede comprender un dominio autocomplementario que es capaz de formar un lazo en horquilla. El extremo de la secuencia de ácido nucleico con un primer adaptador distal a su dominio de ligación se puede ligar al extremo de la secuencia de ácido nucleico con un segundo adaptador que está distal a su dominio de ligación, de esta manera forma un lazo. El lazo puede incluir un sitio de reconocimiento de enzimas de restricción. El dominio de unión al cebador de la secuencia de ácido nucleico con un primer adaptador se puede ubicar en 5' con respecto al dominio SMI. El dominio que incluye al menos un nucleótido modificado de la secuencia de ácido nucleico con un primer adaptador se puede ubicar en 5' con respecto al dominio SMI. El dominio que incluye al menos un nucleótido modificado de la secuencia de ácido nucleico con un primer adaptador se puede ubicar en 3' con respecto al dominio SMI. El dominio que incluye al menos un nucleótido modificado de la secuencia de ácido nucleico con un primer adaptador se puede ubicar en 5' con respecto al dominio SMI y se puede ubicar en 3' con respecto al dominio de unión al cebador. El dominio que incluye al menos un nucleótido modificado de la secuencia de ácido nucleico con un primer adaptador se puede ubicar en 3' con respecto al dominio SMI que se puede ubicar en 3' con respecto al dominio de unión al cebador. El dominio SMI de la secuencia de ácido nucleico con un primer adaptador puede estar ubicado en 5' con respecto al dominio de ligación. El extremo 3' de la secuencia de ácido nucleico con un primer adaptador puede incluir el dominio de ligación. La secuencia de ácido nucleico con un primer adaptador puede incluir, de 5' a 3', el dominio de unión al cebador, el dominio que incluye al menos un nucleótido modificado, el dominio SMI y el dominio de ligación. La secuencia de ácido nucleico con un primer adaptador puede incluir, de 5' a 3', el dominio de unión al cebador, el dominio SMI, el dominio que incluye al menos un nucleótido modificado y el dominio de ligación. La secuencia de ácido nucleico con un primer adaptador o la secuencia de ácido nucleico con un segundo adaptador pueden incluir un nucleótido modificado o una molécula no nucleotídica. La molécula nucleotídica o no nucleotídica modificada puede ser Colicina E2, Im2, Glutatión, Glutatión-s-transferasa (GST), Níquel, polihistidina, etiqueta FLAG, etiqueta myc o biotina. La biotina puede ser Biotina-16-Aminoalil-2'-desoxiuridina-5'-Trifosfato, Biotina-16-Aminoalil-2'-desoxicitidina-5'-Trifosfato, Biotina-16-Aminoalilcitidina-5'-Trifosfato, N4-Biotina-OBEA-2'-desoxicitidina-5'-Trifosfato, Biotina-16-Aminoaliluridina-5'-Trifosfato, Biotina-16-7-Deaza-7-Aminoalil-2'-desoxiguanosina-5'-Trifosfato, Destiobiotina-6-Aminoalil-2'-desoxicitidina-5'-Trifosfato, 5'-Biotina-G-Monofosfato, 5'-Biotina-A-Monofosfato, 5'-Biotina-dG-Monofosfato o 5'-Biotina-dA-Monofosfato. La biotina puede ser capaz de unirse a una estreptavidina unida a un sustrato. Cuando la biotina se une a una estreptavidina unida a un sustrato, la secuencia de ácido nucleico con un primer adaptador puede ser capaz de separarse de la secuencia de ácido nucleico con un segundo adaptador. La secuencia de ácido nucleico con un segundo adaptador puede incluir al menos un enlace fosforotioato. La secuencia de ácido nucleico diana de doble hebra puede ser ADN o ARN. La secuencia de ácido nucleico con un primer adaptador o la secuencia de ácido nucleico con un segundo adaptador pueden incluir un marcador de afinidad seleccionado de una molécula pequeña, un ácido nucleico, un péptido y un resto unible de forma única que es capaz de unirse a una pareja de afinidad. Cuando la pareja de afinidad se une a un sustrato sólido y se une al marcador de afinidad, la secuencia de ácido nucleico adaptadora que incluye el marcador de afinidad puede ser capaz de separarse de la secuencia de ácido nucleico adaptadora que no incluye el marcador de afinidad. El sustrato sólido puede ser una superficie sólida, una perla u otra estructura fija. El ácido nucleico puede ser ADN, ARN o sus combinaciones y, opcionalmente, incluir un ácido nucleico peptídico o un ácido nucleico bloqueado. El marcador de afinidad se puede ubicar en un extremo de un adaptador o dentro de un dominio en la secuencia de ácido nucleico con un primer adaptador que puede no ser completamente complementario a un dominio opuesto en la secuencia de ácido nucleico con un segundo adaptador. La secuencia de ácido nucleico con un primer adaptador o la secuencia de ácido nucleico con un segundo adaptador pueden incluir un grupo físico que tenga una propiedad magnética, una propiedad de carga o una propiedad de insolubilidad. Cuando el grupo físico tiene una propiedad magnética y se aplica un campo magnético, la secuencia de ácido nucleico adaptadora que incluye el grupo físico se puede separar de la secuencia de ácido nucleico adaptadora que no incluye el grupo físico. Cuando el grupo físico tiene una propiedad de carga y se aplica un campo eléctrico, la secuencia de ácido nucleico adaptadora que incluye el grupo físico se puede separar de la secuencia de ácido nucleico adaptadora que no incluye el grupo físico. Cuando el grupo físico tiene una propiedad de insolubilidad y el par de secuencias de ácido nucleico adaptadoras están contenidas en una solución para la cual el grupo físico es insoluble, la secuencia de ácido nucleico adaptadora, que incluye el grupo físico, se puede precipitar lejos de la secuencia de ácido nucleico adaptadora sin incluir el grupo físico que permanece en solución. El grupo físico puede estar ubicado en un extremo de un adaptador o dentro de un dominio en la secuencia de ácido nucleico con un primer adaptador que puede no ser completamente complementario a un dominio opuesto en la secuencia de ácido nucleico con un segundo adaptador. La secuencia de ácido nucleico con un primer adaptador o la secuencia de ácido nucleico con un segundo adaptador pueden ser al menos parcialmente monocatenarias. La secuencia de ácido nucleico con un primer adaptador o la secuencia de ácido nucleico con un segundo adaptador pueden ser monocatenarias. La secuencia de ácido nucleico con un primer adaptador y la secuencia de ácido nucleico con un segundo adaptador pueden ser monocatenarias. Al menos uno de los dominios de ligación incluye una base deshidroxilada. Al menos uno de los dominios de ligación se puede modificar químicamente para que no se pueda ligar.
También se describe en un cuarto ejemplo una composición que incluye al menos dos pares de moléculas de ácido nucleico adaptadoras del tercer ejemplo en el que el dominio SMI de una primera molécula de ácido nucleico adaptadora de un primer par de moléculas de ácido nucleico adaptadoras difiere del dominio SMI de una primera molécula de ácido nucleico adaptadora de al menos un segundo par de moléculas de ácido nucleico adaptadoras.
El dominio SMI de la primera molécula de ácido nucleico adaptadora del primer par de moléculas de ácido nucleico adaptadoras monocatenarias puede tener la misma longitud que el dominio s Mi de la primera molécula de ácido nucleico adaptadora monocatenaria de al menos el segundo par de moléculas de ácido nucleico adaptadoras monocatenarias. El dominio SMI de la primera molécula de ácido nucleico adaptadora del primer par de moléculas de ácido nucleico adaptadoras monocatenarias puede tener una longitud diferente que el dominio SMI de la primera molécula de ácido nucleico adaptadora monocatenaria de al menos el segundo par de moléculas de ácido nucleico adaptadoras monocatenarias. Cada dominio SMI incluye una o más bases fijas en un sitio dentro de o que flanquea el SMI.
También se describe en un quinto ejemplo una composición que incluye al menos un primer ácido nucleico acomplejado de doble hebra que incluye un primer par de moléculas de ácido nucleico adaptadoras del tercer ejemplo ligadas a un primer extremo de una molécula de ácido nucleico diana de doble hebra y un segundo par de moléculas de ácido nucleico adaptadoras del tercer ejemplo ligadas a un segundo extremo de la molécula de ácido nucleico diana de doble hebra.
El primer par de moléculas de ácido nucleico adaptadoras puede ser diferente del segundo par de moléculas de ácido nucleico adaptadoras. La molécula de ácido nucleico diana con un primer adaptador en la hebra del primer par de moléculas de ácido nucleico adaptadoras puede incluir un primer dominio SMI y la molécula de ácido nucleico diana con un adaptador en la hebra del segundo par de moléculas de ácido nucleico adaptadoras puede incluir un segundo dominio SMI. La molécula de ácido nucleico diana con un primer adaptador en la hebra del primer par de moléculas de ácido nucleico adaptadoras puede incluir un primer dominio SMI y la molécula de ácido nucleico diana con un primer adaptador en la hebra del segundo par de moléculas de ácido nucleico adaptadoras incluye un segundo dominio SMI. La composición puede incluir al menos un segundo ácido nucleico acomplejado de doble hebra.
También se describe en un sexto ejemplo una composición que incluye al menos un par de moléculas de ácido nucleico adaptadoras del primer aspecto y al menos un par de moléculas de ácido nucleico adaptadoras del tercer ejemplo.
También se describe en un séptimo ejemplo una composición que incluye al menos un primer ácido nucleico acomplejado de doble hebra que incluye un primer par de moléculas de ácido nucleico adaptadoras del primer ejemplo ligadas a un primer extremo de una molécula de ácido nucleico diana de doble hebra y un segundo par de moléculas de ácido nucleico adaptadoras del tercer ejemplo ligadas a un segundo extremo de la molécula de ácido nucleico diana de doble hebra.
La presente invención se refiere a un método de secuenciación de un ácido nucleico diana de doble hebra que incluye las etapas de: (1) ligar un par de secuencias de ácido nucleico adaptadoras del primer ejemplo a al menos un extremo de una molécula de ácido nucleico diana de doble hebra, los que forma de esta manera una molécula de ácido nucleico de doble hebra que incluye una secuencia de ácido nucleico diana con un primer adaptador en la hebra y una secuencia de ácido nucleico diana con un segundo adaptador en la hebra, (2) amplificar la secuencia de ácido nucleico diana con un primer adaptador en la hebra, de esta manera produce un primer conjunto de productos amplificados que incluye una pluralidad de primeras secuencias de ácido nucleico diana adaptadoras de hebra y una pluralidad de sus moléculas complementarias (3) amplificar la secuencia de ácido nucleico diana con un segundo adaptador en la hebra, de esta manera produce un segundo conjunto de productos amplificados que incluyen una pluralidad de segundas secuencias de ácido nucleico diana adaptadoras de hebra y una pluralidad de sus moléculas complementarias, en las que el segundo conjunto de productos amplificados se pueden distinguir del primer conjunto de productos amplificados, (4) secuenciar el primer conjunto de productos amplificados, y (5) secuenciar el segundo conjunto de productos amplificados de acuerdo con las reivindicaciones.
En modalidades, el al menos un extremo puede ser dos extremos. La amplificación se puede realizar por PCR, por amplificación de desplazamiento múltiple o por amplificación isotérmica. El par de secuencias de ácido nucleico adaptadoras ligadas a un primer extremo de la secuencia de ácido nucleico diana de doble hebra tiene una estructura idéntica al par de secuencias de ácido nucleico adaptadoras ligadas a un segundo extremo de la secuencia de ácido nucleico diana de doble hebra. En modalidades, la secuencia de ácido nucleico diana con un primer adaptador en la hebra incluye en orden 5' a 3': (a) una secuencia de ácido nucleico con un primer adaptador, (b) una primera hebra del ácido nucleico diana de doble hebra, y (c) una secuencia de ácido nucleico con un segundo adaptador. En modalidades, la secuencia de ácido nucleico diana con un segundo adaptador en la hebra puede incluir en el orden 3' a 5': (a) una secuencia de ácido nucleico con un primer adaptador, (b) una segunda hebra del ácido nucleico diana de doble hebra, y (c) una secuencia de ácido nucleico con un segundo adaptador. El par de secuencias de ácido nucleico adaptadoras ligadas a un primer extremo de la secuencia de ácido nucleico diana de doble hebra puede ser diferente del par de secuencias de ácido nucleico adaptadoras ligadas a un segundo extremo de la secuencia de ácido nucleico diana de doble hebra. El par de secuencias de ácido nucleico adaptadoras ligadas a un primer extremo de la secuencia de ácido nucleico diana de doble hebra tiene un primer dominio SMI y el par de secuencias de ácido nucleico adaptadoras ligadas a un segundo extremo de la secuencia de ácido nucleico diana de doble hebra tiene un segundo dominio SMI en el que el primer dominio SMI puede ser diferente del segundo dominio SMI. En modalidades, la secuencia de ácido nucleico diana con un primer adaptador en la hebra puede incluir en orden 5' a 3': (a) una secuencia de ácido nucleico con un primer adaptador que incluye la primera SDE, (b) un primer dominio SMI, (c) una primera hebra del ácido nucleico diana de doble hebra y (d) una secuencia de ácido nucleico con un segundo adaptador. En modalidades, la secuencia de ácido nucleico diana con un segundo adaptador en la hebra puede incluir en el orden 5' a 3': (a) una secuencia de ácido nucleico con un primer adaptador que incluye la primera SDE, (b) un segundo dominio SMI, (c) una segunda hebra del ácido nucleico diana de doble hebra y (d) una secuencia de ácido nucleico con un segundo adaptador. La secuencia de consenso para el primer conjunto de productos amplificados se compara con la secuencia de consenso para el segundo conjunto de productos amplificados y una diferencia entre las dos secuencias de consenso se puede considerar un artefacto.
La presente invención se refiere a un método de secuenciación de un ácido nucleico diana de doble hebra que incluye las etapas de: (1) ligar un par de secuencias de ácido nucleico adaptadoras del tercer ejemplo a al menos un extremo de una molécula de ácido nucleico diana de doble hebra, lo que forma de esta manera una molécula de ácido nucleico de doble hebra que incluye una secuencia de ácido nucleico diana con un primer adaptador en la hebra y una secuencia de ácido nucleico diana con un segundo adaptador en la hebra, (2) amplificar la molécula de ácido nucleico diana con un primer adaptador en la hebra, de esta manera produce un primer conjunto de productos amplificados que incluye una pluralidad de primeras moléculas de ácido nucleico diana adaptadoras de hebra y una pluralidad de sus moléculas complementarias (3) amplificar la segunda molécula de ácido nucleico diana adaptadora de hebra, de esta manera produce un segundo conjunto de productos amplificados que incluye una pluralidad de segundas moléculas de ácido nucleico diana adaptadoras de hebra y una pluralidad de sus moléculas complementarias, (4) secuenciar el primer conjunto de productos amplificados, de esta manera se obtiene una secuencia de consenso para el primer conjunto de productos amplificados, y (5) secuenciar el segundo conjunto de productos amplificados productos, de esta manera se obtiene una secuencia de consenso para el segundo conjunto de productos amplificados de acuerdo con las reivindicaciones.
El segundo conjunto de productos amplificados se distingue del primer conjunto de productos amplificados. La amplificación se puede realizar por PCR, por amplificación de desplazamiento múltiple o por amplificación isotérmica. En modalidades, el método incluye, además, después de la etapa (1), una etapa de poner en contacto la molécula de ácido nucleico de doble hebra con al menos una enzima (por ejemplo, una glicosilasa) que cambia el al menos un nucleótido modificado a otra estructura química. El par de secuencias de ácido nucleico adaptadoras ligadas a un primer extremo de la molécula de ácido nucleico diana de doble hebra puede ser idéntico al par de secuencias de ácido nucleico adaptadoras ligadas a un segundo extremo de la molécula de ácido nucleico diana de doble hebra. El par de secuencias de ácido nucleico adaptadoras ligadas a un primer extremo de la molécula de ácido nucleico diana de doble hebra puede ser diferente del par de secuencias de ácido nucleico adaptadoras ligadas a un segundo extremo de la molécula de ácido nucleico diana de doble hebra. En modalidades, se puede ligar un par de secuencias de ácido nucleico adaptadoras a un primer extremo de una molécula de ácido nucleico diana de doble hebra y se puede utilizar un cebador correspondiente a una porción de la secuencia de ADN de la molécula de ADN diana para amplificar la molécula de ADN. En modalidades, la secuencia de ácido nucleico diana con un primer adaptador en la hebra incluye en orden 5' a 3': (a) una secuencia de ácido nucleico con un primer adaptador que incluye el al menos un nucleótido modificado o el al menos un sitio abásico, (b) una primera hebra del ácido nucleico diana de doble hebra, y (c) una secuencia de ácido nucleico con un segundo adaptador. En modalidades, la secuencia de ácido nucleico diana con un segundo adaptador en la hebra incluye en orden 3' a 5': (a) una secuencia de ácido nucleico con un primer adaptador, (b) una segunda hebra del ácido nucleico diana de doble hebra, y (c) una secuencia de ácido nucleico con un segundo adaptador. El par de secuencias de ácido nucleico adaptadoras ligadas a un primer extremo de la molécula de ácido nucleico diana de doble hebra puede ser diferente del par de secuencias de ácido nucleico adaptadoras ligadas a un segundo extremo de la molécula de ácido nucleico diana de doble hebra. El par de secuencias de ácido nucleico adaptadoras ligadas a un primer extremo de la molécula de ácido nucleico diana de doble hebra tiene un primer dominio SMI y el par de secuencias de ácido nucleico adaptadoras ligadas a un segundo extremo de la secuencia de ácido nucleico diana de doble hebra tiene un segundo dominio SMI, en el que el primer dominio SMI puede ser diferente del segundo dominio SMI. En modalidades, la secuencia de ácido nucleico diana con un primer adaptador en la hebra incluye en orden 5' a 3': (a) una secuencia de ácido nucleico con un primer adaptador que incluye el al menos un nucleótido modificado o el al menos un sitio abásico y el primer dominio SMI, (b) una primera hebra del ácido nucleico diana de doble hebra, y (c) una secuencia de ácido nucleico con un segundo adaptador que incluye el segundo dominio SMI. En modalidades, cuando el al menos un nucleótido modificado puede ser 8-oxo-G, y la secuencia de ácido nucleico con un segundo adaptador incluye una citosina en una posición correspondiente al 8-oxo-G. En modalidades, la secuencia de ácido nucleico diana con un segundo adaptador en la hebra incluye en orden 3' a 5': (a) una secuencia de ácido nucleico con un primer adaptador que incluye el primer dominio SMI, (b) una segunda hebra del ácido nucleico diana de doble hebra y (c) una secuencia de ácido nucleico con un segundo adaptador que incluye el segundo dominio SMI. En modalidades, el al menos un nucleótido modificado puede ser 8-oxo-G, la secuencia de ácido nucleico con un segundo adaptador incluye una citidina en una posición correspondiente al 8-oxo-G. En modalidades, durante la amplificación de la etapa (2) o la etapa (3), el al menos un sitio abásico se puede convertir tras la amplificación en una timidina en el producto amplificado correspondiente, lo que da como resultado la introducción de un SDE. En modalidades, durante la amplificación de la etapa (2) o la etapa (3), el al menos un sitio del nucleótido modificado codifica una adenosina en el producto amplificado correspondiente.
La presente invención se refiere a un método en el que se obtienen productos de amplificación distinguibles de cada una de las dos hebras de moléculas de ADN individuales, y la secuencia de consenso para el primer conjunto de productos amplificados se compara con la secuencia de consenso para el segundo conjunto de productos amplificados, en el que una diferencia entre las dos secuencias de consenso se puede considerar un artefacto de acuerdo con las reivindicaciones.
En modalidades, se puede determinar que los productos amplificados han surgido de la misma molécula de ADN inicial en virtud de compartir la misma secuencia SMI. En modalidades, se puede determinar que los productos amplificados han surgido de la misma molécula de ADN inicial en virtud de que llevan distintas secuencias SMI que se puede saber que se corresponden entre sí basado en una base de datos producida en el momento y junto con la síntesis de la biblioteca de adaptadores SMI. En modalidades, se puede determinar que los productos amplificados han surgido de hebras distintas de la misma secuencia inicial de ADN de doble hebra a través de al menos un nucleótido de diferencia de secuencia que se introdujo mediante un SDE.
La presente invención se refiere a un método en el que se obtienen productos de amplificación distinguibles de cada una de las dos hebras de moléculas de ADN individuales, y la secuencia obtenida a partir de un producto amplificado correspondiente a una de las dos hebras de ADN iniciales de una molécula de a Dn simple se compara con un producto amplificado correspondiente a la segunda de las dos hebras de ADN iniciales, y una diferencia entre las dos secuencias se puede considerar un artefacto de acuerdo con las reivindicaciones.
La presente invención se refiere a un método en el que se obtienen productos de amplificación distinguibles a partir de las dos hebras de una molécula de ADN individual cuando la secuencia obtenida a partir de un producto amplificado correspondiente a una de las dos hebras de ADN iniciales de una molécula de ADN simple se compara con un producto amplificado correspondiente a la segunda de las dos hebras de ADN iniciales y no se identifica ninguna diferencia entre las dos secuencias de acuerdo con las reivindicaciones.
Se puede determinar que los productos amplificados han surgido de la misma molécula de ADN de doble hebra inicial en virtud de compartir la misma secuencia SMI basada en la base de datos producida en el momento y junto con la síntesis de la biblioteca de adaptadores SMI. En modalidades, se puede determinar que los productos amplificados han surgido de hebras distintas de la misma secuencia de ADN de doble hebra inicial a través de al menos un nucleótido de diferencia de secuencia que se introdujo mediante un SDE. En modalidades, el método incluye además una etapa de dilución de una molécula simple después de la fusión térmica o química de los dúplex de ADN en sus hebras simples componentes. Las hebras simples se pueden diluir en múltiples cámaras de reacción separadas físicamente, de manera que la probabilidad de que las dos hebras emparejadas originalmente compartan el mismo contenedor puede ser pequeña. Las cámaras de reacción separadas físicamente se pueden seleccionar de contenedores, tubos, pozos y al menos un par de gotas que no se comunican. En las modalidades, la amplificación por PCR se puede llevar a cabo para cada cámara de reacción separada físicamente, preferentemente mediante el uso de cebadores para cada cámara que lleven una secuencia de etiqueta diferente. En modalidades, cada secuencia de etiqueta funciona como un SDE. En modalidades, una serie de secuencias emparejadas correspondientes a las dos hebras del mismo ADN inicial se pueden comparar entre sí, y al menos una secuencia de la serie de productos se puede seleccionar como la que tiene más probabilidades de representar la secuencia correcta de la molécula de ADN inicial. El producto seleccionado como con mayor probabilidad de representar la secuencia correcta de la molécula de ADN inicial se puede seleccionar al menos en parte debido a que tiene el menor número de apareamientos erróneos entre los productos obtenidos a partir de las dos hebras de ADN. El producto seleccionado como con mayor probabilidad de representar la secuencia correcta de la molécula de ADN inicial se puede seleccionar al menos en parte debido a que tiene el menor número de apareamientos erróneos con relación a la secuencia de referencia.
También se describe en un ejemplo adicional una composición que incluye al menos dos pares de secuencias de ácido nucleico adaptadoras, en la que un primer par de secuencias de ácido nucleico adaptadoras incluye: un dominio de unión al cebador, un elemento definidor de hebra (SDE) y un dominio de ligación, en el que un segundo par de secuencias de ácido nucleico adaptadoras incluye: un dominio de unión al cebador, un dominio identificador de molécula simple (SMI) y un dominio de ligación.
También se describe en un ejemplo adicional un ácido nucleico acomplejado de doble hebra que incluye: (1) un primer par de secuencias de ácido nucleico adaptadoras que incluye: un dominio de unión al cebador y un SDE, y (2) un ácido nucleico diana de doble hebra, y (3) un segundo par de secuencias de ácido nucleico adaptadoras que incluye: un dominio de unión al cebador y un dominio identificador de molécula simple (SMI), en el que el primer par de moléculas de ácido nucleico adaptadoras se puede ligar a un primer extremo de la molécula de ácido nucleico diana de doble hebra y el segundo par de moléculas de ácido nucleico adaptadoras se puede ligar a un segundo extremo de la molécula de ácido nucleico diana de doble hebra. El primer par de secuencias de ácido nucleico adaptadoras y/o el segundo par de secuencias de ácido nucleico adaptadoras pueden incluir además un dominio de ligación.
También se describe en un ejemplo adicional un par de secuencias de ácido nucleico adaptadoras para su uso en la secuenciación de una molécula de ácido nucleico diana de doble hebra, que incluye una secuencia de ácido nucleico con un primer adaptador y una secuencia de ácido nucleico con un segundo adaptador, en el que cada secuencia de ácido nucleico adaptadora incluye: un dominio de unión al cebador, un SDE, un dominio de ligación, en el que el SDE de la secuencia de ácido nucleico con un primer adaptador puede ser al menos parcialmente no complementaria al SDE de la secuencia de ácido nucleico con un segundo adaptador.
También se describe en un ejemplo adicional un ácido nucleico circular de doble hebra que incluye un par de moléculas de ácido nucleico adaptadoras del primer ejemplo ligadas a un primer extremo de una molécula de ácido nucleico diana de doble hebra y ligadas a un segundo extremo de la molécula de ácido nucleico diana de doble hebra.
También se describe en un ejemplo adicional un ácido nucleico circular de doble hebra que incluye un par de moléculas de ácido nucleico adaptadoras del tercer ejemplo ligadas a un primer extremo de una molécula de ácido nucleico diana de doble hebra y ligadas a un segundo extremo de la molécula de ácido nucleico diana de doble hebra.
También se describe en un ejemplo adicional un ácido nucleico circular de doble hebra que incluye un par de moléculas de ácido nucleico adaptadoras del primer ejemplo ligadas a un primer extremo de una molécula de ácido nucleico diana de doble hebra y un par hibridado de dominios de unión a cebadores ligados a un segundo extremo de la molécula de ácido nucleico diana de doble hebra, en el que el par hibridado de dominios de unión a cebadores se puede ligar al par de moléculas de ácido nucleico adaptadoras.
También se describe en un ejemplo adicional un ácido nucleico circular de doble hebra que incluye un par de moléculas de ácido nucleico adaptadoras del tercer ejemplo ligadas a un primer extremo de una molécula de ácido nucleico diana de doble hebra y un par hibridado de dominios de unión a cebadores ligados a un segundo extremo de la molécula de ácido nucleico diana de doble hebra, en el que el par hibridado de dominios de unión a cebadores se puede ligar al par de moléculas de ácido nucleico adaptadoras.
También se describe en un ejemplo adicional un ácido nucleico acomplejado de doble hebra que incluye: (1) un par de secuencias de ácido nucleico adaptadoras que incluyen: un dominio de unión al cebador, un elemento definidor de hebra (SDE) y un dominio identificador de molécula simple (SMI), (2) un ácido nucleico diana de doble hebra y (3) dominios de unión a cebadores de un par hibridado, en los que el par de moléculas de ácido nucleico adaptadoras se puede ligar a un primer extremo de la molécula de ácido nucleico diana de doble hebra y los dominios de unión a cebadores del par hibridado se pueden ligar a un segundo extremo de la molécula de ácido nucleico diana de doble hebra. El par de secuencias de ácido nucleico adaptadoras y/o los dominios de unión a cebadores del par hibridado incluye además un dominio de ligación.
La secuenciación dúplex se describe adicionalmente en el documento WO2013142389A1 y en Schmitt y otros, PNAS2012.
Cualquiera de los ejemplos anteriores se puede combinar con la presente invención de acuerdo con las reivindicaciones.
Otras características, ventajas, de la invención serán evidentes a partir de las reivindicaciones. La descripción anterior pretende ilustrar y no limitar el alcance de la descripción.
Breve descripción de las diversas vistas de los dibujos:
Las características anteriores y otras se apreciarán más claramente a partir de la siguiente descripción detallada cuando se toma junto con los dibujos acompañantes.
La Figura 1A a la Figura 1I ilustran la secuenciación dúplex descrita originalmente mediante el uso de adaptadores en forma de Y. Se muestra un adaptador ilustrativo en forma de Y (Figura 1A), una molécula de ADN de doble hebra ligada a tal adaptador (Figura 1B), productos de PCR derivados del mismo (Figura 1C y Figura 1D) y lecturas de secuenciación así producidas (Figura 1E a Figura 1I).
La Figura 2A a la Figura 2K ilustran la secuenciación dúplex de la presente invención mediante el uso de adaptadores de "burbuja" no complementarios. Se muestran adaptadores de "burbuja" ilustrativos (Figura 2A y Figura 2H a Figura 2K), una molécula de ADN de doble hebra ligada al adaptador de la Figura 2A (Figura 2B), productos de PCR derivados de la misma (Figura 2C y Figura 2D), y lecturas de secuenciación así producidas (Figura 2E a Figura 2G).
La Figura 3A a la Figura 3G ilustran la secuenciación dúplex de la presente invención mediante el uso de adaptadores que tienen un identificador de molécula simple (SMI) en forma de "burbuja" no complementario que sirve conjuntamente como un identificador molecular, así como también un elemento definidor de hebra (SDE) que introduce asimetría. Se muestra un adaptador de "burbuja" ilustrativo (Figura 3A), una molécula de ADN de doble hebra ligada al adaptador de la Figura 3A (Figura 3B), productos de PCR derivados del mismo (Figura 3C y Figura 3D), y lecturas de secuenciación así producidas (Figura 3E y Figura 3F). La Figura 3G muestra las lecturas de secuenciación de la Figura 3E y la Figura 3F agrupadas por secuencias SMI específicas y su pareja no complementaria correspondiente.
La Figura 4A a la Figura 4H ilustran la secuenciación dúplex de la presente invención mediante el uso de adaptadores que tienen un nucleótido o un análogo de nucleótido que inicialmente forma un ADN de hebra emparejada, pero luego se convierte en un apareamiento erróneo del ADN después de una reacción bioquímica subsecuente. Se muestra un adaptador ilustrativo (Figura 4A) que comprende 8-oxo-7,8-dihidro-2'-desoxiguanosina (8-oxo-G), una molécula de ADN de doble hebra ligada al adaptador de la Figura 4A (Figura 4B), la Figura 4C muestra la molécula de ADN de doble hebra de la Figura 4B después del tratamiento con una glicosilasa que crea un sitio abásico que reemplaza las bases 8-oxo-G y, de esta manera, un apareamiento erróneo en el adaptador; productos de PCR derivados de los mismos (Figura 4D y Figura 4E), y lecturas de secuenciación así producidas (Figura 4F a Figura 4H).
La Figura 5A a la Figura 5H ilustran la secuenciación dúplex de la presente invención mediante el uso de combinaciones de diseños de adaptadores de secuenciación dúplex para introducir diferentes sitios de cebadores en extremos opuestos de moléculas de ADN. Se muestra un adaptador de secuenciación dúplex ilustrativo (Figura 5A) y un adaptador "estándar" (Figura 5B), se producen tres tipos de moléculas de ADN de doble hebra cuando los adaptadores de la Figura 5A y la Figura 5B se ligan a la molécula de ADN (Figura 5C a la Figura 5E), productos de PCR derivados de los mismos (Figura 5F y Figura 5G) y lecturas de secuenciación así producidas (Figura 5H).
La Figura 6A a la Figura 6I ilustran la secuenciación dúplex de la presente invención mediante el uso de combinaciones de diseños de adaptadores de secuenciación dúplex que permiten dos lecturas en plataformas de extremos no pareados. Se muestra un adaptador "estándar" (Figura 6A) y un adaptador de secuenciación dúplex ilustrativo (Figura 6B), una molécula de ADN de doble hebra preferida que se produce cuando los adaptadores de la Figura 6A y la Figura 6B se ligan a la molécula de ADN (Figura 6C), productos de PCR derivados del mismo (Figura 6D y Figura 6E, el arreglo de la hebra molde de secuenciación derivada de la hebra "superior" (Figura 6F) y la hebra "inferior" (Figura 6G), y las lecturas de secuenciación así producidas (Figura 6H y Figura 6I).
La Figura 7A a la Figura 7I ilustran la secuenciación dúplex de la presente invención mediante el uso de combinaciones de diseños de adaptadores de secuenciación dúplex que permiten dos lecturas en plataformas de extremos no pareados. Se muestra un adaptador (Figura 7A) que incluye adicionalmente una secuencia SMI degenerada o semidegenerada y un adaptador de secuenciación dúplex ilustrativo (Figura 7B), una molécula de ADN de doble hebra preferida que se produce cuando los adaptadores de la Figura 7A y la Figura 7B se ligan a la molécula de ADN (Figura 7C), productos de PCR derivados de la misma (Figura 7D y Figura 7E, el arreglo de la hebra molde de secuenciación derivada de la hebra "superior" (Figura 7F) y la hebra "inferior" (Figura 7G), y las lecturas de secuenciación así producidas (Figura 7H y Figura 7I).
La Figura 8A a la Figura 8J ilustran la secuenciación dúplex de la presente invención mediante el uso de adaptadores de secuenciación dúplex en forma de Y que tienen SMI asimétricos. Se muestra un adaptador de secuenciación dúplex ilustrativo (Figura 8A), una molécula de ADN de doble hebra producida cuando el adaptador de la Figura 8A se liga a la molécula de ADN (Figura 8B), productos de PCR derivados del mismo (Figura 8C y Figura 8D, y lecturas de secuenciación así producidas (Figura 8E y Figura 8F). La Figura 8G muestra las lecturas de secuenciación de la Figura 8E y la Figura 8F agrupadas por secuencias SMI específicas y su pareja no complementaria correspondiente. La Figura 8H a la Figura 8J muestran diseños de adaptadores alternativos útiles en este ejemplo.
La Figura 9A a la Figura 9G ilustran la secuenciación dúplex de la presente invención mediante el uso de adaptadores de secuenciación dúplex en forma de Y o en forma de lazo que tienen SMI asimétricos ubicados en las regiones de cola monocatenarias libres. Se muestra un adaptador de secuenciación dúplex ilustrativo (Figura 9A), una molécula de ADN de doble hebra preferida producida cuando el adaptador de la Figura 9A se liga a la molécula de ADN (Figura 9B), productos de PCR derivados del mismo (Figura 9C y Figura 9D, la orientación de sitios de cebadores de secuenciación y sitios de cebadores de indexación se muestran en la Figura 9E y la Figura 9F. La Figura 9G muestra las lecturas de secuenciación de agrupación obtenidas en los métodos que se muestran en la Figura 9E y la Figura 9F.
La Figura 10A a la Figura 10E ilustran la secuenciación dúplex de la presente invención en la que todos los elementos necesarios para la secuenciación dúplex están incluidos en una molécula simple en lugar de dos adaptadores pareados. La Figura 10A muestra una configuración de este tipo antes de la ligación de una molécula de ADN de doble hebra y la Figura 10B muestra la configuración de la Figura 10A después de la ligación de una molécula de ADN de doble hebra. La Figura 10C a la Figura 10E muestran algunas alternativas para este ejemplo.
La Figura 11A a la Figura 11D ilustran la secuenciación dúplex a través del marcaje químico asimétrico y el aislamiento de hebras. Se muestra un adaptador de secuenciación dúplex ilustrativo (Figura 11A) que tiene una etiqueta química (aquí, biotina) y un segundo adaptador (Figura 11B), una molécula de ADN de doble hebra preferida producida cuando el adaptador de la Figura 11A y el adaptador de la Figura 11B se ligan a la molécula de ADN (Figura 11C), y las etapas adicionales en el método en el que la hebra que comprende la etiqueta química se separa de la otra hebra y cada una se amplifica y secuencia independientemente (Figura 11D).
La Figura 12A a la Figura 12M ilustran la secuenciación dúplex de la presente invención en la que se introduce un SDE mediante traducción de muescas. La Figura 12A a la Figura 12D muestran un diseño de adaptador en el que se pierde un SDE después de la traducción de la muesca. Se muestran adaptadores compatibles con Ion Torrent™ útiles en este ejemplo (Figura 12E y Figura 12F), una molécula de ADN de doble hebra preferida producida cuando los adaptadores de la Figura 12E y la Figura 12F se ligan a una molécula de ADN (Figura 12G), incorporación errónea de nucleótidos terminales (Figura 12H), producto de extensión derivado del mismo y que muestra los apareamientos erróneos (Figura 12I), productos de PCR derivados de la molécula de la Figura 12I (Figura 12J y Figura 12K) y lecturas de secuenciación así producidas (Figura 12L y Figura 12M).
La Figura 13A a la Figura 13G ilustran la secuenciación dúplex en la que se introduce un SDE después de la traducción de la muesca. Se muestra un adaptador de secuenciación dúplex que comprende un extremo 5' desfosforilado (Figura 13A), una molécula de ADN de doble hebra producida cuando el adaptador de la Figura 13A se liga a una molécula de ADN (Figura 13B), una estructura después de que se ha producido la síntesis de desplazamiento de hebra ( Figura 13C), un producto de extensión de la estructura de la Figura 13C (Figura 13D) que no muestra los apareamientos erróneos, una estructura que incluye una brecha después del tratamiento con uracilo ADN glicosilasa y una endonucleasa AP apropiada (Figura 13E), la estructura de la Figura 13E después que la brecha se ha rellenado con un nucleótido de apareamiento erróneo y se ha cerrado con ligación (Figura 13F), y lecturas de secuenciación así producidas (Figura 13G). La Figura 14A a la Figura 14I ilustran la secuenciación dúplex en la que se introduce un apareamiento erróneo, por extensión con polimerasa, en una molécula de ADN que se va a secuenciar. Se muestra una molécula de ADN de doble hebra que se va a secuenciar (Figura 14a ), la molécula de ADN de doble hebra de la Figura 14A que ha sido tratada con una endonucleasa que deja un saliente 5' (Figura 14B); la molécula de ADN parcialmente de doble hebra de la Figura 14B se trata para introducir dos apareamientos erróneos (Figura 14C), el producto de extensión de la estructura de la Figura 14C (Figura 14D) que ahora incluye una "burbuja" en cada apareamiento erróneo, se muestra un par de adaptadores en la Figura 14E, la estructura de la Figura 14F se produce cuando los adaptadores de la Figura 14e se ligan a una molécula de ADN de la Figura 14D, productos de PCR derivados de la molécula de la Figura 14F (Figura 14G y Figura 14H), y las lecturas de secuenciación así producidas (Figura 14I).
Descripción detallada de la invención
La secuenciación dúplex se describió inicialmente con el uso de sitios de unión de cebadores asimétricos para la amplificación separada de las dos hebras de ADN. En la presente descripción se describen enfoques alternativos y superiores a la secuenciación dúplex que no requieren usar sitios de unión de cebadores asimétricos. En su lugar, la asimetría entre las dos hebras se puede introducir al crear una diferencia de al menos un nucleótido en la secuencia de ADN entre las dos hebras dentro de un adaptador o en otra parte de la molécula de ADN que se va a secuenciar (por ejemplo, un apareamiento erróneo, un nucleótido adicional y un nucleótido omitido), el reemplazamiento de al menos un nucleótido con un nucleótido modificado (por ejemplo, un nucleótido que carece de una base o con una base atípica), y/o la inclusión de al menos un nucleótido marcado (por ejemplo, un nucleótido biotinilado) que puede separar físicamente las dos hebras.
La Tabla 1 ilustra opciones ilustrativas para ensamblar adaptadores para secuenciación dúplex como se describe en la presente invención de acuerdo con las reivindicaciones.
Tabla 1:
Figure imgf000014_0001
Los diseños y enfoques de adaptadores descritos en la presente descripción para la secuenciación dúplex no dependen del uso de adaptadores en Y con secuencias SMI complementarias.
Algunos diseños son directamente aplicables a la secuenciación de un solo extremo. Los enfoques descritos en la presente descripción comparten dos características generales: (1) cada mitad monocatenaria de una molécula de ADN dúplex individual está marcada de tal manera que las secuencias que finalmente se derivan de cada una de las dos hebras se pueden reconocer como relacionadas con el mismo dúplex de ADN y (2) cada hebra simple de una molécula de ADN dúplex individual se marca de tal manera que las secuencias que finalmente se derivan de cada una de las dos hebras se pueden reconocer como distintas de las derivadas de la hebra opuesta. Las características moleculares que cumplen estas funciones respectivas se denominan en la presente descripción Identificador de molécula simple (SMI) y Elemento definidor de hebra (SDE).
Esta es la primera introducción descrita de la asimetría que define la hebra a través de diferentes versiones de una secuencia de "burbuja" interna no complementaria. Uno de tales ejemplos implica la introducción de una secuencia de "burbuja" no complementaria que no está ubicada dentro de los sitios del cebador de amplificación; las distintas secuencias de las dos hebras de la "burbuja" darán como resultado un marcaje separado de las dos hebras.
En la presente descripción se describe cómo la asimetría que define la hebra se puede introducir de manera similar en moléculas de ADN adaptadas mediante el uso de bases de ADN modificadas como un SDE. En los ejemplos, la asimetría se introduce al incluir uno o más análogos de nucleótidos que inicialmente dan como resultado una secuencia complementaria, pero que subsecuentemente se puede convertir en una secuencia no complementaria. También se describen formas en las que se pueden aplicar diseños de adaptadores asimétricos sin forma de Y a plataformas de secuenciación que requieren una secuencia de cebador diferente en los extremos opuestos de cada molécula de ADN.
En la presente descripción se describen formas alternativas en las que se pueden distribuir diferentes tipos de etiquetas SMI y SDE entre dos adaptadores diferentes que contienen sitio de cebador para el beneficio de maximizar la longitud de lectura y la diversidad de etiquetados SMI.
También se describen en la presente descripción diseños adicionales para adaptadores de secuenciación dúplex que comprenden colas en forma de Y o de lazo que son fácilmente susceptibles de secuenciación de extremos pareados, pero donde las etiquetas SMI no son secuencias complementarias y, por lo tanto, permiten una flexibilidad de diseño significativa.
Aquí se demuestra cómo tal introducción de tal asimetría permite distinguir productos de las dos hebras de ADN con fines de corrección de errores mediante secuenciación dúplex. Además, en la presente descripción se muestran descripciones de cómo algunas modalidades facilitan la realización de la secuenciación dúplex en plataformas de lectura de extremo simple.
Además, se describen métodos para introducir sitios de cebadores y los sitios SMI y los sitios SDE para la secuenciación dúplex con un adaptador simple para formar un complejo de molécula de ADN adaptador circular. Adicionalmente, se describe un enfoque completamente diferente para la introducción de un SDE que se basa en el etiquetado químico asimétrico que permite la separación física/mecánica de hebras emparejadas en distintos compartimentos de reacción para análisis independientes, en lugar del etiquetado molecular basado en secuencias diferenciales de las dos hebras.
En la presente descripción se describen ejemplos de diseños de adaptadores específicamente para la plataforma de secuenciación Ion Torrent™ (Life Technologies®).
En la presente descripción se describen variantes de adaptadores que se pueden ligar a ambas hebras simples en cada extremo de una molécula dúplex, así como también diseños que permiten la ligación de hebras simples seguida de una "traducción de la muesca" que retiene los elementos SMI y SDE necesarios en la molécula preparada final.
En la presente descripción se describe cómo se puede incorporar un SDE en una molécula de ADN propiamente de una manera que es independiente de la ligación del adaptador.
Finalmente, en la presente descripción se describen enfoques algorítmicos alternativos simplificados para la secuenciación dúplex que se pueden usar con cualquier diseño de adaptador dúplex que elimine la necesidad de generar una secuencia de consenso de hebra simple (SSCS) anterior.
En algunas modalidades, una porción de una secuencia de nucleótidos puede estar "degenerada". En una secuencia degenerada, cada posición puede ser cualquier nucleótido (es decir, cada posición, representada por "X", "N" o "M" puede ser una adenina (A), citosina (C), guanina (G), timina (T) o uracilo (U)) o cualquier otro nucleótido de ADN o ARN natural o no natural o sustancia similar a un nucleótido o análogo con propiedades de emparejamiento de bases (por ejemplo, xantosina, inosina, hipoxantina, xantina, 7-metilguanina, 7-metilguanosina, 5,6-dihidrouracilo, 5-metilcitosina, dihidrouridina, isocitosina, isoguanina, desoxinucleósidos, nucleósidos, ácidos nucleicos peptídicos, ácidos nucleicos bloqueados, ácidos nucleicos de glicol y ácidos nucleicos de treosa). Alternativamente, una porción de una secuencia de nucleótidos puede no estar completamente degenerada de manera que la secuencia incluye al menos un nucleótido predefinido o al menos un polinucleótido predefinido y posiciones que pueden ser cualquier nucleótido o una o más posiciones que incluyen solo una combinación de subconjuntos de posibles nucleótidos. Una combinación de subconjuntos de posibles nucleótidos podría incluir: cualquiera de los tres siguientes: A, C, G y T; cualquiera de los dos siguientes: A, C, G, T y U; o U más cualquiera de los tres siguientes: A, C, G y T. Tales combinaciones de subconjuntos podrían incluir adicionalmente o ser sustituidos por cualquier otro nucleótido de ADN o ARN natural o no natural o sustancia similar a nucleótido o análogo con propiedades de apareamiento de bases. La relación estequiométrica entre cualquiera de estos nucleótidos en una población de moléculas podría ser de aproximadamente 1:1 o cualquier otra relación; en la presente descripción tal secuencia se denomina "semidegenerada". En determinadas modalidades, una secuencia "semidegenerada" se refiere a un conjunto de dos o más secuencias, en donde las dos o más secuencias difieren en al menos una posición de nucleótido. En modalidades, una secuencia semidegenerada es una secuencia en la que no todos los nucleótidos son aleatorios con respecto a sus nucleótidos adyacentes (inmediatamente adyacentes o dentro de dos o más nucleótidos). En modalidades, el término degenerado y semidegenerado, como se usa en la presente, puede tener el mismo significado que entiende comúnmente un experto en la técnica a la que pertenece esta solicitud y que se usa comúnmente en la técnica a la que pertenece esta solicitud; tal técnica se incorpora por referencia en su totalidad.
En modalidades, las secuencias no necesitan contener todas las bases posibles en cada posición. Las secuencias degeneradas o semidegeneradas de n-mer se pueden generar mediante un método mediado por polimerasa, o se pueden generar mediante la preparación e hibridación de una biblioteca de oligonucleótidos individuales de secuencia conocida. Alternativamente, cualquier secuencia de n-mer degenerada o semidegenerada puede ser una molécula de ADN de doble hebra fragmentada aleatoriamente o no aleatoriamente de cualquier fuente alternativa que difiera de la fuente de ADN diana. En algunas modalidades, la fuente alternativa es un genoma o plásmido derivado de una bacteria, un organismo diferente al del ADN diana, o una combinación de tales organismos o fuentes alternativos. El ADN fragmentado aleatorio o no aleatorio se puede introducir en adaptadores SMI para que sirvan como etiquetas variables. Esto se puede lograr mediante ligación enzimática o cualquier otro método conocido en la técnica.
Como se usa en esta descripción y las reivindicaciones adjuntas, las formas singulares "un", "una" y "el/la" incluyen las referencias en plural a menos que el contexto lo dicte claramente de cualquier otra manera.
A menos que se indique específicamente o sea obvio por el contexto, como se usa en la presente, se entiende que el término "o" es inclusivo y cubre tanto "o" como "y".
Se entiende que los términos "uno o más", "al menos uno", "más de uno" y similares incluyen, pero no se limitan a, al menos 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 1920, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32,
33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63,
64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94,
95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118,
119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 142, 143, 144, 145, 146, 147, 148, 149 or 150, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 2000, 3000, 4000,
5000 o más y cualquier número intermedio.
Por el contrario, el término "no más de" incluye cada valor inferior al valor establecido. Por ejemplo, "no más de 100 nucleótidos" incluye 100, 99, 98, 97, 96, 95, 94, 93, 92, 91, 90, 89, 88, 87, 86, 85, 84, 83, 82, 81, 80, 79, 78, 77, 76,
75, 74, 73, 72, 71, 70, 69, 68, 67, 66, 65, 64, 63, 62, 61, 60, 59, 58, 57, 56, 55, 54, 53, 52, 51, 50, 49, 48, 47, 46, 45,
44, 43, 42, 41, 40, 39, 38, 37, 36, 35, 34, 33, 32, 31, 30, 29, 28, 27, 26, 25, 24, 23, 22, 21, 20, 19, 18, 17, 16, 15, 14,
13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1 y 0 nucleótidos.
Los términos "pluralidad", "al menos dos", "dos o más", "al menos segundo", y similares, se entiende que incluyen pero no se limitan a al menos 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 1920, 21, 22, 23, 24, 25, 26, 27,
28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58,
59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89,
90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114,
115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149
Figure imgf000016_0001
or 150, 200, 300, 400, 500, 600, 700, 800, 900, 2000, 3000, 4000, 5000 o más y cualquier número intermedio.
A través de la descripción de la palabra "que comprende", o variaciones tales como "comprende" o "que comprende", se entenderá que implica la inclusión de un elemento indicado, entero o etapa, o grupo de elementos, enteros o etapas, pero no la exclusión de nigún otros elemento, entero o etapa, o grupo de elementos, enteros o etapas.
A menos que se indique específicamente o sea obvio por el contexto, como se usa en la presente, el término "aproximadamente" se entiende dentro de un intervalo de tolerancia normal en la técnica, por ejemplo, dentro de 2 desviaciones estándar de la media. Acerca de se puede entender como dentro del 10 %, 9 %, 8 %, 7 %, 6 %, 5 %, 4
%, 3 %, 2 %, 1 %, 0,5 %, 0,1 %, 0,05 %, 0,01 % o 0,001 % del valor declarado. A menos que se aclare del contexto de cualquier otra manera, todos los valores numéricos proporcionados en la presente descripción se modifican por el término "aproximadamente".
Aunque los métodos y los materiales similares o equivalentes a los descritos en la presente descripción se pueden usar en la práctica o prueba de la presente invención, los métodos y los materiales adecuados se describen más abajo. Las referencias citadas en la presente descripción no se admiten como estado de la técnica de la invención reivindicada. En caso de conflicto, prevalecerá la presente descripción, incluidas las definiciones. En adición, los materiales, métodos y ejemplos solo son ilustrativos y no están destinados a ser limitantes.
A menos que se definan de cualquier otra manera, todos los términos técnicos y científicos usados en la presente descripción tienen el mismo significado que el comúnmente entendido por un experto en la técnica a la que pertenece la presente solicitud y que son usados comúnmente en la técnica a la que pertenece esta solicitud.
Cualquiera de los ejemplos anteriores se puede combinar con las reivindicaciones, que incluyen los ejemplos/modalidades más abajo de acuerdo con las reivindicaciones.
Desventajas de usar adaptadores en forma de Y para la secuenciación dúplex
La secuenciación dúplex con adaptadores en forma de Y se realiza más fácilmente con lecturas de secuenciación de extremos pareados, como se describió originalmente en el documento (WO2013142389A1 y en Schmitt y otros, PNAS 2012). Sin embargo, no todas las plataformas de secuenciación son compatibles con las lecturas de secuenciación de extremos pareados. Cuando se usan los adaptadores en forma de Y o de lazo descritos anteriormente donde los sitios de cebadores asimétricos están ubicados en la región monocatenaria opuesta al extremo ligable del adaptador, la secuenciación dúplex con lecturas de secuenciación de extremo simple requiere que la lectura de secuenciación se extienda a través de la molécula de ADN completamente. Esto es necesario para capturar las secuencias de la etiqueta SMI en ambos extremos de la molécula, lo que se requiere para poder distinguir las lecturas de secuenciación de las dos hebras derivadas. Este requisito se ilustra a continuación.
En la Figura 1A se muestra un adaptador de secuenciación dúplex en forma de Y descrito anteriormente. En la Figura 1A, las características A y B representan diferentes sitios de unión de cebadores; a y a' representan una secuencia degenerada o semidegenerada y su complementaria inverso; p representa una secuencia degenerada o semidegenerada diferente; y a y p son dos secuencias arbitrarias entre un conjunto de secuencias degeneradas o semidegeneradas. Juntos, estos sirven como identificadores de molécula simple (SMI).
Como se describió originalmente (por ejemplo, en el documento WO2013142389A1), los SMI se usan para distinguir moléculas individuales dentro de un conjunto grande. Es necesario tener una población suficientemente grande de estos codificados en la biblioteca de adaptadores de manera que sea estadísticamente improbable que dos moléculas de ADN cualesquiera se marquen con las mismas secuencias SMI. Además, como se describió anteriormente, los sitios de fragmentación introducidos durante la generación de la biblioteca pueden funcionar como SMI endógenos en determinadas situaciones, ya sea independientemente o en combinación con SMI exógenos codificados en secuencias adaptadoras. En la presente descripción, solo se muestran dominios SMI exógenos en ejemplos de diferentes diseños de adaptadores; sin embargo, se entiende (y se incluye en la presente invención) que los dominios SMI exógenos se pueden sustituir o aumentar con puntos de cizallamiento de ADN que actúan como SMI endógenos.
Después de ligar los adaptadores a cada extremo de un fragmento de ADN de doble hebra de una biblioteca, la estructura aparecerá como se muestra en la Figura 1B. Para mayor claridad al rastrear los derivados en los diagramas subsecuentes, se indican los extremos "izquierdo" y "derecho" de un inserto de ADN en particular, así como también las hebras "superior" e "inferior".
Después de la PCR, el producto de doble hebra derivado de la hebra "superior" se muestra en la Figura 1C. (L) y (R) indican los extremos "izquierdo" y "derecho" respectivos de la molécula de ADN inicial:
El producto de PCR de doble hebra derivado de la hebra "inferior" se muestra en la Figura ID.
Se deben tener en cuenta los diferentes arreglos de a y p con relación a A y B en los productos de la hebra "superior" y la hebra "inferior". Con lecturas de secuenciación de extremos pareados (es decir, lectura del sitio del cebador A y B para cada producto de PCR), es posible distinguir los productos derivados de cada hebra porque la etiqueta a aparece en la lectura A y p en la lectura B de una hebra y el caso recíproco ocurre en la otra hebra. Véase la Figura 1E.
El uso de lecturas de extremos pareados, como se describió anteriormente, hace posible la corrección de la secuencia dúplex. Sin embargo, con el uso de lecturas de secuenciación de un extremo simple (es decir, solo lectura del sitio del cebador A o del sitio del cebador B pero no de ambos para una molécula en particular), solo es posible obtener secuencias dúplex si las lecturas de secuenciación son lo suficientemente largas para capturar las secuencias SMI en ambos extremos. Si se usa el cebador de secuenciación A, las lecturas de secuenciación de longitud completa (es decir, lo suficientemente largas como para incluir ambas secuencias SMI) derivadas de las diferentes hebras producirán las dos secuencias que se muestran en la Figura 1F. De manera similar, el uso del cebador de secuenciación B con lecturas de secuenciación de longitud completa producirá las siguientes dos secuencias que se muestran en la Figura 1G. En los dos casos anteriores, los productos derivados de la hebra "superior" e inferior se pueden distinguir entre sí en virtud de tener SMI en la orientación opuesta (a-p en uno y p-a en el otro). Sin embargo, sin lecturas de secuenciación que sean lo suficientemente largas para capturar ambas secuencias SMI, la secuenciación dúplex no se realiza fácilmente con la secuenciación de un extremo simple. Esto se debe a que las dos lecturas de secuenciación no contienen las etiquetas a y p. Otra forma de ver este problema es que, para partes de los extremos de las moléculas de ADN, la complementaria puede no estar secuenciada, por lo que no hay información sobre la segunda hebra con la que hacer una comparación.
Para ilustrar esto, los dos tipos de secuencias producidas cuando se usan lecturas de secuenciación de extremo simple de longitud no completa del cebador A se muestran en la Figura 1H. De manera similar, las secuencias correspondientes producidas cuando se usan lecturas de secuenciación de extremo simple de longitud no completa del cebador B se muestran en la Figura 1I. Tenga en cuenta que para las dos lecturas de secuenciación que se muestran en la Figura 1H y la Figura 1I, los extremos "izquierdo" y "derecho" de cada fragmento de ADN solo se secuencian una vez con un cebador dado, por lo que no se puede lograr la secuenciación dúplex. Esto se debe a que no hay una secuencia de hebra opuesta con la que comparar. Por lo tanto, incluso si se secuenciara una población amplificada de moléculas con cada uno de los dos cebadores diferentes, no habría información sobre la segunda hebra que revele que un conjunto particular de secuencias A y B leídas se originó a partir de la misma molécula derivada.
La necesidad de "lectura completa" de la molécula de ADN completa cuando se usa la secuenciación de un solo extremo puede crear desafíos técnicos en algunas plataformas de secuenciación donde la longitud de lectura es limitada.
Para que la secuenciación dúplex sea compatible con las lecturas de secuenciación de longitud parcial con secuenciación de extremo simple, se necesitan diseños de adaptadores alternativos. En ausencia de lecturas de secuenciación de extremos pareados y sitios de cebadores asimétricos en adaptadores en forma de Y, se debe introducir alguna otra forma de asimetría en las moléculas de ADN adaptadas para poder distinguir las hebras. Los ejemplos de tal diseño se describen más abajo.
Introducción de asimetría de definición de hebra con una "burbuja" no complementaria
En la Figura 2A se describe un diseño ilustrativo de un adaptador sin forma de Y que permite la secuenciación dúplex con secuenciación final no pareada (es decir, un "adaptador de burbujas"). A diferencia de los adaptadores en forma de Y descritos anteriormente que tienen dos sitios de cebador, solo está presente un único sitio de cebador (P) con el complementario inverso (P'). a y su complementario a' representan una secuencia de identificador de molécula simple (SMI) degenerada o semidegenerada; X e Y representan dos mitades de unos elementos definitorios de hebra (SDE), que es un segmento de secuencias no complementarias que forman una "burbuja" desapareada en medio de secuencias complementarias adyacentes dentro del adaptador. Finalmente, el adaptador tiene una secuencia ligable. La asimetría introducida por el SDE en este diseño de adaptador distingue las lecturas de secuenciación derivadas de cada hebra, como se ilustra en la Figura 2B a la Figura 2G.
Después de la ligación de adaptadores similares a los que se muestran en la Figura 2A a cada extremo de un fragmento de ADN, se produce la estructura que se muestra en la Figura 2B. El segundo adaptador se muestra con la secuencia SMI p y p' para ilustrar que la secuencia SMI del segundo adaptador ligado es generalmente diferente de la del primer adaptador. Alternativamente, se puede ligar un adaptador idéntico a ambos extremos de una molécula de ADN.
Después de la amplificación por PCR, el producto de doble hebra derivado de la hebra "superior" se muestra en la Figura 2C y el producto de doble hebra derivado de la hebra "inferior" se muestra en la Figura 2D.
Debido a que la secuencia del sitio del cebador es la misma en ambos extremos de la molécula en este ejemplo, se obtendrán dos tipos diferentes de lecturas de secuenciación de secuencias a partir de lecturas de secuenciación de un extremo simple del producto de PCR de cada hebra, en dependencia de qué mitad monocatenaria pase a ser secuenciada. La lectura derivada del producto de PCR de la hebra "superior" se muestra en la Figura 2E y la lectura derivada del producto de PCR de la hebra "inferior" se muestra en la Figura 2F.
Para el análisis, como se muestra en la Figura 2G, las lecturas de secuenciación se agrupan por aquellas que contienen un SMI particular, en este caso, a o p. Las secuencias que han surgido a partir de una sola molécula dada de ADN se pueden agrupar en virtud de tener la misma secuencia SMI. Es evidente que dentro de cada grupo SMI se ven dos tipos de secuencias: una está marcada por SDE X y otra por SDE Y. Éstas definen lecturas de secuenciación derivadas de hebras opuestas (es decir, "superior" e "inferior"). Por ejemplo, cuando las secuencias con la etiqueta SMI a se agrupan, las secuencias obtenidas son X-a-ADN (Figura 2E) y Y'-a-ADN (Figura 2F). Se puede hacer un consenso que consiste de secuencias que surgen de la hebra "superior" de la molécula de ADN original al agrupar las secuencias de X-a-ADN. Asimismo, se puede hacer un consenso de la hebra "inferior" al agrupar las secuencias Y'-a-ADN. Finalmente, se puede hacer un consenso de las dos hebras al comparar las secuencias que surgen de las dos hebras (es decir, las marcadas con la secuencia X se compararán con las marcadas con la secuencia Y'). Juntos, estos permiten la comparación como parte del análisis de secuenciación dúplex.
Se puede lograr un resultado similar al conmutar el orden de las secuencias SMI y SDE. En la Figura 2H se muestra un ejemplo de tal adaptador.
Como se articula arriba y en el documento WO2013142389A, los SMI contenidos dentro de las secuencias adaptadoras se pueden omitir en lugar de las secuencias SMI endógenas que comprenden las secuencias de punto de cizallamiento de la propia molécula de ADN. La estructura de un diseño de adaptador de este tipo implicaría la que se muestra en la Figura 2A, pero con exclusión de a y a'.
En algunas aplicaciones, es preferible la orientación que se muestra en la Figura 2H. Por ejemplo, en algunas plataformas de secuenciación, como las que actualmente fabrica Illumina®, un determinado número de bases al comienzo de una ejecución de secuenciación se puede usar para la identificación de grupos y las "bases invariantes", es decir, las bases que se leen como iguales en todas o en una pluralidad sustancial de moléculas que se secuencian, pueden afectar la eficiencia de este proceso. Por lo tanto, en esta situación puede ser más deseable una secuencia SMI degenerada o semidegenerada inmediatamente al comienzo de la serie de secuenciación.
En otras aplicaciones, es preferible la orientación que se muestra en la Figura 2A. Como se describe en la descripción original de la secuenciación dúplex (es decir, en el documento WO2013142389A1), las secuencias SMI de doble hebras complementarias se pueden producir más convenientemente ya sea mediante la extensión del cebador con una polimerasa a través de una secuencia degenerada o semidegenerada monocatenaria o mediante la síntesis e hibridación individual de oligonucleótidos que contienen diferentes secuencias SMI y luego agruparlos para crear una diversa biblioteca de adaptadores. Si se selecciona el método de extensión con polimerasa, tener la secuencia SMI en el extremo del adaptador del dominio de ligación puede ser ventajoso para facilitar la reacción de extensión. En determinadas plataformas de secuenciación, como las fabricadas por Ion Torrent™, un saliente en 3' con bases modificadas en el extremo no ligable del adaptador puede no ser fácilmente compatible con la síntesis por una polimerasa; por lo tanto, la síntesis de un adaptador mediante el enfoque de extensión de polimerasa se realiza más fácilmente con la secuencia SMI ubicada hacia el extremo ligable del adaptador, como se muestra en la Figura 2A.
Como ejemplo específico de cómo se llevaría a la práctica este enfoque, considere la plataforma de secuenciación Ion Torrent™, que puede usar el siguiente par de adaptadores:
Adaptador P1
5' CCACTACGCCTCCGCTTTCCTCTCTATGGGCAGTCGGTGAT 3' (SEQ ID NO: 1) 3'
T*T*GGTGATGCGGAGGCGAAAGGAGAGATACCCGTCAGCCACTA 5' (SEQ ID NO: 2)
Adaptador A
5' CCATCTCATCCCTGCGTGTCTCCGACTCAG 3' (SEQ ID NO: 3)
3' T*T*GGTAGAGTAGGGACGCACAGAGGCTGAGTC 5' (SEQ ID NO: 4)
Los asteriscos "*" representan enlaces fosforotioato.
El cebador de secuenciación se hibrida con el Adaptador A y, por lo tanto, la información de la secuencia se lee del fragmento de ADN a partir del extremo 3' del Adaptador A. El Adaptador A se puede convertir a una forma aplicable para el enfoque diagramado en la Figura 2 con el uso de lo siguiente secuencia:
5' CCATCTCATCCCTGCGTGTCTCCGACTCAG GCGC NNNN G 3' (SEQ ID NO: 5)
3' T*T*GGTAGAGT AGGGAC GCACAGAGGCTGAGT C ATAT MMMM C 5' (SEQ ID NO: 6)
NNNN se refiere a una secuencia de cuatro nucleótidos degenerada o semidegenerada; MMMM se refiere a su complementaria; y se incluye un par de bases G-C aguas abajo de la secuencia degenerada para facilitar la ligación, aunque se pueden usar otras formas de dominios de ligación.
En esta ilustración, el adaptador P1 y el adaptador A están ambos ligados a la molécula de ADN diana que se va a secuenciar. Para simplificar, se puede ignorar el mismo adaptador ligado a ambos extremos de la molécula de ADN. Sin embargo, los adaptadores de Ion Torrent™ utilizan un adaptador diferente en cada extremo de la molécula. Tras la ligación inicial, una molécula de ADN individual se puede ligar con adaptadores en diversas configuraciones, por ejemplo, A-ADN-P1, A-ADN-A o P1-ADN-P1. La configuración correcta de A-ADN-P1 se puede utilizar para la reacción de secuenciación en virtud de que se amplifica en una PCR en una emulsión con cebadores dirigidos contra los sitios A y P1. Alternativamente, se pueden usar otros métodos conocidos en la técnica para seleccionar solo moléculas ligadas a dos adaptadores diferentes.
Tras la amplificación y secuenciación, se obtendrán los siguientes productos:
GCGC NNNN [secuencia de ADN]
TATA NNNN [secuencia de ADN]
Tenga en cuenta que estos corresponden a los productos X-a-ADN y Y'-a-ADN como se muestra en la Figura 2G.
Los productos de las dos hebras se pueden unir para el procesamiento de datos a través de la secuenciación dúplex como se describió originalmente (véase, por ejemplo, el documento WO2013142389A1). Específicamente, se puede hacer un consenso a partir de lecturas que comienzan con la secuencia GCGC NNNN para obtener el consenso de la hebra "superior". Se puede hacer un consenso separado a partir de lecturas que comienzan con la secuencia TATA NNNN para obtener el consenso de la hebra "inferior". Las dos secuencias de consenso monocatenarias se pueden comparar para obtener la secuencia de consenso dúplex de la molécula de ADN inicial. A continuación, se describe un enfoque alternativo de procesamiento de datos; véase "Esquema alternativo de procesamiento de datos para la secuenciación dúplex".
El enfoque anterior permite la secuenciación dúplex en plataformas que utilizan lecturas cortas que no son capaces de lecturas de extremos pareados, como en este ejemplo, la información de la secuencia de ADN solo se necesita de uno de los dos extremos del fragmento de ADN.
Un enfoque alternativo sería introducir la asimetría en la propia secuencia SMI mediante eluso de un SMI de doble hebra, no complementario o parcialmente no complementario. Si bien las secuencias SMI en sí mismas no serán complementarias, se podría determinar que los productos que surgen de las secuencias SMI no complementarias han surgido de la misma molécula de ADN de doble hebra inicial en virtud de haber sido predeterminados para formar pares.
Como un ejemplo específico, considere una serie de moléculas del "Adaptador A" de Ion Torrent™que tienen las siguientes secuencias:
Adaptador 1:
5' CCATCTCATCCCTGCGTGTCTCCGACTCAG AAAT GCAGC 3' (SEQ ID NO: 7)
3' T*T*GGTAGAGTAGGGACGCACAGAGGCTGAGTC GGGC CGTCG 5' (SEQ ID NO: 8)
Adaptador 2:
5' CCAT CT CATCCCTGCGT GT CTCCGACTCAG ATAT GCAGC 3' (SEQ ID NO: 9)
3' T*T*GGTAGAGTAGGGACGCACAGAGGCTGAGTC GCGC CGTCG 5' (SEQ ID NO: 10)
Adaptador 3:
5' CCAT CT CATCCCTGCGT GT CTCCGACTCAG TATT GCAGC 3' (SEQ ID NO: 11)
3' T*T*GGTAGAGT AGGGAC GCACAGAGGCTGAGT C GGCC CGTCG 5' (SEQ ID NO: 12)
Adaptador 4:
5' CCAT CT CATCCCTGCGT GT CTCCGACTCAG ATTT GCAGC 3' (SEQ ID NO: 13)
3' T*T*GGTAGAGT AGGGAC GCACAGAGGCTGAGT C CGGG CGTCG 5' (SEQ ID NO: 14)
Para simplificar, solo se enumeran cuatro adaptadores arriba, aunque en la práctica puede ser deseable tener un conjunto más grande de tales adaptadores. Tenga en cuenta que, en este ejemplo, se incluye una secuencia complementaria aguas abajo de la secuencia no complementaria para formar una región de doble hebra que facilitará la ligación a la molécula de ADN.
Los fragmentos de ADN individuales se ligan a adaptadores individuales, lo que da como resultado un marcaje asimétrico de las dos hebras de ADN. En particular, tras la secuenciación, la secuencia de la "hebra superior" de la molécula de ADN inicial se marcará con la secuencia de la "hebra superior" del adaptador. La secuencia de la "hebra inferior" de la molécula de ADN inicial se marcará con la complementaria inversa de la secuencia en la "hebra inferior" del adaptador.
Como un ejemplo particular, las dos hebras de ADN ligadas al Adaptador 1 se marcarán como AAAT (hebra superior) y CCCg (hebra inferior). Una vez más, se debe señalar que la hebra inferior, tras la secuenciación, produce la complementaria inversa de la secuencia inicialmente presente en la hebra inferior del adaptador. Igualmente, para las secuencias ligadas a los otros adaptadores, los identificadores moleculares pueden parearse juntos en virtud de sus etiquetas pareadas. Luego, un programa de computadora puede usar una tabla de secuencias de etiquetas conocidas de los adaptadores para ensamblarlas en lecturas que surgen de hebras complementarias de moléculas de ADN simples. La Tabla 2 muestra cómo se marcarían las lecturas de secuencia resultantes en función de las secuencias de identificador específicas no complementarias que se muestran en el ejemplo anterior.
Tabla 2.
Primeros cuatro nucleótidos de lectura de
secuenciación
Hebra superior Hebra inferior
Adaptador 1 AAAT CCCG
Adaptador 2 ATAT CGCG
Adaptador 3 TATT CCGG
Adaptador 4 ATTT GCCC
Estos son solo ejemplos específicos. Será evidente para un experto en la técnica que las etiquetas SMI pueden tener cualquier longitud arbitraria, que las SMI pueden ser completamente aleatorias o que consisten completamente en secuencias predefinidas. Cuando una secuencia SMI está en ambas hebras de una molécula de doble hebra, las dos secuencias SMI pueden ser completamente complementarias (como se describe en el ejemplo anterior mencionado en primer lugar), parcialmente no complementarias o completamente no complementarias. En algunos ejemplos no se necesita en absoluto ninguna etiqueta identificadora molecular exógena. En algunos casos, se pueden usar los extremos cizallados al azar de las moléculas de ADN como identificadores únicos, siempre que esté presente algún tipo de asimetría (que comprende un SDE) que permita distinguir los productos que surgen de las dos hebras independientes de una molécula simple dada de ADN de doble hebra.
Tanto en los SMI monocatenarios como de doble hebras, el conjunto de etiquetas SMI se puede diseñar con una distancia de edición entre etiquetas distintas, de manera que un error al sintetizar, amplificar o secuenciar la secuencia SMI no dará como resultado la conversión de una secuencia SMI a otra (véase, por ejemplo, Shiroguchi y otros, Proc Nat Acad Sci USA, 109(4):1347-1352). La incorporación de una distancia de edición entre las secuencias SMI permite identificar y eliminar los errores SMI, por ejemplo, mediante el uso de la distancia Hamming, los códigos Hamming u otro método de corrección de errores conocido en la técnica. Todos los SMI de un conjunto pueden tener la misma longitud; alternativamente se pueden emplear mezclas de SMI de dos o más longitudes diferentes dentro de un conjunto de SMI. Mediante el uso de mezclas de longitudes de SMI puede ser ventajoso para los diseños de adaptadores que usan una secuencia de SMI y, adicionalmente, tienen una o más bases fijas en un sitio dentro de o que flanquean el SMI, ya que utilizar más de una longitud de SMI dentro de un conjunto provocará que la base(s) invariante(s) no ocurran todas en la misma posición de lectura durante la secuenciación (véase, por ejemplo, Hummelen R y otros, PLoS One, 5(8): e12078 (2010)). Este enfoque puede eludir los problemas que pueden surgir en las plataformas de secuenciador que pueden encontrar un rendimiento subóptimo (por ejemplo, dificultad con la identificación de conglomerados) en situaciones donde las bases invariantes están presentes en una posición de lectura específica.
También será evidente para un experto en la técnica que las secuencias que introducen asimetría se pueden introducir en cualquier lugar dentro de un adaptador de secuenciación, incluso, por ejemplo, como una secuencia de "burbuja" interna como se muestra arriba, antes o después de una secuencia SMI, o dentro de una secuencia de "cola" monocatenaria en diseños de adaptadores que poseen tal secuencia. Estas secuencias, así como cualquier secuencia SMI asociada, se pueden leer directamente como parte de una lectura de secuenciación o, alternativamente, se pueden determinar a partir de una reacción de secuenciación independiente (por ejemplo, en una lectura de índice). Además, estas secuencias se pueden usar junto con adaptadores en forma de Y, adaptadores de "lazo" o cualquier otro diseño de adaptador conocido en la técnica.
De hecho, los adaptadores que tienen diferentes orientaciones relativas de secuencias SMI, secuencias SDE y sitios de unión al cebadores están previstos e incluidos en la presente invención.
Los diseños de adaptadores que se muestran en la Figura 2A y la Figura 2H muestran el extremo no ligado con extremos romos. Sin embargo, este extremo puede estar en voladizo, empotrado o con una base modificada o un grupo quími
Además, las dos hebras del adaptador se pueden conectar para formar un "lazo" cerrado, lo que puede ser deseable en algunas aplicaciones para evitar la degradación o la ligación no deseada. Véase, por ejemplo, la Figura 2I. El enlace de "lazo" cerrado (marcado en la posición "S") de la Figura 2I se puede lograr mediante un enlace fosfodiéster convencional o mediante cualquier otro grupo enlazador químico natural o no natural. Este enlace se puede escindir química o enzimáticamente para lograr un extremo "abierto" antes, durante o después de que se lleve a cabo la ligación; puede ser conveniente escindir el lazo antes de la amplificación por PCR para evitar un amplicón de tipo círculo rodante. Aquí se puede usar una base no estándar, tal como un uracilo, y antes, durante o después de la ligación del adaptador, se puede usar un conjunto de etapas enzimáticas para escindir la cadena principal fosfodiéster. Por ejemplo, en el caso del uracilo, sería suficiente usar la combinación de uracilo ADN glicosilasa para formar un sitio abásico y endonucleasa VIII para escindir la cadena principal. Alternativamente, se podría usar un grupo químico voluminoso u otra base modificada no transversal en este sitio de enlace para evitar que una polimerasa atraviese más allá del extremo del lazo y tenga el mismo propósito.
Los diseños de adaptadores que usan una secuencia SMI de doble hebra, ya sea complementaria, parcialmente no complementaria o totalmente no complementaria, una ventaja específica de sintetizar el adaptador como una molécula lineal que se recoce en forma de "lazo" es que las secuencias SMI de las hebras "superior" e "inferior" estarán presentes en una relación de 1:1 dentro de la propia molécula. Este enfoque puede ser ventajoso en relación con la hibridación de pares de oligonucleótidos "superior" e "inferior" individuales para formar SMI de doble hebra, como en tal enfoque, si la concentración de oligonucleótido usada para las hebras "superior" e "inferior" no está en una relación perfecta de 1:1, el exceso de moléculas de una hebra adaptadora u otra puede estar presente y puede ser problemático para las etapas aguas abajo (por ejemplo, los oligonucleótidos monocatenarios adicionales pueden provocar un cebado inadecuado durante la amplificación por PCR o se pueden hibridar con otros oligonucleótidos monocatenarios que podrían estar presentes y que podrían crear moléculas adaptadoras en donde las dos hebras de SMI no están pareadas apropiadamente).
En algunos casos, puede ser conveniente evitar la replicación de la propia secuencia de lazo completa, en la que se puede incluir opcionalmente una posición de secuencia modificada como un bloque de replicación. Esta puede ser una base que se puede eliminar enzimáticamente (por ejemplo, uracilo, que se puede eliminar mediante uracilo ADN glicosilasa) o, por ejemplo, una región que inhibe parcialmente o totalmente la replicación del ADN (por ejemplo, un sitio abásico).
Alternativamente o adicionalmente, se puede introducir un sitio de endonucleasa de restricción (marcado en la posición "T" en la Figura 2I) que podría ser usado para lograr la conformación "abierta", con la liberación resultante de un pequeño fragmento de horquilla.
Debería ser fácilmente evidente que las diferentes disposiciones de asimetría de bases entre las dos hebras adaptadoras sirven igualmente como un elemento definidor de hebra. Se puede formar una burbuja en una hebra adaptadora cuando se inserta un nucleótido o más de un nucleótido con relación a la hebra complementaria de cualquier otra manera que se muestra en el adaptador de la Figura 2J. La Figura 2K muestra un adaptador donde la inserción de más de un nucleótido incluye una porción que es autocomplementaria; este último adaptador ofrece una funcionalidad similar como una simple diferencia entre las dos hebras que implican una o más posiciones de nucleótidos.
Introducción de la asimetría de definición de hebra mediante el uso de una secuencia SMI no complementaria Los diseños de adaptadores que se muestran en las Figuras 2A a 2K contienen dos características clave que permiten la secuenciación dúplex basada en etiquetas. Uno es un identificador molecular único (es decir, un SMI) y el otro es un medio para introducir asimetría en las dos hebras de ADN (es decir, un SDE). En una descripción inicial de la secuenciación dúplex, se utilizaron adaptadores en forma de Y y lecturas de secuenciación de extremos pareados. La introducción de asimetría en las dos hebras de ADN se logró en virtud de las propias colas asimétricas. Un diseño de adaptador de secuenciación dúplex distinto y superior, como se muestra en la Figura 3A, incluye un SMI en forma de "burbuja" no complementario que sirve conjuntamente como un identificador molecular, así como también un SDE que introduce asimetría.
En este diseño, P y P', respectivamente, representan un sitio del cebador y su complementario y ai y aii representan dos secuencias degeneradas o semidegeneradas que no son complementarias en toda o una porción de su longitud. La síntesis de esta forma de adaptador se logra más fácilmente al sintetizar e hibridar individualmente pares de oligonucleótidos con diferentes secuencias degeneradas o semidegeneradas antes de agrupar dos o más de estos para formar un conjunto diverso. Debido a que los oligonucleótidos se sintetizan e hibridan individualmente, la relación entre una secuencia dada de ai y aii se conocerá y registrará en una base de datos en la que se pueden buscar secuencias SMI asociadas correspondientes durante el análisis posterior a la secuenciación.
Después de la ligación del adaptador a un fragmento de ADN de doble hebra, se produce la estructura que se muestra en la Figura 3B. En esta estructura, pi y pii son un par de secuencias SMI no complementarias que generalmente son distintas de ai y aii, aunque la misma estructura adaptadora podría estar ligada a ambos extremos.
Después de la amplificación por PCR, el producto de doble hebra derivado de la hebra "superior" se muestra en la Figura 3C y el producto de doble hebra derivado de la hebra "inferior" se muestra en la Figura 3D.
Debido a que la secuencia del sitio del cebador es la misma en ambos extremos de la molécula (en este ejemplo), se obtendrán dos tipos diferentes de lecturas de secuencia a partir de lecturas de secuenciación de un extremo simple del producto de PCR de cada hebra y en dependencia de qué hebra simple sea secuenciada. La lectura de secuenciación de un extremo simple del producto de PCR de la hebra "superior" se muestra en la Figura 3E y la lectura de secuenciación de un extremo simple de la hebra "inferior" se muestra en la Figura 3F.
Durante el análisis, las lecturas se pueden agrupar por secuencias SMI específicas y su pareja no complementaria correspondiente basado en una relación conocida de una base de datos producida en el momento de y junto con la síntesis de la biblioteca del adaptador SMI. Como se muestra en la Figura 3G, las secuencias de las hebras "superior" e "inferior" pareadas de la molécula original están etiquetadas con ai y aii para las lecturas que se originan en un extremo de la molécula y pi y pii para las del extremo opuesto.
Introducción de asimetría de definición de hebra mediante el uso de nucleótidos modificados o no estándar Otra forma en que se puede introducir la asimetría de hebra en un adaptador de secuenciación dúplex es mediante un nucleótido o un análogo de nucleótido que inicialmente forma una hebra de ADN pareada, pero luego da como resultado un apareamiento erróneo después de una etapa bioquímica adicional. Un ejemplo de esto es una incorporación incorrecta del ADN polimerasa. La incorporación incorrecta puede ocurrir durante la amplificación, ya sea inherentemente o después de la conversión a una región de apareamiento erróneo a través de una etapa química o enzimática.
Para algunas aplicaciones, esta forma de SDE puede ser preferible a las secuencias de "tipo burbuja", descritas anteriormente, ya que evitan los problemas que pueden surgir de las regiones monocatenarias libres, por ejemplo, la hibridación incorrecta con otros oligonucleótidos de ADN y la degradación de exonucleasa/endonucleasa.
Muchos nucleótidos no estándar conocidos en la técnica pueden servir para este propósito. Los ejemplos no limitantes de tales nucleótidos modificados incluyen tetrahidrofurano; 8-oxo-7,8-dihidro-2'-desoxiadenosina (8-oxo-A); 8-oxo-7,8-dihidro-2'-desoxiguanosina (8-oxo-G); desoxiinosina, 5'-nitroindol; 5-hidroximetil-2'-desoxicitidina; isocitosina; 5'-metil-isocitosina; e iso-guanosina, y otros conocidos en la técnica.
En la Figura 4A se muestra un adaptador de secuenciación dúplex que contiene 8-oxo-G. La base 8-oxo está pareada frente a una base de citosina complementaria y no se forma ninguna burbuja. Como en los ejemplos anteriores y siguientes, el orden relativo de la secuencia SMI (en este caso a) y el sitio SDE (en este caso el sitio 8-oxo-G) se puede cambiar según sea necesario. P y P' representan un sitio del cebador y su complementario.
Después de la ligación del adaptador a un fragmento de ADN de doble hebra, se produce la estructura que se muestra en la Figura 4B.
A continuación, se puede realizar el tratamiento del ADN de doble hebra de la Figura 4B con una glicosilasa, como la oxoguanina glicosilasa (OGG1), (potencialmente junto con una ligasa de ADN para reparar la muesca resultante que puede ocurrir con las glicosilasas que poseen actividad de liasa). Este tratamiento dará como resultado una cadena principal de ADN de fosfodiéster intacta con la introducción de un sitio abásico, como se muestra en la Figura 4C. Cada una de las dos hebras se puede copiar, por ejemplo, con una polimerasa. Bajo condiciones de reacción apropiadas, determinadas polimerasas termoestables preferentemente insertan sitios abásicos opuestos A (Belousova EA y otros, Biochim Biophys Acta 2006), lo que resulta en una mutación G->T. La hebra recíproca, por el contrario, retiene el nucleótido C que estaba presente en el adaptador en el momento de la ligación. Este tratamiento conduce a una asimetría de hebras que permite distinguir los productos de las dos hebras.
Durante la PCR u otras formas de amplificación de ADN, bajo determinadas condiciones con polimerasas particulares, la adenina se insertará preferentemente frente al abásico cuando se copia la hebra. Con rondas subsecuentes de copia, esta adenina se apareará con una timina, lo que finalmente conducirá al reemplazo del sitio 8-oxo-G original con una T. Además, el tratamiento con una glicosilasa no es obligatorio. En condiciones de reacción apropiadas, las polimerasas pueden insertar A frente a 8-oxo-G sin el intermediario abásico que se muestra (Sikorsky JA y otros Biochem Biophys Res Commun 2007). En cualquier caso, después de la amplificación por PCR, el producto de doble hebra derivado de la hebra "superior" será como se muestra en la Figura 4d y el producto de doble hebra derivado de la hebra "inferior" será como se muestra en la Figura 4E.
Debido a que la secuencia del sitio del cebador es la misma en ambos extremos de la molécula en este ejemplo (no limitante), se obtendrán dos tipos diferentes de lecturas de secuencia a partir de lecturas de secuenciación de un extremo simple del producto de PCR de cada hebra, en dependencia de qué hebra sea secuenciada. Los productos de PCR derivados del producto de PCR de la hebra "superior" serán como se muestra en la Figura 4F y los productos de PCR derivados de la hebra "inferior" serán como se muestra en la Figura 4G.
Durante el análisis, las lecturas de secuenciación se pueden agrupar por aquellas que contienen un SMI particular, en este caso a o p. Véase la Figura 4H. Los productos marcados con T y G dentro de cada grupo SMI definen la hebra de origen y permiten la comparación de secuencias dúplex.
También será evidente para un experto en la técnica que un nucleótido modificado u otro análogo, como se describió anteriormente, se puede colocar en cualquier lugar dentro de un adaptador de secuenciación, siempre que la secuencia obtenida del nucleótido modificado u otro análogo se pueda recuperar en el momento de la secuenciación del ADN.
Será evidente para un experto en la técnica que se pueden utilizar muchos otros análogos de nucleótidos para cumplir el mismo propósito. Otros ejemplos incluyen tetrahidrofurano y 8-oxo-7,8-dihidro-2'-desoxiadenosina (8-oxo-A). Cualquier modificación de nucleótido que pueda resultar inherentemente en la incorporación incorrecta de un nucleótido diferente por un ADN polimerasa o que se pueda convertir en una lesión de codificación incorrecta o una base de apareamiento erróneo por una etapa enzimática o química o espontáneamente con el tiempo se puede usar en adaptadores de este ejemplo.
Además, se puede incorporar una molécula no nucleotídica para marcar asimétricamente las dos hebras. Por ejemplo, la biotina se puede incorporar en una de las dos hebras adaptadoras, lo que facilitaría el análisis separado de las dos hebras al utilizar estreptavidina para separar físicamente las hebras que contienen biotina de las hebras que carecen de biotina. Este ejemplo es discutido en detalle más abajo.
El uso de combinaciones de diseños de adaptadores de secuenciación dúplex para introducir diferentes sitios de cebadores en extremos opuestos de moléculas de ADN
Los ejemplos anteriores de adaptadores sin forma de Y muestran la ligación simétrica del mismo tipo de adaptador a ambos extremos de las moléculas de ADN. Actualmente, la mayoría de las plataformas de secuenciación requieren que las moléculas de ADN adaptadas tengan diferentes sitios de cebadores en cada extremo, por ejemplo, para permitir la amplificación de conglomerados en superficies o perlas. Para plataformas de secuenciación que no usan adaptadores en forma de Y de forma rutinaria para crear estos sitios de cebadores diferentes (por ejemplo, Ion Torrent™(Termo®Inc), SOLiD (Biosistemas Aplicados®Inc.), y 454 (Roche®Inc.)) se liga una mezcla de dos adaptadores diferentes y luego se seleccionan moléculas que contienen uno de cada sitio del cebador; más comúnmente a través de un proceso de PCR en emulsión basado en perlas.
A continuación, se ilustra un enfoque simple para generar sitios de cebadores asimétricos mediante el uso de adaptadores de secuenciación dúplex sin forma de Y.
Para esto, se produce una mezcla de un adaptador dúplex y un adaptador estándar en el que cada adaptador contiene un sitio del cebador de PCR diferente. El adaptador dúplex puede ser cualquier diseño descrito en la presente descripción arriba o más abajo o como se conoce en la técnica.
En la Figura 5A se muestra un adaptador dúplex ilustrativo, que tiene un sitio del cebador P con complementario P' seguido de un SDE compuesto por secuencias X e Y no coincidentes, cada una de las cuales comprende uno o más nucleótidos, seguido de una secuencia SMI degenerada o semidegenerada a. El otro adaptador, que se muestra en la Figura 5B, es un adaptador "estándar" que contiene un sitio del cebador diferente O con complementario O'. Después de la ligación de esta mezcla de adaptadores a una biblioteca de ADN, se producen tres tipos diferentes de productos, como se muestra en la Figura 5C a la Figura 5E. En promedio, la mitad de las moléculas adaptadas exitosamente llevarán una secuencia adaptadora diferente en cada extremo (Figura 5C), una cuarta parte tendrá dos adaptadores dúplex (Figura 5D) y una cuarta parte tendrá dos adaptadores estándar (Figura 5E). En condiciones de selección apropiadas, solo se amplificarán en conglomerados las moléculas con un sitio del cebador P y un sitio del cebador O. Por lo tanto, los dos últimos tipos de productos (no útiles) se pueden ignorar en el futuro y no se muestran en las descripciones subsiguientes.
Después de la amplificación por PCR, el producto de doble hebra derivado de la hebra "superior" será como se muestra en la Figura 5F y el producto de doble hebra derivado de la hebra "inferior" será como se muestra en la Figura 5G.
La secuenciación desde el sitio del cebador P producirá las siguientes secuencias que se derivan de las hebras "superior" e "inferior". Estos se pueden distinguir en virtud de llevar un marcador SDE X o Y. Véase la Figura 5H. Es evidente que cualquier otra forma de adaptador dúplex sin forma de Y descrito en la presente descripción o conocido en la técnica podría servir para el mismo propósito que el usado en este ejemplo. Por ejemplo, en lugar de un adaptador dúplex y un adaptador estándar, es posible usar dos adaptadores dúplex que lleven sitios de cebadores diferentes. Después de la ligación y la PCR, el producto amplificado se podría dividir y una parte secuenciarse con el cebador P y la otra secuenciarse con el cebador O. Esto permitiría la secuenciación dúplex en ambos extremos de cada molécula adaptada. Debido a que las lecturas de diferentes sitios de cebadores en realidad no tienen extremos apareados, no se pueden relacionar fácilmente entre sí para ninguna molécula en particular. Sin embargo, para aplicaciones en las que el ADN que se va a secuenciar es de una cantidad muy limitada, la información de secuencia adicional obtenida de la secuenciación dúplex de ambos extremos de las moléculas aún puede ser ventajosa.
El uso de dos lecturas en plataformas no apareadas puede maximizar la longitud de lectura durante la secuenciación dúplex
La secuenciación de extremos apareados, como la que se lleva a cabo en los instrumentos Illumina®, generalmente requiere que una plataforma de secuenciación sea capaz de secuenciar una hebra de un sitio del cebador en un extremo de una molécula de ADN adaptadora y luego generar la hebra complementaria inversa antes de secuenciar el otro extremo de la molécula de un sitio del cebador diferente. Un desafío técnico de esto incluye el proceso de generación de hebras complementarias, razón por la cual no todas las plataformas son fácilmente compatibles con esta secuenciación de extremos apareados.
Sin embargo, la capacidad de secuenciar dos porciones diferentes de una molécula de ADN adaptada se puede
lograr, hasta una extensión limitada, sin necesidad de generar una hebra complementaria. Esto se puede lograr mediante el uso de un segundo sitio del cebador contenido dentro de un segundo adaptador unido al extremo opuesto de la molécula de ADN con relación al primer adaptador, de manera que la lectura de secuenciación progrese al alejarse de la molécula de ADN y el primer adaptador, de esta manera produce una lectura de secuenciación del segundo adaptador en sí. En algunas situaciones tal capacidad puede ser conveniente. Por ejemplo, debido a que las secuencias SMI y SDE requeridas para la secuenciación dúplex consumen una porción de la longitud de lectura inherentemente limitada que se puede lograr, poder mover estos elementos al adaptador opuesto para leerlos durante una segunda lectura más corta podría ser útil cuando se requiere la longitud máxima de lectura. Se podría obtener un beneficio similar al reubicar las secuencias de códigos de barras de índice que se usan
a menudo para la multiplexación de muestras.
Para habilitar este proceso, se pueden usar dos adaptadores diferentes. El primero, como se muestra en la Figura
6A, contiene un sitio del cebador simple P opuesto a su complementario P'.
La otra secuencia adaptadora, como se muestra en la Figura 6B, contiene las funciones necesarias para la secuenciación dúplex sin colas en forma de Y: un SMI y un SDE. Este adaptador dúplex puede ser cualquiera de los diseños descritos en la presente descripción y en los que el SMI y el SDE son elementos de secuencia separados, combinados en el mismo elemento de secuencia como un SMI no apareado, o donde el SDE comprende una base modificada.
En el ejemplo que se muestra en la Figura 6B, el SDE implica secuencias X e Y con apareamientos er adyacentes a una secuencia a de SMI degenerada o semidegenerada. El sitio O del cebador de PCR con el complementario O' está en el extremo no ligado del adaptador. Único en este diseño de adaptador es un segundo
sitio deñ cebador P2 con complementario P2' que está adyacente al extremo ligable, pero orientado de tal manera
que un cebador hibridado se extenderá hacia la propia molécula adaptadora en lugar de hacia el fragmento de ADN.
Después de la ligación de esta mezcla de adaptadores a una biblioteca de ADN, se producen tres productos diferentes. Aquellos con dos de los mismos tipos de adaptadores en extremos opuestos se pueden ignorar porque
solo el producto con uno de cada adaptador (que contiene los sitios del cebador P y O, como se muestra en la
Figura 6C) se amplificará y secuenciará con éxito.
Después de la amplificación por PCR, el producto de doble hebra derivado de la hebra "superior" será como se muestra en la Figura 6D y el producto de doble hebra derivado de la hebra "inferior" será como se muestra en la
Figura 6E.
Más abajo se muestran las orientaciones de los cebadores de secuenciación hibridados P1 y P2 y las regiones que
cada uno puede secuenciar. Estas lecturas se secuenciarían más convenientemente con una antes de la otra. Esto se lograría al introducir un cebador de secuenciación y al someter a una primera lectura de secuenciación; luego, introducir la segunda después de completar la primera lectura de secuenciación. Si se lleva a cabo primero la "lectura #2" (como se muestra en la Figura 6F y la Figura 6G), la secuenciación se podría ejecutar hasta que se alcance el final de la molécula y terminaría automáticamente la secuenciación. Si se lleva a cabo primero la "lectura
#1", sería necesario abortar esta reacción de secuenciación antes de añadir el cebador P2 para comenzar la "lectura
#2". Esto se podría lograr mediante la introducción de dNTP modificados que no se pueden extender más después de la incorporación o mediante la fusión de la hebra sintetizada durante la reacción de secuenciación inicial lejos de la hebra molde, ya sea térmica o químicamente, y al lavarla antes de añadir el siguiente cebador de secuenciación.
El arreglo de la hebra molde de secuenciación derivada de la hebra "superior" es como se muestra en la Figura 6F y el arreglo de la hebra molde de secuenciación derivada de la hebra "inferior" es como se muestra en la Figura 6G.
Las lecturas de secuenciación del molde derivado de la hebra "superior" serán como se muestra en la Figura 6H y las lecturas de secuenciación del molde derivado de la hebra "inferior" serán como se muestra en la Figura 6I.
Es fácilmente evidente que los pares de lectura de secuenciación de las diferentes moléculas de la hebra original se distinguen en virtud de llevar un marcador SDE X o un marcador SDE Y.
El uso de dos lecturas en plataformas no apareadas maximiza la diversidad de etiquetas para la secuenciación
dúplex
Las ventajas potenciales derivadas del uso de la forma de doble lectura descrita anteriormente se extienden más allá
de la simple conservación de la longitud de lectura. En la descripción original de la secuenciación dúplex basada en etiquetas con adaptadores en forma de Y, se añadía una secuencia SMI a cada extremo de la molécula de ADN adaptada. Este diseño tiene una ventaja práctica en determinadas situaciones para generar eficientemente una población suficientemente grande de diversos adaptadores que contienen SMI para garantizar que cada molécula de
ADN se pueda etiquetar de manera única.
Como una ilustración, si se introduce una secuencia SMI de cuatro nucleótidos completamente degenerada en el diseño original del adaptador en forma de Y y se liga a una biblioteca de fragmentos de ADN (como se muestra en la Figura 1B) y se secuencia con lecturas finales apareadas, el número total de formas posibles que una molécula podría ser marcada es 44 * 44 = 65536. Si se incorporara una secuencia SMI de 8 pares de bases completamente degenerada en un adaptador dúplex y se ligara a una biblioteca de ADN para lectura de un solo extremo (como se muestra en la Figura 5C), se podrían lograr las mismas 65536 combinaciones de marcaje. Al generar etiquetas SMI complementarias con un método de extensión de polimerasa, estos dos medios para lograr 65536 marcajes serían igualmente factibles, sin embargo, este no es el caso cuando se generan grupos de adaptadores con oligonucleótidos sintetizados individualmente. En el primer escenario, sería necesario producir un total de 44 * 2 = 512 oligonucleótidos. En el último escenario, sería necesario producir 48 * 2 = 131 072 e hibridados individualmente; esto aumentaría considerablemente el costo financiero y los esfuerzos necesarios.
Para algunas secuencias dúplex, es preferible el método de síntesis de oligonucleótidos de producción de adaptadores SMI y una población de adaptadores que contienen SMI suficientemente diversa podría no ser prácticamente alcanzable con solo un único SMI en un extremo de una molécula, tal como se describió anteriormente.
El método descrito anteriormente de doble lectura en plataformas compatibles con extremos no apareados se podría usar para superar esta limitación al permitir que se incluya una secuencia SMI en ambos adaptadores para la secuenciación en dos etapas de la misma reacción. Esto se ilustra más abajo.
Para esto, se necesitan dos tipos de adaptadores, cada uno lleva un sitio del cebador de amplificación diferente. Al menos uno debe contener un SDE y, en los ejemplos, ambos contendrán una secuencia SMI degenerada o semidegenerada. Como se muestra en la Figura 7A, el primer adaptador es similar al adaptador de la Figura 6A excepto que además incluye una secuencia SMI (identificada aquí como "p"). El segundo adaptador, como se muestra en la Figura 7B, es similar al adaptador que se muestra en la Figura 6B y contiene una secuencia SMI (aquí, identificada como "a").
Será obvio para un experto en la técnica que los arreglos relativos de las características SMI y SDE de los dos adaptadores se pueden intercambiar para lograr el mismo resultado. El SDE que se muestra arriba en el último adaptador se podría colocar en el primero. Cualquier forma de SDE o SMI descrita anteriormente se podría sustituir con un efecto equivalente a las usadas en este ejemplo.
Después de la unión de esta mezcla de adaptadores a una biblioteca de ADN, el producto se unirá exitosamente a uno de cada tipo de adaptador como se muestra en la Figura 7C.
Después de la amplificación por PCR, el producto de doble hebra derivado de la hebra "superior" será como se muestra en la Figura 7D y el producto de doble hebra derivado de la hebra "inferior" será como se muestra en la Figura 7E.
Como se describió en el ejemplo anterior, la orientación de los sitios del cebador de secuenciación P1 y P2 y las regiones secuenciadas por cada uno para la hebra "superior" se muestran en la Figura 7F y para la hebra inferior se muestran en la Figura 7G.
Las lecturas del molde derivado de la hebra "superior" serán como se muestra en la Figura 7H y las lecturas derivadas del molde derivado de la hebra "inferior" serán como se muestra en la Figura 7I.
Nuevamente, los productos de las dos hebras se distinguen fácilmente en virtud de sus diferentes marcajes de SDE X e Y. Para el análisis de secuenciación dúplex, las secuencias de SMI a y SMI p se pueden combinar en una sola secuencia de etiqueta de identificación.
SMI asimétricos en adaptadores de secuenciación dúplex en forma de Y
Varias plataformas de secuenciación disponibles actualmente requieren diferentes sitios de cebadores en los extremos opuestos de las moléculas de ADN para permitir la amplificación y secuenciación de conglomerados. Esto se puede lograr con adaptadores en forma de Y o de burbuja con sitios de unión de cebadores asimétricos o mediante el método de ligación de dos adaptadores ilustrado en los tres ejemplos inmediatamente anteriores. Los adaptadores en forma de Y se han usado con mayor frecuencia en plataformas compatibles con la secuenciación final apareada, como los fabricados por Illumina®; sin embargo, se podrían usar en otras plataformas.
Una ventaja general de los adaptadores Y o "en forma de burbuja" para la preparación de bibliotecas es que, en teoría, todas las moléculas de ADN doblemente adaptadas se podrán secuenciar. Sin embargo, con métodos que usan dos adaptadores diferentes, solo la mitad de las moléculas producidas se podrán secuenciar si tienen uno de cada tipo de adaptador, mientras que la otra mitad de las moléculas producidas tendrán dos copias del mismo adaptador. En determinadas situaciones, por ejemplo, cuando el ADN de entrada es limitante, puede ser deseable una mayor conversión de adaptadores en forma de Y.
Sin embargo, como se ilustra en el primer ejemplo descrito anteriormente (el método de secuenciación dúplex descrito originalmente), sin la capacidad de realizar lecturas de extremos apareados o lecturas completas, los adaptadores dúplex en forma de Y descritos originalmente no permiten fácilmente la secuenciación dúplex con lecturas de extremos simples.
Sin embargo, el uso de un sitio del cebador de secuenciación en la secuencia "tallo" complementaria de los adaptadores en forma de Y permite lecturas de un extremo simple para la secuenciación dúplex, pero solo si al menos un SDE introduce una asimetría en otra parte de la secuencia del adaptador. A continuación, se presenta una breve ilustración.
En la Figura 8A, se muestra un adaptador en forma de Y que contiene un SMI desapareado que comprende las secuencias ai y aii. Esta secuencia en este diseño también servirá como SDE. Tres sitios de cebadores están presentes: A y B, que son cebadores de PCR en las colas libres, y C (y C') que incluye un sitio del cebador de secuenciación (y su complementario).
Después de la ligación del adaptador a un fragmento de ADN, se produce la estructura que se muestra en la Figura 8B en la que se fijan dos adaptadores con dos SMI no complementarios distintos a cada extremo.
Después de la amplificación por PCR mediante el uso de cebadores complementarios a los sitios A y B, el producto de doble hebra derivado de la hebra "superior' será como se muestra en la Figura 8C y el producto de PCR de doble hebra derivado de la hebra "inferior' será como se muestra en Figura 8D.
Después de la secuenciación desde el sitio C del cebador, se obtendrán dos tipos diferentes de lecturas de secuenciación a partir de lecturas de un extremo simple del producto de PCR de cada hebra, en dependencia de la mitad monocatenaria que se secuencie. Las lecturas de secuenciación del producto de PCR de la hebra "superior" se muestran en la Figura 8E y las lecturas de secuenciación derivadas del producto de PCR de la hebra "inferior" se muestran en la Figura 8F.
Durante el análisis, las lecturas de secuenciación se pueden agrupar por secuencias SMI específicas y su socio no complementario correspondiente en función de una relación conocida de una base de datos producida en el momento de y junto con la síntesis de la biblioteca de adaptadores SMI. En esto, como se muestra en la Figura 8G, las secuencias de las hebras "superior" e "inferior' apareadas de la molécula original están etiquetadas con ai y aii para las lecturas que se originan en un extremo de la molécula y pi y pii para las del extremo opuesto.
Por lo tanto, se puede llevar a cabo un análisis de secuencia dúplex. El análisis es análogo al descrito anteriormente en el ejemplo titulado "Introducción de la asimetría de definición de hebra mediante el uso de una secuencia SMI no complementaria".
Un diseño alternativo, como se ejemplifica en la Figura 8H, para este tipo de adaptador en forma de Y incluye un lazo cerrado que es ventajoso para evitar la digestión con exonucleasas o la ligación potencialmente no específica a los brazos libres de la Y, así como también la "conexión en cadena" de los brazos libres. Un enlace de "lazo" cerrado (marcado por una flecha) se puede lograr mediante un enlace fosfodiéster convencional o mediante cualquier otro grupo enlazador químico natural o no natural. Este enlace se podría escindir químicamente o enzimáticamente para lograr un extremo "abierto" después de que se haya llevado a cabo la ligación, tal como a menudo sería conveniente antes de la amplificación por PCR para evitar un amplicón de tipo círculo rodante. Alternativamente, se podría usar un grupo químico voluminoso o un nucleótido modificado en este sitio de enlace para evitar que una polimerasa atraviese más allá del final del lazo y tenga el mismo propósito. Alternativamente, como se ejemplifica en la Figura 8I, se introduce un sitio de reconocimiento de endonucleasa de restricción en una región de complementariedad de horquilla dentro del lazo (marcada por una flecha); esto se podría usar para lograr la conformación "abierta", con la liberación resultante de un pequeño fragmento de horquilla.
En algunas situaciones, es preferible no tener que realizar etapas enzimáticas adicionales después de la ligación del adaptador antes de la PCR. Un diseño de adaptador, como se ejemplifica en la Figura 8J, en el que las colas de los adaptadores son complementarias, pero no están conectadas covalentemente, aún puede superar los problemas causados por colas de ADN no apareadas libres, en ausencia de la necesidad de etapas adicionales.
SMI asimétricos en adaptadores de secuenciación dúplex en forma de Y
Otra variación del concepto de SMI no apareados en adaptadores en forma de Y o en forma de lazo incluye estos SMI no apareados ubicados en las regiones de cola monocatenarias libres entre los sitios del cebador de PCR y un tallo complementario. Una ventaja de este diseño es que permite que los SMI se secuencien por completo como parte de las lecturas de "indexación dual", tales como las que están disponibles en los sistemas de secuenciación Illumina seleccionados® (Kircher y otros (2012) Nucleic Acid Res. Vol. 40, No. 1, e3). No tener SMI incluidos en la lectura de secuenciación principal maximizaría la longitud de lectura de un inserto de ADN para aplicaciones donde las lecturas largas son particularmente convenientes. A continuación, se muestra un ejemplo.
La Figura 9A muestra un adaptador de secuenciación dúplex en forma de Y que contiene sitios del cebador de PCR A y B no apareados. ai y aii representan un par de SMI degenerados o semidegenerados al menos parcialmente no complementarios. P y P' es un sitio del cebador de secuenciación y su complementario.
Después de la unión del adaptador a un fragmento de ADN, se produce la estructura que se muestra en la Figura 9B mediante la cual se fijan dos adaptadores con dos SMI al menos parcialmente no complementarios a cada extremo. Después de la amplificación por PCR mediante el uso de cebadores complementarios a los sitios A y B, el producto de doble hebra derivado de la hebra "superior" será como se muestra en la Figura 9C y el producto de doble hebra derivado de la hebra "inferior" será como se muestra en la Figura 9D.
En la plataforma Ilumina®, como un ejemplo, cuando se usa secuenciación de extremos apareados con indexación dual, después de terminar una lectura de secuenciación y una lectura de indexación, se puede generar la hebra complementaria y se puede llevar a cabo la secuenciación correspondiente y la lectura de índice de la otra hebra. Sin embargo, se debe señalar que ni la secuenciación de extremos apareados ni la indexación dual como técnicas permiten la secuenciación dúplex por sí sola. Si bien ambas hebras simples de un producto de PCR determinado se secuencian juntas de manera efectiva, cada producto de PCR se deriva de solo una de las dos hebras de un dúplex de ADN original y, por lo tanto, secuenciar ambas hebras de un producto de PCR no equivale a secuenciar ambas hebras de un dúplex de ADN original.
En la Figura 9E se muestra una posible orientación relativa de un cebador de secuenciación y un cebador de indexación y las regiones que secuencian para lecturas en ambas direcciones del producto de PCR derivado de la hebra "superior" y en la Figura 9F para lecturas en ambas direcciones del producto de PCR derivado de la hebra "inferior".
También sería suficiente secuenciar tanto el SMI como la propia secuencia en una lectura de secuenciación simple en lugar de dos lecturas separadas. Es evidente que se pueden utilizar muchas configuraciones y números de cebadores diferentes para secuenciar el SMI y la secuencia de lectura. En algunos ejemplos, tales como la secuenciación de nanoporos, es posible que la secuenciación de la secuencia SMI y/o del ADN no requiera sitios de cebadores específicos en absoluto. Además, aunque este ejemplo describe el uso de PCR, este y otros ejemplos se pueden amplificar mediante cualquier otro método conocido en la técnica, que incluyen la amplificación por círculo rodante y otros enfoques. Véase, Kirchery otros (2012).
Al comparar los diferentes patrones de secuencias en las cuatro lecturas con respecto a las derivadas de las hebras "superior" e "inferior" (como se muestra en la Figura 9G), es evidente que se pueden distinguir entre sí porque una porta las etiquetas SMI ai' y pi y el otro porta las etiquetas y aii y pii'. Aunque las dos hebras no comparten ninguna etiqueta en común en este ejemplo no limitativo, aún pueden estar relacionadas entre sí porque la relación entre ai y aii y entre pi y pii se conoce desde que se prepararon los adaptadores y, por lo tanto, puede ser buscada en una base de datos como un componente del análisis.
Uso de un vector circular simple para introducir sitios de cebadores, un SMI y un SDE para secuenciación dúplex En la Figura 10 se ilustra una estructura alternativa que introduce todos los elementos necesarios para la secuenciación dúplex en una molécula simple en lugar de dos adaptadores apareados.
En este ejemplo, se forma una estructura circular mediante la unión de los dos extremos de una molécula lineal de doble hebra (que comprende los elementos necesarios para la secuenciación dúplex) con los dos extremos de un fragmento de ADN con sitios de ligación compatibles.
En la Figura 10A, A/A' y B/B' representan dos sitios cebadores diferentes y su complementario inverso; a y a' implican una secuencia SMI degenerada o semidegenerada; y X e Y son mitades respectivas no complementarias de un SDE.
Después de la ligación de un fragmento de ADN de doble hebra en la molécula de doble hebra de la Figura 10A, se produce un lazo cerrado, como se muestra en la Figura 10B.
Después de generar el producto ligado de la Figura 10B, se lleva a cabo la amplificación a partir de los sitios del cebador mediante PCR. Alternativamente, la amplificación del círculo rodante se podría llevar a cabo primero. La destrucción selectiva de bibliotecas y adaptadores no ligados puede ser ventajosa y lograrse con una exonucleasa 5'-3' o 3'-5'. El diseño circular ofrece de manera única estas oportunidades, que no son posibles con muchos otros diseños.
Será fácilmente evidente que cualquiera de las formas de SMI y SDE descritas anteriormente y más abajo se podrían sustituir por las que se muestran o cambiar el orden de las mismas.
Como un ejemplo, como se muestra en la Figura 10C, se podría usar un elemento simple cerca de un sitio de ligación que sirve como SMI y SDE, como se describe en "Introducción de la asimetría de definición de la hebra mediante el uso de una secuencia SMI no complementaria".
Alternativamente, como se muestra en la Figura 10D y la Figura 10E, se podría diseñar un SDE y un SMI en las secuencias cercanas a cada uno de los sitios de ligación del adaptador para facilitar la secuenciación de extremos apareados.
En este diseño, se debe tener en cuenta que no es obligatorio que las secuencias de SMI en hebras opuestas sean complementarias (como se muestra en la Figura 10E), siempre que la relación entre las secuencias correspondientes (es decir, ai y aii) se conozca y se pueda buscar en una base de datos durante el análisis.
Secuenciación dúplex mediante marcaje químico asimétrico y aislamiento de hebras
Como se discutió anteriormente, la secuenciación dúplex se basa fundamentalmente en la secuenciación de ambas hebras de un dúplex de ADN de manera que se puedan distinguir. En una secuenciación dúplex descrita originalmente (en el documento WO2013142389A1), ambas hebras podrían estar unidas entre sí con una secuencia de horquilla para secuenciar hebras apareadas juntas. El documentoWO2013142389A1, así como también en los múltiples ejemplos descritos anteriormente, describe formas en las que se pueden distinguir dos hebras de un dúplex de ADN único mediante el uso del etiquetado de ADN. Este último enfoque implica marcar cada molécula de ADN con una secuencia de ADN única (un SMI endógeno que comprende las coordenadas de uno o ambos extremos de un fragmento de ADN o un SMI exógeno que comprende una secuencia degenerada o semidegenerada) e introducir asimetría de definición de hebra a través de al menos una forma de un SDE (por ejemplo, un sitio del cebador asimétrico con lectura de extremos apareados, una secuencia de "burbuja", una secuencia SMI no complementaria y un nucleótido no estándar que se convierte de forma natural o química en un apareamiento erróneo).
Más abajo se describe otro enfoque para llevar a cabo la secuenciación dúplex que incluye el marcaje químico asimétrico de las dos hebras en un dúplex de manera que se puedan separar físicamente para la secuenciación en reacciones independientes. Un ejemplo de esto sigue.
Como se muestra en la Figura 11A, se usan dos adaptadores diferentes. El primer adaptador contiene el sitio del cebador P con el complementario P' y una secuencia SMI a con la complementaria a'. Una hebra del primer adaptador porta adicionalmente una etiqueta química que es capaz de unirse o ser unida por una sustancia conocida, por ejemplo, una superficie sólida, una perla, una estructura fija y una pareja de unión, de manera que la otra hebra de ADN no lo es. Como se muestra en la Figura 11A, la etiqueta química es biotina, que tiene una pareja de unión y afinidad por estreptavidina.
Se pueden usar otros pares de parejas de unión conocidos en la técnica, preferentemente en forma de una molécula pequeña, un péptido o cualquier otro resto que se pueda unir de forma única. Esta etiqueta también podría estar en forma de una secuencia de ácido nucleico (por ejemplo, ADN, ARN o sus combinaciones y un ácido nucleico modificado tal como ácidos nucleicos peptídicos o ácido nucleico bloqueado), preferentemente en forma monocatenaria, donde se podría usar una secuencia de "cebo" sustancialmente complementaria fijada a un sustrato sólido (por ejemplo, una superficie sólida, una perla u otra estructura fija similar) para unirse, capturar selectivamente y aislar una hebra de la molécula ligada al adaptador de la otra.
El segundo adaptador no lleva una etiqueta química en este ejemplo no limitante. Como se muestra en la Figura 11B, el segundo adaptador lleva un sitio del cebador O diferente con complementario O'.
Después de ligar los adaptadores de la Figura 11A y la Figura 11B a un fragmento de ADN, se produce la estructura (preferida) que se muestra en la Figura 11C.
En adición, se producirán otros dos tipos de estructuras: una que tiene dos adaptadores que contienen el sitio P del cebador y otra que está ligada a dos adaptadores que contienen el sitio O del cebador. Como se discutió anteriormente en "Uso de combinaciones de diseños de adaptadores de secuenciación dúplex para introducir diferentes sitios de cebadores en extremos opuestos de moléculas de ADN", el enriquecimiento de la estructura preferida sobre los otros dos tipos de estructuras se puede lograr de forma rutinaria con condiciones de amplificación específicas antes de la secuenciación, de manera que los otros dos tipos de estructuras pueden ser ignorados. Como se muestra en la Figura 11D, después de la ligación, las hebras de ADN se pueden fundir térmicamente o químicamente y luego la hebra que lleva la etiqueta química con una afinidad selectiva por una pareja de unión particular (en este caso, la estreptavidina, por ejemplo, unida a perlas paramagnéticas) se puede separar de la otra hebra. Las dos hebras, ahora separadas, se pueden secuenciar independientemente, opcionalmente con una etapa anterior en el que las dos hebras separadas se amplifican independientemente (la secuenciación puede ocurrir en reacciones físicamente diferentes o en la misma reacción después de aplicar diferentes índices a cada una, por ejemplo, con cebadores de PCR marcados y recombinados).
Alternativamente, ambas hebras se pueden marcar con etiquetas químicas diferentes con afinidades para dos tipos diferentes de cebos. Las etiquetas que se encuentran en una reacción de secuenciación o grupo de índice se pueden comparar con las etiquetas correspondientes en la otra población y se lleva a cabo un análisis de secuenciación dúplex. En este ejemplo, todavía se usa un SDE, pero implica una etiqueta química fijada asimétricamente que puede usarse para separar físicamente las hebras. Su compartimentación físicamente diferente permite que las dos hebras se secuencien individualmente o se sometan a una etapa de marcaje diferencial subsecuente (por ejemlo, PCR con cebadores que llevan diferentes secuencias de índice en sus colas) antes de la agrupación y la secuenciación combinada que luego se puede desconvolucionar informáticamente.
Otra modalidad de este concepto sería usar marcadores (es decir, grupos físicos) con otras propiedades que permitan la separación de hebras por medios distintos a la afinidad química. Como ejemplos, una hebra de ácido nucleico que comprende una molécula con una fuerte carga positiva (por ejemplo, un grupo físico que tiene una propiedad de carga) se podría separar preferentemente de su hebra apareada no marcada mediante la aplicación de un campo eléctrico (por ejemplo, por electroforesis) o una hebra de ácido nucleico que comprende una molécula con una fuerte capacidad magnética (por ejemplo, un grupo físico que tiene una propiedad magnética) se podría separar preferentemente de su hebra apareada no marcada mediante la aplicación de un campo magnético. Una hebra de ácido nucleico que comprende un grupo químico que es sensible a la precipitación (por ejemplo, un grupo físico que tiene una propiedad de insolubilidad) se podría separar preferentemente de su hebra apareada no marcada cuando está en solución bajo determinadas condiciones aplicadas, de manera que el ADN en sí mismo es soluble, pero el ADN que comprende el grupo físico es insoluble.
Otra variación más del concepto de separación física de hebras apareadas después de aplicar un SMI (ya sea como una una etiqueta exógena dentro de un secuenciador adaptador ligado o como un SMI endógeno que comprende los puntos de cizallamiento únicos del fragmento de ADN) es usar la dilución después de la fusión térmica o química de los dúplex de ADN en sus componentes monocatenarios. En lugar de aplicar un marcador químico purificable a una hebra para separarla de la otra, las hebras simples se diluyen en múltiples (es decir, dos o más) cámaras de reacción separadas físicamente, de manera que la probabilidad de que las dos hebras apareadas originalmente compartan el mismo el contenedor es pequeña. Por ejemplo, si la mezcla se dividiera entre cien contenedores, por casualidad aleatoria, solo aproximadamente el 1 % de las hebras asociadas se colocarían en el mismo contenedor. Los recipientes pueden implicar un conjunto de embarcaciones físicas, tales como contenedores, tubos de ensayo o pocillos en una placa de micropocillos, o gotas no comunicantes físicamente separadas, por ejemplo, una emulsión de fase acuosa en hidrófoba. Puede usarse cualquier otro método en el que se evite que los contenidos de dos o más volúmenes espacialmente distintos de un fluido o un sólido que contiene moléculas de ácido nucleico entremezclen sustancialmente las moléculas de ácido nucleico. En cada contenedor, se podría llevar a cabo la amplificación por PCR, preferentemente mediante el uso de cebadores que lleven una secuencia de etiqueta diferente en cada uno. Esta secuencia de etiqueta única añadida por el cebador diferente en cada contenedor se situaría más convenientemente donde se podría registrar durante una lectura de índice de secuenciación (por ejemplo, véase la Figura 9E). Estos marcadores servirían como un SDE. En este ejemplo, aproximadamente al 99 % de las hebras asociadas que llevan el mismo marcador SMI se les asignaría un marcador SDE diferente a la de su hebra asociada. Solo aproximadamente el 1 % se le asignaría el mismo marcador. El análisis de secuenciación dúplex y la creación de consenso podrían proceder como de costumbre mediante el uso del SMI y estos SDE. En el pequeño número de casos en los que las hebras asociadas adquieren el mismo SDE por casualidad, estas moléculas se ignorarán inherentemente durante el análisis dúplex y no contribuirán con mutaciones falsas.
Introducción de un SDE durante la traducción de muesca
En algunos entornos, tales como en los kits disponibles comercialmente que se usan para la ligación del adaptador para la plataforma Ion Torrent™, los adaptadores de doble hebras se ligan a una molécula de ADN diana de doble hebra que se va a secuenciar. Sin embargo, aquí, solo una de las dos hebras de la molécula de ADN diana está ligada al adaptador. Un ejemplo común de esto es cuando la hebra 5' del dominio de ligación no está fosforilada. Luego se usa una polimerasa con actividad de desplazamiento de hebra para copiar la secuencia de la hebra ligada a la hebra no ligada, en un proceso comúnmente conocido como "traducción de muesca". Si los diseños de adaptadores descritos en la presente descripción se usan de esta manera y sin modificación, en muchos casos se perdería el SDE durante la etapa de traducción de muesca; de esta manera, evitaría la secuenciación dúplex. Esto se ejemplifica más abajo.
En la Figura 12A se muestra un tipo de adaptador de secuenciación dúplex. Las N representan una secuencia SMI degenerada o semidegenerada; TT opuesto a GG es una región SDE no complementaria; y el asterisco representa una base 5' desfosforilada no ligable:
Después de la ligación del adaptador de la Figura 12A a una molécula de ADN de doble hebra, queda una muesca sin ligar como se muestra en la Figura 12B.
Con los enfoques estándar de "traducción de muesca", se usa una polimerasa de desplazamiento de hebra para extender el extremo 3' de la molécula de ADN de la biblioteca y desplazar la hebra no ligada del adaptador. Esto se muestra en la Figura 12C. Después de la extensión, el SDE no complementario se pierde como se muestra en la Figura 12D. Cuando se pierde el SDE, la secuenciación dúplex no puede ocurrir porque las hebras son indistinguibles.
Un enfoque para permitir el uso del método de traducción de muesca de ligación de adaptadores y que retiene el SDE es el siguiente.
En la Figura 12E se muestra un ejemplo de un adaptador Ion Torrent™"A" que se ha modificado para incluir una secuencia SMI degenerada o semidegenerada. Tenga en cuenta que no hay SDE presente. "A" es el sitio del cebador. El asterisco representa la base 5' no fosforilada. En la Figura 12F se muestra un ejemplo de un cebador PI Ion Torrent™. PI representa el sitio del cebador. El asterisco indica una base 5' desfosforilada.
Después de la ligación de cada adaptador de la Figura 12E y la Figura 12F a un ADN de doble hebra, se forma la estructura de la Figura 12G. Los productos con dos sitios de cebadores PI o dos A no se muestran, ya que no se amplificarán en conglomerados. Para mayor claridad, tampoco se muestran las hebras adaptadoras no ligadas. A continuación, se añade una polimerasa de desplazamiento de hebra según el protocolo típico de traducción de muesca (por ejemplo, polimerasa Bst, como se usa en algunos kits comerciales, debido a su fuerte actividad de desplazamiento de hebra). Sin embargo, como se muestra en la Figura 12H, solo se añade inicialmente uno de los cuatro dNTP, en este ejemplo, dGTP, y por lo tanto se producirá un apareamiento erróneo de T-dGTP (de nota, este evento de apareamiento erróneo se puede hacer que ocurra con un número de polimerasas de ADN en condiciones de reacción apropiadas; véase, por ejemplo, McCulloch y Kunkel, Cell Research 18: 148-161 (2008) y las referencias allí citadas).
Si bien la incorporación de apareamientos erróneos puede ser bastante eficiente bajo determinadas condiciones, la extensión de apareamientos erróneos y la creación de un segundo apareamiento erróneo es bastante ineficiente (McCulloch y Kunkel, 2008). Por lo tanto, con las condiciones apropiadas, la incorporación de nucleótidos cesará después de que ocurra el apareamiento erróneo. En este momento, se pueden añadir los tres dNTP restantes de modo que la polimerasa tenga acceso a los cuatro dNTP. El resto de la secuencia adaptadora se copiará para formar la estructura que se muestra en la Figura 12I, que tiene una posición no complementaria de manera que los productos de amplificación de la hebra "superior" se distinguirán de los productos de amplificación de la hebra "inferior".
Después de la PCR, el producto que surge de la hebra "superior" original será como se muestra en la Figura 12J y la PCR, el producto que surge de la hebra "inferior" original será como se muestra en la Figura 12K
La secuenciación del producto de la hebra "superior" producirá la estructura que se muestra en la Figura 12L y la secuenciación del producto de la hebra "inferior" producirá la estructura que se muestra en la Figura 12M.
Tenga en cuenta que los productos de secuenciación se pueden distinguir entre sí basado en el apareamiento erróneo introducido.
Un ejemplo específico de reducción de este concepto a la práctica con adptadores Ion Torrent™ se muestra más abajo.
Los adaptadores Ion Torrent™ pueden usar las siguientes secuencias:
Adaptador P1
5' CCACTACGCCTCCGCTTTCCTCTCTATGGGCAGTCGGTGAT 3' (SEQ ID NO: 15)
3' T*T*GGTGATGCGGAGGCGAAAGGAGAGATACCCGTCAGCCACTA 5' (SEQ ID NO: 16)
Adaptador A
5' CCATCTCATCCCTGCGTGTCTCCGACTCAG 3' (SEQ ID NO: 17)
3' T*T*GGTAGAGTAGGGACGCACAGAGGCTGAGTC 5' (SEQ ID NO: 18)
El asterisco "*" representa un enlace de fosforotioato.
La secuencia del Adaptador A se podría modificar de la siguiente manera. NNNN indica una secuencia SMI degenerada o semidegenerada (se muestran cuatro nucleótidos, pero la longitud de esta secuencia es arbitraria), y MMMM indica la complementaria de NNNN. Como se describió anteriormente, la secuenciación dúplex se puede realizar sin secuencias SMI, pero aquí se muestra un SMI como un ejemplo específico de la aplicación del concepto con etiquetado molecular de doble hebra.
Adaptador A modificado
5' CCATCTCATCCCTGCGTGTCTCCGACTCAG NNNN AAC 3' (SEQ ID NO: 19)
3' T*T*GGTAGAGTAGGGACGCACAGAGGCTGAGTC MMMM TTG 5' (SEQ ID NO: 20)
Los adaptadores A y PI se unen a los extremos opuestos de una molécula de ADN que se va a secuenciar. Para simplificar, solo se muestra el extremo del adaptador A de la molécula, y también para simplificar, las dos hebras se muestran como X e Y, respectivamente. Se podría usar cualquier secuencia de ADN de cualquier longitud, siempre que la longitud del fragmento secuenciado sea compatible con el proceso de secuenciación que es usado.
La hebra "superior" está ligada, pero la hebra "inferior" no está ligada, lo que deja una muesca (que se muestra como |)
5' CCAT CT CATCCCTGCGT GT CTCCGACTCAGNN NNAACXXXXXXXXX 3' (SEQID NO: 21)
3' T*T*GGTAGAGTAGGGACGCACAGAGGCTGAGTCMMMMTTG|YYYYYYYYY 5' (SEQID NO: 22)
Se añade una polimerasa de desplazamiento de hebra junto con dGTP. G se incorpora en la primera posición encontrada en el sentido 5'-3' (incorporación correcta de G frente a C), así como en la segunda posición encontrada (incorporación incorrecta de G frente a A). Debido a que la extensión de una base incorrecta después de un aparemaiento erróneo es ineficaz, en condiciones apropiadas de concentración de polimerasa, tiempo de reacción y condiciones de tampón, la polimerasa se detiene y no se produce una incorporación adicional. Tenga en cuenta que los dos primeros nucleótidos de la hebra adaptadora "inferior" se desplazan durante esta reacción y se muestra más abajo la construcción del ADN adaptador en el esquema más abajo. Las bases de nueva incorporación se indican en negrita.
5' CCAT CT CATCCCTGCGT GT CTCCGACTCAGNN NNAACXXXXXXXXX 3'
3' T*T*GGTAGAGT AGGGAC GCACAGAGGCTGAGT CMMMMTT GGG YYYYYYYYY 5'
(Parte superior: SEQ ID NO: 23 y Parte inferior: SEQ ID NO: 24)
Ahora, se añaden dCTP, dATP y dTTP a la reacción, de manera que los cuatro nucleótidos estén disponibles para la polimerasa. La síntesis de desplazamiento de hebra puede proceder, con un producto intermediario que se muestra más abajo con fines ilustrativos:
5' CCAT CT CATCCCTGCGT GT CTCCGACTCAGNN NNAACXXXXXXXXX 3'
3' T*T*GGTAGAGTAGGGACGCACAGAGGCTGAGTC M M MMTT GGCTGAGTCMMM MTGG YYYYYYYYY 5'
(Parte superior: SEQ ID NO: 25, Parte intermedia: SEQ ID NO: 26, and Parte inferior: SEQ ID NO: 27)
Una vez que se alcanza el extremo del molde, la hebra "inferior" original del adaptador se desplaza por completo (no se muestra) y está presente una hebra "inferior" completamente sintetizada con un solo par de bases que no es complementario (par de bases A:G, subrayada)
5' CCAT CT CATCCCTGCGT GT CTCCGACTCAGNN NNAACXXXXXXXXX 3' (SEQ ID NO: 28)
3' GGTAGAGTAGGGACGCACAGAGGCTGAGTCMMMMTGGYYYYYYYYY 5' (SEQ ID NO: 29)
Esta construcción se puede usar para la amplificación y secuenciación de PCR por protocolos Ion Torrent ™típicos. Cabe destacar que la amplificación por PCR da como resultado productos tanto de la hebra "superior" como de la "inferior", y estos productos se pueden distinguir entre sí en virtud del par de bases no complementarias introducidas durante la traducción de muesca.
Los productos que surgen de la hebra "superior" tendrán la siguiente forma (la posición del apareamiento erróneo de base está subrayada):
TCAGNNNNAACXXXXXXXXX (SEQ ID NO: 30)
Los productos que surgen de la hebra "inferior", por el contrario, tendrán la siguiente forma (la posición del apareamiento erróneo de base está subrayada):
TCAGNNNNACCXXXXXXXXX (SEQ ID NO: 31)
Tenga en cuenta que el producto de la hebra "inferior" es el complementario inverso de la secuencia inicialmente presente en la hebra "inferior" del ADN ligado al adaptador (y, por lo tanto, el nucleótido G, que fue la inserción incorrecta de la base introducida durante la traducción de la muesca), se lee durante la secuenciación como un nucleótido C).
Ahora, los duplicados de amplificación que surgen de cada una de las dos hebras se pueden comparar entre sí para la corrección de errores. Los productos de la "hebra superior" que surgen de una molécula dada de ADN de doble hebra tendrán la secuencia de etiqueta NNNNAAC. Los productos de la hebra "inferior", por el contrario, tendrán la secuencia de etiqueta NNNNACC. Por lo tanto, los duplicados de las dos hebras se pueden resolver con fines de corrección de errores, como se describió anteriormente (Schmitt y otros, PNAS 2012).
Al introducir un apareamiento erróneo después de la traducción de la muesca
Un enfoque alternativo al anterior sería completar la traducción de muesca con los cuatro nucleótidos presentes y luego cambiar una base en la hebra molde a una base diferente.
En la Figura 13A se muestra un adaptador que contiene una secuencia de cebador y su complementaria (P/P'), un par de bases U-A (U=uracilo) y una secuencia SMI monocatenaria y su complementaria (a/a'); el asterisco representa un extremo 5' desfosforilado.
Después de que el adaptador de la Figura 13A se liga a una molécula de ADN de doble hebra que se va a secuenciar, queda una muesca monocatenaria en el sitio desfosforilado, como se muestra en la Figura 13B. Aquí, la hebra "superior" se liga en virtud del fosfato 5' en la molécula de ADN diana, pero la hebra "inferior" no se liga al ADN objetivo debido a la falta de un fosfato 5' en el adaptador, dejando la muesca.
La síntesis de desplazamiento de hebra se puede realizar con una polimerasa (por ejemplo, polimerasa Bst) y los cuatro dNTP, lo que da como resultado la estructura que se muestra en la Figura 13C.
El producto ampliado resultante vuelve a aparecer como en el adaptador original. Como se muestra en la Figura 13D, todavía no está presente ningún sitio de asimetría.
Se puede realizar un paso de purificación para eliminar la polimerasa y los dNTP. Luego, el uracilo se puede eliminar de la hebra "superior" (de la estructura que se muestra en la Figura 13D) agregando uracilo ADN glicosilasa y una endonucleasa AP apropiada, lo que da como resultado una brecha de un solo nucleótido como se muestra en la Figura 13E.
A continuación, se añade una polimerasa que no desplaza la hebra (por ejemplo, sulfolobusADN polimerasa IV, que es muy propensa a errores y facilita la incorporación errónea de bases) junto con un solo nucleótido, por ejemplo, dGTP pero ningún otro nucleótido. En este ejemplo, esto daría como resultado una incorporación incorrecta de G frente a A. La muesca resultante podría sellarse con ADN ligasa, lo que daría como resultado un producto con un apareamiento erróneo en el adaptador, como se muestra en la Figura 13F.
Como se muestra en la Figura 13G, después de la amplificación y la secuenciación, los productos que surgen de la hebra "superior" se distinguen de los que surgen de la hebra "inferior" en virtud de tener una base G o T en las lecturas de secuenciación que llevan la misma secuencia SMI.
Este ejemplo se ilustra con la creación de un apareamiento erróeo de G-A, pero será evidente que cualquier otro apareamiento erróneo de una o más bases, en cualquier posición de la molécula, tendría el mismo efecto.
Un ejemplo específico de la aplicación de este concepto en el Ion Torrent™plataforma se muestra más abajo.
Considere el siguiente "Adaptador A modificado" con adiciones a la secuencia estándar en negrita (U = uracilo):
5' CCATCTCATCCCTGCGTGTCTCCGACTCAGU NNNN C3' (SEC ID N°: 32)
3' T*T*GGTAGAGTAGGGACGCACAGAGGCTGAGTCA MMMM G5' (SEQ ID NO: 33)
El adaptador se liga a una molécula de ADN objetivo como se indicó anteriormente, y la ubicación de la muesca se muestra como "|":
5' CCAT CT CATCCCTGCGT GT CTCCGACTCAGUN NNNCXXXXXXXXX 3' (SEQ ID NO: 34)
3' T*T*GGTAGAGT AGGGAC GCACAGAGGCTGAGT CAMMMM G | YYYYYYYYY 5' (SEQID NO: 35)
Ahora, se usa una polimerasa de desplazamiento de hebra en presencia de los cuatro dNTP para permitir el desplazamiento completo de la hebra de la "hebra inferior" del adaptador (las bases recién incorporadas están en negrita, la hebra original del adaptador inferior está desplazada y no se muestra):
5' CCAT CT CATCCCTGCGT GT CTCCGACTCAGUN NNNCXXXXXXXXX 3' (SEQ ID NO: 36)
3' GGTAGAGTAGGGACGCACAGAGGCTGAGTCAMMMMGYYYYYYYYY 5' (SEQ ID NO: 37)
El producto se purifica para eliminar los dNTP, luego se agregan uracilo ADN glicosilasa y una endonucleasa AP para eliminar el uracilo de la hebra "superior", dejando una brecha de nucleótido simple:
5' CCATCTCATCCCTGCGTGTCTCCGACTCAG NNNNCXXXXXXXXX 3' (SEQ ID NO: 38)
3' GGTAGAGTAGGGACGCACAGAGGCTGAGTCAMMMMGYYYYYYYYY 5' (SEQ ID NO: 39)
A continuación, una polimerasa propensa a errores que no desplaza la hebra (por ejemplo, sulfolobus ADN polimerasa IV) se añade junto con dGTP, lo que da como resultado la incorporación de G opuesto a A en la brecha de un solo nucleótido; luego se puede agregar ligasa para dar como resultado un producto de ADN adaptador intacto en la hebra "superior". Esto da como resultado un par de bases no complementario (ubicación subrayada).
5' CCAT CT CATCCCTGCGT GT CTCCGACTCAGGNN NNCXXXXXXXXX 3' (SEQ ID NO: 40)
3' GGT AGAGT AGGGAC GCACAGAGGCTGAGT CAM MMM GYYYYYYYYY 5' (SEQ ID NO: 41)
Este producto se puede utilizar para la corrección de errores con un método análogo al descrito en el ejemplo inmediatamente anterior.
Al introducir un apareamiento erróneo después de la traducción de la muesca
El ejemplo titulado "Introducción de un SDE durante la traducción de la muesca" mostró cómo se puede introducir un SDE asimétrico durante la traducción de la muesca dentro de una secuencia adaptadora. El mismo principio podría aplicarse a una biblioteca de moléculas de ADN en sí misma, de modo que se incorpore un sitio asimétrico (un SDE) en las moléculas de la biblioteca, posiblemente incluso antes de agregar un adaptador. Esto se puede lograr de varias maneras. El siguiente es simplemente un ejemplo.
En la Figura 14A se muestra una molécula de ADN de doble hebra con una hebra "superior" y una "inferior". Las moléculas de ADN se pueden fragmentar de varias maneras para la preparación de bibliotecas. Algunas fuentes de ADN, como el ADN libre de células en el plasma, ya se encuentran en fragmentos pequeños y no se necesita un paso de fragmentación por separado. El cizallamiento acústico es un método de uso frecuente. Se pueden utilizar métodos de cizallamiento enzimático semialeatorios. Las endonucleasas no aleatorias que cortan en sitios de reconocimiento definidos son otro método. En este ejemplo, se utiliza una endonucleasa que deja un saliente en 5' para crear una biblioteca de fragmentos salientes en 5' similares, como se muestra en la Figura 14B.
Este estado asimétrico se puede convertir en una secuencia asimétrica mediante el uso de una polimerasa en presencia de un solo nucleótido que no es complementario del primer nucleótido que va a ser copiado por la polimerasa. En este ejemplo, se usa dGTP, lo que conducirá a una incorporación incorrecta de T-dGTP (dichas incorporaciones incorrectas pueden ocurrir con varios ADN polimerasas en condiciones de reacción apropiadas; consulteMcCulloch y Kunkel, Cell Research 18:148-161 (2008) y las referencias allí citadas). En la Figura 14C se muestra una molécula de ADN parcialmente de doble hebra que incluye dos apareamientos erróneos.
Luego, los cuatro nucleótidos se agregan a la reacción y la copia continúa extendiendo el extremo de la molécula de ADN hasta que la molécula de ADN es de doble hebra. Se produce una burbuja de apareamiento erróneo en cada extremo de fragmento, formando dos SDE como se muestra en la Figura 14D.
A continuación, los adaptadores de secuenciación dúplex se pueden ligar a la molécula de ADN. Los ejemplos de adaptadores que se muestran en la Figura 14E tienen un sitio de cebador P con complementario P', un sitio de cebador O diferente con complementario O' y un SMI a degenerado o semidegenerado con complementario a'. La ligación se lleva a cabo entre la molécula de ADN de doble hebra de la Figura 14D y los adaptadores de la Figura 14E para producir la estructura de la Figura 14F. Como se discutió, los productos que están ligados a dos de las mismas secuencias adaptadoras pueden ignorarse, ya que bajo las condiciones apropiadas no se amplificarán. Después de la PCR, el producto derivado de la hebra "superior" es como se muestra en la Figura 14G y el producto derivado de la hebra "inferior" es como se muestra en la Figura 14H.
La secuenciación con el cebador P conducirá a las siguientes secuencias de las hebras respectivas que se muestran en la Figura 141.
Tenga en cuenta que la presencia de una C frente a una T después de la secuencia SMI permite distinguir las lecturas de la hebra "superior" de las derivadas de la hebra "inferior".
Se podría lograr un marcado SDE similar con el uso de análogos de nucleótidos mutagénicos para llenar las brechas de los extremos 3' u otros métodos.
Se podrían utilizar otros métodos de cizallamiento y crear extremos rebajados en 3' con una exonucleasa antes de rellenar de forma que se cree un SDE.
En términos generales, este ejemplo ilustra que se puede introducir un SDE de forma independiente de los propios adaptadores. Para que ocurra la secuenciación dúplex, solo alguna forma de SMI y SDE en cada molécula adaptada final permite que las secuencias derivadas de cada hebra de un dúplex se relacionen entre sí, pero también se distingan definitivamente entre sí. Estos elementos vienen en una variedad de formas, como se consideró anteriormente, y se pueden introducir antes, durante o después de la ligación del adaptador.
Variaciones en el ensamblaje de moléculas apropiadas para la secuenciación dúplex
Lo descrito anteriormente ilustra métodos mejorados para la secuenciación dúplex, en donde una molécula final que se ensambla comprende al menos un elemento definidor de hebra (SDE) y al menos una secuencia identificadora de molécula simple (SMI); tanto el SDE como el SMI están unidos a una molécula de ADN de doble hebra o parcialmente de doble hebra que se va a secuenciar. Sin embargo, SMI y SDE no necesitan estar incluidos en un solo adaptador; simplemente necesitan estar presentes en la molécula final, idealmente antes o durante cualquier paso de amplificación y/o secuenciación.
Por ejemplo, se puede crear un SDE en un adaptador después de la ligación mediante una reacción enzimática, como se muestra en la Figura 4D. De manera similar, como se describió originalmente (enWO2013142389A1), en algunos ejemplos, las secuencias específicas en los puntos de cizallamiento de los fragmentos de la biblioteca de ADN individuales pueden servir como una secuencia SMI endógena, sin necesidad de añadir una SMI exógena incluida dentro de un adaptador. Los "puntos de cizallamiento" se pueden considerar como las coordenadas de mapeo de cualquiera de los extremos de un fragmento de ADN, cuando el fragmento se alinea con un genoma de referencia. Las coordenadas de uno de los extremos, o de ambos extremos, se pueden usar como un "SMI endógeno" para distinguir distintas moléculas de ADN entre sí, solas o en combinación con las secuencias de una o más secuencias de SMI exógenas.
La siguiente lista incluye variantes no limitantes de tales adaptadores:
-- El SDE está presente en ambas hebras, pero el SMI y el sitio de unión del cebador están presentes en una sola hebra adaptadora. Estos elementos luego se copian a la otra hebra con una polimerasa.
-- No hay SDE presente; el SMI y el sitio de unión del cebador están en una sola hebra. Se usa una polimerasa con solo un dNTP incorrecto presente para crear un SDE, y luego se agregan los dNTP restantes para permitir que la polimerasa haga que el SMI y los sitios de unión del cebador sean de doble hebras. -- Un dominio de ligación solo está presente en una hebra adaptadora (de modo que la segunda hebra adaptadora no está unida). A continuación, se copia una nueva segunda hebra adaptadora de la primera hebra adaptadora con una polimerasa. Esto crea el SMI y el dominio de unión al cebador. Como se indicó anteriormente, solo se agrega inicialmente un dNTP incorrecto para crear un SDE; luego, se agregan los dNTP restantes. Este enfoque se muestra en un ejemplo descrito anteriormente.
-- Un dominio de ligación solo está presente en una hebra adaptadora (de modo que la segunda hebra adaptadora no está unida); esta hebra adaptadora incluye un uracilo. A continuación, se copia una nueva segunda hebra adaptadora de la primera hebra adaptadora con una polimerasa con los cuatro nucleótidos presentes. Luego, la base de uracilo en la hebra adaptadora original se elimina enzimáticamente con uracilo ADN glicosilasa y una endonucleasa AP apropiada. Luego, se usa una polimerasa de ADN con un solo nucleótido incorrecto presente para insertar una falta de coincidencia en el espacio en el ADN, y luego el espacio se liga con ligasa de ADN. Este enfoque se muestra con más detalle en el ejemplo descrito anteriormente que se relaciona con la Figura 4.
-- Un primer adaptador adjunto tiene dominios SMI solos en ambas hebras. Luego se une a este un segundo adaptador, que tiene el dominio de unión al cebador y SDE, también en ambas hebras.
-- Un primer adaptador conectado tiene dominios SMI y SDE en ambas hebras. Se adjunta un segundo adaptador que tiene un dominio de unión al cebador en ambas hebras.
-- Un primer adaptador conectado tiene dominios SMI en ambas hebras. A continuación, se une un segundo "adaptador Y" que tiene dos dominios de unión al cebador no complementarios o parcialmente no complementarios.
-- Un primer adaptador unido tiene un SMI en ambas hebras, así como también una región monocatenaria, con un dominio de ligación también. Un oligonucleótido se hibrida y se liga en la región monocatenaria; se incluye un apareamiento erróneo dentro del oligonucleótido que crea un dominio SDE.
-- En otros ejemplos, se puede cambiar la ubicación de la burbuja, se puede alterar la longitud del n-mer, se puede eliminar un n-mer por completo con duplicados de cada hebra identificada en lugar de los puntos de cizallamiento en los extremos de las moléculas de ADN. Dentro del ADN se pueden usar variantes de nucleótidos o moléculas similares a nucleótidos (por ejemplo, ácidos nucleicos bloqueados (LNA) y ácidos nucleicos peptídicos (PNA) y RNA).
Cada una de las variantes descritas en la presente descripción se incluyen en la presente invención de acuerdo con las reivindicaciones.
En cada una de estas variantes, se aplica el mismo concepto general: la molécula final para la secuenciación dúplex comprende los elementos centrales de un SDE y un SMI conectados a un segmento de ADN que se va a secuenciar. También tenga en cuenta que el mismo concepto general se aplica a la descripción original de secuenciación dúplex (en el documento WO2013142389A1), en donde la secuenciación dúplex se realiza con un adaptador que comprende dos sitios de unión de cebadores asimétricos (por ejemplo, en una configuración "Y"), que sirven como SDE en este caso, y una secuencia SMI unida a una molécula de ADN de doble hebra. Estos componentes se pueden ensamblar en una molécula de ADN diana de diversas formas, siempre que los componentes necesarios estén presentes en la molécula final, idealmente antes o durante cualquier etapa de amplificación o secuenciación.
Esquema alternativo de procesamiento de datos para secuenciación dúplex
La secuenciación dúplex se puede realizar al obtener un "consenso" de duplicados amplificados que surgen de cada una de las dos hebras de ADN individuales para obtener dos secuencias de consenso monocatenarias y luego al comparar las secuencias de consenso de hebra monocatenarias resultantes para obtener una secuencia de consenso dúplex. Este enfoque de "promediar" la secuencia de duplicados amplificados de una sola molécula, posición por posición, puede no ser conveniente en algunos entornos (por ejemplo, si pueden ocurrir errores de amplificación recurrentes en una posición dada en el ADN muy dañado) y más confiable, por lo tanto, se podrían obtener resultados en algunos entornos con un esquema de procesamiento de datos diferente.
Los enfoques alternativos incluyen lo siguiente:
-- Entre las moléculas con una secuencia de etiqueta correspondiente a las hebras "superior" e "inferior", elegir arbitrariamente una hebra "superior" y una hebra "inferior", y comparar la secuencia de las dos hebras. Mantener posiciones en las que ambas hebras estén de acuerdo; marcar las posiciones en desacuerdo como indefinidas. Llamar a la lectura de secuencia resultante una lectura dúplex.
-- Repetir este proceso para las hebras "superior" e "inferior" seleccionadas arbitrariamente que comparten la misma secuencia de etiquetas para obtener una serie de "lecturas dúplex".
-- Entre las "lecturas dúplex" resultantes con una secuencia de etiqueta dada, seleccionar la lectura dúplex con, por ejemplo, la menor cantidad de cambios de secuencia en relación con la secuencia de referencia y/o la menor cantidad de posiciones indefinidas dentro de la lectura. Esta lectura se puede entonces considerar la lectura que representa con mayor probabilidad la secuencia verdadera del dúplex de ADN inicial.
En una modalidad, tal enfoque se podría habilitar específicamente con el algoritmo descrito más abajo. Se entiende que este es solo un único ejemplo con fines ilustrativos, y muchos otros algoritmos se podrían usar para formar lecturas de consenso dúplex. Además, el ejemplo se muestra para una modalidad específica de la secuenciación dúplex, pero se podrían preparar ejemplos similares apropiados para muchas otras modalidades de la secuenciación dúplex.
Las siguientes etapas se pueden usar en una modalidad descrita en la presente descripción que usa una secuencia de "burbuja" para dar como resultado que las hebras "superiores" de cada dúplex se marquen como GCGC, y las hebras "inferiores" se marquen como TATA, al compartir ambas hebras la misma secuencia identificadora de molécula simple (SMI).
1. Preparar un archivo que contiene todas las lecturas de secuenciación del experimento;
2. Dividir el archivo en dos archivos: un archivo llamado "GCGC" que contiene lecturas etiquetadas como GCGC, y un segundo archivo llamado "TATA" que contiene lecturas etiquetadas como TATA;
3. Elegir una lectura arbitraria en el archivo "GCGC", leer su etiqueta SMI y buscar una etiqueta SMI coincidente en el archivo "TATA";
4. Si se encuentra una coincidencia: crear una nueva secuencia a partir de estas dos secuencias. En la nueva secuencia, mantener todas las posiciones de secuencia dentro de las lecturas que coincidan y marcar todas las posiciones en desacuerdo entre las dos lecturas como indefinidas. Escribir esta nueva secuencia en un archivo llamado "dúplex" y eliminar las dos secuencias de los archivos "GCGC" y "TATA" Si no se encuentra una coincidencia: eliminar la secuencia del archivo "GCGC" y escribirla en un archivo llamado "no pareado"; 5. Elegir otra lectura arbitraria del archivo "GCGC" y realizar las etapas 3 a 4 nuevamente; y
6. Continuar hasta que no queden lecturas en el archivo "GCGC".
Dentro del archivo "dúplex" resultante, considerar todas las lecturas que tengan una secuencia de etiqueta SMI coincidente. En algunos casos, puede haber múltiples lecturas "dúplex" que tengan la misma etiqueta SMI (esto se puede deber, por ejemplo, a múltiples duplicados de PCR de una molécula de ADN simple inicial). Estos se pueden convertir en una sola lectura dúplex mediante cualquiera de los siguientes enfoques:
--Entre estas lecturas, seleccionar la lectura con la menor cantidad de apareamientos erróneos con relación a la secuencia del genoma de referencia y descartar las lecturas restantes.
--Alternativamente, seleccionar la lectura con la menor cantidad de posiciones indefinidas con relación a la secuencia del genoma de referencia y descartar las lecturas restantes.
--Alternativamente, crear un consenso entre las lecturas que tienen una secuencia de etiqueta SMI compartida para crear lecturas de consenso dúplex.
Será evidente para un experto en la técnica que se pueden usar combinaciones de las opciones anteriores para desarrollar lecturas de consenso dúplex, o que se pueden usar varios otros métodos no descritos anteriormente.

Claims (15)

    REIVINDICACIONESi. Un método de secuenciación de un ácido nucleico diana de doble hebra que comprende las etapas de:
  1. (1) ligar un par de secuencias de ácido nucleico adaptadoras, que comprenden una secuencia de ácido nucleico con un primer adaptador y una secuencia de ácido nucleico con un segundo adaptador, en donde cada secuencia de ácido nucleico adaptadora comprende un dominio de unión al cebador y un dominio identificador de molécula simple (SMI), a al menos un extremo de una molécula de ácido nucleico diana de doble hebra, lo que forma de esta manera una molécula de ácido nucleico de doble hebra que comprende una secuencia de ácido nucleico diana con un primer adaptador en la hebra y una secuencia de ácido nucleico diana con un segundo adaptador en la hebra;
    (2) amplificar la molécula de ácido nucleico diana con un primer adaptador en la hebra, lo que produce de esta manera un primer conjunto de productos amplificados que comprenden una pluralidad de las moléculas de ácido nucleico diana con un pimer adaptador en la hebra y una pluralidad de sus moléculas complementarias, y amplificar la molécula de ácido nucleico diana con un segundo adaptador en la hebra, lo que produce de esta manera un segundo conjunto de productos amplificados que comprenden una pluralidad de moléculas de ácido nucleico diana con un segundo adaptador en la hebra y una pluralidad de sus moléculas complementarias;
    (3) secuenciar el primer conjunto de productos amplificados, de esta manera se obtiene una secuencia de consenso para el primer conjunto de productos amplificados; y
    (4) secuenciar el segundo conjunto de productos amplificados, para obtener de esta manera una secuencia de consenso para el segundo conjunto de productos amplificados en donde la secuencia de consenso para el primer conjunto de productos amplificados se compara con la secuencia de consenso para el segundo conjunto de productos amplificados, en donde una diferencia entre las dos secuencias de consenso puede considerarse un artefacto, caracterizado porque se obtienen productos de amplificación distinguibles de cada una de las dos hebras de moléculas de ácido nucleico individuales mediante la fusión térmica o química de la molécula de ácido nucleico de doble hebra y luego la separación física de la secuencia de ácido nucleico diana con un primer adaptador en la hebra de la secuencia de ácido nucleico diana con un segundo adaptador en la hebra antes de la amplificación de cada hebra en reacciones separadas.
  2. 2. El método de la reivindicación 1, en donde la molécula de ácido nucleico diana es ADN y se determina que los productos amplificados han surgido de la misma molécula de ADN inicial en virtud de compartir una misma secuencia SMI.
  3. 3. El método de la reivindicación 1, en donde la molécula de ácido nucleico diana es ADN y se determina que los productos amplificados han surgido de la misma molécula de ADN inicial en virtud de llevar distintas secuencias SMI que se sabe que se corresponden entre sí de acuerdo a una base de datos producida en el momento de y junto con la síntesis de la biblioteca de adaptadores SMI.
  4. 4. El método de cualquiera de las reivindicaciones 1 a 3, en donde la molécula de ácido nucleico diana es ADN y se determina que los productos amplificados han surgido de hebras distintas de la misma molécula de ADN a través de al menos un nucleótido de diferencia de secuencia que fue introducido por un elemento definidor de hebra (SDE).
  5. 5. El método de cualquier reivindicación anterior, en donde la secuencia de ácido nucleico diana con un primer adaptador en la hebra y la secuencia de ácido nucleico diana con un segundo adaptador en la hebra se separan físicamente por dilución en cámaras de reacción seleccionadas de recipientes, tubos, pocillos y gotitas no comunicantes.
  6. 6. El método de cualquiera de las reivindicaciones 1 a 5, en donde las dos hebras separadas se secuencian independientemente en reacciones físicamente diferentes.
  7. 7. El método de la reivindicación 5, en donde:
    la etapa (2) se lleva a cabo para cada cámara de reacción físicamente separada mediante el uso de al menos un cebador para cada cámara que lleva una secuencia marcadora diferente;
    la secuencia marcadora es sustancialmente diferente dentro de cada cámara de reacción, de manera que cada secuencia marcadora funciona como un dominio de elemento definidor de hebra (SDE); y la muestra separada se recombina antes de las etapas (3) y (4).
  8. 8. El método de cualquier reivindicación anterior, en donde la molécula de ácido nucleico diana es ADN y la etapa (2) incluye la amplificación de las secuencias de ácido nucleico diana con un primer y segundo adaptador en la hebra mediante el uso de un cebador específico para una parte de la secuencia de la molécula de ADN diana.
  9. 9. El método de cualquier reivindicación anterior, en donde el par de secuencias de ácido nucleico adaptadoras tienen dominios de unión a cebadores al menos parcialmente complementarios, y en donde la etapa (2) comprende amplificar las secuencias de ácido nucleico diana con un primer y segundo adaptador en la hebra mediante el uso de cebadores específicos para el dominio de unión al cebador.
  10. 10. El método de la reivindicación 1, en donde la molécula de ácido nucleico diana con adaptador de doble hebra comprende una molécula no nucleotídica o un marcador de afinidad capaz de unirse a una pareja de afinidad, donde la molécula no nucleotídica o el marcador de afinidad están presentes en una hebra de la molécula de ácido nucleico diana con adaptador de doble hebra, y en donde separar físicamente la secuencia de ácido nucleico con un primer adaptador de la secuencia de ácido nucleico con un segundo adaptador en la hebra comprende usar la pareja de afinidad para capturar la hebra que comprende la molécula no nucleotídica o el marcador de afinidad, preferentemente en donde la molécula no nucleotídica o el marcador de afinidad está ubicado en un extremo de la secuencia de ácido nucleico diana con un primer adaptador o la secuencia de ácido nucleico adaptadora con un segundo adaptador en la hebra, en donde el marcador de afinidad se selecciona de una molécula pequeña, un ácido nucleico, un péptido y un resto enlazable de forma única que es capaz de unirse a una pareja de afinidad.
  11. 11. El método de la reivindicación 10, en donde la molécula no nucleotídica o el marcador de afinidad se selecciona del grupo que comprende colicina E2, Im2, glutatión, glutatión-s-transferasa (GST), níquel, polihistidina, etiqueta FLAG, etiqueta myc o biotina, preferentemente en donde la molécula no nucleotídica o el marcador de afinidad es biotina, y:
    i) la biotina es biotina-16-aminoalil-2'-desoxiuridina-5'-trifosfato, biotina-16-aminoalil-2'-desoxicitidina-5'-trifosfato, biotina-16-aminoalilcitidina-5'-trifosfato, N4-Biotina-OBEA-2'desoxicitidina-5'-Trifosfato, Biotina-16-Aminoaliluridina-5'-Trifosfato, Biotina-16-7-Deaza-7-Aminoalil-2'-desoxiguanosina-5'-Trifosfato, Destiobiotina-6-Aminoalil-2'desoxicitidina-5'-trifosfato, 5'-Biotina-G-Monofosfato, 5'-Biotina-A-Monofosfato, 5'Biotina-dG-Monofosfato o 5'-bBiotina-dA-Monofosfato; o
    ii) la pareja de afinidad es estreptavidina unida a un sustrato, preferentemente en donde el sustrato sólido es una superficie sólida, una perla u otra estructura fija.
  12. 12. El método de la reivindicación 10, en donde:
    el marcador de afinidad comprende un ácido nucleico que incluye ADN, ARN o una combinación de los mismos y, opcionalmente, en donde el ácido nucleico comprende un ácido nucleico peptídico o un ácido nucleico bloqueado.
  13. 13. El método de la reivindicación 1, en donde la secuencia de ácido nucleico diana con un primer adaptador o la secuencia de ácido nucleico diana con un segundo adaptador en la hebra comprende un grupo físico que tiene una propiedad magnética, una propiedad de carga o una propiedad de insolubilidad y, opcionalmente, en donde:
    i) el grupo físico tiene una propiedad magnética, y en donde separar físicamente la secuencia de ácido nucleico con un primer adaptador de la secuencia de ácido nucleico con un segundo adaptador en la hebra comprende aplicar un campo magnético a las secuencias de ácido nucleico diana con un primer y segundo adaptador en la hebra para separar dicha secuencia de ácido nucléico diana con adaptador que tiene la propiedad magnética de la otra secuencia de ácido nucleico diana con adaptador;
    ii) el grupo físico tiene una propiedad de carga, y en donde separar físicamente la secuencia de ácido nucleico con un primer adaptador de la secuencia de ácido nucleico con un segundo adaptador en la hebra comprende aplicar un campo eléctrico a las secuencias de ácido nucleico diana con un primer y segundo adaptador en la hebra para separar dicha secuencia de ácido nucleico diana con adaptador que tiene la propiedad de carga de la otra secuencia de ácido nucleico diana con adaptador; o
    iii) el grupo físico tiene una propiedad de insolubilidad, y en donde separar físicamente la secuencia de ácido nucleico con un primer adaptador de la secuencia de ácido nucleico con un segundo adaptador en la hebra comprende precipitar dicha secuencia de ácido nucleico diana con adaptador que comprende el grupo físico para separar las secuencias de ácido nucleico diana con un primer y segundo adaptador en la hebra.
  14. 14. El método de cualquier reivindicación anterior que comprende además proporcionar una secuencia de consenso con corrección de artefacto de la molécula de ácido nucleico diana de doble hebra.
  15. 15. El método de cualquier reivindicación anterior:
    i) en donde el dominio SMI comprende al menos una secuencia de ácido nucleico degenerada o semidegenerada; y/o
    ii) en donde la molécula de ácido nucleico diana es ADN y el dominio SMI se considera junto con la secuencia correspondiente a los extremos cizallados aleatoria o semialeatoriamente de ADN ligado para obtener una secuencia SMI capaz de distinguir moléculas de ADN entre sí.
ES16822832T 2015-12-08 2016-12-08 Adaptadores, métodos y composiciones mejorados para secuenciación dúplex Active ES2911421T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201562264822P 2015-12-08 2015-12-08
US201662281917P 2016-01-22 2016-01-22
PCT/US2016/065605 WO2017100441A1 (en) 2015-12-08 2016-12-08 Improved adapters, methods, and compositions for duplex sequencing

Publications (1)

Publication Number Publication Date
ES2911421T3 true ES2911421T3 (es) 2022-05-19

Family

ID=57750605

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16822832T Active ES2911421T3 (es) 2015-12-08 2016-12-08 Adaptadores, métodos y composiciones mejorados para secuenciación dúplex

Country Status (11)

Country Link
US (2) US11332784B2 (es)
EP (2) EP3387152B1 (es)
JP (3) JP6975507B2 (es)
CN (1) CN109072294A (es)
AU (1) AU2016366231B2 (es)
CA (1) CA3006792A1 (es)
ES (1) ES2911421T3 (es)
IL (1) IL259788B2 (es)
PL (1) PL3387152T3 (es)
PT (1) PT3387152T (es)
WO (1) WO2017100441A1 (es)

Families Citing this family (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012129363A2 (en) 2011-03-24 2012-09-27 President And Fellows Of Harvard College Single cell nucleic acid detection and analysis
US10011871B2 (en) 2012-02-17 2018-07-03 Fred Hutchinson Cancer Research Center Compositions and methods for accurately identifying mutations
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US11913065B2 (en) 2012-09-04 2024-02-27 Guardent Health, Inc. Systems and methods to detect rare mutations and copy number variation
IL305303A (en) 2012-09-04 2023-10-01 Guardant Health Inc Systems and methods for detecting rare mutations and changes in number of copies
US10876152B2 (en) 2012-09-04 2020-12-29 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
KR102423377B1 (ko) 2013-08-05 2022-07-25 트위스트 바이오사이언스 코포레이션 드 노보 합성된 유전자 라이브러리
JP6571665B2 (ja) 2013-12-28 2019-09-04 ガーダント ヘルス, インコーポレイテッド 遺伝的バリアントを検出するための方法およびシステム
CN107124888B (zh) * 2014-11-21 2021-08-06 深圳华大智造科技股份有限公司 鼓泡状接头元件和使用其构建测序文库的方法
CA2975852A1 (en) 2015-02-04 2016-08-11 Twist Bioscience Corporation Methods and devices for de novo oligonucleic acid assembly
WO2016172377A1 (en) 2015-04-21 2016-10-27 Twist Bioscience Corporation Devices and methods for oligonucleic acid library synthesis
US10844428B2 (en) 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
CN108368482A (zh) 2015-09-18 2018-08-03 特韦斯特生物科学公司 寡核酸变体文库及其合成
KR20180058772A (ko) 2015-09-22 2018-06-01 트위스트 바이오사이언스 코포레이션 핵산 합성을 위한 가요성 기판
CN108603307A (zh) 2015-12-01 2018-09-28 特韦斯特生物科学公司 功能化表面及其制备
US11332784B2 (en) 2015-12-08 2022-05-17 Twinstrand Biosciences, Inc. Adapters, methods, and compositions for duplex sequencing
CN108603228B (zh) 2015-12-17 2023-09-01 夸登特健康公司 通过分析无细胞dna确定肿瘤基因拷贝数的方法
WO2017181146A1 (en) 2016-04-14 2017-10-19 Guardant Health, Inc. Methods for early detection of cancer
US11384382B2 (en) 2016-04-14 2022-07-12 Guardant Health, Inc. Methods of attaching adapters to sample nucleic acids
EP4180539A1 (en) 2016-07-12 2023-05-17 Qiagen Sciences, LLC Single end duplex dna sequencing
JP6876785B2 (ja) 2016-07-18 2021-05-26 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft 単分子配列決定のための一本鎖環状dnaライブラリーを生成するための方法
WO2018031588A1 (en) * 2016-08-09 2018-02-15 Takara Bio Usa, Inc. Nucleic acid adaptors with molecular identification sequences and use thereof
JP6854340B2 (ja) 2016-08-22 2021-04-07 ツイスト バイオサイエンス コーポレーション デノボ合成された核酸ライブラリ
KR102217487B1 (ko) 2016-09-21 2021-02-23 트위스트 바이오사이언스 코포레이션 핵산 기반 데이터 저장
EA201991262A1 (ru) 2016-12-16 2020-04-07 Твист Байосайенс Корпорейшн Библиотеки вариантов иммунологического синапса и их синтез
WO2018125892A1 (en) * 2016-12-28 2018-07-05 Quest Diagnostics Investments Llc Compositions and methods for detecting circulating tumor dna
BR112019014651A2 (pt) 2017-01-18 2020-07-21 Illumina, Inc. métodos para sequenciar moléculas de ácido nucleico e para preparar adaptadores de sequenciamento, produto de programa de computador, e, sistema de computador.
EP3586255A4 (en) 2017-02-22 2021-03-31 Twist Bioscience Corporation NUCLEIC ACID-BASED DATA STORAGE
WO2018170169A1 (en) 2017-03-15 2018-09-20 Twist Bioscience Corporation Variant libraries of the immunological synapse and synthesis thereof
EP3601598B1 (en) 2017-03-23 2022-08-03 University of Washington Methods for targeted nucleic acid sequence enrichment with applications to error corrected nucleic acid sequencing
WO2018183942A1 (en) * 2017-03-31 2018-10-04 Grail, Inc. Improved library preparation and use thereof for sequencing-based error correction and/or variant identification
US11028435B2 (en) 2017-05-01 2021-06-08 Illumina, Inc. Optimal index sequences for multiplex massively parallel sequencing
AU2018266377A1 (en) 2017-05-08 2019-11-14 Illumina, Inc. Universal short adapters for indexing of polynucleotide samples
CA3066744A1 (en) 2017-06-12 2018-12-20 Twist Bioscience Corporation Methods for seamless nucleic acid assembly
WO2018231864A1 (en) 2017-06-12 2018-12-20 Twist Bioscience Corporation Methods for seamless nucleic acid assembly
CA3075505A1 (en) 2017-09-11 2019-03-14 Twist Bioscience Corporation Gpcr binding proteins and synthesis thereof
US11447818B2 (en) 2017-09-15 2022-09-20 Illumina, Inc. Universal short adapters with variable length non-random unique molecular identifiers
GB2583590A (en) 2017-10-20 2020-11-04 Twist Bioscience Corp Heated nanowells for polynucleotide synthesis
KR20230028569A (ko) 2017-11-06 2023-02-28 일루미나, 인코포레이티드 핵산 색인 기술
US11739367B2 (en) 2017-11-08 2023-08-29 Twinstrand Biosciences, Inc. Reagents and adapters for nucleic acid sequencing and methods for making such reagents and adapters
JP7191448B2 (ja) 2018-01-04 2022-12-19 ツイスト バイオサイエンス コーポレーション Dnaベースのデジタル情報ストレージ
CN108300716B (zh) * 2018-01-05 2020-06-30 武汉康测科技有限公司 接头元件、其应用和基于不对称多重pcr进行靶向测序文库构建的方法
GB201804641D0 (en) * 2018-03-22 2018-05-09 Inivata Ltd Methods of sequencing nucleic acids and error correction of sequence reads
CN112041462A (zh) * 2018-03-23 2020-12-04 德克萨斯州立大学董事会 具有极低的错误水平的dsDNA有效测序
JP2021524736A (ja) * 2018-05-16 2021-09-16 ツインストランド・バイオサイエンシズ・インコーポレイテッドTwinstrand Biosciences, Inc. 核酸混合物および混合細胞集団を解析するための方法および試薬ならびに関連用途
AU2019270243A1 (en) 2018-05-18 2021-01-07 Twist Bioscience Corporation Polynucleotides, reagents, and methods for nucleic acid hybridization
SG11202100141SA (en) * 2018-07-12 2021-02-25 Twinstrand Biosciences Inc Methods and reagents for characterizing genomic editing, clonal expansion, and associated applications
WO2020043803A1 (en) * 2018-08-28 2020-03-05 Sophia Genetics S.A. Methods for asymmetric dna library generation and optionally integrated duplex sequencing
EP3853362A1 (en) * 2018-09-21 2021-07-28 F. Hoffmann-La Roche AG System and method for modular and combinatorial nucleic acid sample preparation for sequencing
US11358137B2 (en) 2018-12-26 2022-06-14 Industrial Technology Research Institute Tubular structure for producing droplets and method for producing droplets
KR20210148122A (ko) * 2019-02-25 2021-12-07 트위스트 바이오사이언스 코포레이션 차세대 시퀀싱을 위한 조성물 및 방법
WO2020176678A1 (en) 2019-02-26 2020-09-03 Twist Bioscience Corporation Variant nucleic acid libraries for glp1 receptor
SG11202109283UA (en) 2019-02-26 2021-09-29 Twist Bioscience Corp Variant nucleic acid libraries for antibody optimization
CN114729342A (zh) 2019-06-21 2022-07-08 特韦斯特生物科学公司 基于条形码的核酸序列装配
CN114502742A (zh) * 2019-08-01 2022-05-13 特温斯特兰德生物科学有限公司 用于核酸测序及相关应用的方法和试剂
GB2623904A (en) 2019-11-06 2024-05-01 Univ Leland Stanford Junior Methods and systems for analyzing nucleic acid molecules
US11783912B2 (en) 2021-05-05 2023-10-10 The Board Of Trustees Of The Leland Stanford Junior University Methods and systems for analyzing nucleic acid molecules
WO2024015869A2 (en) * 2022-07-12 2024-01-18 University Of Washington Systems and methods for variant detection in cells
WO2024022207A1 (en) * 2022-07-25 2024-02-01 Mgi Tech Co., Ltd. Methods of in-solution positional co-barcoding for sequencing long dna molecules

Family Cites Families (96)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6582908B2 (en) 1990-12-06 2003-06-24 Affymetrix, Inc. Oligonucleotides
US5308751A (en) 1992-03-23 1994-05-03 General Atomics Method for sequencing double-stranded DNA
JP2002503954A (ja) * 1997-04-01 2002-02-05 グラクソ、グループ、リミテッド 核酸増幅法
US6087099A (en) 1997-09-08 2000-07-11 Myriad Genetics, Inc. Method for sequencing both strands of a double stranded DNA in a single sequencing reaction
AU2144000A (en) 1998-10-27 2000-05-15 Affymetrix, Inc. Complexity management and analysis of genomic dna
US6958225B2 (en) 1999-10-27 2005-10-25 Affymetrix, Inc. Complexity management of genomic DNA
US7300751B2 (en) 2000-06-30 2007-11-27 Syngenta Participations Ag Method for identification of genetic markers
US6632611B2 (en) 2001-07-20 2003-10-14 Affymetrix, Inc. Method of target enrichment and amplification
US7297778B2 (en) 2001-07-25 2007-11-20 Affymetrix, Inc. Complexity management of genomic DNA
US20040002073A1 (en) 2001-10-15 2004-01-01 Li Alice Xiang Multiplexed analysis of polymorphic loci by concurrent interrogation and enzyme-mediated detection
US7406385B2 (en) 2001-10-25 2008-07-29 Applera Corporation System and method for consensus-calling with per-base quality values for sample assemblies
US7459273B2 (en) 2002-10-04 2008-12-02 Affymetrix, Inc. Methods for genotyping selected polymorphism
US7452699B2 (en) 2003-01-15 2008-11-18 Dana-Farber Cancer Institute, Inc. Amplification of DNA in a hairpin structure, and applications
EP1606417A2 (en) 2003-03-07 2005-12-21 Rubicon Genomics Inc. In vitro dna immortalization and whole genome amplification using libraries generated from randomly fragmented dna
US20080261204A1 (en) 2004-01-23 2008-10-23 Lingvitae As Polynucleotide Ligation Reactions
US7393665B2 (en) 2005-02-10 2008-07-01 Population Genetics Technologies Ltd Methods and compositions for tagging and identifying polynucleotides
US8796441B2 (en) 2005-04-13 2014-08-05 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Human sweet and umami taste receptor variants
ES2387878T3 (es) 2005-06-23 2012-10-03 Keygene N.V. Estrategias para la identificación de alto rendimiento y la detección de polimorfismos
US20090170713A1 (en) 2005-09-29 2009-07-02 Keygene N.V. High throughput screening of mutagenized populations
GB0522310D0 (en) 2005-11-01 2005-12-07 Solexa Ltd Methods of preparing libraries of template polynucleotides
WO2007087312A2 (en) 2006-01-23 2007-08-02 Population Genetics Technologies Ltd. Molecular counting
US20070172839A1 (en) * 2006-01-24 2007-07-26 Smith Douglas R Asymmetrical adapters and methods of use thereof
DK3239304T3 (da) 2006-04-04 2020-10-26 Keygene Nv Højgennemløbsdetektering af molekylære markører baseret på AFLP og sekventering med højt gennemløb
WO2008093098A2 (en) 2007-02-02 2008-08-07 Illumina Cambridge Limited Methods for indexing samples and sequencing multiple nucleotide templates
EP2201143B2 (en) 2007-09-21 2016-08-24 Katholieke Universiteit Leuven Tools and methods for genetic tests using next generation sequencing
BRPI0909212A2 (pt) 2008-03-28 2015-08-18 Pacific Biosciences California Composições e método para sequeciamento de ácido nucléico
WO2009133466A2 (en) 2008-04-30 2009-11-05 Population Genetics Technologies Ltd. Asymmetric adapter library construction
US8383345B2 (en) 2008-09-12 2013-02-26 University Of Washington Sequence tag directed subassembly of short sequencing reads into long sequencing reads
WO2010056728A1 (en) 2008-11-11 2010-05-20 Helicos Biosciences Corporation Nucleic acid encoding for multiplex analysis
KR101797773B1 (ko) 2009-01-30 2017-11-15 옥스포드 나노포어 테크놀로지즈 리미티드 막횡단 시퀀싱에서 핵산 구축물용 어댑터
US20100331204A1 (en) 2009-02-13 2010-12-30 Jeff Jeddeloh Methods and systems for enrichment of target genomic sequences
US20120165202A1 (en) 2009-04-30 2012-06-28 Good Start Genetics, Inc. Methods and compositions for evaluating genetic markers
US9085798B2 (en) 2009-04-30 2015-07-21 Prognosys Biosciences, Inc. Nucleic acid constructs and methods of use
EP2248914A1 (en) 2009-05-05 2010-11-10 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. The use of class IIB restriction endonucleases in 2nd generation sequencing applications
ES2562159T3 (es) 2009-08-20 2016-03-02 Population Genetics Technologies Ltd. Composiciones y métodos para el reordenamiento de ácido nucleico molecular
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
US9080210B2 (en) 2010-06-09 2015-07-14 Keygene N.V. High throughput screening using combinatorial sequence barcodes
US20120238738A1 (en) 2010-07-19 2012-09-20 New England Biolabs, Inc. Oligonucleotide Adapters: Compositions and Methods of Use
US20120244525A1 (en) * 2010-07-19 2012-09-27 New England Biolabs, Inc. Oligonucleotide Adapters: Compositions and Methods of Use
PT2623613T (pt) 2010-09-21 2016-10-11 Population Genetics Tech Ltd Aumento da confiança da designação de alelos por contagem molecular
WO2012042374A2 (en) 2010-10-01 2012-04-05 Anssi Jussi Nikolai Taipale Method of determining number or concentration of molecules
US9074251B2 (en) * 2011-02-10 2015-07-07 Illumina, Inc. Linking sequence reads using paired code tags
EP2635679B1 (en) 2010-11-05 2017-04-19 Illumina, Inc. Linking sequence reads using paired code tags
WO2012083225A2 (en) 2010-12-16 2012-06-21 Gigagen, Inc. System and methods for massively parallel analysis of nycleic acids in single cells
EP3736281A1 (en) 2011-02-18 2020-11-11 Bio-Rad Laboratories, Inc. Compositions and methods for molecular labeling
WO2012129363A2 (en) 2011-03-24 2012-09-27 President And Fellows Of Harvard College Single cell nucleic acid detection and analysis
PL2697397T3 (pl) 2011-04-15 2017-08-31 The Johns Hopkins University System bezpiecznego sekwencjonowania
EP2729580B1 (en) 2011-07-08 2015-09-16 Keygene N.V. Sequence based genotyping based on oligonucleotide ligation assays
AU2012304537B2 (en) 2011-09-06 2015-08-20 Gen-Probe Incorporated Closed nucleic acid structures
GB2496016B (en) * 2011-09-09 2016-03-16 Univ Leland Stanford Junior Methods for obtaining a sequence
JP5418579B2 (ja) 2011-12-06 2014-02-19 株式会社デンソー 開閉眼検出装置
US20160153039A1 (en) 2012-01-26 2016-06-02 Nugen Technologies, Inc. Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
EP3578697B1 (en) 2012-01-26 2024-03-06 Tecan Genomics, Inc. Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
US9528107B2 (en) * 2012-01-31 2016-12-27 Pacific Biosciences Of California, Inc. Compositions and methods for selection of nucleic acids
US10011871B2 (en) 2012-02-17 2018-07-03 Fred Hutchinson Cancer Research Center Compositions and methods for accurately identifying mutations
WO2013130512A2 (en) 2012-02-27 2013-09-06 The University Of North Carolina At Chapel Hill Methods and uses for molecular tags
WO2013128281A1 (en) 2012-02-28 2013-09-06 Population Genetics Technologies Ltd Method for attaching a counter sequence to a nucleic acid sample
NO2694769T3 (es) * 2012-03-06 2018-03-03
WO2013138510A1 (en) 2012-03-13 2013-09-19 Patel Abhijit Ajit Measurement of nucleic acid variants using highly-multiplexed error-suppressed deep sequencing
HUE051845T2 (hu) 2012-03-20 2021-03-29 Univ Washington Through Its Center For Commercialization Módszerek a tömegesen párhuzamos DNS-szekvenálás hibaarányának csökkentésére duplex konszenzus szekvenálással
EP2847353B1 (en) 2012-05-10 2022-01-19 The General Hospital Corporation Methods for determining a nucleotide sequence
CA2872141C (en) 2012-05-31 2016-01-19 Board Of Regents, The University Of Texas System Method for accurate sequencing of dna
IL305303A (en) 2012-09-04 2023-10-01 Guardant Health Inc Systems and methods for detecting rare mutations and changes in number of copies
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
CN102877136B (zh) 2012-09-24 2014-03-12 上海交通大学 基于基因组简化与二代测序dna文库构建方法及试剂盒
DK3553175T3 (da) 2013-03-13 2021-08-23 Illumina Inc Fremgangsmåde til fremstilling af et nukleinsyresekvenseringsbibliotek
US10087481B2 (en) 2013-03-19 2018-10-02 New England Biolabs, Inc. Enrichment of target sequences
US11414695B2 (en) 2013-05-29 2022-08-16 Agilent Technologies, Inc. Nucleic acid enrichment using Cas9
CN105555957A (zh) * 2013-09-24 2016-05-04 私募蛋白质体公司 多适配子靶标检测
JP6571665B2 (ja) * 2013-12-28 2019-09-04 ガーダント ヘルス, インコーポレイテッド 遺伝的バリアントを検出するための方法およびシステム
WO2015117040A1 (en) 2014-01-31 2015-08-06 Swift Biosciences, Inc. Improved methods for processing dna substrates
WO2016040901A1 (en) 2014-09-12 2016-03-17 The Board Of Trustees Of The Leland Stanford Junior University Identification and use of circulating nucleic acids
WO2016118883A1 (en) 2015-01-23 2016-07-28 Washington University Detection of rare sequence variants, methods and compositions therefor
US10686637B2 (en) 2015-02-20 2020-06-16 Nec Corporation Receiving apparatus and receiving method
US10844428B2 (en) 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
JP6698708B2 (ja) 2015-06-09 2020-05-27 ライフ テクノロジーズ コーポレーション 分子タグ付けのための方法、システム、組成物、キット、装置、及びコンピュータ可読媒体
US10465241B2 (en) 2015-06-15 2019-11-05 The Board Of Trustees Of The Leleand Stanford Junior University High resolution STR analysis using next generation sequencing
GB201515557D0 (en) 2015-09-02 2015-10-14 14M Genomics Ltd Method of sequencing
CN108350491A (zh) 2015-11-18 2018-07-31 加利福尼亚太平洋生物科学股份有限公司 将核酸加载到基材上
US11332784B2 (en) 2015-12-08 2022-05-17 Twinstrand Biosciences, Inc. Adapters, methods, and compositions for duplex sequencing
CN108603229A (zh) 2016-01-22 2018-09-28 格瑞尔公司 用于高保真测序的方法和系统
AU2017209330B2 (en) 2016-01-22 2023-05-04 Grail, Llc Variant based disease diagnostics and tracking
EP4180539A1 (en) 2016-07-12 2023-05-17 Qiagen Sciences, LLC Single end duplex dna sequencing
EP3276328B1 (en) 2016-07-29 2020-12-02 Sysmex Corporation Smear transporting apparatus, smear image capture system, and smear analysis system
WO2018031588A1 (en) 2016-08-09 2018-02-15 Takara Bio Usa, Inc. Nucleic acid adaptors with molecular identification sequences and use thereof
US10487358B2 (en) 2016-09-23 2019-11-26 Grail, Inc. Methods of preparing and analyzing cell-free nucleic acid sequencing libraries
US10982351B2 (en) 2016-12-23 2021-04-20 Grail, Inc. Methods for high efficiency library preparation using double-stranded adapters
EP3601598B1 (en) 2017-03-23 2022-08-03 University of Washington Methods for targeted nucleic acid sequence enrichment with applications to error corrected nucleic acid sequencing
WO2018183942A1 (en) 2017-03-31 2018-10-04 Grail, Inc. Improved library preparation and use thereof for sequencing-based error correction and/or variant identification
US11739367B2 (en) 2017-11-08 2023-08-29 Twinstrand Biosciences, Inc. Reagents and adapters for nucleic acid sequencing and methods for making such reagents and adapters
EP3752639A4 (en) 2018-02-13 2021-12-01 Twinstrand Biosciences, Inc. METHODS AND REAGENTS FOR DETECTION AND ASSESSMENT OF GENOTOXICITY
WO2019178577A1 (en) 2018-03-15 2019-09-19 Twinstrand Biosciences, Inc. Methods and reagents for enrichment of nucleic acid material for sequencing applications and other nucleic acid material interrogations
CN112041462A (zh) 2018-03-23 2020-12-04 德克萨斯州立大学董事会 具有极低的错误水平的dsDNA有效测序
JP2021524736A (ja) 2018-05-16 2021-09-16 ツインストランド・バイオサイエンシズ・インコーポレイテッドTwinstrand Biosciences, Inc. 核酸混合物および混合細胞集団を解析するための方法および試薬ならびに関連用途
SG11202100141SA (en) 2018-07-12 2021-02-25 Twinstrand Biosciences Inc Methods and reagents for characterizing genomic editing, clonal expansion, and associated applications
KR102662200B1 (ko) 2019-07-15 2024-04-29 엘지디스플레이 주식회사 유기발광표시장치

Also Published As

Publication number Publication date
EP3387152B1 (en) 2022-01-26
IL259788B1 (en) 2023-01-01
CA3006792A1 (en) 2017-06-15
JP2019509015A (ja) 2019-04-04
AU2016366231B2 (en) 2022-12-15
US20170211140A1 (en) 2017-07-27
IL259788B2 (en) 2023-05-01
US11332784B2 (en) 2022-05-17
WO2017100441A1 (en) 2017-06-15
CN109072294A (zh) 2018-12-21
AU2016366231A1 (en) 2018-06-14
EP4043584A1 (en) 2022-08-17
PT3387152T (pt) 2022-04-19
US20220267841A1 (en) 2022-08-25
PL3387152T3 (pl) 2022-05-09
JP2022017453A (ja) 2022-01-25
JP2024010122A (ja) 2024-01-23
EP3387152A1 (en) 2018-10-17
IL259788A (en) 2018-07-31
JP6975507B2 (ja) 2021-12-01

Similar Documents

Publication Publication Date Title
ES2911421T3 (es) Adaptadores, métodos y composiciones mejorados para secuenciación dúplex
ES2724824T3 (es) Métodos para la secuenciación de ácidos nucleicos
US20180334729A1 (en) High throughput nucleic acid sequencing by expansion
ES2697974T3 (es) Códigos de barras de secuencia combinatoria para selección de alto rendimiento
CN105283558B (zh) 使用热稳定的TthPrimPol扩增和测序的方法
CN106232834A (zh) 样品制备方法
CN109844137B (zh) 用于鉴定嵌合产物的条形码化环状文库构建
ES2866896T3 (es) Procedimiento para incrementar el rendimiento de secuenciación de molécula única concatenando fragmentos de ADN cortos
BR122021026781B1 (pt) Transposon de preservação de contiguidade
ES2965194T3 (es) Algoritmo de secuenciación
US20240052339A1 (en) Rna probe for mutation profiling and use thereof
EP3878972A1 (en) Barcoding technology for sequencing of nucleic acid molecules
WO2021159184A1 (en) Reference ladders and adaptors
Tserovski Chemical labeling and next-generation sequencing for detection of RNA-modifications
JP2023552984A (ja) 両端からポリヌクレオチド断片を配列決定するための方法
WO2020012057A1 (es) Preparación de librerías de ácidos nucléicos o genotecas
JP2005278465A (ja) 環状一本鎖dnaの製造方法、および環状一本鎖dnaの製造に使用するポリヌクレオチド配列の決定方法